Corso di Modelli Analitici per le Applicazioni 1. Reti di reazioni chimiche ed equazioni differenziali Corrado MASCIA & Eugenio MONTEFUSCO [email protected], [email protected] Dipartimento di Matematica “G. Castelnuovo”, Sapienza – Università di Roma March 5, 2010 L’uso del linguaggio delle equazioni differenziali per descrivere quantitativamente l’evoluzione di reazioni chimiche è generalmente attibuito allo scienziato tedesco Ludwig Ferdinand Wilhelmy (1812–1864) che pubblicò, nel 1850, un lavoro relativo alla conversione di una soluzione di zucchero in una mistura di fruttosio e glucosio, a causa della presenza di acidi. Nel suo lavoro, indicata con Z la concentrazione di zucchero e con S la concentrazione di acido, Wilhelmy propose un’equazione della forma dZ = −M S Z, dt dove il coefficiente M è da determinare, e mostrò, attraverso una serie di esperimenti, che tale coefficiente è sostanzialmente costante (con piccole variazioni che dipendono da variazioni di temperatura). Il lavoro di Wilhelmy non fu particolarmente considerato dai contemporanei e lo sviluppo in grande scala della cinetica chimica fu determinato dai contributi di Jacobus Henricus van ‘t Hoff (premio Nobel per la Chimica nel 1901) e di Svante Arrhenius (premio Nobel per la Chimica nel 1903). La descrizione tramite equazioni differenziali di reazioni chimiche si basa sul punto di vista seguente. Si suppone che le specie chimiche in gioco siano descrivibili attraverso una variabile, dipendente dal tempo, che ne descrive la concentrazione. Nella versione più semplice, si considera che la concentrazione sia indipendente dalla posizione spaziale. Versioni più raffinate, che tengono conto anche della distribuzione spaziale, danno luogo ad equazioni alle derivate parziali. I singoli elementi di una specie possono trasformarsi, divenendo elementi di un’altra specie, sia in maniera autonoma che a causa di interazioni con altri elementi presenti nella mistura. Il primo caso viene usualmente descritto attraverso una legge di reazione analoga a quella di Wilhelmy dando luogo a sistemi di equazioni differenziali lineari. Nel caso di interazione, invece, il riferimento classico è dato dalla legge di azione di massa (dovuta, nella sua versione più completa, a Cato Maximilian Guldberg e Peter Waage) che afferma che il tasso di reazione sia proporzionale al 2 prodotto delle concentrazioni dei reagenti e che, di conseguenza, determina sistemi di equazioni nonlineari. 1. Transizione di una singola specie La situazione più elementare nello studio dei processi di reazione è quella di un trasformazione di una specie A in una specie B. Nel seguito indichiamo con A e B sia le due specie che il numero di elementi di cui esse sono composte. Qui, con ”specie” si possono intendere oggetti di tipo diverso: atomi, molecole, composti chimici, individui... In corrispondenza, la trasformazione da uno stato ad un altro indica una trasformazione delle natura della specie: ad esempio, il decadimento di sostanze radioattive, il passaggio dallo stato di malattia allo stato di guarigione... Per una descrizione statistica di un gran numero di particelle di tipo A, occorre conoscere la probabilità λ di passaggio dallo stato A allo stato B nell’unità di tempo. La reazione viene allora indicata tramite lo schema λ A −→ B Il parametro λ viene detto costante cinetica della transizione. Supponendo che tutte le particelle siano uguali e che la probabilità λ sia costante nel tempo, il numero di particelle che nell’intervallo di tempo ∆t sono passate da A a B è dato, a meno di fluttuazioni, dal valore λ A ∆t. Quindi ∆A ≈ −λ A ∆t. Il segno negativo deriva dal fatto che la transizione da A a B corrisponde ad una perdita di elementi di tipo A. La costante λ ha le dimensioni dell’inverso di un tempo ed esprime la probabilità statistica di trasformazione nell’unità di tempo. Per esempio, se λ = 0, 01 s−1 per una particolare specie radioattiva, allora ogni atomo di tale specie ha una probabilità di 0,01 (cioè dell’1%) di decadere e una probabilità 0,99 (cioè del 99%) di non decadere in un qualsiasi intervallo temporale di durata di 1 s. Nel caso di un gran numero di particelle di tipo A, grazie alla legge dei grandi numeri, le fluttuazioni attorno al valore descritto dalla distribuzione di probabilità tendono a zero e la precedente espressione approssimata può essere considerata esatta. In altre parole, è lecito, per lo meno euristicamente, ”confondere” la distribuzione di probabilità con il numero effettivo delle particelle, ottenendo al limite, le equazioni 3 differenziali dA dB = −λA, = λA dt dt Le soluzioni di queste equazioni, con condizione iniziale A(0) = A0 e B(0) = 0 sono A(t) = A0 e−λ t , B(t) = A0 (1 − e−λt ). Dato che la transizione da A a B è puramente casuale, la vita effettiva di un elemento della specie A può variare tra zero e infinito. La vita media, riferita ad un gran numero di elementi della stessa specie, è invece una quantità ben definita. Nell’intervallo di tempo [t, t + ∆t], circa λA(t)∆t elementi della specie A passano allo stato B. Tutti questi elementi hanno una vita di durata approssimativamente pari a t. Quindi, la somma totale L delle vite di tutti gli elementi di A si rappresenta nella forma Z ∞ Z λ t A(t) dt = A0 L= 0 ∞ −λt 0 t (−e Z ) dt = A0 0 0 ∞ e−λt dt = A0 . λ Pertanto, la vita media τ è data da τ := L 1 = . A0 λ La costante λ, quindi, è pari all’inverso del tempo di vita medio nello stato A. Nello studio dei decadimenti radioattivi, un parametro utilizzato convenzionalmente è il tempo di dimezzamento, cioè il tempo T necessario per dimezzare il quantitiativo iniziale A0 della specie A. In formule, il valore T è determinato dalla condizione 1 A0 e−λ T = A0 , 2 da cui si deducono le relazioni ln 2 T = = τ ln 2 λ dove λ e τ hanno lo stesso significato utilizzato in precedenza. Si noti che il tempo di dimezzamento ed la metà della vita media sono due quantità ben diverse... Dissociazione. Un’altra situazione tipica nell’ambito delle reazioni chimiche (e non solo) è quella di una specie A che, spontaneamente, si dissocia in due parti B e C. Supponendo che la dissociazione sia governata dal parametro cinetico λ, essa può essere schematizzata con il diagramma λ A −→ B+C 4 Il sistema di equazioni differenziali corrispondenti per le tre specie prende la forma dA = −λA, dt dB = λ A, dt dC = λ A. dt La situazione è sostanzialmente la stessa del caso considerato in precedenza. Si noti che dalle equazioni del sistema si può dedurre che si conservano le quantità A + B e A + C, separatamente, questo perché una frazione della specie A si dissocia in B e tutta la parte restante passa in C, da cui segue una sorta di principio di conservazione. Legge di Arrhenius. Quando si considerano reazioni chimiche, è necessario tenere conto anche della temperatura a cui tali reazioni avvengono. Una formula empirica, molto utilizzata in letteratura, per descrivere la dipendenza della costante cinetica λ di una reazione chimica dalla temperatura è data dall’equazione di Arrhenius: (1.1) λ(T ) = λ∞ e−E/RT , dove λ è la costante cinetica della reazione, T è la temperatura assoluta (in gradi Kelvin), R è la costante dei gas ideali, λ∞ è un fattore di frequenza ed E è l’energia di attivazione. La stessa relazione (1.1) viene chiamata relazione di Polanyi–Wigner, I coefficienti λ∞ ed E dipendono, in generale, anch’essi dalla temperatura, ma per escursioni termiche non molto ampie, essi rimangono sostanzialmente costanti. Perciò, indicando con λ1 e λ2 le costanti cinetiche relative a due diverse temperature T1 e T2 e utilizzando l’equazione di Arrhenius (1.1), si ottiene la relazione λ2 E 1 1 ln = − , λ1 R T1 T2 che permette di calcolare la costante cinetica di reazione ad una certa temperatura se è nota la costante per un’altra temperatura e l’energia di attivazione della reazione. Ad esempio, nel caso di un’energia di attivazione pari a 50 kJ mol−1 , dato che la costante dei gas R vale 8.31 J K −1 mol−1 , passando da 10◦ C a 30◦ C (ovvero da T1 = 293◦ K a T2 = 303◦ K), si ha λ2 E 1 1 = exp − = e0.68 = 1.97 λ1 R T1 T2 che indica un sostanziale raddoppiamento della costante cinetica λ dovuto all’innalzamento della temperatura. Alcune reazioni chimiche si accordano molto bene con l’equazione di Arrhenius: ne riportiamo un paio con i relativi valori misurati sperimentalmente per il fattore 5 di frequenza λ∞ e l’energia di attivazione E N2 O N2 O5 −→ −→ N2 + O 2 N O + O2 λ∞ = 8 × 10−11 , E = 251 kJ mol−1 , λ∞ = 6 × 10−14 , E = 88 kJ mol−1 , Per semplicità di presentazione, in quel che segue, non porteremo attenzione alle variazioni di temperatura e quindi non terremo conto delle variazioni per le costanti cinetiche. Transizioni a più passi. Il caso di una quantità osservata che subisce più trasformazioni una dopo l’altra, ciascuna delle quali con un suo proprio parametro cinetico, è schematizzata da λ2 λ1 A −→ B −→ C con costanti di decadimento λ1 , λ2 , che, per semplicità, supponiamo diverse λ1 6= λ2 . Procedendo analogamente a quanto fatto in precedenza, il processo si traduce nel seguente sistema di equazioni differenziali ordinarie dA = −λ1 A, dt dB = −λ2 B + λ1 A, dt dC = λ2 B, dt con condizioni iniziali A(0) = A0 , B(0) = C(0) = 0. Le soluzioni sono date da λ1 (e−λ1 t − e−λ2 t ), λ2 − λ1 λ2 λ1 −λ1 t −λ2 t C(t) = A0 1 − e − e . λ2 − λ1 λ1 − λ2 A(t) = A0 e−λ1 t , B(t) = A0 Analogamente è possibile trattare il caso di un decadimento con una successione più numerosa di stati successivi. Esempi tipici in questa categoria sono i decadimenti radioattivi. Consideriamo ad esempio, il caso dell’Uranio-238. La sua catena di decadimenti, detta serie dell’Uranio (o serie del Radio) è particolarmente lunga e si compone, in una versione leggermente semplificata, di 14 passi. Saltando alcune configurazioni intermedie con tempo di vita breve rispetto alle altre, la serie si semplifica in λ1 238 U −→ λ2 234 Th −→ λ3 230 Th −→ λ4 226 Ra −→ 206 Pb 6 (dove U=Uranio, Th=Torio, Ra=Radio, Pb=Piombo) con tempi di dimezzamento, dati in anni, pari a T1 = 4.5 × 109 , T2 = 2.4 × 105 , T3 = 7.7 × 104 , T4 = 1.6 × 103 , e, di conseguenza, con costanti cinetiche λ1 = 1.5 × 10−10 , λ2 = 2.9 × 10−6 , λ3 = 9.0 × 10−6 , λ4 = 4.3 × 10−4 . Un sotto ramo di questa serie è alla base della tecnica di datazione 210 Pb utiliz- zato per individuare contraffazione nel campo della pittura (come nel caso dei falsi Vermeer dipinti dall’olandese Han van Meegeren). Esistono anche catene di decadimento più brevi. Tra queste, vale la pena ricordare la catena del Carbonio-14, che è alla base della tecnica di datazione radiometrica sviluppata dall’equipe di Willard Libby (premio Nobel per la Chimica nel 1960) e colleghi, nel 1949. I decadimenti nucleari vengono classicamente distinti in tre classi: decadimento alfa, decadimento beta, decadimento gamma. Tali emissioni (in particolare le radiazioni gamma) sono in grado di provocare danni di diverso tipo sulle cellule, e in particolare su DNA ed RNA. Ad esempio, nel caso l’incidente della centrale di Cernobyl, avvenuto nel 1985, ebbe conseguenze catastrofiche a causa delle radiazioni connesse con i decadimenti di Iodio-131 (tempo di dimezzamento di circa 8 giorni) e di Cesio-137 (circa 30 anni). Transizioni reversibili. Le situazioni descritte fin qui corrispondono a casi di reazioni irreversibili: una volta che la transizione dallo stato A allo stato B è avvenuta, non è più possibile tornare indietro. Nel caso di reazioni reversibili, si deve tenere conto sia della possibilità di passaggio da A a B sia del passaggio da B ad A. Supponendo che le probabilità di successo della transizione delle due reazioni in gioco non si influenzino reciprocamente, la reazione reversibile può essere schematizzata con il diagramma λ1 A B λ−1 Le corrispondenti equazioni differenziali costituiscono un sistema lineare a coefficienti costanti dA = −λ1 A + λ−1 B, dt a cui vanno associate le condizioni iniziali (1.2) A(0) = A0 , dB = λ1 A − λ−1 B, dt B(0) = 0. 7 Il caso B(0) 6= 0 può essere trattato senza grandi modifiche. Le variabili diagonali (ottenute calcolando gli autovettori della matrice dei coefficienti del sistema (1.2)) (1.3) D := λ1 A − λ−1 B C := A + B, risolvono il sistema disaccoppiato dC dD = 0, = −(λ1 + λ−1 )D, dt dt con condizioni iniziali C(0) = A0 , D(0) = λ1 A0 . Perciò C(t) = A0 , D(t) = λ1 A0 e−(λ1 +λ−1 )t . Invertendo le relazioni (1.3), si hanno λ1 C − D λ−1 C + D , B= . A= λ1 + λ−1 λ1 + λ−1 Quindi le soluzioni del problema di Cauchy per A e B sono date da λ−1 + λ1 e−(λ1 +λ−1 )t 1 − e−(λ1 +λ−1 )t , B = A0 λ1 . λ1 + λ−1 λ1 + λ−1 = 0 (reazione irreversibile) si riottiene la soluzione già determinata in A = A0 Nel caso λ−1 precedenza. Per t → ∞, le soluzioni tendono alla configurazione d’equilibrio del sistema λ1 A0 λ−1 A0 , . (Ā, B̄) = λ1 + λ−1 λ1 + λ−1 Tale configurazione asintotica può essere individuata anche cercando gli equilibri del sistema (1.2) e imponendo la condizione A + B = A0 + B0 = A0 λ1 A = λ−1 B, A + B = A0 . Il procedimento di individuazione degli stati asintotici di un processo di reazione (chimico) richiedendo l’equilibrio dei reagenti e la conservazione della massa totale è anche detto stechiometria (dal greco: stoikheion, ”elemento”, e metria, ”misura”). L’equilibrio (Ā, B̄) viene raggiunto asintoticamente e la velocità di convergenza è esponenziale con tasso λ1 +λ−1 , cioè con tasso pari alla somma delle costanti cinetiche delle due reazioni in gioco. In particolare, per arrivare rapidamente all’equilibrio basta che una sola delle due reazioni sia sufficientemente rapida. Se si considera come condizione iniziale una perturbazione dell’equilibrio (Ā, B̄) (che quindi verifichi λ1 Ā = λ−1 B̄), cioè se, ad esempio, si considera una condizione iniziale del tipo A(0) = Ā + A1 , B(0) = B̄, dove A1 corrisponde alla quantità di specie A aggiunta al tempo iniziale alla configurazione d’equilibrio, il composto A, B evolverà fino ad arrivare ad un nuovo equilibrio (Ã, B̃), che può essere determinato 8 a priori imponendo la condizione d’equilibrio λ1 à = λ−1 B̃ e la conservazione della massa à + B̃ = Ā + B̄ + A1 . In chimica, questo meccanismo è codificato nel principio di Le Chatelier, che afferma che se un sistema chimico all’equilibrio subisce un cambiamento di concentrazione, temperatura o pressione totale, l’equilibrio si sposterà in maniera da minimizzare tale cambiamento. Nel caso di m specie diverse Ai , i = 1, . . . , m con transizioni definite da λji Ai i, j ∈ {1, . . . , m}, i 6= j, Aj λij per assegnati valori di λji ≥ 0, il sistema di equazioni differenziali corrispondente è dY = AY dt dove Y := (A1 , . . . , Am ) e A := − P i6=1 λ21 .. . λi1 − λ12 P ... λi2 . . . i6=2 .. .. . . Si tratta, quindi, di un sistema lineare a coefficienti costanti, e con la proprietà (notevole) di avere la somma degli elementi di ogni colonna nulla. Il sistema risulta simmetrico se e solo se tutte le reazioni sono simmetriche, ossia se e solo se λji = λij per ogni i, j (i 6= j). Torneremo più avanti sulle proprietà di questo sistema. 2. La legge di azione di massa In molti contesti, la transizione da uno stato ad un altro è causata dall’incontro tra elementi di tipo diverso. Nell’ambito delle reazioni chimiche, ad esempio, la formazione di due molecole di acqua H2 O può avvenire a partire dalla reazione tra due molecole di idrogeno H2 ed una di ossigeno O2 (2.1) 2 H2 + O2 −→ 2 H2 O Per tradurre in termini matematici una reazione del tipo A + B → C si ricorre alla seguente legge. Legge di azione di massa. (Guldberg e Waage, 1864). Il tasso di reazione di un reagente chimico è direttamente proporzionale al prodotto delle concentrazioni effettive delle molecole in gioco. Il nome ”azione di massa” esprime l’idea che un gran numero di unità elementari piccole (ad esempio, atomi o molecole) che, individualmente, agiscono in maniera 9 casuale, possono generare strutture coordinate quando vengano considerate nel loro insieme, seguendo le regole di un comportamento collettivo. La legge di azione di massa chiede che, per una reazione del tipo A + B → C, indicando con a, b e c le concentrazioni delle quantità A, B e C, rispettivamente, la velocità della formazione di C sia data da dc (2.2) = λab dt dove λ è una costante caratteristica della reazione che, come nei casi visti in precedenza, può dipendere da altre variabili (temperatura, pressione,. . . ). Deduzione euristica. La legge di azione di massa si basa sull’ipotesi che la probabilità di trovare una molecola di reagente in una piccola regione dello spazio considerato sia indipendente dalla probabilità di trovare nello stesso volume una molecola dell’altro reagente. Di conseguenza, la probabilità di trovare entrambe le molecole nella stessa regione è data dal prodotto delle due probabilità. Supponiamo di avere N caselle a disposizione e di avere nA particelle della classe A e nB particelle della classe B. Supponiamo inoltre che in ogni casella, possa trovarsi al più una particella A e al più una particella B e che l’interazione tra le due sostanze possa avvenire se e solo se sia A che B si trovano contemporaneamente in una stessa casella. La probabilità p(A) di trovare una particella A in una casella a caso è data da p(A) = nA /N e, analogamente, la probabilità p(B) di trovare una particella B in una casella a caso è data da p(B) = nB /N . Se si suppone che la distribuzione di A e di B sia indipendente, la probabilità di trovare nella stessa casella sia A che B è p(A)p(B). Il fatto che, nell’unità di tempo, A e B interagiscano dando luogo alla formazione di C, è anch’esso dato da un’opportuna probabilità λ (che, ad esempio, descrive la probabilità che le particelle si ”incontrino” nella posizione geometrica corretta che permette l’interazione). La probabilità di generare una singola particella di tipo C nella singola casella nell’unità tempo è λ p(A)p(B) e, quindi, il numero di particelle di tipo C generate in un intervallo di tempo ∆t, fluttuerà attorno al valore λ p(A)p(B) ∆t N : 1 ∆nC ≈ λ p(A) p(B) ∆t. N Dato che p(C) = nC /N è la probabilità di trovare nella singola casella un elemento di tipo C, passando al limite per ∆t → 0 si trova la relazione dp(C) ≈ λ p(A) p(B). dt 10 Quando il numero di elementi in gioco è sufficientemente grande (ma sempre piccolo rispetto al numero di caselle N ), per la legge dei grandi numeri, è possibile ”confondere” le probabilità p(A), p(B) e p(C) delle singole specie con le effettive concentrazioni a, b e c delle stesse, ottenendo in questo modo l’equazione (2.2). Il passaggio è quindi lecito nel caso in cui il numero degli elementi in gioco sia estremamente grande. Nel caso delle reazioni chimiche, ad esempio, ci si trova a lavorare con un numero di moli dell’ordine di 1 delle date molecole. Ogni mole corrisponde a un numero di molecole pari al numero di Avogadro, che è approssimativamente pari a 6 × 1023 . In questo caso, quindi, l’approssimazione è lecita. In contesti diversi (ad esempio, nella dinamica di popolazioni) il numero di esemplari è molto più ridotto e l’applicazione della legge di azione di massa è più opinabile. Applicando la legge di azione di massa, il diagramma λ A+B −→ C viene tradotto nel sistema di equazioni differenziali per le corrispondenti concentrazioni (2.3) da = −λ a b, dt db = −λ a b, dt dc = λ a b, dt che, a differenza dei casi esplorati in precedenza, è nonlineare. Esempio 2.1. L’Etil-t-butil etere (leggasi Etil-terziar-butil etere), o ETBE, formula chimica C6 H14 O, è un composto organico che viene utilizzato per arricchire la benzina di ossigeno e ridurre, in fase di combustione, le emissioni di di monossido di carbonio e di idrocarburi incombusti. L’ETBE viene sintetizzato a partire dall’isobutene, C4 H8 , e dall’etanolo, C2 H6 O. La reazione chimica corrispondente è descritta da C4 H8 + C2 H6 O −→ C6 H14 O Indicando con a, b, c le concentrazioni di C4 H8 , C2 H6 O e C6 H14 O, e supponendo valida la legge di azione di massa, la dinamica della reazione è descritta dal sistema (2.3). Supponendo di conoscere i dati iniziali (a0 , b0 , c0 ) della reazione, il sistema (2.3) fornisce una soluzione che converge ad un equilibrio? E, in caso affermativo, quale? Uguagliando a zero i secondi membri di (2.3), si ottiene una famiglia di punti 11 stazionari data da {(a, b, c) : a = 0 oppure b = 0}. Per determinare il comportamento asintotico del sistema nonlineare, occorre utilizzare le proprietà di conservazione dello stesso. Precisamente si ha d (a + c) = 0, e dt da cui segue a + c = C1 ∈ R d (b + c) = 0, dt b + c = C2 ∈ R. e Supponendo, per semplicità, c0 = 0, si ottiengono le relazioni a = a0 − c e b = b0 − c. Quindi, la concentrazione c è soluzione del problema di Cauchy dc = λ (a0 − c) (b0 − c), c(0) = 0. dt Quindi c → min{a0 , b0 } per t → +∞. Nel caso in cui due o più degli elementi in gioco a sinistra della reazione coincidano, nelle equazioni differenziali compaiono delle potenze. Ad esempio, la reazione tra 2 molecole di idrogeno H2 (specie A) con una di ossigeno O2 (specie B) che genera una molecola d’acqua H2 O (specie C) si può rappresentare tramite lo schema λ 2A + B −→ 2C e, interpretando 2A + B come A + A + B, e 2 C come C + C, si ottiene, grazie alla legge di azione di massa, il sistema db da = −2λ a2 b, = −λ a2 b, (2.4) dt dt Più in generale, uno schema del tipo dc = 2λ a2 b. dt λ mA + nB −→ pC + qE si traduce nel sistema di equazioni differenziali ordinarie da db dc = −m λ am bn , = −n λ am bn , = p λ a m bn , dt dt dt che è di tipo nonlineare. de = q λ a m bn , dt Esempio 2.2. L’alluminio Al reagisce con l’ossigeno O2 formando l’ossido d’alluminio (o allumina) Al2 O3 . Nella forma minerale è noto come corindone e comprende tra le sue varietà il rubino e lo zaffiro (la colorazione di queste pietre è determinata dalla presenza di inclusioni di altri materiali). Ad un primo approccio superficiale, si sarebbe tentati di scrivere una reazione del tipo Al + O2 −→ Al2 O3 12 In questa maniera, però la reazione non risulta bilanciata, nel senso che il numero di atomi presenti a sinistra non coincide con quelli presenti a destra. La versione Figura 1. Alluminio ed ossigeno che formano l’ossido di alluminio. bilanciata della reazione è 4 Al + 3 O2 −→ 2 Al2 O3 , che corrisponde, supponendo che la reazione sia regolata dalla legge di azione di massa, al sistema di equazioni differenziali ordinarie da db dc = −4 λ a4 b3 , = −3 λ a4 b3 , = 2 λ a4 b3 dt dt dt dove a indica la concentrazione di alluminio Al, b quella di molecole di ossigeno O2 e c quella di allumina Al2 O3 . L’ossido di alluminio è un materiale molto utilizzato in elettronica e meccanica. Per le sue ottime proprietà di biocompatibilità, viene utilizzato in medicina dato che non presenta fenomeni di rigetto quando è a contatto con tessuti viventi. Esempio 2.3. Il monossido di azoto N O è un gas incolore che reagisce in maniera spontanea con l’ossigeno O2 producendo diossido di azoto N O2 , secondo la reazione 2 N O + O2 −→ 2 N O2 . Indicando con a, b, c le concentrazioni di N O, O2 , N O2 , la reazione è descritta da (2.4). Il parametro cinetico della reazione a 25◦ C, è stato misurato sperimentalente ed è circa pari a λ = 7.13 × 10−3 `2 mol−2 s−1 . A differenza del monossido di azoto, il diossido assorbe la radiazione visibile ed è responsabile della foschia presente sopra le grandi città. In generale, una singola reazione chimica si decompone in una sequenza di sottoreazioni con produzione di specie intermediarie e transitorie. La legge di azione di massa descrive una reazione elementare, cioè una reazione che non passi intermedi. Esempio 2.4. La combustione di metano CH4 a causa della presenza di ossigeno O2 determina la produzione di biossido di carbonio CO2 (detto anche diossido di carbonio o anidride carbonica), acqua H2 O e calore. La reazione avviene in più 13 passi consecutivi, a cui partecipano anche monossido di carbonio CO (detto anche ossido di carbonio o ossido carbonico) e molecole di idrogeno H2 . Lo schema delle reazioni è CH4 + O2 −→ C O + H2 + H2 O 2 H2 + O2 −→ 2 H2 O 2 CO + O2 −→ 2 C O2 Indicando con x1 , x2 , x3 , x4 , x5 le concentrazioni di CH4 , O2 , CO, H2 , H2 O e CO2 , supponendo che le singole reazioni siano elementari e descritte dalla legge di azione di massa, il corrispondente sistema di equazioni differenziali è dx1 dx2 = −λ1 x1 x2 , = −λ1 x1 x2 − λ2 x2 x24 − λ3 x2 x23 , dt dt dx3 dx4 = λ1 x1 x2 − 2 λ3 x2 x23 , = λ1 x1 x2 − 2 λ2 x2 x24 , dt dt dx5 dx6 = λ1 x1 x2 + 2 λ2 x2 x24 , = 2 λ3 x2 x23 , dt dt Il metano fu isolato da Alessandro Volta (1745–1827) nel periodo tra il 1776 e il 1778, nell’ambito degli studi di gas presenti nella palude dellisolino Partegora, nel Lago Maggiore. Per questo motivo, il metano viene anche detto gas di palude. Reazioni reversibili. Nel caso di reazioni reversibili, se si suppone che i processi di associazione/dissociazione siano indipendenti, le corrispondenti equazioni differenziali si ottengono semplicemente sommando i contributi di ciascuna reazione. Il caso più semplice è quello descritto dal diagramma λ1 A+B C λ−1 Applicando la legge di azione di massa, questo si traduce nelle equazioni seguenti per le concentrazioni a, b e c da db dc (2.5) = −λ1 a b + λ−1 c, = −λ1 a b + λ−1 c, = λ1 a b − λ−1 c. dt dt dt Consideriamo il problema di Cauchy per il sistema (2.5) determinato dalle condizioni iniziali (2.6) a(0) = a0 , b(0) = b0 , c(0) = 0. Dato che d d (a + c) = (b + c) = 0, dt dt le quantità a + c e b + c sono conservate dal sistema. Quindi a + c = a0 e b + c = b0 . Ricavando da queste relazioni a e b in funzione di c ed inserendo nell’ultima equazione 14 di (2.5) si ottiene un problema di Cauchy per la sola variabile c dc = λ1 a0 b0 − [λ1 (a0 + b0 ) + λ−1 ] c + λ1 c2 , dt c(0) = 0. L’equazione differenziale è a variabili separabili e può essere risolta esplicitamente a patto di essere disposti a svolgere un certo numero di conti... Quanti e quali sono gli equilibri dell’equazione? Si tratta di equilibri stabili? Esempio 2.5. L’ammoniaca N H3 viene sintetizzata in laboratorio con il processo di Haber–Bosch, che si basa sulla reazione reversibile λ1 3 H2 + N2 2 N H3 λ−1 Modificando pressione o temperatura i valori di λ1 e λ−1 cambiano, e, di conseguenza, è possibile aumentare l’effetto di uno o dell’altro dei processi, a seconda della necessità. 3. Reti di reazioni lineari Passiamo ora ad esplorare in maggiore dettaglio le proprietà di una famiglia di reazioni che si traducono in equazioni differenziali come illustrato nelle pagine precedenti. Emergono subito alcune questioni naturali: fissato il sistema di reazioni chimiche, – esistono equilibri positivi? e, in caso affermativo, quanti sono? – qual è la loro stabilità? Il problema è interessante già nel caso delle transizioni pure, in cui il sistema di equazioni differenziali risulta essere lineare. In questo caso, ricorrendo ad un certo numero di nozioni e di risultati dell’algebra delle matrici, si riesce a dare una descrizione pressoché completa del problema. Consideriamo le specie X 1 , . . . , X m con concentrazioni relative x1 , . . . , xm . Sia λi→j = λji ≥ 0 il parametro di transizione dallo stato i allo stato j. Il caso λ = 0 corrisponde al caso di transizione assente. Il modello è descritto da un sistema lineare di equazioni differenziali X X dxi =− λij xj λji xi + dt j6=i j6=i i = 1, . . . , m. 15 ovvero, ponendo x := (x1 , . . . , xm ), (3.1) dx = Λx dt dove Λ := − P i6=1 λ21 .. . λi1 − λ12 P ... λi2 . . . i6=2 .. .. . . La matrice Λ ha alcune proprietà rilevanti, di cui la prima salta all’occhio: la somma degli elementi di ogni colonna è nulla. Di conseguenza, sommando le equazioni rispetto all’indice i si ottiene ! m m X m X X X X j X d X i j i λ i xi + λij xj = 0, x =− λi x + λij xj = − dt i=1 i=1 j6=i i=1 j6=i i,j, j6=i i,j, i6=j che indica che la somma delle concentrazioni si conserva nel tempo. In altre parole, con Antoine Lavoisier (considerato il padre della chimica moderna), “Rien ne se perd, rien ne se crée, tout se transforme.” Gli equilibri del sistema (3.1) sono tutti e soli gli elementi del nucleo della trasformazione A che ha determinante nullo. La stabilità di tali equilibri è collegata in maniera diretta agli autovalori della matrice stessa. Per localizzarli, è possibile ricorrere al criterio seguente. Teorema 3.1 (Geršgorin). Data la matrice A = (aji ) ∈ Cm×m , siano X j |ai | i = 1, . . . , m. ri := j6=i Allora tutti gli autovalori della matrice A sono contenuti nella regione di Geršgorin G(A) := m [ {z ∈ C : |z − aii | ≤ ri } i=1 dove i dischi {z ∈ C : |z − aii | ≤ ri } sono detti dischi di Geršgorin. Nel caso banale di una matrice diagonale, i raggi ri sono tutti nulli e, di conseguenza, la regione G(A) coincide con l’insieme degli autovalori. Il Teorema 3.1 considera il caso di una matrice qualsiasi vista come perturbazione della matrice diagonale diag (aii ). La somma dei moduli degli elementi della colonna controlla l’allontanamento massimo di un autovalore dal valore non perturbato. Si noti che, dato che gli autovalori di una matrice e della sua trasposta coincidono, il risultato vale anche nel caso in cui i valori dei raggi dei dischi di Geršgorin si calcolino sommando i moduli degli elementi di riga, anziché di colonna. 16 Nel caso della matrice Λ definita in (3.1), i dischi di Geršgorin sono dati da X j {z ∈ C : |z − ri | ≤ ri } dove ri = λi . j6=1 Si tratta, quindi, di dischi contenuti nel semipiano {z : Re z ≤ 0}, con centro sull’asse reale, e passanti per l’origine. In particolare, tutti gli autovalori della matrice hanno parte reale non-negativa. Tale condizione non permette di concludere nulla né sul numero dei punti di equilibrio, né sulla loro eventuale stabilità. Occorrono informazioni aggiuntive sulla molteplicità algebria e geometrica dell’autovalore 0. Per questo motivo, introduciamo un altro concetto dell’algebra delle matrici. Definizione 3.2. Una matrice A = (aji ) ∈ Rm×m è una matrice positiva se tutti i suoi elementi sono positivi, i.e. aji > 0 per ogni i, j. Analogamente, essa è una matrice non-negativa se tutti i suoi elementi sono non-negativi, i.e. aji ≥ 0 per ogni i, j. La matrice Λ non è positiva visto che gli elementi sulla diagonale principale sono tutti negativi. Per ottenere una matrice non-negativa, basta aggiungere un multiplo opportuno della matrice identità. Nel seguito, indichiamo con κ > 0 un numero reale tale che la matrice Λ + κ I è positiva (cioè κ è strettamente maggiore del massimo dei moduli degli elementi della diagonale principale di Λ). Inoltre, indicati con σ(A) lo spettro della matrice A, cioè l’insieme dei suoi autovalori, e con ρ(A) il raggio spettrale, definito da ρ(A) := sup {|λ| : λ ∈ σ(A)} , dato che i dischi di Grišgorin della matrice Λ + κ I sono traslazioni di lunghezza κ dei dischi della matrice Λ, si deduce che ρ(Λ + κ I) = κ e che κ è un autovalore della matrice. La matrice Λ + κ I sarà positiva solo nel caso in cui si abbia λji > 0 per ogni i, j, cioè nel caso in cui una qualsiasi specie può avere una transizione verso una qualsiasi altra. Quando si lavora con matrici positive si può ricorrere al Teorema di Perron. Teorema 3.3 (Perron, versione semplificata). Sia A ∈ Rm×m una matrice positiva. Allora valgono le seguenti affermazioni (a) esiste un vettore x = (x1 , . . . , xm ), con xi > 0 per ogni i tale che Ax = ρ(A) x; (b) ρ(A) ha molteplicità algebrica (e quindi geometrica) pari a 1. Quindi, nel caso in cui gli elementi λji siano tutti strettamente positivi, si può utilizzare il fatto che la matrice Λ + κ I è positiva. Dato che: – si ha σ(Λ + κ I) = σ(Λ) + κ; 17 – le matrici Λ e Λ + κ I hanno gli stessi autovettori; – le molteplicità algebriche e geometriche di autovalori corrispondenti restano le stesse, nel caso in cui tutti i valori λji siano strettamente positivi, il sistema ammette uno spazio uni-dimensionale V0 , individuato da un vettore x̂, unitario e con coordinate tutte positive che comprende tutti i punti di equilibrio del sistema. Data la condizione iniziale m x(0) = x0 = (x10 , . . . , xm 0 ) ∈ R , l’orbita x = x(t; x0 ) determinata da (3.1) è interamente contenuta nel piano π : m X i=1 i x = m X xi0 . i=1 In tale piano, è presente un unico punto di equilibrio x̄ = (x̄1 , . . . , x̄m ) ∈ V0 ∩ π, che risulta essere globalmente attrattivo (con velocità esponenziale di decadimento delle perturbazioni). La richiesta λji > 0 indica che un qualsiasi individuo di una qualsiasi specie Xi ha la possibilità di effettuare una transizione verso una qualsiasi altra specie Xj . Se il valore λji è molto piccolo, la probabilità di un tale evento è molto piccola; ma la richiesta di stretta positività si traduce nel fatto che tale eventualità è comunque possibile. Nei casi realistici, si è ben lontani da una situazione di questo genere e, pertanto, il risultato appena descritto non è per nulla soddisfacente. Come detto in precedenza, per κ sufficientemente grande, la matrice Λ + κI è una matrice non-negativa. In generale, il Teorema di Perron non vale per matrici non-negative. Per determinarne una estensione, occorre introdurre un’altra serie di concetti relativi all’algebra della matrici. Definizione 3.4. i. Una matrice di permutazione P ∈ Rm×m è una matrice che ha elementi pij pari a 0 o a 1 e che in ogni riga e in ogni colonna compare una ed una sola volta il valore 1. ii. Una matrice A ∈ Rm×m è riducibile se m = 1 e A = O o se m ≥ 2 ed esiste una matrice di permutazione P ∈ Rm×m ed un intero r con 1 ≤ r ≤ n − 1 tale che B C T (3.2) P AP = 0 D con B ∈ Rr×r , C ∈ Rr×(n−r) , 0 ∈ R(n−r)×r , D ∈ R(n−1)×(n−r) . iii. Una matrice A ∈ Rm×m è irriducibile se non è riducibile. 18 Una matrice di permutazione è sempre unitaria (quindi ortogonale) e, quindi, P T = P −1 . Il caso più semplice (diverso dalla matrice identità I) è dato dalla matrice che ha tutti elementi nondiagonali nulli tranne pij = 1 e pji = 1 per una fissata coppia i e j, il cui effetto è quello di scambiare la i−esima e la j−esima riga, e, contemporaneamente, la i−esima e la j−esima colonna. Si noti che, nella definizione di riducibilità non si fa riferimento alla presenza/assenza di elementi nulli delle matrici B, C, D. Il Teorema di Perron si estende al caso di matrici non-negative irriducibili. Teorema 3.5 (Perron–Frobenius, versione semplificata). Sia A ∈ Rm×m una matrice non-negativa ed irriducibile. Allora: (a) esiste un vettore x = (x1 , . . . , xm ), con xi > 0 per ogni i tale che Ax = ρ(A) x; (b) ρ(A) ha molteplicità algebrica (e quindi geometrica) pari a 1. Per applicare il Teorema di Perron–Frobenius alla matrice Λ + κ I, basta osservare che una matrice A è irriducibile se e solo se A+c I, (c ∈ R) (la verifica è immediata). Quindi, se la matrice Λ è irriducibile, è possibile ripetere quanto già descritto nel caso in cui λji > 0 per ogni i, j. Pertanto, vale il risultato seguente. Teorema 3.6 (Caso irriducibile). Se la rete di reazioni chimiche è tale che la matrice Λ è irriducibile per ogni dato iniziale x0 esiste un unico equilibrio x̄ ∈ ker Λ, tale che m X xi0 i=1 = m X x̄i . i=1 Inoltre, esistono C, α > 0 tali che x(·; x0 ) − x̄ ≤ C e−α t dove x(·; x0 ) indica la soluzione del problema di Cauchy per (3.1), x(·; x0 ) = x0 . Esempio 3.7. Nel caso di tre specie A, B, C con concentrazioni a, b, c, a meno di permutazioni dei nomi delle specie, esistono 5 casi irriducibili diversi: 1: A→B→C→A; 2: ABC; 4: ABC→A; 3: AB→C→A; 5: ABCA. Supponendo che i parametri λij siano sempre pari a 0 o ad 1, i 5 casi corrispondono alle seguenti matrici Λi , i = 1, . . . , 5, −1 0 +1 −1 +1 0 Λ1 = +1 −1 0 , Λ2 = +1 −2 +1 , 0 +1 −1 0 +1 −1 −1 +1 +1 Λ3 = +1 −2 0 , 0 +1 −1 19 −1 +1 +1 Λ4 = +1 −2 +1 , 0 +1 −2 −2 +1 +1 Λ5 = +1 −2 +1 . +1 +1 −2 Lo stato asintotico (ā, b̄, c̄) determinato dalla condizione iniziale (a0 , b0 , c0 ) verifica le due condizioni seguenti ā + b̄ + c̄ = a0 + b0 + c0 =: m0 (ā, b̄, c̄) ∈ ker Λi . e Conti alla mano, i valori ā, b̄, c̄ sono dati da casi 1,2,5 : ā = b̄ = c̄ = 31 m0 ; caso 3 : ā = 21 m0 , b̄ = c̄ = 14 m0 ; caso 4 : ā = 21 m0 , b̄ = 13 m0 , c̄ = 16 m0 . A differenza della classificazione dei cinque casi irriducibili, l’espressione esplicita delle configurazioni asintotico non è più la stessa nel caso in cui i valori λji siano diversi da 0 e 1. Esercizio 3.8. Una voce di corridoio sostiene che, nei cinque casi appena esplorati, il valore α descritto nell’enunciato del Teorema 3.6 è approsimativamente dato da α1 = 1.5, α2 = 1, α3 = −2, α4 = −2, α5 = −3. Si tratta di una voce affidabile? Esistono caratterizzazione dell’irriducibilità in termini di altre proprietà equivalenti (si veda [5], Teorema 6.2.24). Qui, diamo qualche cenno solamente alla traduzione in termini di grafi. Definizione 3.9. Un grafo orientato G è una coppia (V, A), dove V = {X1 , . . . , Xm } è l’insieme dei nodi (o vertici) e A è l’insieme degli archi orientati che connettono i nodi del grafo. Un grafo orientato G è fortemente connesso se tra ogni coppia di nodi distinti Xi , Xj in G, esiste un cammino orientato che parte in Xi e arriva in Xj . Nel contesto delle reti di reazioni chimiche lineari, i nodi del grafo corrispondono alle diverse specie e i cammini orientati sono codificati dalle regole di transizione. A livello di grafo, l’unica cosa sigificativa del parametro λ della singola transizione è il suo segno, ovvero se sia o non sia nullo. Quindi, la struttura del grafo orientato di una specifica rete di reazioni non cambia se ad ogni valore λ 6= 0 si sostituisce il valore 1. Definizione 3.10. Il grafo orientato della matrice A = (aji ) ∈ Rm×m , indicato con G(A), è il grafo orientato sugli m nodi X1 , . . . , Xm con un arco orientato da Xi a Xj se e solo se aji 6= 0. 20 Possiamo enunciare il seguente risultato. Teorema 3.11. La matrice A è irriducibile se e solo se il suo grafo orientato G(A) è fortemente connesso. In termini di reazioni chimiche, il significato è chiaro. La matrice Λ risulta essere irriducibile se e solo se per ogni coppia di elementi Xi , Xj , i 6= j, esiste una catena di reazioni che permette ad elementi del tipo Xi di trasformarsi nello stato Xj . Ad esempio, la rete descritta da A B → C, dà luogo ad una matrice riducibile. Infatti, mentre non sono presenti cammini da C ad A, né da C a B. In effetti, la matrice Λ corrispondente è data da −1 +1 0 Λ1 = +1 −1 +1 , 0 0 −1 ha chiaramente una struttura del tipo (3.2) (con m = 3 e r = 2). Indaghiamo ora il caso in cui la matrice Λ sia riducibile. A meno di permutazioni delle coordinate x1 , . . . , xm , la struttura della matrice Λ è della forma (3.2). Nel caso in cui la matrice C sia identicamente nulla, la rete di reazioni considerata risulta essere composta da (almeno) due componenti distinte: quella relative alle specie X1 , . . . , Xr e quella relativa alle rimanenti specie. In questo caso, il grafo relativo alla rete di reazioni può essere separato in due (o più) sotto-grafi sconnessi tra loro. Vale la pena introdurre qualche nozione per precisare la situazione. Definizione 3.12. Dato un grafo G = (V, A), con vertici V = {X1 , . . . , Xm } e A archi, due vertici Xi e Xj si dicono connessi se esiste un cammino (non orientato) da Xi a Xj . La connessione definisce una classe di equivalenza nell’insieme dei vertici del grafo. I sottografi che contengono tutti e soli gli elementi di una classe si chiamano componenti connesse del grafo e il numero di componenti connesse si indica con γ(G). Se il grafo determinato da una rete di reazioni ha γ componenti connesse, a meno di permutazioni di righe e colonne, la matrice Λ si può scrivere nella forma Λ1 · · · 0 (3.3) Λ = ... . . . ... . 0 · · · Λγ 21 Ciascuno sottogruppo di reazioni, relativo ad una matrice Λj , può essere considerato in maniera indipendente dagli altri. Se ogni singolo sotto-gruppo risulta essere irriducibile, ci si può ridurre, mutatis mutandis, al Teorema 3.6. Resta da affrontare il caso in cui la rete di reazioni, che si può supporre connessa senza perdere di generalità, generi una matrice Λ della forma Λ1 C Λ= . 0 D con la matrice C non sia identicamente nulla. Le colonne della matrice D sono della forma t X j−1 j+1 i m λr+1 , . . . , λ , λ , λ , . . . , λ j j j j j i6=j dove la sommatoria è su tutti gli indici da 1 a m, j escluso. Dato che C è non nulla, esiste almeno un indice j per cui j−1 X i=r+1 λij + m X i=j+1 λij < X λr+1 . i i6=j Di conseguenza, il corrispondente disco di Geršgorin è interamente contenuto nel semipiano complesso {Re λ < 0}. Giunge a proposito il seguente criterio (vedi [5], Teoremi 6.2.8, 6.2.24). Proposizione 3.13. Data A ∈ Rm×m , sia λ ∈ σ(A) ∩ ∂G(A) dove G(A) indica la regione di Geršgorin della matrice A. Se A è irriducibile, ogni disco di Geršgorin passa per λ. Nel caso in cui la matrice D sia irriducibile, il punto λ = 0 non è contenuto in uno dei dischi di Geršgorin della matrice e, pertanto, la matrice D è invertibile. Il sistema (3.1) per la variabile x = (x1 , x2 ) ∈ Rr × Rm−r può essere riscritto come dx 1 = Λ1 x1 + C x2 , dt (3.4) dx 2 = Dx , 2 dt Se D è irriducibile, per quanto visto, tutti gli autovalori di D sono contenuti nel semispazio aperto {Re λ < 0}, e, di conseguenza, le soluzioni del sistema per l’incognita x2 tendono a 0 con velocità esponenziale. Il comportamento asintotico delle soluzioni del sistema (3.4) è descritto dal sistema ridotto dx1 = Λ1 x1 . dt 22 Nel caso in cui la matrice D sia riducibile, si può ragionare in maniera analoga e determinare una sotto-struttura di componenti che tendono a zero asintoticamente ed una dinamica asintotica descritta da un sistema ridotto di equazioni. Prima di passare al caso nonlineare, proviamo a sintetizzare quanto visto fin qui introducendo un indicatore significativo, relativo al sistema di reazioni: la differenza tra il numero m delle incognite e la somma tra il numero di relazioni di conservazione γ e il rango della matrice Λ. Definizione 3.14. Si chiama indice di difetto δ di una rete di reazioni, il numero δ =m−γ−r dove m è il numero di specie, γ il numero di componenti connesse del grafo corrispondente, r il rango della matrice Λ. La struttura (3.3), indica che esistono almeno γ relazioni di conservazione, indipendenti tra loro, che si ottengono sommando tutte le equazioni presenti in ciascuno sotto-gruppo di equazioni. Di conseguenza, il rango r della matrice Λ è sempre minore o uguale a m−γ, il difetto δ è sempre non-negativo. Il caso δ = 0 corrisponde al caso in cui il numero di condizioni bilancia esattamente il numero di incognite e, quindi, ci si aspetta un unico punto di equilibrio, asintoticamente stabile. Senza condizioni aggiuntive, tale punto di equilibrio potrebbe però avere coordinate nulle. Per recuperare la positività delle coordinate, occorre un’ipotesi collegata, in qualche forma, con la condizione di irriducibiltà. Definizione 3.15. Una rete di reazioni si dice reversibile se per ogni arco orientato da Xi a Xj esiste un arco orientato nel verso opposto, cioè da Xj a Xi . Una rete di reazioni si dice debolmente reversibile se per ogni cammino orientato da Xi a Xj esiste un cammino orientato nel verso opposto, cioè da Xj a Xi . Per una rete di reazioni con grafo connesso, la proprietà di debole reversibilità è equivalente all’irriducibilità della matrice Λ e quindi, grazie al Teorema 3.11, al fatto che il grafo della rete è fortemente connesso. Infatti, se il grafo è fortemente connesso, esiste un cammino orientato da Xi a Xj , per ogni scelta di i e j, e quindi la rete è debolmente reversibile. Viceversa, se la rete è debolmente reversibile e si suppone per assurdo che la matrice corrispondente può essere espressa nella forma (3.2), si vede facilmente che esistono percorsi da qualcuno degli elementi Xr+1 , . . . , Xm a qualcuno degli elementi X1 , . . . , Xr , ma non ne esiste nessuno nella direzione opposta. Possiamo quindi concludere enunciando il seguente risultato. 23 Teorema 3.16. Se l’indice di difetto δ è nullo e la rete è debolmente reversibile, il sistema di equazioni differenziali corrispondente ammette un’unico punto di equilibrio con coordinate tutte positive. Tale punto è asintoticamente stabile, con perturbazioni che decadono a velocità esponenziale. 4. Reti di reazioni nonlineari Il caso nonlineare è ben più complesso rispetto al caso lineare. Ad esempio, è ben noto che esistono sistemi definiti da funzioni polinomiali che generano dinamiche di tipo caotico (ad esempio, il famoso sistema di Lorenz). Nel caso di sistemi di reazioni, governate dalla legge di azione di massa, è ancora possibile estrapolare una sotto-classe di sistemi con proprietà dinamiche relativamente semplici. In questa Sezione, ci limiteremo a presentare il Teorema di difetto nullo, sviluppato in una serie di lavori di Feinberg e di Horn–Jackson (si vedano [1, 3, 4, 6]). Il punto di vista è il seguente: come individuare classi di reti di reazioni chimiche, che abbiano una struttura dell’insieme degli equilibri relativamente semplice? Più precisamente, vogliamo trovare condizioni sulla struttura della rete che garantiscano l’esistenza di un unico equilibrio positivo (cioè in cui tutte le concentrazioni delle specie in gioco siano strettamente positive) e che sia asintoticamente stabile, indipendentemente dal valore specifico delle costanti cinetiche. Cominciamo con l’analizzare un certo numero di esempi. Esempio 4.1. Consideriamo la rete di reazioni A + B C, C B, B + C A, che, modellizzata utilizzando la legge di azione di massa e supponendo tutti i parametri cinetici pari a 1 dà luogo al sistema di equazioni differenziali da = −a + c − ab + bc, dt db (4.1) = a − b + 2c − ab − bc, dt dc = a + b − 2c + ab − bc, dt dove a, b e c indicano le concentrazioni delle specie A, B e C. I punti di equilibrio verificano le condizioni −a + c − ab + bc = 0, a − b + 2c − ab − bc = 0, a + b − 2c + ab − bc = 0. 24 Sommando e sottraendo la seconda e la terza equazione, si ottengono le relazioni bc = a, ab = 2c − b. Inserendo nella prima equazione, si ricava b = c. Quindi, il sistema è equivalente alle tre equazioni b2 = a, ab = b, b=c che ha solo due soluzioni in {a, b, c ≥ 0}: O := (0, 0, 0), P := (1, 1, 1). La linearizzazione di (4.1) nel punto critico (ā, b̄, c̄) è descritta dalla matrice −1 − b̄ −ā + c̄ 1 + b̄ 1 − b̄ −1 − ā − c̄ 2 − b̄ , 1 + b̄ 1 + ā − c̄ −2 − b̄ da cui si deduce che il punto (0, 0, 0) è instabile, mentre il punto è asintoticamente stabile. Esempio 4.2. In [4], si considera la rete ε 3A 1 −→ ↑ A + 2B ↓1 ε 2A + B −→ 3B Il sistema di equazioni differenziali corrispondente è da = −2 ε a3 + a2 b − a b2 + 2 ε b3 , dt (4.2) db = 2 ε a3 − a2 b + a b2 − 2 ε b3 . dt Ponendo ξ = a/b, i punti critici sono individuati dalla relazione p(ξ) := 2 ε ξ 3 − ξ 2 + ξ − 2 ε = 0. Dato che il polinomio p = p(ξ) si fattorizza come 2 p(ξ) := 2 ε(ξ − 1)(ξ − 2 θ ξ + 1) 1 dove θ := 2 1 −1 , 2ε ci sono due situazioni possibili: – se θ2 < 1, p(ξ) = 0 se e solo se ξ = 1; ¯ ξ¯−1 } dove ξ¯ := θ + – se θ2 > 1, p(ξ) = 0 se e solo se ξ ∈ {1, ξ, √ θ2 − 1. Il sistema ammette quindi, nel caso θ2 > 1, che corrisponde a ε < 1/6, tre rette di punti di equilibri, tutte passanti per l’origine. Che tipo di stabilità hanno i corrispondenti punti di equilibrio? 25 Il primo esempio mostra un caso in cui il sistema nonlineare esibisce un unico punto di equilibrio con coordinate positive. Cosa succede modificando i parametri cinetici dell’equazione? Il secondo esempio esibisce un caso in cui la struttura dei punti di equilibrio dipende in maniera radicale dal valore dei parametri cinetici. In effetti, è possibile definire un indicatore, detto il difetto della rete di reazioni, che precisa la situazione: nel caso in cui il difetto sia nullo, indipendentemente dal valore specifico dei parametri cinetici, il sistema ammette un unico punto di equilibrio all’interno del cosiddetto sottospazio stoichiometrico e tale punto di equilibrio è asintoticamente stabile. Il primo dei due esempi mostrati rientra in tale categoria, il secondo no. Per precisare quanto detto, occorre introdurre delle notazioni. Date le specie 1 X , . . . , X n , con concentrazioni x = (x1 , . . . , xn ) battezziamo complessi Y 1 , . . . , Y m , le combinazioni lineari (formali) che compaiono nella rete di reazioni. I coefficienti di questa combinazione costituiscono un vettore bj ∈ Rn , j = 1, . . . , m. Per rappresentare la rete, come nel caso delle reazioni lineari, è utile introdurre un grafo i cui vertici sono i complessi e gli archi orientati sono determinati dalla rete stessa. Ogni arco è etichettato con il corrispondente coefficiente λ che descrive la rapidità della reazione. Se sono presenti m complessi distinti, i coefficienti λ costituiscono gli elementi di una matrice Λ = (λij ) ∈ Rm×m . Il sistema di equazioni differenziali determinato dalla legge di azione di massa, si può scrivere nella forma (4.3) m m m X dx X X i 1 b1j n bnj = bi λj (x ) · · · (x ) − bj λij (x1 )b1j · · · (xn )bnj dt i=1 j=1 i,j=1 = m X (bi − bj )λij (x1 )b1j · · · (xn )bnj i,j=1 dove bj = (b11 , . . . , bnj ) e le sommatorie sono calcolate per i 6= j. Esempio 4.3. La reazione reversibile λ1 A+B C λ−1 corrisponde al caso di tre specie, A, B, C, e due complessi Y 1 := A + B e Y 2 := C, che definiscono i due vettori b1 = (1, 1, 0) e b2 = (0, 0, 1). La matrice Λ è data da ∗ λ12 ∗ λ−1 Λ= = . λ21 ∗ λ1 ∗ 26 Perciò, indicate con a, b, c le concentrazioni di A, B, C, il a −1 1 d b −1 λ1 a b + 1 λ−1 c = = dt c 1 −1 sistema di equazioni è −λ1 a b + λ−1 c −λ1 a b + λ−1 c , λ1 a b − λ−1 c come già dedotto in precedenza. Esempio 4.4. Consideriamo la rete di reazioni relativa alla combustione del metano e descritta nell’Esempio 2.4. In questo caso, le specie sono sei: X 1 = CH4 , X 2 = O2 , X 3 = CO, X 4 = H2 , X 5 = H2 O, X 6 = CO2 i complessi sono sei Y 1 = CH4 + O2 , Y 2 = C O + H2 + H2 O, Y 3 = 2 H2 + O2 , Y 4 = 2 H2 O, Y 5 = 2 CO + O2 , Y 6 = 2 C O2 che corrispondono ai vettori b1 = (1, 1, 0, 0, 0, 0), b2 = (0, 0, 1, 1, 1, 0), b3 = (0, 1, 0, 2, 0, 0), b4 = (0, 0, 0, 0, 2, 0), b5 = (0, 1, 2, 0, 0, 0), b6 = (0, 0, 0, 0, 0, 2). e, infine, la matrice Λ è data da Λ= ∗ λ1 0 0 0 0 0 0 ∗ 0 0 ∗ 0 λ2 0 0 0 0 0 0 0 0 0 0 ∗ 0 0 ∗ 0 λ3 0 0 0 0 0 ∗ Di conseguenza, il sistema è dato da dx = (b2 − b1 )λ1 x1 x2 + (b4 − b3 )λ2 x2 x24 + (b6 − b5 )λ3 x2 x23 dt coerentemente con quanto visto in precedenza. Un ruolo fondamentale è giocato dal sottospazio S generato da tutte le differenze bi − bj , detto sottospazio stoichiometrico, che è invariante per il sistema di equazioni differenziali (4.3). La dimensione di tale sottospazio, indicata con r, è detta rango della rete di reazioni chimiche. Esempio 4.5. Consideriamo la rete di reazioni definita da A 2B, A + C D, D → B, B → A + C, In questo caso ci sono 4 specie e 5 complessi: X1 = A, Y1 = A, X2 = B, Y2 = 2B, X3 = C, Y3 = A + C, X4 = D Y4 = D, Y5 = B 27 che corrispondono ai vettori b1 = (1, 0, 0, 0), b2 = (0, 2, 0, 0), b4 = (0, 0, 0, 1), b5 = (0, 1, 0, 0). b3 = (1, 0, 1, 0), Il sottospazio stochiometrico è generato da b2 − b1 = (−1, 2, 0, 0), b4 − b3 = (−1, 0, −1, 1), b5 − b4 = (0, 1, 0, −1), b3 − b5 = (1, −1, 1, 0), cioè S := span {(−1, 2, 0, 0), (−1, 0, −1, 1), (0, 1, 0, −1)} e il rango della rete è r = 3. L’ultimo ingrediente necessario per la prossima definizione è il numero γ di componenti connesse del grafo definito dalla rete di reazioni, dove, questa volta, i nodi del grafo sono chiaramente dati dai complessi Yi . Definizione 4.6. Si chiama indice di difetto δ di una rete di reazioni il numero (intero non negativo) δ := m − γ − r dove m è il numero di complessi, γ il numero di componenti connesse del grafo definito dalla rete e r è il rango della rete. Per reti con indice nullo, vale un risultato del tutto analogo a quello enunciato nel Teorema 3.16. Teorema 4.7. Se l’indice di difetto δ è nullo e la rete è debolmente reversibile, il sistema di equazioni differenziali corrispondente ammette un’unico punto di equilibrio con coordinate tutte positive. Tale punto è asintoticamente stabile. Per maggiori dettagli, consultare [2]. Riferimenti bibliografici [1] Feinberg M., Complex balancing in general kinetic systems, Arch. Rational Mech. Anal. 49 (1972/73), 187–194. [2] Feinberg M., The existence and uniqueness of steady states for a class of chemical reaction networks, Arch. Rational Mech. Anal. 132 (1995), no. 4, 311–370. [3] Horn F., Necessary and sufficient conditions for complex balancing in chemical kinetics, Arch. Rational Mech. Anal. 49 (1972/73), 172–186. [4] Horn F., Jackson R., General mass action kinetics, Arch. Rational Mech. Anal. 47 (1972), 81–116. [5] Horn R.A., Johnson C.R., “Matrix analysis”, Corrected reprint of the 1985 original. Cambridge University Press, Cambridge, 1990. [6] Sontag E.D., Structure and Stability of Certain Chemical Networks and Applications to the Kinetic Proofreading Model of T-Cell Receptor Signal Transduction, IEEE Trans. Automatic Control 46 (2001) no.7, 1028–1047.