1. Reti di reazioni chimiche ed equazioni differenziali

Corso di Modelli Analitici per le Applicazioni
1. Reti di reazioni chimiche ed equazioni differenziali
Corrado MASCIA & Eugenio MONTEFUSCO
[email protected], [email protected]
Dipartimento di Matematica “G. Castelnuovo”,
Sapienza – Università di Roma
March 5, 2010
L’uso del linguaggio delle equazioni differenziali per descrivere quantitativamente
l’evoluzione di reazioni chimiche è generalmente attibuito allo scienziato tedesco
Ludwig Ferdinand Wilhelmy (1812–1864) che pubblicò, nel 1850, un lavoro relativo
alla conversione di una soluzione di zucchero in una mistura di fruttosio e glucosio,
a causa della presenza di acidi. Nel suo lavoro, indicata con Z la concentrazione di
zucchero e con S la concentrazione di acido, Wilhelmy propose un’equazione della
forma
dZ
= −M S Z,
dt
dove il coefficiente M è da determinare, e mostrò, attraverso una serie di esperimenti,
che tale coefficiente è sostanzialmente costante (con piccole variazioni che dipendono
da variazioni di temperatura). Il lavoro di Wilhelmy non fu particolarmente considerato dai contemporanei e lo sviluppo in grande scala della cinetica chimica fu
determinato dai contributi di Jacobus Henricus van ‘t Hoff (premio Nobel per la
Chimica nel 1901) e di Svante Arrhenius (premio Nobel per la Chimica nel 1903).
La descrizione tramite equazioni differenziali di reazioni chimiche si basa sul punto
di vista seguente. Si suppone che le specie chimiche in gioco siano descrivibili attraverso una variabile, dipendente dal tempo, che ne descrive la concentrazione.
Nella versione più semplice, si considera che la concentrazione sia indipendente dalla
posizione spaziale. Versioni più raffinate, che tengono conto anche della distribuzione
spaziale, danno luogo ad equazioni alle derivate parziali.
I singoli elementi di una specie possono trasformarsi, divenendo elementi di un’altra
specie, sia in maniera autonoma che a causa di interazioni con altri elementi presenti nella mistura. Il primo caso viene usualmente descritto attraverso una legge di
reazione analoga a quella di Wilhelmy dando luogo a sistemi di equazioni differenziali lineari. Nel caso di interazione, invece, il riferimento classico è dato dalla legge
di azione di massa (dovuta, nella sua versione più completa, a Cato Maximilian
Guldberg e Peter Waage) che afferma che il tasso di reazione sia proporzionale al
2
prodotto delle concentrazioni dei reagenti e che, di conseguenza, determina sistemi
di equazioni nonlineari.
1. Transizione di una singola specie
La situazione più elementare nello studio dei processi di reazione è quella di un
trasformazione di una specie A in una specie B. Nel seguito indichiamo con A e
B sia le due specie che il numero di elementi di cui esse sono composte. Qui, con
”specie” si possono intendere oggetti di tipo diverso: atomi, molecole, composti
chimici, individui... In corrispondenza, la trasformazione da uno stato ad un altro
indica una trasformazione delle natura della specie: ad esempio, il decadimento di
sostanze radioattive, il passaggio dallo stato di malattia allo stato di guarigione...
Per una descrizione statistica di un gran numero di particelle di tipo A, occorre
conoscere la probabilità λ di passaggio dallo stato A allo stato B nell’unità di tempo.
La reazione viene allora indicata tramite lo schema
λ
A
−→
B
Il parametro λ viene detto costante cinetica della transizione. Supponendo che tutte
le particelle siano uguali e che la probabilità λ sia costante nel tempo, il numero di
particelle che nell’intervallo di tempo ∆t sono passate da A a B è dato, a meno di
fluttuazioni, dal valore λ A ∆t. Quindi
∆A ≈ −λ A ∆t.
Il segno negativo deriva dal fatto che la transizione da A a B corrisponde ad una
perdita di elementi di tipo A. La costante λ ha le dimensioni dell’inverso di un
tempo ed esprime la probabilità statistica di trasformazione nell’unità di tempo.
Per esempio, se λ = 0, 01 s−1 per una particolare specie radioattiva, allora ogni
atomo di tale specie ha una probabilità di 0,01 (cioè dell’1%) di decadere e una
probabilità 0,99 (cioè del 99%) di non decadere in un qualsiasi intervallo temporale
di durata di 1 s.
Nel caso di un gran numero di particelle di tipo A, grazie alla legge dei grandi numeri, le fluttuazioni attorno al valore descritto dalla distribuzione di probabilità tendono a zero e la precedente espressione approssimata può essere considerata esatta.
In altre parole, è lecito, per lo meno euristicamente, ”confondere” la distribuzione di
probabilità con il numero effettivo delle particelle, ottenendo al limite, le equazioni
3
differenziali
dA
dB
= −λA,
= λA
dt
dt
Le soluzioni di queste equazioni, con condizione iniziale A(0) = A0 e B(0) = 0 sono
A(t) = A0 e−λ t ,
B(t) = A0 (1 − e−λt ).
Dato che la transizione da A a B è puramente casuale, la vita effettiva di un elemento
della specie A può variare tra zero e infinito. La vita media, riferita ad un gran
numero di elementi della stessa specie, è invece una quantità ben definita.
Nell’intervallo di tempo [t, t + ∆t], circa λA(t)∆t elementi della specie A passano
allo stato B. Tutti questi elementi hanno una vita di durata approssimativamente
pari a t. Quindi, la somma totale L delle vite di tutti gli elementi di A si rappresenta
nella forma
Z
∞
Z
λ t A(t) dt = A0
L=
0
∞
−λt 0
t (−e
Z
) dt = A0
0
0
∞
e−λt dt =
A0
.
λ
Pertanto, la vita media τ è data da
τ :=
L
1
= .
A0
λ
La costante λ, quindi, è pari all’inverso del tempo di vita medio nello stato A.
Nello studio dei decadimenti radioattivi, un parametro utilizzato convenzionalmente è il tempo di dimezzamento, cioè il tempo T necessario per dimezzare il quantitiativo iniziale A0 della specie A. In formule, il valore T è determinato dalla
condizione
1
A0 e−λ T = A0 ,
2
da cui si deducono le relazioni
ln 2
T =
= τ ln 2
λ
dove λ e τ hanno lo stesso significato utilizzato in precedenza. Si noti che il tempo
di dimezzamento ed la metà della vita media sono due quantità ben diverse...
Dissociazione. Un’altra situazione tipica nell’ambito delle reazioni chimiche (e non
solo) è quella di una specie A che, spontaneamente, si dissocia in due parti B e C.
Supponendo che la dissociazione sia governata dal parametro cinetico λ, essa può
essere schematizzata con il diagramma
λ
A
−→
B+C
4
Il sistema di equazioni differenziali corrispondenti per le tre specie prende la forma
dA
= −λA,
dt
dB
= λ A,
dt
dC
= λ A.
dt
La situazione è sostanzialmente la stessa del caso considerato in precedenza. Si
noti che dalle equazioni del sistema si può dedurre che si conservano le quantità
A + B e A + C, separatamente, questo perché una frazione della specie A si dissocia
in B e tutta la parte restante passa in C, da cui segue una sorta di principio di
conservazione.
Legge di Arrhenius. Quando si considerano reazioni chimiche, è necessario tenere
conto anche della temperatura a cui tali reazioni avvengono. Una formula empirica,
molto utilizzata in letteratura, per descrivere la dipendenza della costante cinetica
λ di una reazione chimica dalla temperatura è data dall’equazione di Arrhenius:
(1.1)
λ(T ) = λ∞ e−E/RT ,
dove λ è la costante cinetica della reazione, T è la temperatura assoluta (in gradi
Kelvin), R è la costante dei gas ideali, λ∞ è un fattore di frequenza ed E è l’energia
di attivazione. La stessa relazione (1.1) viene chiamata relazione di Polanyi–Wigner,
I coefficienti λ∞ ed E dipendono, in generale, anch’essi dalla temperatura, ma
per escursioni termiche non molto ampie, essi rimangono sostanzialmente costanti.
Perciò, indicando con λ1 e λ2 le costanti cinetiche relative a due diverse temperature
T1 e T2 e utilizzando l’equazione di Arrhenius (1.1), si ottiene la relazione
λ2
E 1
1
ln
=
−
,
λ1
R T1 T2
che permette di calcolare la costante cinetica di reazione ad una certa temperatura se
è nota la costante per un’altra temperatura e l’energia di attivazione della reazione.
Ad esempio, nel caso di un’energia di attivazione pari a 50 kJ mol−1 , dato che la
costante dei gas R vale 8.31 J K −1 mol−1 , passando da 10◦ C a 30◦ C (ovvero da
T1 = 293◦ K a T2 = 303◦ K), si ha
λ2
E 1
1
= exp
−
= e0.68 = 1.97
λ1
R T1 T2
che indica un sostanziale raddoppiamento della costante cinetica λ dovuto all’innalzamento
della temperatura.
Alcune reazioni chimiche si accordano molto bene con l’equazione di Arrhenius:
ne riportiamo un paio con i relativi valori misurati sperimentalmente per il fattore
5
di frequenza λ∞ e l’energia di attivazione E
N2 O
N2 O5
−→
−→
N2 + O
2 N O + O2
λ∞ = 8 × 10−11 ,
E = 251 kJ mol−1 ,
λ∞ = 6 × 10−14 ,
E = 88 kJ mol−1 ,
Per semplicità di presentazione, in quel che segue, non porteremo attenzione alle
variazioni di temperatura e quindi non terremo conto delle variazioni per le costanti
cinetiche.
Transizioni a più passi. Il caso di una quantità osservata che subisce più trasformazioni una dopo l’altra, ciascuna delle quali con un suo proprio parametro cinetico,
è schematizzata da
λ2
λ1
A
−→
B
−→
C
con costanti di decadimento λ1 , λ2 , che, per semplicità, supponiamo diverse λ1 6= λ2 .
Procedendo analogamente a quanto fatto in precedenza, il processo si traduce nel
seguente sistema di equazioni differenziali ordinarie
dA
= −λ1 A,
dt
dB
= −λ2 B + λ1 A,
dt
dC
= λ2 B,
dt
con condizioni iniziali
A(0) = A0 ,
B(0) = C(0) = 0.
Le soluzioni sono date da
λ1
(e−λ1 t − e−λ2 t ),
λ2 − λ1
λ2
λ1
−λ1 t
−λ2 t
C(t) = A0 1 −
e
−
e
.
λ2 − λ1
λ1 − λ2
A(t) = A0 e−λ1 t ,
B(t) = A0
Analogamente è possibile trattare il caso di un decadimento con una successione più
numerosa di stati successivi.
Esempi tipici in questa categoria sono i decadimenti radioattivi. Consideriamo ad
esempio, il caso dell’Uranio-238. La sua catena di decadimenti, detta serie dell’Uranio
(o serie del Radio) è particolarmente lunga e si compone, in una versione leggermente
semplificata, di 14 passi. Saltando alcune configurazioni intermedie con tempo di
vita breve rispetto alle altre, la serie si semplifica in
λ1
238
U −→
λ2
234
Th −→
λ3
230
Th −→
λ4
226
Ra −→
206
Pb
6
(dove U=Uranio, Th=Torio, Ra=Radio, Pb=Piombo) con tempi di dimezzamento,
dati in anni, pari a
T1 = 4.5 × 109 ,
T2 = 2.4 × 105 ,
T3 = 7.7 × 104 ,
T4 = 1.6 × 103 ,
e, di conseguenza, con costanti cinetiche
λ1 = 1.5 × 10−10 ,
λ2 = 2.9 × 10−6 ,
λ3 = 9.0 × 10−6 ,
λ4 = 4.3 × 10−4 .
Un sotto ramo di questa serie è alla base della tecnica di datazione
210
Pb utiliz-
zato per individuare contraffazione nel campo della pittura (come nel caso dei falsi
Vermeer dipinti dall’olandese Han van Meegeren).
Esistono anche catene di decadimento più brevi. Tra queste, vale la pena ricordare
la catena del Carbonio-14, che è alla base della tecnica di datazione radiometrica
sviluppata dall’equipe di Willard Libby (premio Nobel per la Chimica nel 1960) e
colleghi, nel 1949.
I decadimenti nucleari vengono classicamente distinti in tre classi: decadimento
alfa, decadimento beta, decadimento gamma. Tali emissioni (in particolare le radiazioni gamma) sono in grado di provocare danni di diverso tipo sulle cellule, e
in particolare su DNA ed RNA. Ad esempio, nel caso l’incidente della centrale di
Cernobyl, avvenuto nel 1985, ebbe conseguenze catastrofiche a causa delle radiazioni
connesse con i decadimenti di Iodio-131 (tempo di dimezzamento di circa 8 giorni)
e di Cesio-137 (circa 30 anni).
Transizioni reversibili. Le situazioni descritte fin qui corrispondono a casi di
reazioni irreversibili: una volta che la transizione dallo stato A allo stato B è
avvenuta, non è più possibile tornare indietro. Nel caso di reazioni reversibili, si
deve tenere conto sia della possibilità di passaggio da A a B sia del passaggio da B
ad A. Supponendo che le probabilità di successo della transizione delle due reazioni
in gioco non si influenzino reciprocamente, la reazione reversibile può essere schematizzata con il diagramma
λ1
A
B
λ−1
Le corrispondenti equazioni differenziali costituiscono un sistema lineare a coefficienti costanti
dA
= −λ1 A + λ−1 B,
dt
a cui vanno associate le condizioni iniziali
(1.2)
A(0) = A0 ,
dB
= λ1 A − λ−1 B,
dt
B(0) = 0.
7
Il caso B(0) 6= 0 può essere trattato senza grandi modifiche.
Le variabili diagonali (ottenute calcolando gli autovettori della matrice dei coefficienti del sistema (1.2))
(1.3)
D := λ1 A − λ−1 B
C := A + B,
risolvono il sistema disaccoppiato
dC
dD
= 0,
= −(λ1 + λ−1 )D,
dt
dt
con condizioni iniziali C(0) = A0 , D(0) = λ1 A0 . Perciò
C(t) = A0 ,
D(t) = λ1 A0 e−(λ1 +λ−1 )t .
Invertendo le relazioni (1.3), si hanno
λ1 C − D
λ−1 C + D
,
B=
.
A=
λ1 + λ−1
λ1 + λ−1
Quindi le soluzioni del problema di Cauchy per A e B sono date da
λ−1 + λ1 e−(λ1 +λ−1 )t
1 − e−(λ1 +λ−1 )t
,
B = A0 λ1
.
λ1 + λ−1
λ1 + λ−1
= 0 (reazione irreversibile) si riottiene la soluzione già determinata in
A = A0
Nel caso λ−1
precedenza.
Per t → ∞, le soluzioni tendono alla configurazione d’equilibrio del sistema
λ1 A0
λ−1 A0
,
.
(Ā, B̄) =
λ1 + λ−1 λ1 + λ−1
Tale configurazione asintotica può essere individuata anche cercando gli equilibri del
sistema (1.2) e imponendo la condizione A + B = A0 + B0 = A0
λ1 A = λ−1 B,
A + B = A0 .
Il procedimento di individuazione degli stati asintotici di un processo di reazione
(chimico) richiedendo l’equilibrio dei reagenti e la conservazione della massa totale
è anche detto stechiometria (dal greco: stoikheion, ”elemento”, e metria, ”misura”).
L’equilibrio (Ā, B̄) viene raggiunto asintoticamente e la velocità di convergenza è
esponenziale con tasso λ1 +λ−1 , cioè con tasso pari alla somma delle costanti cinetiche
delle due reazioni in gioco. In particolare, per arrivare rapidamente all’equilibrio
basta che una sola delle due reazioni sia sufficientemente rapida.
Se si considera come condizione iniziale una perturbazione dell’equilibrio (Ā, B̄)
(che quindi verifichi λ1 Ā = λ−1 B̄), cioè se, ad esempio, si considera una condizione
iniziale del tipo A(0) = Ā + A1 , B(0) = B̄, dove A1 corrisponde alla quantità di
specie A aggiunta al tempo iniziale alla configurazione d’equilibrio, il composto A, B
evolverà fino ad arrivare ad un nuovo equilibrio (Ã, B̃), che può essere determinato
8
a priori imponendo la condizione d’equilibrio λ1 Ã = λ−1 B̃ e la conservazione della
massa à + B̃ = Ā + B̄ + A1 . In chimica, questo meccanismo è codificato nel
principio di Le Chatelier, che afferma che se un sistema chimico all’equilibrio subisce
un cambiamento di concentrazione, temperatura o pressione totale, l’equilibrio si
sposterà in maniera da minimizzare tale cambiamento.
Nel caso di m specie diverse Ai , i = 1, . . . , m con transizioni definite da
λji
Ai
i, j ∈ {1, . . . , m}, i 6= j,
Aj
λij
per assegnati valori di λji ≥ 0, il sistema di equazioni differenziali corrispondente è
dY
= AY
dt
dove Y := (A1 , . . . , Am ) e



A := 

−
P
i6=1
λ21
..
.
λi1
−
λ12
P
...


λi2 . . . 

i6=2

..
..
.
.
Si tratta, quindi, di un sistema lineare a coefficienti costanti, e con la proprietà
(notevole) di avere la somma degli elementi di ogni colonna nulla. Il sistema risulta
simmetrico se e solo se tutte le reazioni sono simmetriche, ossia se e solo se λji = λij
per ogni i, j (i 6= j). Torneremo più avanti sulle proprietà di questo sistema.
2. La legge di azione di massa
In molti contesti, la transizione da uno stato ad un altro è causata dall’incontro
tra elementi di tipo diverso. Nell’ambito delle reazioni chimiche, ad esempio, la
formazione di due molecole di acqua H2 O può avvenire a partire dalla reazione tra
due molecole di idrogeno H2 ed una di ossigeno O2
(2.1)
2 H2 + O2
−→
2 H2 O
Per tradurre in termini matematici una reazione del tipo A + B → C si ricorre alla
seguente legge.
Legge di azione di massa. (Guldberg e Waage, 1864). Il tasso di reazione di un
reagente chimico è direttamente proporzionale al prodotto delle concentrazioni effettive delle molecole in gioco.
Il nome ”azione di massa” esprime l’idea che un gran numero di unità elementari
piccole (ad esempio, atomi o molecole) che, individualmente, agiscono in maniera
9
casuale, possono generare strutture coordinate quando vengano considerate nel loro
insieme, seguendo le regole di un comportamento collettivo. La legge di azione di
massa chiede che, per una reazione del tipo A + B → C, indicando con a, b e c le
concentrazioni delle quantità A, B e C, rispettivamente, la velocità della formazione
di C sia data da
dc
(2.2)
= λab
dt
dove λ è una costante caratteristica della reazione che, come nei casi visti in precedenza, può dipendere da altre variabili (temperatura, pressione,. . . ).
Deduzione euristica. La legge di azione di massa si basa sull’ipotesi che la probabilità di trovare una molecola di reagente in una piccola regione dello spazio considerato sia indipendente dalla probabilità di trovare nello stesso volume una molecola
dell’altro reagente. Di conseguenza, la probabilità di trovare entrambe le molecole
nella stessa regione è data dal prodotto delle due probabilità.
Supponiamo di avere N caselle a disposizione e di avere nA particelle della classe
A e nB particelle della classe B. Supponiamo inoltre che in ogni casella, possa
trovarsi al più una particella A e al più una particella B e che l’interazione tra le
due sostanze possa avvenire se e solo se sia A che B si trovano contemporaneamente
in una stessa casella.
La probabilità p(A) di trovare una particella A in una casella a caso è data da
p(A) = nA /N e, analogamente, la probabilità p(B) di trovare una particella B in
una casella a caso è data da p(B) = nB /N . Se si suppone che la distribuzione di A
e di B sia indipendente, la probabilità di trovare nella stessa casella sia A che B è
p(A)p(B).
Il fatto che, nell’unità di tempo, A e B interagiscano dando luogo alla formazione
di C, è anch’esso dato da un’opportuna probabilità λ (che, ad esempio, descrive
la probabilità che le particelle si ”incontrino” nella posizione geometrica corretta
che permette l’interazione). La probabilità di generare una singola particella di
tipo C nella singola casella nell’unità tempo è λ p(A)p(B) e, quindi, il numero di
particelle di tipo C generate in un intervallo di tempo ∆t, fluttuerà attorno al valore
λ p(A)p(B) ∆t N :
1
∆nC ≈ λ p(A) p(B) ∆t.
N
Dato che p(C) = nC /N è la probabilità di trovare nella singola casella un elemento
di tipo C, passando al limite per ∆t → 0 si trova la relazione
dp(C)
≈ λ p(A) p(B).
dt
10
Quando il numero di elementi in gioco è sufficientemente grande (ma sempre piccolo rispetto al numero di caselle N ), per la legge dei grandi numeri, è possibile
”confondere” le probabilità p(A), p(B) e p(C) delle singole specie con le effettive
concentrazioni a, b e c delle stesse, ottenendo in questo modo l’equazione (2.2). Il
passaggio è quindi lecito nel caso in cui il numero degli elementi in gioco sia estremamente grande. Nel caso delle reazioni chimiche, ad esempio, ci si trova a lavorare
con un numero di moli dell’ordine di 1 delle date molecole. Ogni mole corrisponde a
un numero di molecole pari al numero di Avogadro, che è approssimativamente pari
a 6 × 1023 . In questo caso, quindi, l’approssimazione è lecita. In contesti diversi (ad
esempio, nella dinamica di popolazioni) il numero di esemplari è molto più ridotto
e l’applicazione della legge di azione di massa è più opinabile.
Applicando la legge di azione di massa, il diagramma
λ
A+B
−→
C
viene tradotto nel sistema di equazioni differenziali per le corrispondenti concentrazioni
(2.3)
da
= −λ a b,
dt
db
= −λ a b,
dt
dc
= λ a b,
dt
che, a differenza dei casi esplorati in precedenza, è nonlineare.
Esempio 2.1. L’Etil-t-butil etere (leggasi Etil-terziar-butil etere), o ETBE, formula
chimica C6 H14 O, è un composto organico che viene utilizzato per arricchire la benzina di ossigeno e ridurre, in fase di combustione, le emissioni di di monossido di carbonio e di idrocarburi incombusti. L’ETBE viene sintetizzato a partire dall’isobutene,
C4 H8 , e dall’etanolo, C2 H6 O. La reazione chimica corrispondente è descritta da
C4 H8 + C2 H6 O
−→
C6 H14 O
Indicando con a, b, c le concentrazioni di C4 H8 , C2 H6 O e C6 H14 O, e supponendo
valida la legge di azione di massa, la dinamica della reazione è descritta dal sistema
(2.3).
Supponendo di conoscere i dati iniziali (a0 , b0 , c0 ) della reazione, il sistema (2.3)
fornisce una soluzione che converge ad un equilibrio? E, in caso affermativo, quale?
Uguagliando a zero i secondi membri di (2.3), si ottiene una famiglia di punti
11
stazionari data da {(a, b, c) : a = 0 oppure b = 0}. Per determinare il comportamento asintotico del sistema nonlineare, occorre utilizzare le proprietà di conservazione dello stesso. Precisamente si ha
d
(a + c) = 0,
e
dt
da cui segue
a + c = C1 ∈ R
d
(b + c) = 0,
dt
b + c = C2 ∈ R.
e
Supponendo, per semplicità, c0 = 0, si ottiengono le relazioni a = a0 − c e b = b0 − c.
Quindi, la concentrazione c è soluzione del problema di Cauchy
dc
= λ (a0 − c) (b0 − c),
c(0) = 0.
dt
Quindi c → min{a0 , b0 } per t → +∞.
Nel caso in cui due o più degli elementi in gioco a sinistra della reazione coincidano,
nelle equazioni differenziali compaiono delle potenze. Ad esempio, la reazione tra 2
molecole di idrogeno H2 (specie A) con una di ossigeno O2 (specie B) che genera
una molecola d’acqua H2 O (specie C) si può rappresentare tramite lo schema
λ
2A + B
−→
2C
e, interpretando 2A + B come A + A + B, e 2 C come C + C, si ottiene, grazie alla
legge di azione di massa, il sistema
db
da
= −2λ a2 b,
= −λ a2 b,
(2.4)
dt
dt
Più in generale, uno schema del tipo
dc
= 2λ a2 b.
dt
λ
mA + nB
−→
pC + qE
si traduce nel sistema di equazioni differenziali ordinarie
da
db
dc
= −m λ am bn ,
= −n λ am bn ,
= p λ a m bn ,
dt
dt
dt
che è di tipo nonlineare.
de
= q λ a m bn ,
dt
Esempio 2.2. L’alluminio Al reagisce con l’ossigeno O2 formando l’ossido d’alluminio
(o allumina) Al2 O3 . Nella forma minerale è noto come corindone e comprende tra
le sue varietà il rubino e lo zaffiro (la colorazione di queste pietre è determinata
dalla presenza di inclusioni di altri materiali). Ad un primo approccio superficiale,
si sarebbe tentati di scrivere una reazione del tipo
Al + O2
−→
Al2 O3
12
In questa maniera, però la reazione non risulta bilanciata, nel senso che il numero
di atomi presenti a sinistra non coincide con quelli presenti a destra. La versione
Figura 1. Alluminio ed ossigeno che formano l’ossido di alluminio.
bilanciata della reazione è
4 Al + 3 O2
−→
2 Al2 O3 ,
che corrisponde, supponendo che la reazione sia regolata dalla legge di azione di
massa, al sistema di equazioni differenziali ordinarie
da
db
dc
= −4 λ a4 b3 ,
= −3 λ a4 b3 ,
= 2 λ a4 b3
dt
dt
dt
dove a indica la concentrazione di alluminio Al, b quella di molecole di ossigeno O2
e c quella di allumina Al2 O3 .
L’ossido di alluminio è un materiale molto utilizzato in elettronica e meccanica.
Per le sue ottime proprietà di biocompatibilità, viene utilizzato in medicina dato
che non presenta fenomeni di rigetto quando è a contatto con tessuti viventi.
Esempio 2.3. Il monossido di azoto N O è un gas incolore che reagisce in maniera
spontanea con l’ossigeno O2 producendo diossido di azoto N O2 , secondo la reazione
2 N O + O2
−→
2 N O2 .
Indicando con a, b, c le concentrazioni di N O, O2 , N O2 , la reazione è descritta da
(2.4). Il parametro cinetico della reazione a 25◦ C, è stato misurato sperimentalente
ed è circa pari a λ = 7.13 × 10−3 `2 mol−2 s−1 . A differenza del monossido di azoto, il
diossido assorbe la radiazione visibile ed è responsabile della foschia presente sopra
le grandi città.
In generale, una singola reazione chimica si decompone in una sequenza di sottoreazioni con produzione di specie intermediarie e transitorie. La legge di azione di
massa descrive una reazione elementare, cioè una reazione che non passi intermedi.
Esempio 2.4. La combustione di metano CH4 a causa della presenza di ossigeno
O2 determina la produzione di biossido di carbonio CO2 (detto anche diossido di
carbonio o anidride carbonica), acqua H2 O e calore. La reazione avviene in più
13
passi consecutivi, a cui partecipano anche monossido di carbonio CO (detto anche
ossido di carbonio o ossido carbonico) e molecole di idrogeno H2 . Lo schema delle
reazioni è
CH4 + O2
−→
C O + H2 + H2 O
2 H2 + O2
−→
2 H2 O
2 CO + O2
−→
2 C O2
Indicando con x1 , x2 , x3 , x4 , x5 le concentrazioni di CH4 , O2 , CO, H2 , H2 O e CO2 ,
supponendo che le singole reazioni siano elementari e descritte dalla legge di azione
di massa, il corrispondente sistema di equazioni differenziali è
dx1
dx2
= −λ1 x1 x2 ,
= −λ1 x1 x2 − λ2 x2 x24 − λ3 x2 x23 ,
dt
dt
dx3
dx4
= λ1 x1 x2 − 2 λ3 x2 x23 ,
= λ1 x1 x2 − 2 λ2 x2 x24 ,
dt
dt
dx5
dx6
= λ1 x1 x2 + 2 λ2 x2 x24 ,
= 2 λ3 x2 x23 ,
dt
dt
Il metano fu isolato da Alessandro Volta (1745–1827) nel periodo tra il 1776 e il
1778, nell’ambito degli studi di gas presenti nella palude dellisolino Partegora, nel
Lago Maggiore. Per questo motivo, il metano viene anche detto gas di palude.
Reazioni reversibili. Nel caso di reazioni reversibili, se si suppone che i processi di
associazione/dissociazione siano indipendenti, le corrispondenti equazioni differenziali si ottengono semplicemente sommando i contributi di ciascuna reazione. Il caso
più semplice è quello descritto dal diagramma
λ1
A+B
C
λ−1
Applicando la legge di azione di massa, questo si traduce nelle equazioni seguenti
per le concentrazioni a, b e c
da
db
dc
(2.5)
= −λ1 a b + λ−1 c,
= −λ1 a b + λ−1 c,
= λ1 a b − λ−1 c.
dt
dt
dt
Consideriamo il problema di Cauchy per il sistema (2.5) determinato dalle condizioni
iniziali
(2.6)
a(0) = a0 ,
b(0) = b0 ,
c(0) = 0.
Dato che
d
d
(a + c) = (b + c) = 0,
dt
dt
le quantità a + c e b + c sono conservate dal sistema. Quindi a + c = a0 e b + c = b0 .
Ricavando da queste relazioni a e b in funzione di c ed inserendo nell’ultima equazione
14
di (2.5) si ottiene un problema di Cauchy per la sola variabile c
dc
= λ1 a0 b0 − [λ1 (a0 + b0 ) + λ−1 ] c + λ1 c2 ,
dt
c(0) = 0.
L’equazione differenziale è a variabili separabili e può essere risolta esplicitamente a
patto di essere disposti a svolgere un certo numero di conti... Quanti e quali sono
gli equilibri dell’equazione? Si tratta di equilibri stabili?
Esempio 2.5. L’ammoniaca N H3 viene sintetizzata in laboratorio con il processo
di Haber–Bosch, che si basa sulla reazione reversibile
λ1
3 H2 + N2
2 N H3
λ−1
Modificando pressione o temperatura i valori di λ1 e λ−1 cambiano, e, di conseguenza,
è possibile aumentare l’effetto di uno o dell’altro dei processi, a seconda della necessità.
3. Reti di reazioni lineari
Passiamo ora ad esplorare in maggiore dettaglio le proprietà di una famiglia di
reazioni che si traducono in equazioni differenziali come illustrato nelle pagine precedenti. Emergono subito alcune questioni naturali: fissato il sistema di reazioni
chimiche,
– esistono equilibri positivi? e, in caso affermativo, quanti sono?
– qual è la loro stabilità?
Il problema è interessante già nel caso delle transizioni pure, in cui il sistema di
equazioni differenziali risulta essere lineare. In questo caso, ricorrendo ad un certo
numero di nozioni e di risultati dell’algebra delle matrici, si riesce a dare una descrizione pressoché completa del problema.
Consideriamo le specie X 1 , . . . , X m con concentrazioni relative x1 , . . . , xm . Sia
λi→j = λji ≥ 0 il parametro di transizione dallo stato i allo stato j. Il caso λ = 0
corrisponde al caso di transizione assente. Il modello è descritto da un sistema
lineare di equazioni differenziali
X X
dxi
=−
λij xj
λji xi +
dt
j6=i
j6=i
i = 1, . . . , m.
15
ovvero, ponendo x := (x1 , . . . , xm ),

(3.1)
dx
= Λx
dt


dove Λ := 

−
P
i6=1
λ21
..
.
λi1
−
λ12
P
...


λi2 . . . 

i6=2

..
..
.
.
La matrice Λ ha alcune proprietà rilevanti, di cui la prima salta all’occhio: la somma
degli elementi di ogni colonna è nulla. Di conseguenza, sommando le equazioni
rispetto all’indice i si ottiene
!
m
m X
m X
X
X
X j
X
d X i
j i
λ i xi +
λij xj = 0,
x =−
λi x +
λij xj = −
dt i=1
i=1 j6=i
i=1 j6=i
i,j, j6=i
i,j, i6=j
che indica che la somma delle concentrazioni si conserva nel tempo. In altre parole,
con Antoine Lavoisier (considerato il padre della chimica moderna), “Rien ne se
perd, rien ne se crée, tout se transforme.”
Gli equilibri del sistema (3.1) sono tutti e soli gli elementi del nucleo della trasformazione A che ha determinante nullo. La stabilità di tali equilibri è collegata in
maniera diretta agli autovalori della matrice stessa. Per localizzarli, è possibile
ricorrere al criterio seguente.
Teorema 3.1 (Geršgorin). Data la matrice A = (aji ) ∈ Cm×m , siano
X j
|ai |
i = 1, . . . , m.
ri :=
j6=i
Allora tutti gli autovalori della matrice A sono contenuti nella regione di Geršgorin
G(A) :=
m
[
{z ∈ C : |z − aii | ≤ ri }
i=1
dove i dischi {z ∈ C : |z − aii | ≤ ri } sono detti dischi di Geršgorin.
Nel caso banale di una matrice diagonale, i raggi ri sono tutti nulli e, di conseguenza, la regione G(A) coincide con l’insieme degli autovalori. Il Teorema 3.1
considera il caso di una matrice qualsiasi vista come perturbazione della matrice
diagonale diag (aii ). La somma dei moduli degli elementi della colonna controlla
l’allontanamento massimo di un autovalore dal valore non perturbato. Si noti che,
dato che gli autovalori di una matrice e della sua trasposta coincidono, il risultato vale anche nel caso in cui i valori dei raggi dei dischi di Geršgorin si calcolino
sommando i moduli degli elementi di riga, anziché di colonna.
16
Nel caso della matrice Λ definita in (3.1), i dischi di Geršgorin sono dati da
X j
{z ∈ C : |z − ri | ≤ ri }
dove ri =
λi .
j6=1
Si tratta, quindi, di dischi contenuti nel semipiano {z : Re z ≤ 0}, con centro
sull’asse reale, e passanti per l’origine. In particolare, tutti gli autovalori della matrice hanno parte reale non-negativa. Tale condizione non permette di concludere
nulla né sul numero dei punti di equilibrio, né sulla loro eventuale stabilità. Occorrono informazioni aggiuntive sulla molteplicità algebria e geometrica dell’autovalore
0. Per questo motivo, introduciamo un altro concetto dell’algebra delle matrici.
Definizione 3.2. Una matrice A = (aji ) ∈ Rm×m è una matrice positiva se tutti
i suoi elementi sono positivi, i.e. aji > 0 per ogni i, j. Analogamente, essa è una
matrice non-negativa se tutti i suoi elementi sono non-negativi, i.e. aji ≥ 0 per ogni
i, j.
La matrice Λ non è positiva visto che gli elementi sulla diagonale principale sono
tutti negativi. Per ottenere una matrice non-negativa, basta aggiungere un multiplo
opportuno della matrice identità. Nel seguito, indichiamo con κ > 0 un numero reale
tale che la matrice Λ + κ I è positiva (cioè κ è strettamente maggiore del massimo
dei moduli degli elementi della diagonale principale di Λ). Inoltre, indicati con σ(A)
lo spettro della matrice A, cioè l’insieme dei suoi autovalori, e con ρ(A) il raggio
spettrale, definito da
ρ(A) := sup {|λ| : λ ∈ σ(A)} ,
dato che i dischi di Grišgorin della matrice Λ + κ I sono traslazioni di lunghezza κ
dei dischi della matrice Λ, si deduce che ρ(Λ + κ I) = κ e che κ è un autovalore della
matrice. La matrice Λ + κ I sarà positiva solo nel caso in cui si abbia λji > 0 per
ogni i, j, cioè nel caso in cui una qualsiasi specie può avere una transizione verso
una qualsiasi altra.
Quando si lavora con matrici positive si può ricorrere al Teorema di Perron.
Teorema 3.3 (Perron, versione semplificata). Sia A ∈ Rm×m una matrice positiva.
Allora valgono le seguenti affermazioni
(a) esiste un vettore x = (x1 , . . . , xm ), con xi > 0 per ogni i tale che Ax = ρ(A) x;
(b) ρ(A) ha molteplicità algebrica (e quindi geometrica) pari a 1.
Quindi, nel caso in cui gli elementi λji siano tutti strettamente positivi, si può
utilizzare il fatto che la matrice Λ + κ I è positiva. Dato che:
– si ha σ(Λ + κ I) = σ(Λ) + κ;
17
– le matrici Λ e Λ + κ I hanno gli stessi autovettori;
– le molteplicità algebriche e geometriche di autovalori corrispondenti restano le
stesse,
nel caso in cui tutti i valori λji siano strettamente positivi, il sistema ammette uno
spazio uni-dimensionale V0 , individuato da un vettore x̂, unitario e con coordinate
tutte positive che comprende tutti i punti di equilibrio del sistema. Data la condizione iniziale
m
x(0) = x0 = (x10 , . . . , xm
0 ) ∈ R ,
l’orbita x = x(t; x0 ) determinata da (3.1) è interamente contenuta nel piano
π :
m
X
i=1
i
x =
m
X
xi0 .
i=1
In tale piano, è presente un unico punto di equilibrio x̄ = (x̄1 , . . . , x̄m ) ∈ V0 ∩ π, che
risulta essere globalmente attrattivo (con velocità esponenziale di decadimento delle
perturbazioni).
La richiesta λji > 0 indica che un qualsiasi individuo di una qualsiasi specie Xi
ha la possibilità di effettuare una transizione verso una qualsiasi altra specie Xj . Se
il valore λji è molto piccolo, la probabilità di un tale evento è molto piccola; ma la
richiesta di stretta positività si traduce nel fatto che tale eventualità è comunque
possibile. Nei casi realistici, si è ben lontani da una situazione di questo genere e,
pertanto, il risultato appena descritto non è per nulla soddisfacente.
Come detto in precedenza, per κ sufficientemente grande, la matrice Λ + κI è
una matrice non-negativa. In generale, il Teorema di Perron non vale per matrici
non-negative. Per determinarne una estensione, occorre introdurre un’altra serie di
concetti relativi all’algebra della matrici.
Definizione 3.4. i. Una matrice di permutazione P ∈ Rm×m è una matrice che ha
elementi pij pari a 0 o a 1 e che in ogni riga e in ogni colonna compare una ed una
sola volta il valore 1.
ii. Una matrice A ∈ Rm×m è riducibile se m = 1 e A = O o se m ≥ 2 ed esiste una
matrice di permutazione P ∈ Rm×m ed un intero r con 1 ≤ r ≤ n − 1 tale che
B C
T
(3.2)
P AP =
0 D
con B ∈ Rr×r , C ∈ Rr×(n−r) , 0 ∈ R(n−r)×r , D ∈ R(n−1)×(n−r) .
iii. Una matrice A ∈ Rm×m è irriducibile se non è riducibile.
18
Una matrice di permutazione è sempre unitaria (quindi ortogonale) e, quindi,
P
T
= P −1 . Il caso più semplice (diverso dalla matrice identità I) è dato dalla
matrice che ha tutti elementi nondiagonali nulli tranne pij = 1 e pji = 1 per una
fissata coppia i e j, il cui effetto è quello di scambiare la i−esima e la j−esima riga,
e, contemporaneamente, la i−esima e la j−esima colonna.
Si noti che, nella definizione di riducibilità non si fa riferimento alla presenza/assenza
di elementi nulli delle matrici B, C, D.
Il Teorema di Perron si estende al caso di matrici non-negative irriducibili.
Teorema 3.5 (Perron–Frobenius, versione semplificata). Sia A ∈ Rm×m una matrice non-negativa ed irriducibile. Allora:
(a) esiste un vettore x = (x1 , . . . , xm ), con xi > 0 per ogni i tale che Ax = ρ(A) x;
(b) ρ(A) ha molteplicità algebrica (e quindi geometrica) pari a 1.
Per applicare il Teorema di Perron–Frobenius alla matrice Λ + κ I, basta osservare
che una matrice A è irriducibile se e solo se A+c I, (c ∈ R) (la verifica è immediata).
Quindi, se la matrice Λ è irriducibile, è possibile ripetere quanto già descritto nel
caso in cui λji > 0 per ogni i, j. Pertanto, vale il risultato seguente.
Teorema 3.6 (Caso irriducibile). Se la rete di reazioni chimiche è tale che la matrice
Λ è irriducibile per ogni dato iniziale x0 esiste un unico equilibrio x̄ ∈ ker Λ, tale
che
m
X
xi0
i=1
=
m
X
x̄i .
i=1
Inoltre, esistono C, α > 0 tali che
x(·; x0 ) − x̄ ≤ C e−α t
dove x(·; x0 ) indica la soluzione del problema di Cauchy per (3.1), x(·; x0 ) = x0 .
Esempio 3.7. Nel caso di tre specie A, B, C con concentrazioni a, b, c, a meno di
permutazioni dei nomi delle specie, esistono 5 casi irriducibili diversi:
1: A→B→C→A;
2: ABC;
4: ABC→A;
3: AB→C→A;
5: ABCA.
Supponendo che i parametri λij siano sempre pari a 0 o ad 1, i 5 casi corrispondono
alle seguenti matrici Λi , i = 1, . . . , 5,




−1 0 +1
−1 +1 0
Λ1 =  +1 −1 0  , Λ2 =  +1 −2 +1  ,
0 +1 −1
0 +1 −1


−1 +1 +1
Λ3 =  +1 −2 0  ,
0 +1 −1
19


−1 +1 +1
Λ4 =  +1 −2 +1  ,
0 +1 −2


−2 +1 +1
Λ5 =  +1 −2 +1  .
+1 +1 −2
Lo stato asintotico (ā, b̄, c̄) determinato dalla condizione iniziale (a0 , b0 , c0 ) verifica
le due condizioni seguenti
ā + b̄ + c̄ = a0 + b0 + c0 =: m0
(ā, b̄, c̄) ∈ ker Λi .
e
Conti alla mano, i valori ā, b̄, c̄ sono dati da
casi 1,2,5 :
ā = b̄ = c̄ = 31 m0 ;
caso 3 :
ā = 21 m0 , b̄ = c̄ = 14 m0 ;
caso 4 :
ā = 21 m0 , b̄ = 13 m0 , c̄ = 16 m0 .
A differenza della classificazione dei cinque casi irriducibili, l’espressione esplicita
delle configurazioni asintotico non è più la stessa nel caso in cui i valori λji siano
diversi da 0 e 1.
Esercizio 3.8. Una voce di corridoio sostiene che, nei cinque casi appena esplorati,
il valore α descritto nell’enunciato del Teorema 3.6 è approsimativamente dato da
α1 = 1.5,
α2 = 1,
α3 = −2,
α4 = −2,
α5 = −3.
Si tratta di una voce affidabile?
Esistono caratterizzazione dell’irriducibilità in termini di altre proprietà equivalenti (si veda [5], Teorema 6.2.24). Qui, diamo qualche cenno solamente alla
traduzione in termini di grafi.
Definizione 3.9. Un grafo orientato G è una coppia (V, A), dove V = {X1 , . . . , Xm }
è l’insieme dei nodi (o vertici) e A è l’insieme degli archi orientati che connettono i
nodi del grafo. Un grafo orientato G è fortemente connesso se tra ogni coppia di nodi
distinti Xi , Xj in G, esiste un cammino orientato che parte in Xi e arriva in Xj .
Nel contesto delle reti di reazioni chimiche lineari, i nodi del grafo corrispondono
alle diverse specie e i cammini orientati sono codificati dalle regole di transizione.
A livello di grafo, l’unica cosa sigificativa del parametro λ della singola transizione
è il suo segno, ovvero se sia o non sia nullo. Quindi, la struttura del grafo orientato
di una specifica rete di reazioni non cambia se ad ogni valore λ 6= 0 si sostituisce il
valore 1.
Definizione 3.10. Il grafo orientato della matrice A = (aji ) ∈ Rm×m , indicato con
G(A), è il grafo orientato sugli m nodi X1 , . . . , Xm con un arco orientato da Xi a
Xj se e solo se aji 6= 0.
20
Possiamo enunciare il seguente risultato.
Teorema 3.11. La matrice A è irriducibile se e solo se il suo grafo orientato G(A)
è fortemente connesso.
In termini di reazioni chimiche, il significato è chiaro. La matrice Λ risulta essere
irriducibile se e solo se per ogni coppia di elementi Xi , Xj , i 6= j, esiste una catena
di reazioni che permette ad elementi del tipo Xi di trasformarsi nello stato Xj . Ad
esempio, la rete descritta da
A B → C,
dà luogo ad una matrice riducibile. Infatti, mentre non sono presenti cammini da C
ad A, né da C a B. In effetti, la matrice Λ corrispondente è data da


−1 +1 0
Λ1 =  +1 −1 +1  ,
0
0 −1
ha chiaramente una struttura del tipo (3.2) (con m = 3 e r = 2).
Indaghiamo ora il caso in cui la matrice Λ sia riducibile. A meno di permutazioni
delle coordinate x1 , . . . , xm , la struttura della matrice Λ è della forma (3.2). Nel caso
in cui la matrice C sia identicamente nulla, la rete di reazioni considerata risulta
essere composta da (almeno) due componenti distinte: quella relative alle specie
X1 , . . . , Xr e quella relativa alle rimanenti specie. In questo caso, il grafo relativo
alla rete di reazioni può essere separato in due (o più) sotto-grafi sconnessi tra loro.
Vale la pena introdurre qualche nozione per precisare la situazione.
Definizione 3.12. Dato un grafo G = (V, A), con vertici V = {X1 , . . . , Xm } e A
archi, due vertici Xi e Xj si dicono connessi se esiste un cammino (non orientato)
da Xi a Xj . La connessione definisce una classe di equivalenza nell’insieme dei
vertici del grafo. I sottografi che contengono tutti e soli gli elementi di una classe
si chiamano componenti connesse del grafo e il numero di componenti connesse si
indica con γ(G).
Se il grafo determinato da una rete di reazioni ha γ componenti connesse, a meno
di permutazioni di righe e colonne, la matrice Λ si può scrivere nella forma


Λ1 · · · 0
(3.3)
Λ =  ... . . . ...  .
0 · · · Λγ
21
Ciascuno sottogruppo di reazioni, relativo ad una matrice Λj , può essere considerato
in maniera indipendente dagli altri. Se ogni singolo sotto-gruppo risulta essere
irriducibile, ci si può ridurre, mutatis mutandis, al Teorema 3.6.
Resta da affrontare il caso in cui la rete di reazioni, che si può supporre connessa
senza perdere di generalità, generi una matrice Λ della forma
Λ1 C
Λ=
.
0 D
con la matrice C non sia identicamente nulla.
Le colonne della matrice D sono della forma
t
X
j−1
j+1
i
m
λr+1
,
.
.
.
,
λ
,
λ
,
λ
,
.
.
.
,
λ
j
j
j
j
j
i6=j
dove la sommatoria è su tutti gli indici da 1 a m, j escluso. Dato che C è non nulla,
esiste almeno un indice j per cui
j−1
X
i=r+1
λij
+
m
X
i=j+1
λij <
X
λr+1
.
i
i6=j
Di conseguenza, il corrispondente disco di Geršgorin è interamente contenuto nel
semipiano complesso {Re λ < 0}. Giunge a proposito il seguente criterio (vedi [5],
Teoremi 6.2.8, 6.2.24).
Proposizione 3.13. Data A ∈ Rm×m , sia λ ∈ σ(A) ∩ ∂G(A) dove G(A) indica la
regione di Geršgorin della matrice A. Se A è irriducibile, ogni disco di Geršgorin
passa per λ.
Nel caso in cui la matrice D sia irriducibile, il punto λ = 0 non è contenuto in
uno dei dischi di Geršgorin della matrice e, pertanto, la matrice D è invertibile. Il
sistema (3.1) per la variabile x = (x1 , x2 ) ∈ Rr × Rm−r può essere riscritto come

dx

 1 = Λ1 x1 + C x2 ,
dt
(3.4)
dx

 2 = Dx ,
2
dt
Se D è irriducibile, per quanto visto, tutti gli autovalori di D sono contenuti
nel semispazio aperto {Re λ < 0}, e, di conseguenza, le soluzioni del sistema per
l’incognita x2 tendono a 0 con velocità esponenziale. Il comportamento asintotico
delle soluzioni del sistema (3.4) è descritto dal sistema ridotto
dx1
= Λ1 x1 .
dt
22
Nel caso in cui la matrice D sia riducibile, si può ragionare in maniera analoga e
determinare una sotto-struttura di componenti che tendono a zero asintoticamente
ed una dinamica asintotica descritta da un sistema ridotto di equazioni.
Prima di passare al caso nonlineare, proviamo a sintetizzare quanto visto fin qui
introducendo un indicatore significativo, relativo al sistema di reazioni: la differenza
tra il numero m delle incognite e la somma tra il numero di relazioni di conservazione
γ e il rango della matrice Λ.
Definizione 3.14. Si chiama indice di difetto δ di una rete di reazioni, il numero
δ =m−γ−r
dove m è il numero di specie, γ il numero di componenti connesse del grafo corrispondente, r il rango della matrice Λ.
La struttura (3.3), indica che esistono almeno γ relazioni di conservazione, indipendenti tra loro, che si ottengono sommando tutte le equazioni presenti in ciascuno sotto-gruppo di equazioni. Di conseguenza, il rango r della matrice Λ è sempre
minore o uguale a m−γ, il difetto δ è sempre non-negativo. Il caso δ = 0 corrisponde
al caso in cui il numero di condizioni bilancia esattamente il numero di incognite
e, quindi, ci si aspetta un unico punto di equilibrio, asintoticamente stabile. Senza
condizioni aggiuntive, tale punto di equilibrio potrebbe però avere coordinate nulle.
Per recuperare la positività delle coordinate, occorre un’ipotesi collegata, in qualche
forma, con la condizione di irriducibiltà.
Definizione 3.15. Una rete di reazioni si dice reversibile se per ogni arco orientato
da Xi a Xj esiste un arco orientato nel verso opposto, cioè da Xj a Xi . Una rete
di reazioni si dice debolmente reversibile se per ogni cammino orientato da Xi a Xj
esiste un cammino orientato nel verso opposto, cioè da Xj a Xi .
Per una rete di reazioni con grafo connesso, la proprietà di debole reversibilità è
equivalente all’irriducibilità della matrice Λ e quindi, grazie al Teorema 3.11, al fatto
che il grafo della rete è fortemente connesso. Infatti, se il grafo è fortemente connesso,
esiste un cammino orientato da Xi a Xj , per ogni scelta di i e j, e quindi la rete è
debolmente reversibile. Viceversa, se la rete è debolmente reversibile e si suppone per
assurdo che la matrice corrispondente può essere espressa nella forma (3.2), si vede
facilmente che esistono percorsi da qualcuno degli elementi Xr+1 , . . . , Xm a qualcuno
degli elementi X1 , . . . , Xr , ma non ne esiste nessuno nella direzione opposta.
Possiamo quindi concludere enunciando il seguente risultato.
23
Teorema 3.16. Se l’indice di difetto δ è nullo e la rete è debolmente reversibile, il
sistema di equazioni differenziali corrispondente ammette un’unico punto di equilibrio con coordinate tutte positive. Tale punto è asintoticamente stabile, con perturbazioni che decadono a velocità esponenziale.
4. Reti di reazioni nonlineari
Il caso nonlineare è ben più complesso rispetto al caso lineare. Ad esempio, è ben
noto che esistono sistemi definiti da funzioni polinomiali che generano dinamiche
di tipo caotico (ad esempio, il famoso sistema di Lorenz). Nel caso di sistemi di
reazioni, governate dalla legge di azione di massa, è ancora possibile estrapolare una
sotto-classe di sistemi con proprietà dinamiche relativamente semplici. In questa
Sezione, ci limiteremo a presentare il Teorema di difetto nullo, sviluppato in una serie
di lavori di Feinberg e di Horn–Jackson (si vedano [1, 3, 4, 6]).
Il punto di vista è il seguente: come individuare classi di reti di reazioni chimiche,
che abbiano una struttura dell’insieme degli equilibri relativamente semplice? Più
precisamente, vogliamo trovare condizioni sulla struttura della rete che garantiscano
l’esistenza di un unico equilibrio positivo (cioè in cui tutte le concentrazioni delle
specie in gioco siano strettamente positive) e che sia asintoticamente stabile, indipendentemente dal valore specifico delle costanti cinetiche. Cominciamo con
l’analizzare un certo numero di esempi.
Esempio 4.1. Consideriamo la rete di reazioni
A + B C,
C B,
B + C A,
che, modellizzata utilizzando la legge di azione di massa e supponendo tutti i parametri cinetici pari a 1 dà luogo al sistema di equazioni differenziali
da
= −a + c − ab + bc,
dt
db
(4.1)
= a − b + 2c − ab − bc,
dt
dc
= a + b − 2c + ab − bc,
dt
dove a, b e c indicano le concentrazioni delle specie A, B e C. I punti di equilibrio
verificano le condizioni
−a + c − ab + bc = 0,
a − b + 2c − ab − bc = 0,
a + b − 2c + ab − bc = 0.
24
Sommando e sottraendo la seconda e la terza equazione, si ottengono le relazioni
bc = a, ab = 2c − b. Inserendo nella prima equazione, si ricava b = c. Quindi, il
sistema è equivalente alle tre equazioni
b2 = a,
ab = b,
b=c
che ha solo due soluzioni in {a, b, c ≥ 0}:
O := (0, 0, 0),
P := (1, 1, 1).
La linearizzazione di (4.1) nel punto critico (ā, b̄, c̄) è descritta dalla matrice


−1 − b̄
−ā + c̄
1 + b̄
 1 − b̄ −1 − ā − c̄ 2 − b̄  ,
1 + b̄
1 + ā − c̄ −2 − b̄
da cui si deduce che il punto (0, 0, 0) è instabile, mentre il punto è asintoticamente
stabile.
Esempio 4.2. In [4], si considera la rete
ε
3A
1
−→
↑
A + 2B
↓1
ε
2A + B
−→
3B
Il sistema di equazioni differenziali corrispondente è
da
= −2 ε a3 + a2 b − a b2 + 2 ε b3 ,
dt
(4.2)
db
= 2 ε a3 − a2 b + a b2 − 2 ε b3 .
dt
Ponendo ξ = a/b, i punti critici sono individuati dalla relazione
p(ξ) := 2 ε ξ 3 − ξ 2 + ξ − 2 ε = 0.
Dato che il polinomio p = p(ξ) si fattorizza come
2
p(ξ) := 2 ε(ξ − 1)(ξ − 2 θ ξ + 1)
1
dove θ :=
2
1
−1 ,
2ε
ci sono due situazioni possibili:
– se θ2 < 1, p(ξ) = 0 se e solo se ξ = 1;
¯ ξ¯−1 } dove ξ¯ := θ +
– se θ2 > 1, p(ξ) = 0 se e solo se ξ ∈ {1, ξ,
√
θ2 − 1. Il sistema
ammette quindi, nel caso θ2 > 1, che corrisponde a ε < 1/6, tre rette di punti di
equilibri, tutte passanti per l’origine. Che tipo di stabilità hanno i corrispondenti
punti di equilibrio?
25
Il primo esempio mostra un caso in cui il sistema nonlineare esibisce un unico
punto di equilibrio con coordinate positive. Cosa succede modificando i parametri
cinetici dell’equazione?
Il secondo esempio esibisce un caso in cui la struttura dei punti di equilibrio
dipende in maniera radicale dal valore dei parametri cinetici.
In effetti, è possibile definire un indicatore, detto il difetto della rete di reazioni,
che precisa la situazione: nel caso in cui il difetto sia nullo, indipendentemente dal
valore specifico dei parametri cinetici, il sistema ammette un unico punto di equilibrio all’interno del cosiddetto sottospazio stoichiometrico e tale punto di equilibrio
è asintoticamente stabile. Il primo dei due esempi mostrati rientra in tale categoria,
il secondo no.
Per precisare quanto detto, occorre introdurre delle notazioni. Date le specie
1
X , . . . , X n , con concentrazioni x = (x1 , . . . , xn ) battezziamo complessi Y 1 , . . . , Y m ,
le combinazioni lineari (formali) che compaiono nella rete di reazioni. I coefficienti
di questa combinazione costituiscono un vettore bj ∈ Rn , j = 1, . . . , m. Per rappresentare la rete, come nel caso delle reazioni lineari, è utile introdurre un grafo i
cui vertici sono i complessi e gli archi orientati sono determinati dalla rete stessa.
Ogni arco è etichettato con il corrispondente coefficiente λ che descrive la rapidità
della reazione. Se sono presenti m complessi distinti, i coefficienti λ costituiscono
gli elementi di una matrice Λ = (λij ) ∈ Rm×m . Il sistema di equazioni differenziali
determinato dalla legge di azione di massa, si può scrivere nella forma
(4.3)
m
m
m
X
dx X X i 1 b1j
n bnj
=
bi
λj (x ) · · · (x ) −
bj λij (x1 )b1j · · · (xn )bnj
dt
i=1
j=1
i,j=1
=
m
X
(bi − bj )λij (x1 )b1j · · · (xn )bnj
i,j=1
dove bj = (b11 , . . . , bnj ) e le sommatorie sono calcolate per i 6= j.
Esempio 4.3. La reazione reversibile
λ1
A+B
C
λ−1
corrisponde al caso di tre specie, A, B, C, e due complessi Y 1 := A + B e Y 2 := C,
che definiscono i due vettori b1 = (1, 1, 0) e b2 = (0, 0, 1). La matrice Λ è data da
∗ λ12
∗ λ−1
Λ=
=
.
λ21 ∗
λ1 ∗
26
Perciò, indicate con a, b, c le concentrazioni di A, B, C, il
  




a
−1
1
d   
b
−1  λ1 a b +  1  λ−1 c = 
=
dt
c
1
−1
sistema di equazioni è

−λ1 a b + λ−1 c
−λ1 a b + λ−1 c  ,
λ1 a b − λ−1 c
come già dedotto in precedenza.
Esempio 4.4. Consideriamo la rete di reazioni relativa alla combustione del metano
e descritta nell’Esempio 2.4. In questo caso, le specie sono sei:
X 1 = CH4 ,
X 2 = O2 ,
X 3 = CO,
X 4 = H2 ,
X 5 = H2 O,
X 6 = CO2
i complessi sono sei
Y 1 = CH4 + O2 ,
Y 2 = C O + H2 + H2 O,
Y 3 = 2 H2 + O2 ,
Y 4 = 2 H2 O,
Y 5 = 2 CO + O2 ,
Y 6 = 2 C O2
che corrispondono ai vettori
b1 = (1, 1, 0, 0, 0, 0),
b2 = (0, 0, 1, 1, 1, 0),
b3 = (0, 1, 0, 2, 0, 0),
b4 = (0, 0, 0, 0, 2, 0),
b5 = (0, 1, 2, 0, 0, 0),
b6 = (0, 0, 0, 0, 0, 2).
e, infine, la matrice Λ è data da




Λ=


∗
λ1
0
0
0
0
0 0
∗ 0
0 ∗
0 λ2
0 0
0 0
0 0
0 0
0 0
∗ 0
0 ∗
0 λ3
0
0
0
0
0
∗







Di conseguenza, il sistema è dato da
dx
= (b2 − b1 )λ1 x1 x2 + (b4 − b3 )λ2 x2 x24 + (b6 − b5 )λ3 x2 x23
dt
coerentemente con quanto visto in precedenza.
Un ruolo fondamentale è giocato dal sottospazio S generato da tutte le differenze
bi − bj , detto sottospazio stoichiometrico, che è invariante per il sistema di equazioni
differenziali (4.3). La dimensione di tale sottospazio, indicata con r, è detta rango
della rete di reazioni chimiche.
Esempio 4.5. Consideriamo la rete di reazioni definita da
A 2B,
A + C D,
D → B,
B → A + C,
In questo caso ci sono 4 specie e 5 complessi:
X1 = A,
Y1 = A,
X2 = B,
Y2 = 2B,
X3 = C,
Y3 = A + C,
X4 = D
Y4 = D,
Y5 = B
27
che corrispondono ai vettori
b1 = (1, 0, 0, 0),
b2 = (0, 2, 0, 0),
b4 = (0, 0, 0, 1),
b5 = (0, 1, 0, 0).
b3 = (1, 0, 1, 0),
Il sottospazio stochiometrico è generato da
b2 − b1 = (−1, 2, 0, 0),
b4 − b3 = (−1, 0, −1, 1),
b5 − b4 = (0, 1, 0, −1),
b3 − b5 = (1, −1, 1, 0),
cioè S := span {(−1, 2, 0, 0), (−1, 0, −1, 1), (0, 1, 0, −1)} e il rango della rete è r = 3.
L’ultimo ingrediente necessario per la prossima definizione è il numero γ di componenti connesse del grafo definito dalla rete di reazioni, dove, questa volta, i nodi
del grafo sono chiaramente dati dai complessi Yi .
Definizione 4.6. Si chiama indice di difetto δ di una rete di reazioni il numero
(intero non negativo)
δ := m − γ − r
dove m è il numero di complessi, γ il numero di componenti connesse del grafo
definito dalla rete e r è il rango della rete.
Per reti con indice nullo, vale un risultato del tutto analogo a quello enunciato
nel Teorema 3.16.
Teorema 4.7. Se l’indice di difetto δ è nullo e la rete è debolmente reversibile, il sistema di equazioni differenziali corrispondente ammette un’unico punto di equilibrio
con coordinate tutte positive. Tale punto è asintoticamente stabile.
Per maggiori dettagli, consultare [2].
Riferimenti bibliografici
[1] Feinberg M., Complex balancing in general kinetic systems, Arch. Rational Mech. Anal. 49
(1972/73), 187–194.
[2] Feinberg M., The existence and uniqueness of steady states for a class of chemical reaction
networks, Arch. Rational Mech. Anal. 132 (1995), no. 4, 311–370.
[3] Horn F., Necessary and sufficient conditions for complex balancing in chemical kinetics, Arch.
Rational Mech. Anal. 49 (1972/73), 172–186.
[4] Horn F., Jackson R., General mass action kinetics, Arch. Rational Mech. Anal. 47 (1972),
81–116.
[5] Horn R.A., Johnson C.R., “Matrix analysis”, Corrected reprint of the 1985 original. Cambridge
University Press, Cambridge, 1990.
[6] Sontag E.D., Structure and Stability of Certain Chemical Networks and Applications to the
Kinetic Proofreading Model of T-Cell Receptor Signal Transduction, IEEE Trans. Automatic
Control 46 (2001) no.7, 1028–1047.