Ipercicli: il modello di Eigen (prima parte) Dr. Francesco Stellato Corso di Fisica dei Sistemi Biologici Prof. Silvia Morante A.A. 2008-2009 Sommario • • • • • • Evoluzione: comportamento darwiniano Cos’è un Iperciclo? Modellizzazione di un sistema darwiniano L’Iperciclo “astratto” Analisi di punto fisso di una cinetica chimica Bibliografia Comportamento Darwiniano Evoluzione: 2 risultati apparentemente contraddittori 1. Diversità: Esistono milioni di specie diverse 2. Omogeneità: Tutte hanno lo stesso apparato molecolare Evoluzione da un Antenato Comune Comportamento Darwiniano Trasmissione ereditaria di informazione Il codice genetico Il codice genetico definisce la corrispondenza tra triplette di basi nel DNA ed aminoacidi. Esistono 64 possibili triplette e 20 aminoacidi, quindi il codice è degenere A parte pochissime eccezioni, il codice è lo stesso in tutti gli organismi viventi. La “scelta” operata all’inizio si è conservata nel corso dell’evoluzione Comportamento darwiniano: meccanismi di evoluzione e selezione naturale all’interno di una popolazione 1- Ciclo metabolico 2- Elementi autoreplicanti 3- Mutazioni TESI IPOTESI Sotto quali condizioni si origina tale comportamento? 1- Selezione 2- Evoluzione 1. Metabolismo: Formazione e degradazione delle specie molecolari: processi indipendenti e non in equilibrio 2. Autoriproduzione: Le specie molecolari devono essere in grado di istruire la loro stessa sintesi 3. Mutazione: La fedeltà del processo di autoreplicazione è fisicamente limitata dal rumore La mutabilità è necessaria all’evoluzione A temperatura ambiente, kBT= 1.38·10-23J/K x 300 K = 4.14 ·10-21J Le reazioni necessarie per la vita (metabolismo) devono avere energie ΔG dell’ordine di kBT ΔG >> kBT → molecole troppo stabili ΔG << kBT → molecole troppo instabili Si consideri la variazione di energia libera, ΔG, in una reazione A+B⇔ C+D ΔG = ΔG 0 + RT ln [C][D] = ΔG 0 + RT ln(K eq ) [A][B] ΔG0 è la variazione di energia libera in condizioni standard [A]=[B]=[C]=[D]=1 M e si è definita la costante di equilibrio K eq = [C][D] [A][B] All’equilibrio deve aversi ΔG=0, pertanto ΔG 0 eq = − RT ln(K eq ) quindi K eq = exp (-Δ G 0 eq /RT) ΔG0eq >> kBT → reazione spostata verso i reagenti ΔG0eq << kBT → reazione spostata verso i prodotti Due casi reali: -Energia di dissociazione della molecola N2 N2 → N + N 9.42 ·106 J/mol x (1mol/6 ·1023) = 1.6 ·10-17J >> kBT= 4.14 ·10-21J -Reazione di isomerizzazione del diidrossiacetone fosfato in gliceraldeide 3-fosfato (reazione della glicolisi) [diidrossiacetone fosfato]= 5 ·10-4 M [gliceraldeide 3-fosfato ]= 3 ·10-6 M ΔG = -5 ·103 J/mol -5 ·103 J/mol x (1mol/6 ·1023) = 8.3 ·10-21J ~ kBT= 4.14 ·10-21J Cos’è un Iperciclo? Si consideri un insieme di reazioni chimiche in cui il prodotto di una reazione sia sempre il reagente di una reazione precedente: A A→B B→C C→A Si è in presenza di un ciclo di reazione C B Esistono moltissimi esempi in natura di reazioni cicliche Ciclo del Carbonio Il ciclo catalizza la reazione 41H → 4He + γ Ciclo di Krebs Il ciclo catalizza la reazione Acetil-CoA + 3 NAD+ + FAD + ADP + Pi → CoA-SH + 3 NADH + H+ + FADH2 + ATP + 2 CO2 Un ciclo di reazione si comporta come un catalizzatore Si consideri lo schema di reazione di Michaelis-Menten che descrive il funzionamento di un enzima E che catalizza la reazione Substrato S → Prodotto P S + E → ES ES → EP ES EP P S EP → E + P E Si è in presenza di una reazione ciclica per l’enzima E, che si comporta come catalizzatore per la reazione S → P Questo tipo di reazione si rappresenta schematicamente come E S→P Si consideri una reazione in cui il catalizzatore I catalizzi la sua stessa sintesi: si ha in questo caso una reazione autocatalitica IX II X I X → I I I I Se un insieme di reazioni autocatalitiche è organizzato in uno schema ciclico si ha un iperciclo I1 In I2 I4 I3 La sintesi proteica come iperciclo Il processo di sintesi proteica ha la struttura di un iperciclo DNA m-RNA Proteine Il DNA è trascritto in m-RNA, che è tradotto nelle proteine Le proteine stesse sono gli enzimi che catalizzano le reazioni di trascrizione e traduzione Modello matematico Il sistema di equazioni più semplice che ha i requisiti necessari per riprodurre un comportamento darwiniano è del tipo dx i = x& i = (A i Q i − D i )x i + ∑ w ik x k − Φ i dt k ≠i •xi : numero di molecole della i-esima specie autoriproducente •Ai : coefficiente di attività •Di : coefficiente di decomposizione •Qi: fattore di qualità •wik : accoppiamento tra le specie i e k •Φi : flusso Ai Qi xi La reazione che porta alla formazione della specie xi è autocatalitica Ai = f (m1,m2,mp), dove gli mi sono i p monomeri necessari per la sintesi 0 < Qi < 1 fattore di qualità, frazione di copie esatte -Dixi Di : coefficiente di decomposizione Σk≠i wikxk wik : accoppiamento tra le specie i e k Se si considerano nel set di reazioni tutte le specie ed i possibili mutanti, ogni copia errata della specie k porterà alla formazione di una molecola della specie i, quindi si avrà ∑ A i (1 - Q i )x i = ∑∑ w ik x k i i k ≠i Il termine di flusso Φi descrive la variazione del numero di molecole della specie i-esima non dovuta alle reazioni chimiche Si può ipotizzare che il flusso di ciascuna specie sia proporzionale alla sua concentrazione Φi = xi ΦT , ∑ xk ∑ Φi = ΦT i k Un vincolo esterno ragionevole è quello della conservazione del numero totale di molecole Il flusso totale ΦT deve allora essere tale da compensare l’eccesso di produttività Φ T = ∑ A k x k −∑ D k x k ≡ ∑ E k x k k k k Il sistema di equazioni differenziali può essere quindi riscritto nella forma x& i = (Wii − E(t) )x i + ∑ w ik x k k ≠i dove Wii = A i Q i − D i è detto valore selettivo e E(t) = ∑ E k x k k ∑ xk è l’eccesso di produttività medio k E(t) è evidentemente funzione del tempo, poiché dipende dalla popolazione xk(t), e raggiunge uno stato stazionario solo quando la popolazione xk(t) diviene stazionaria ∀ k Il concetto di quasi-specie Si può suddividere la popolazione, invece che in N specie xi, in N quasi-specie yi, ottenute come combinazioni lineari delle xi Dal punto di vista matematico, questo corrisponde ad una trasformazione lineare: y = C-1 x Dal punto di vista biologico, tiene conto del fatto che gli individui di una stessa specie non hanno tutti esattamente la stessa sequenza di DNA, ma è possibile soltanto definire una sequenza media della specie Le quasi-specie includono quindi l’insieme di sequenze (ciascuna delle quali, dal punto di vista molecolare, è una specie) all’interno di una specie (biologica) Si vogliono trasformare le variabili di specie, x, in quelle di quasi-specie, y x i = ∑ c ij y j , con det(C) ≠ 0 j Ricordando che x& i = (Wii − E(t) )x i + ∑ w ik x k = − E(t)x i + ∑ Wik x k k ≠i si ottiene per y i, k C y& = − E(t) C y + W C y Moltiplicando a sinistra per C-1 si ottiene C -1C y& = −C -1E(t) C y + C -1W C y y& = − E(t) y + C-1W C y Si definisce C in modo tale che diagonalizzi W (C -1W C) ij = δ ij λ i Si ottiene così il sistema di equazioni per le quasi-specie y& i = (λ i − E(t) )y i Si consideri quindi il sistema di equazioni differenziali disaccoppiate y& i = (λ i − E(t) )y i dove i λi sono gli autovalori del sistema e E(t) = ∑ λ k y k k ∑ yk k è l’eccesso di produttività medio In questo caso la soluzione è semplice e può essere facilmente ricavata analiticamente, tuttavia in casi più complessi è importante costruire un’equazione differenziale discretizzata in modo da ottenere una soluzione numerica Un brevissimo excursus Discretizzazione di un’equazione differenziale Si consideri la seguente equazione x& = dx = f(x) ⇒ dx = f(x)dt dt Discretizzando si ottiene x(t + Δt) - x(t) = f(x(t)) Δt ⇒ x(t + Δt) = x(t) + f(x(t)) Δt + o(Δt 2 ) Si suddivide il tempo in intervalli discreti ed equispaziati con Δt = 1 Si può quindi scrivere x(t i +1 ) = x(t i ) + f(x(t i )) Un semplice codice consente di risolvere il modello numerico http://www.python.it/ # x0: initial concentrations x0=[.2,.35,.45]; c0=sum(x0) # Lambda: eigenvalues Lambda=[.5,.6,.4] Gamma=[0,0,0] # Chemical evolution x=[ [ ],[ ],[ ] ] for k in range(len(x0)): x[k]+=[x0[k]] for i in range(40): Et=0;E=[]; S1=0; S2=0; S=0 for j in range(len(Lambda)): S1+=Lambda[j]*x[j][i]; S2+=x[j][i] Et=S1/S2; E+=[Et] S=sum(Gamma) for j in range(len(Gamma)): x[j]+=[(Lambda[j]-Et+1)*x[j][i]] tot=[] for t in range(len(x[0])): tot+=[x[0][t]+x[1][t]+x[2][t]] # Saving Graph plot(x[0],'k'); plot(x[1],'r'); plot(x[2],'b') xlabel('Time'); ylabel('Concentration') savefig('Graph1.png') Definizione dei parametri del modello Risoluzione delle equazioni discretizzate ⇓ Evoluzione temporale delle concentrazioni Plot dei risultati Si possono quindi risolvere numericamente le equazioni differenziali che regolano il comportamento del sistema yi (t + 1) = (λ i − E(t) + 1)yi (t) Ogni specie che ha λ < E(t) tende a scomparire. E(t) è una funzione crescente del tempo lim E(t) = λ MAX t →∞ Dopo un tempo sufficientemente lungo rimane quindi solo la specie con λ = λ max L’iperciclo “astratto” Un insieme di reazioni chimiche può essere descritto in modo assai generale dal sistema di equazioni differenziali x& i = Λ i (x 1 ,..., x n ; k 1 ,..., k m ; B) dove le • xi è il numero di molecole della specie i-esima • kj è la costante della j-esima reazione • Le costanti k dipendono dal tempo ⇒ Evoluzione •B sono le condizioni iniziali La funzione Λi può essere riscritta come somma di 3 contributi Λi = Ai − Δi − Φi • Ai contributi positivi alla crescita di xi • Δi contributi negativi alla crescita di xi (decomposizione della specie molecolare) • Φi flusso della specie i-esima (positivo o negativo) Si può quindi definire la differenza Γi = A i − Δ i funzione di crescita netta Si può scrivere allora Λ i = Γi − Φ i Ricordando l’equazione fondamentale x& i = (A i Qi − Di )x i + ∑ w ik x k − Φ i = Γ i − Φ i k ≠i si osserva che Γi = Wii x i + ∑ w ik x k k ≠i Sommando su tutte le specie molecolari si ottiene ∑ Γ i = ∑ Wii x i + ∑∑ w ik x k = i i k ≠i i = ∑ (A i Q i − D i )x i + ∑ A i (1 - Q i )x i = i i = ∑ Ai x i − ∑ Di x i = ∑ Ei x i i i i La funzione di crescita netta Γi dipenderà anch’essa dalle quantità xi, ki, B Utilizzando la notazione vettoriale, dove ⎛ x1 ⎞ ⎜ ⎟ x = ⎜ x i ⎟, ⎜x ⎟ ⎝ n⎠ ⎛ k1 ⎞ ⎜ ⎟ k = ⎜ ki ⎟ ⎜k ⎟ ⎝ m⎠ si può scrivere quindi Γi = Γi (x, k , B) Si analizzano quindi qui di seguito alcuni semplici casi in cui si suppone che Γi sia esprimibile come un polinomio nelle diverse concentrazioni xi Γ i = k i x ip Si studia l’andamento di xi per diversi valori di p e dei vincoli esterni Crescita illimitata Si ricorda l’espressione x& i = Λ i = Γ i − Φ i Si considera il caso in cui il flusso è nullo: Φi = 0 Non c’è nessun limite alla crescita del sistema (modello fisicamente poco realistico!) Si ipotizza che la funzione di crescita netta sia esprimibile come Γi= ki xip e si studia il comportamento del sistema per 3 valori di p, in particolare per p=0, p=1, p=2 p=0 Γi= ki ⇒ x& i = k i Si risolve l’equazione dx i = ki dt dx i = k i dt x i = x i (0) + k i t Tasso di crescita costante Crescita lineare di ciascuna specie xi p=1 Γi= ki xi ⇒ x& i = k i x i Si risolve l’equazione dx i = kixi dt dx i = k i dt xi x i = x i (0)exp(k i t) Tasso di crescita lineare nella popolazione della specie Crescita esponenziale di ciascuna specie xi p=2 Γi= ki xi2 ⇒ x& i = k i x i 2 Si risolve l’equazione dx i = kixi2 dt dx i = k i dt 2 xi x i = x i (0)(1 - x i (0)k i t) -1 Tasso di crescita quadratico nella popolazione della specie Crescita iperbolica di ciascuna specie xi La popolazione della specie i-esima diverge per t=tc=(xi(0)ki)-1 Riassumendo: Λi = Γi -Φi= Γi = kixip p=0 xi=xi(0)+kit p=1 xi=xi(0) exp(kit) p=2 xi=xi(0)(1-xi(0)kit)-1 Si osservano diversi possibili andamenti di crescita, ma l’assenza di un vincolo sul numero di molecole totale comporta l’assenza di competizione tra le specie molecolari Crescita totale nulla In un sistema reale la crescita della popolazione è limitata dalla disponibilità di risorse Si impone quindi come vincolo la conservazione del numero totale di molecole, c c = ∑ x i = cost i c& = ∑ x& i = ∑ Γ i (x) − Φ T i i c& = 0 ⇒ Φ T = ∑ Γ i (x) i Ipotizzando che il flusso di ciascuna specie sia proporzionale alla sua concentrazione si ha xi Φi = c ∑ Γ i ( x) i Le equazioni differenziali divengono x& i = Γ i (x) − xi c ∑ Γ j ( x) j Dato questo nuovo set di equazioni differenziali xi x& i = Γ i (x) − c ∑ Γ j ( x) j si ipotizza anche in questo caso che la funzione di crescita netta sia esprimibile come Γi= ki xip Si studia quindi il comportamento del sistema per 3 valori di p, in particolare per p=0, p=1, p=2 La risoluzione analitica di queste equazioni è generalmente più complicata. Tuttavia Per avere un’idea del sistema è sufficiente cercare analiticamente le condizioni comportamento del di stato stazionario ( x& i = 0 ), che descrivono il comportamento del sistema dopo tempi sufficientemente lunghi. Quindi La soluzione può essere cercata risolvendo il sistema di equazioni numericamente Si può poi verificare a posteriori la consistenza della soluaione trovata con le condizioni determinate analiticamente p=0 La funzione di crescita netta è in questo caso Γi= ki Si risolve l’equazione per lo stato stazionario xi x& i = k i − c ∑kj = 0 j x& i = 0 ⇒ x i = ck i ∑kj j Coesistenza di tutte le specie senza selezione Dopo un tempo finito la popolazione della specie i si porta alla sua concentrazione stazionaria, che dipende solo dalla costante di reazione ki Γi= ki Non c’è dipendenza dalle concentrazioni iniziali Dopo un tempo sufficientemente lungo ciascuna specie raggiunge la sua concentrazione di equilibrio p=1 La funzione di crescita netta è allora Γi= kixi Si risolve l’equazione per lo stato stazionario xi x& i = k i x i − c ∑ k jx j = 0 j x& i = 0 ⇒ x i = 0, i ≠ i x i = c, i = i Dopo un tempo sufficientemente lungo rimane solo una specie Γi= ki xi Non c’è dipendenza dalle concentrazioni iniziali Dopo un tempo sufficientemente lungo l’unica specie presente è quella con la costante di reazione più grande Selezione del più adatto Se nel tempo appare una specie più adatta (con una costante k maggiore), essa riesce a emergere p=2 La funzione di crescita netta è allora Γi= ki xi2 Si risolve l’equazione per lo stato stazionario x& i = k i x i2 xi − c 2 k x ∑ j j =0 j x& i = 0 ⇒ x i = 0, i ≠ i x i = c, i = i Dopo un tempo sufficientemente lungo rimane solo una specie Γi= ki xi2 A causa del tasso di crescita quadratico c’è una dipendenza dalle concentrazioni iniziali Dopo un tempo sufficientemente lungo rimane una sola specie (quella per cui il prodotto kx è maggiore) Selezione “una volta per tutte” del più adatto Se appare una specie più adatta (con una costante k maggiore), essa riesce a emergere solo se la sua concentrazione iniziale non è troppo bassa Info [email protected] Aula dottorandi: 06-72594868 Pagina web http://biophys.roma2.infn.it/Stellato/Stellato-Ita.html