Lezione 5 Cambiamenti evolutivi nelle sequenze nucleotidiche materiale • Graur and Li ch 3 • Graur Lectures 16‐17 Sostituzioni nucleotidiche • Processo base nell’evoluzione molecolare • Essenziale per comprendere i meccanismi di evoluzione del DNA • I cambiamenti delle sequenze nucleotidiche vengono usati per – Stimare il tasso di evoluzione – Ricostruire la storia evolutiva degli organismi Sostituzioni nucleotidiche La distanza tra due sequenze si definisce come il numero atteso di sostituzioni nucleotidiche per sito. Se il tasso di evoluzione è costante nel tempo la distanza crescerà linearmente con il crescere del tempo di divergenza. AATGAAAGAA ACTGGAGGAA 10 siti; 3 differenze Una semplice misura di distanza è la proporzione dei siti differenti (a volte chiamata distanza p) 10 siti; 3 differenze distanza = 30% = 0.3 Sostituzioni nucleotidiche AATGAAAGAA ACTGGAGGAA 10 siti; 3 differenze distanza = 30% = 0.3 Questa proporzione grezza funziona per sequenze che sono molto vicine evolutivamente. Se è passato molto tempo dalla divergenza, p sottostima il numero di sostituzioni che sono realmente avvenute. Un sito variabile può originarsi attraverso più percorsi e perfino un sito uguale in due sequenze può nascondere retro sostituzioni o sostituzioni parallele. Sostituzioni multiple nascondono alcuni cambiamenti, perciò p non è una funzione diretta del tempo evolutivo. La proporzione grezza p può essere usata solo se p < al 5% Sostituzioni nucleotidiche: modelli • Per studiare la dinamica delle sostituzioni dobbiamo fare delle assunzioni sulla probabilità di cambiamento di un nucleotide con un altro • Quanti parametri? Modelli diversi con un diverso numero di parametri Sostituzioni nucleotidiche: modelli • Dove vogliamo arrivare? • Dobbiamo stabilire che cosa ci aspettiamo ad un determinato sito al passare del tempo • Dobbiamo stabilire i cambiamenti temporali nella probabilità di avere un determinato nucleotide ad un dato sito, considerando possibili «complicazioni» (sostituzioni multiple etc) Sostituzioni nucleotidiche: JC69 Modello di Jukes e Cantor (1969) Assunzione: • Tutti i cambiamenti sono equiprobabili (25%) • Modello ad UN parametro: un solo tasso di sostituzione (α) Esempio di α: 10‐9 sostituzioni/sito /anno Sostituzioni nucleotidiche: JC69 Scomponiamo il problema e iniziamo a rispondere alla domanda: Qual è la probabilità che il nucleotide A al tempo 0 sia ancora A al tempo 1? Probabilità di A>T + A>C + A>G P(A1) = 1‐ 3 α P(not A1) = 3 α = 1‐ P(A1) Sostituzioni nucleotidiche: JC69 Ma ci interessa la dinamica nel tempo, quindi proseguiamo: Qual è la probabilità che il nucleotide A al tempo 0 sia ancora A al tempo 2? Sostituzioni nucleotidiche: JC69 Qual è la probabilità che il nucleotide A al tempo 0 sia ancora A al tempo 2? Due possibili percorsi: 1. Il nucleotide è rimasto lo stesso dal tempo 0 al tempo 2. P(A1) 1‐P(A1) 2. Il nucleotide è cambiato in T, C, o G al tempo 1, ma è tornato ad essere A al tempo 2 α (esempio T > A) 1‐3 α Sostituzioni nucleotidiche: JC69 La probabilità che il nucleotide A al tempo 0 sia ancora A al tempo 2 è P(A2 ) = (1‐3 α) P(A1) + α [1‐P(A1)] 1‐P(A1) P(A1) P = α P = 1‐3 α P(At+1 ) = (1‐3 α) P(At) + α [1‐P(At)] Sostituzioni nucleotidiche: JC69 P(At+1 ) = (1‐3 α) P(At) + α [1‐P(At)] P(At+1 ) = P(At) ‐ 3 α P(At) + α [1‐P(At)] Possiamo riformulare l’equazione precedente in termini di quanto cambia PAt per unità di tempo P(At+1 ) ‐ P(At) = ‐ 3 α P(At) + α [1‐P(At)] Δ P(At) = ‐ 3 α P(At) + α ‐ α P(At) = ‐ 4 α P(At) + α Se invece di considerare un processo DISCRETO nel tempo consideriamo un processo CONTINUO, Δ P(At) diventa il tasso di cambiamento al tempo t Sostituzioni nucleotidiche: JC69 soluzione Se si parte da A quindi A0 = A, P(A0)= 1 Se si parte da NON A quindi A0 = G, T, o C P(A0)= 0 Sostituzioni nucleotidiche: JC69 Modello di Jukes e Cantor (1969) Cambiamenti temporali nella probabilità di avere un determinato nucleotide (per noi A) ad un dato sito Nucleotide inizialmente A Frequenza all’equilibrio: Nucleotide inizialmente T, G o C Sostituzioni nucleotidiche: JC69 CA TA i ≠ j Queste due equazioni sono sufficienti per descrivere il processo di sostituzione nel caso del modello ad un parametro Sostituzioni nucleotidiche: K80 o K2P Modello di Kimura (1980): Kimura 2 parametri β α β β β α α β β β α β In questo modello il tasso con cui avvengono le transizioni (α) può essere diverso da quello con cui avvengono le trasversioni (β) In genere le transizioni sono più frequenti delle trasversioni Sostituzioni nucleotidiche: K80 o K2P Modello di Kimura (1980): Kimura 2 parametri Sostituzioni nucleotidiche: K80 o K2P Modello di Kimura (1980): Kimura 2 parametri Assumiamo di nuovo che al tempo 0 il nucleotide sia A, trasversioni α β β β α β β α β α β β C T G transizioni Sostituzioni nucleotidiche: K80 o K2P Modello di Kimura (1980): Kimura 2 parametri A Matrice delle probabilità di cambiamento A G C T P0(t) P1(t) P2(t) P2(t) G C P1(t) P0(t) P2(t) P2(t) P2(t) P2(t) P0(t) P1(t) T P2(t) P2(t) P1(t) P0(t) Conosciamo P0, P1 e P2? Si dimostra che (Kimura 1980, Li 1986): P che un nucleotide ad un sito al tempo t sia identico a quello al tempo 0 P che il nucleotide iniziale e quello al tempo t differiscano per per una transizione P che il nucleotide al tempo t e il nucleotide iniziale differiscano per una trasversione Sostituzioni nucleotidiche: K80 o K2P Modello di Kimura (1980): Kimura 2 parametri A Matrice delle probabilità di cambiamento A G C T P0(t) P1(t) P2(t) P2(t) G C P1(t) P0(t) P2(t) P2(t) P2(t) P2(t) P0(t) P1(t) T P2(t) P2(t) P1(t) P0(t) Ogni nucleotide è soggetto a due tipi di trasversioni,ma ad un solo tipo di transizione. Quindi la probabilità che il nucleotide iniziale e quello al tempo t differiscano di una trasversione è il doppio che nel caso di una transizione P0(t) + P1(t) + 2P2(t) = 1 Sostituzioni nucleotidiche: altri modelli T C A G T C A G Sostituzioni nucleotidiche: altri modelli T C A G T C A G