Lezione 5
Cambiamenti evolutivi nelle sequenze nucleotidiche
materiale
• Graur and Li ch 3
• Graur Lectures 16‐17
Sostituzioni nucleotidiche
• Processo base nell’evoluzione molecolare
• Essenziale per comprendere i meccanismi di evoluzione del DNA
• I cambiamenti delle sequenze nucleotidiche vengono usati per
– Stimare il tasso di evoluzione
– Ricostruire la storia evolutiva degli organismi
Sostituzioni nucleotidiche
La distanza tra due sequenze si definisce come il numero atteso di sostituzioni nucleotidiche per sito. Se il tasso di evoluzione è costante nel tempo la distanza crescerà linearmente con il crescere del tempo di divergenza. AATGAAAGAA
ACTGGAGGAA
10 siti; 3 differenze Una semplice misura di distanza è la proporzione dei siti differenti (a volte chiamata distanza p) 10 siti; 3 differenze distanza = 30% = 0.3
Sostituzioni nucleotidiche
AATGAAAGAA
ACTGGAGGAA
10 siti; 3 differenze
distanza = 30% = 0.3
Questa proporzione grezza funziona per sequenze che sono molto vicine evolutivamente.
Se è passato molto tempo dalla divergenza, p sottostima il numero di sostituzioni che sono realmente avvenute. Un sito variabile può originarsi attraverso più percorsi e perfino un sito uguale in due sequenze può nascondere retro sostituzioni o sostituzioni parallele. Sostituzioni multiple nascondono alcuni cambiamenti, perciò p non è una funzione diretta del tempo evolutivo. La proporzione grezza p può essere usata solo se p < al 5% Sostituzioni nucleotidiche: modelli
• Per studiare la dinamica delle sostituzioni dobbiamo fare delle assunzioni sulla probabilità di cambiamento di un nucleotide con un altro
• Quanti parametri? Modelli diversi con un diverso numero di parametri
Sostituzioni nucleotidiche: modelli
• Dove vogliamo arrivare?
• Dobbiamo stabilire che cosa ci aspettiamo ad un determinato sito al passare del tempo
• Dobbiamo stabilire i cambiamenti temporali nella probabilità di avere un determinato nucleotide ad un dato sito, considerando possibili «complicazioni» (sostituzioni multiple etc) Sostituzioni nucleotidiche: JC69
Modello di Jukes e Cantor (1969)
Assunzione:
• Tutti i cambiamenti sono equiprobabili (25%)
• Modello ad UN parametro: un solo tasso di sostituzione (α)
Esempio di α: 10‐9 sostituzioni/sito /anno
Sostituzioni nucleotidiche: JC69
Scomponiamo il problema e iniziamo a rispondere alla domanda:
Qual è la probabilità che il nucleotide A al tempo 0 sia ancora A al tempo 1?
Probabilità di A>T + A>C + A>G
P(A1) = 1‐ 3 α
P(not A1) = 3 α = 1‐ P(A1)
Sostituzioni nucleotidiche: JC69
Ma ci interessa la dinamica nel tempo, quindi proseguiamo:
Qual è la probabilità che il nucleotide A al tempo 0 sia ancora A al tempo 2?
Sostituzioni nucleotidiche: JC69
Qual è la probabilità che il nucleotide A al tempo 0 sia ancora A al tempo 2?
Due possibili percorsi:
1. Il nucleotide è rimasto lo stesso
dal tempo 0 al tempo 2. P(A1)
1‐P(A1)
2. Il nucleotide è cambiato in T, C, o G al tempo 1, ma è tornato ad essere A al tempo 2
α (esempio T > A)
1‐3 α
Sostituzioni nucleotidiche: JC69
La probabilità che il nucleotide A al tempo 0 sia ancora A al tempo 2 è
P(A2 ) = (1‐3 α) P(A1) + α [1‐P(A1)]
1‐P(A1)
P(A1)
P = α
P = 1‐3 α
P(At+1 ) = (1‐3 α) P(At) + α [1‐P(At)]
Sostituzioni nucleotidiche: JC69
P(At+1 ) = (1‐3 α) P(At) + α [1‐P(At)]
P(At+1 ) = P(At) ‐ 3 α P(At) + α [1‐P(At)]
Possiamo riformulare l’equazione precedente in termini di quanto cambia PAt per unità di tempo
P(At+1 ) ‐ P(At) = ‐ 3 α P(At) + α [1‐P(At)]
Δ P(At) = ‐ 3 α P(At) + α ‐ α P(At) = ‐ 4 α P(At) + α
Se invece di considerare un processo DISCRETO nel tempo consideriamo un processo CONTINUO, Δ P(At) diventa il tasso di cambiamento al tempo t
Sostituzioni nucleotidiche: JC69
soluzione
Se si parte da A quindi A0 = A, P(A0)= 1
Se si parte da NON A quindi A0 = G, T, o C
P(A0)= 0
Sostituzioni nucleotidiche: JC69
Modello di Jukes e Cantor (1969)
Cambiamenti temporali nella probabilità di avere un determinato nucleotide (per noi A) ad un dato sito Nucleotide inizialmente A
Frequenza all’equilibrio:
Nucleotide inizialmente T, G o C
Sostituzioni nucleotidiche: JC69
CA
TA
i ≠ j
Queste due equazioni sono sufficienti per descrivere il processo di sostituzione nel caso del modello ad un parametro
Sostituzioni nucleotidiche: K80 o K2P
Modello di Kimura (1980): Kimura 2 parametri
β
α
β
β
β α
α β
β
β α β
In questo modello il tasso con cui avvengono le transizioni (α) può essere diverso da quello con cui avvengono le trasversioni (β)
In genere le transizioni sono più frequenti delle trasversioni
Sostituzioni nucleotidiche: K80 o K2P
Modello di Kimura (1980): Kimura 2 parametri
Sostituzioni nucleotidiche: K80 o K2P
Modello di Kimura (1980): Kimura 2 parametri
Assumiamo di nuovo che al tempo 0 il nucleotide sia A,
trasversioni
α
β
β
β
α β
β α β
α
β
β
C
T
G
transizioni
Sostituzioni nucleotidiche: K80 o K2P
Modello di Kimura (1980): Kimura 2 parametri
A
Matrice delle
probabilità di
cambiamento
A
G
C
T
P0(t)
P1(t)
P2(t)
P2(t)
G
C
P1(t)
P0(t)
P2(t)
P2(t)
P2(t)
P2(t)
P0(t)
P1(t)
T
P2(t)
P2(t)
P1(t)
P0(t)
Conosciamo P0, P1 e P2? Si dimostra che (Kimura 1980, Li 1986):
P che un nucleotide ad un sito al tempo t
sia identico a quello al tempo 0
P che il nucleotide iniziale e quello al tempo t differiscano per per una transizione
P che il nucleotide al tempo t e il nucleotide iniziale differiscano per una trasversione
Sostituzioni nucleotidiche: K80 o K2P
Modello di Kimura (1980): Kimura 2 parametri
A
Matrice delle
probabilità di
cambiamento
A
G
C
T
P0(t)
P1(t)
P2(t)
P2(t)
G
C
P1(t)
P0(t)
P2(t)
P2(t)
P2(t)
P2(t)
P0(t)
P1(t)
T
P2(t)
P2(t)
P1(t)
P0(t)
Ogni nucleotide è soggetto a due tipi di trasversioni,ma
ad un solo tipo di transizione. Quindi la probabilità che
il nucleotide iniziale e quello al tempo t differiscano di
una trasversione è il doppio che nel caso di una
transizione
P0(t) + P1(t) + 2P2(t) = 1
Sostituzioni nucleotidiche: altri modelli
T
C
A
G
T
C
A
G
Sostituzioni nucleotidiche: altri modelli
T
C
A
G
T
C
A
G