Lezione 8
Selezione positiva o darwiniana
• Graur and Li: Capitolo 4 (+Cap 2 p63-65)
• Graur: lecture 20
• Ziheng Yang: computational molecular
evolution
In generale il tasso di sostituzione in geni e
regioni non geniche si spiega con
• La mutazione che aggiunge varianti
• La deriva genetica che governa la sorte di alleli
neutrali o quasi neutrali
• Il ruolo rispettivo di selezione/deriva che
dipende dalla dimensione della popolazione
• Le selezione purificante che elimina gli alleli
deleteri
E la selezione positiva (adattativa, darwiniana)?
Come identificare la selezione positiva
Alcune considerazioni
• I cambiamenti non sinonimi più probabilmente
avranno significato adattativo
• Le mutazioni vantaggiose si fissano più velocemente
delle neutrali quindi il tasso di sostituzione
Nonsyn > Syn
se la selezione positiva sta agendo sulla proteina
KA > K S
Selezione positiva o darwiniana
Un altro modo di affrontare il problema:
La teoria neutrale fornisce un modello
nullo per i test di selezione
• Se qualunque tipo di sostituzione (anche
quelle Nonsyn) è effettivamente neutrale,
allora il tasso di sostituzioni Nonsyn
dovrebbe eguagliare quello delle Syn.
• Sequenziare lo stesso gene (gene omologo)
in due diverse specie.
• Confrontare il tasso di sostituzioni Syn con
quello delle Nonsyn.
Come identificare la selezione positiva:
test di McDonald Kreitman (1991)
Come identificare la selezione positiva:
test di McDonald Kreitman (1991)
2 specie
Confronto fra mutazioni
-sinonime fisse
-sinonime polimorfiche
-nonsinonime fisse
-nonsinonime polimorfiche
Come identificare la selezione positiva:
test di Mc Donald Kreitman (1991)
Il test si basa sulle seguenti assunzioni:
1. Solo le mutazioni nonsinonime possono essere adattative.
2. Le mutazioni sinonime sono sempre neutrali
3. Una mutazione selettivamente vantaggiosa si fisserà nella popolazione molto
più rapidamente di una neutrale e, quindi, meno facilmente sarà in uno stato
polimorfico.
Mutazione neutrale
Mutazione vantaggiosa
Come identificare la selezione positiva:
test di Mc Donald Kreitman (1991)
Prima classificazione dei siti nucleotidici
Un sito è POLIMORFICO se mostra variabilità
INTRASPECIFICA in una o entrambe le specie
Un sito è FISSATO se è diverso TRA SPECIE, ma non
mostra variabilità intraspecifica
Tutti gli altri siti sono MONOMORFICI e non vengono
usati nelle analisi
Presente
tempo
Passato
Antenato comune
specie1 e specie2
Queste mutazioni si
manifestano come caratteri
condivisi TRA le specie
tempo
Passato
divergenza
Presente
Antenato comune
specie1 e specie2
Queste mutazioni si
manifestano come differenze
FISSATE TRA le specie
Queste mutazioni si
manifestano come
POLIMORFISMI entro specie
Polimorfismi
Differenze fissate
Come identificare la selezione positiva:
test di Mc Donald Kreitman (1991)
Seconda classificazione dei siti nucleotidici
I siti POLIMORFICI e FISSATI vengono divisi in SINONIMI
e NONSINONIMI
Come identificare la selezione positiva:
test di Mc Donald Kreitman (1991)
Secondo il modello neutrale (ipotesi nulla!) ci si attende che:
Il destino delle mutazioni sia governato principalmente dalla
deriva genetica, trascorso un certo tempo t le mutazioni sinonime
e le non sinonime
hanno lo stessa probabilità di essere fissate
hanno la stessa probabilità di essere in stato polimorfico
Hanno la stessa probabilità di essere eliminate
Come identificare la selezione positiva:
test di Mc Donald Kreitman (1991)
Secondo il modello neutrale (ipotesi nulla!) ci si attende
che:
Il rapporto tra mutazioni FISSATE sinonime e
nonsinonime sia uguale al rapporto tra mutazioni
POLIMORFICHE sinonime e nonsinonime
Fissate sinonime
---------------------------Fissate nonsinonime
=
Polimorfiche sinonime
-----------------------------------Polimorfiche non sinonime
Una deviazione significativa da questa attesa permetterà
di rigettare l’ipotesi nulla di evoluzione neutrale
Selezione positiva
<
Mutazioni adattative (quindi selezionate positivamente) non sinonime saranno
soprattutto in stato fissato (differenze tra specie) > X aumenta
Selezione negativa
>
I cambiamenti non sinonimi non si fissano: selezionate purificante < X
SELEZIONE POSITIVA
Mc Donald Kreitman (1991)
Numero di differenze fissate sinonime e nonsinonime e di
polimorfismi in sequenze di glucoso-6-fosfato deidrogenasi tra
Drosophila melanogaster e D. simulans
SELEZIONE POSITIVA
_____________________________________________________
Differences
________________________
Type of change
Fixed
Polymorphic
_____________________________________________________
Synonymous
26
36
Nonsynonymous
21
2
_____________________________________________________
Data da Eanes et al. (1993). Comparazioni basate su 32 sequenze di
D. melanogaster e 12 sequenze di D. simulans, lunghezza
dell’allineamento: 1705 bp.
Problema:
Il risultato dipende dalla grandezza del campione studiato
Aumentando il campione è possibile solo aumentare il
numero dei polimorfismi, non quello delle differenze fissate
polymorphic
fixed
synonymous
X
Y
nonsynonymous
Z
W
Come identificare la selezione positiva:
Ka/Ks (o dN / dS..stessa cosa!!)
NB: non stiamo più parlando di MK test!!!!!!
• Ka/Ks fra due o più sequenze
• Metodi approssimati (disponibili ad esempio in MEGA)
• Metodi di maximum likelihood (PAML)
• Ka/Ks per una particolare linea evolutiva in un albero filogenetico
• Ka/Ks per specifiche regioni di un gene (e specifici aminoacidi)
Come identificare la selezione positiva:
Ka/Ks
Test basato sul rapporto tra sostituzioni nonsinonime e
sinonime
dN/dS: è la stessa cosa!!
Assunzioni:
1. Solo mutazioni nonsinonime possono migliorare le
funzioni di una proteina
2. Le mutazioni sinonime non contribuiscono alla fitness
Come identificare la selezione positiva: Ka/Ks
=ω
ω=1
Neutral
ω>1
positive sel
ω<1
purifying sel
Distanze fra sequenze:coding sites
Seq1
Seq2
KS
KA
Ser
TCA
↕
TCG
Ser
Thr
ACT
↕
ACA
Thr
Sin
Sin
Glu
GAG
GAG
Glu
Non
Sin
Met
ATG
↕
ATA
Ile
Cys Leu
TGT TTA
↕
TGT CTA
Cys Leu
Sin
Basta contare?
NO!
Distanze fra sequenze:coding sites
Metodo di Nei & Gojobori (1986)
Distanze fra due o più sequenze
1. Conto i siti sin e nonsin nelle 2
sequenze
2. Conto le differenze sin e nonsin
tra le sequenze
3. Correggo per sostituzioni
multiple
3a: approximate methods
Miyata and Yasunaga
Nei and Gojobori
MEGA
3b: metodo di maximum likelihood (ML) basato su
un modello esplicito di sostituzione dei codoni
(Box 2) PAML (Yang)
Testo se ω differisce
significativamente da 1
3a: test Z
3b: confronto modelli con un
likelihood ratio test (modello zero:
ω =1)
Spazio dei parametri Superficie espolarata
in modo esaustivo
MCMC
ω=1
Neutral
ω>1
ω<1
positive sel purifying sel
Esempi di KA/KS estremi (>>1):
(1)Glycophorin C = proteina della membrana dei globuli rossi che
serve come recettore per la proteina del Plasmodium falciparum che
lega l’eritrocita, quindi media una delle vie di invasione di P.
falciparum’s invasion nell’uomo).
(2)Granulysin = proteina secreta dalle T cells citotossiche quando
queste attaccano cellule infette. Crea fori nei patogeni come
Mycobacterium tuberculosis e li distrugge. Indice apoptosi nelle
cellule infette.
Elevati KA/KS sono frequenti in geni che hanno a che fare con la
riproduzione sessuale come geni coinvolti nel comportamento legato
all’accoppiamento, nella fertilizzazione, spermatogenesi, eiaculazione,
o determinazione del sesso.
Selezione positiva in una particolare linea evolutiva
Colobines
C
H
Hominoids
Ka/Ks per specifiche regioni di un gene (e specifici aminoacidi)
Sperm lysin
Red: Nonsynonymous/Synonymous >> 1
Green: Nonsynonymous/Synonymous ~ 1
Gray: Nonsynonymous/Synonymous << 1
42
One of the highest KA/KS
ratios (= 5.15) for a fulllength protein was found
in the 18-kilodalton
protein in the acrosomal
vesicle at the anterior of
the sperm cell of several
abalone species.
43
It is thought that sex-related
genes are subject to positive
selection for short periods of
time during speciation as a
means of erecting reproductive
barriers that restrict gene flow
between the speciating
populations.