Lezione 8 Selezione positiva o darwiniana • Graur and Li: Capitolo 4 (+Cap 2 p63-65) • Graur: lecture 20 • Ziheng Yang: computational molecular evolution In generale il tasso di sostituzione in geni e regioni non geniche si spiega con • La mutazione che aggiunge varianti • La deriva genetica che governa la sorte di alleli neutrali o quasi neutrali • Il ruolo rispettivo di selezione/deriva che dipende dalla dimensione della popolazione • Le selezione purificante che elimina gli alleli deleteri E la selezione positiva (adattativa, darwiniana)? Come identificare la selezione positiva Alcune considerazioni • I cambiamenti non sinonimi più probabilmente avranno significato adattativo • Le mutazioni vantaggiose si fissano più velocemente delle neutrali quindi il tasso di sostituzione Nonsyn > Syn se la selezione positiva sta agendo sulla proteina KA > K S Selezione positiva o darwiniana Un altro modo di affrontare il problema: La teoria neutrale fornisce un modello nullo per i test di selezione • Se qualunque tipo di sostituzione (anche quelle Nonsyn) è effettivamente neutrale, allora il tasso di sostituzioni Nonsyn dovrebbe eguagliare quello delle Syn. • Sequenziare lo stesso gene (gene omologo) in due diverse specie. • Confrontare il tasso di sostituzioni Syn con quello delle Nonsyn. Come identificare la selezione positiva: test di McDonald Kreitman (1991) Come identificare la selezione positiva: test di McDonald Kreitman (1991) 2 specie Confronto fra mutazioni -sinonime fisse -sinonime polimorfiche -nonsinonime fisse -nonsinonime polimorfiche Come identificare la selezione positiva: test di Mc Donald Kreitman (1991) Il test si basa sulle seguenti assunzioni: 1. Solo le mutazioni nonsinonime possono essere adattative. 2. Le mutazioni sinonime sono sempre neutrali 3. Una mutazione selettivamente vantaggiosa si fisserà nella popolazione molto più rapidamente di una neutrale e, quindi, meno facilmente sarà in uno stato polimorfico. Mutazione neutrale Mutazione vantaggiosa Come identificare la selezione positiva: test di Mc Donald Kreitman (1991) Prima classificazione dei siti nucleotidici Un sito è POLIMORFICO se mostra variabilità INTRASPECIFICA in una o entrambe le specie Un sito è FISSATO se è diverso TRA SPECIE, ma non mostra variabilità intraspecifica Tutti gli altri siti sono MONOMORFICI e non vengono usati nelle analisi Presente tempo Passato Antenato comune specie1 e specie2 Queste mutazioni si manifestano come caratteri condivisi TRA le specie tempo Passato divergenza Presente Antenato comune specie1 e specie2 Queste mutazioni si manifestano come differenze FISSATE TRA le specie Queste mutazioni si manifestano come POLIMORFISMI entro specie Polimorfismi Differenze fissate Come identificare la selezione positiva: test di Mc Donald Kreitman (1991) Seconda classificazione dei siti nucleotidici I siti POLIMORFICI e FISSATI vengono divisi in SINONIMI e NONSINONIMI Come identificare la selezione positiva: test di Mc Donald Kreitman (1991) Secondo il modello neutrale (ipotesi nulla!) ci si attende che: Il destino delle mutazioni sia governato principalmente dalla deriva genetica, trascorso un certo tempo t le mutazioni sinonime e le non sinonime hanno lo stessa probabilità di essere fissate hanno la stessa probabilità di essere in stato polimorfico Hanno la stessa probabilità di essere eliminate Come identificare la selezione positiva: test di Mc Donald Kreitman (1991) Secondo il modello neutrale (ipotesi nulla!) ci si attende che: Il rapporto tra mutazioni FISSATE sinonime e nonsinonime sia uguale al rapporto tra mutazioni POLIMORFICHE sinonime e nonsinonime Fissate sinonime ---------------------------Fissate nonsinonime = Polimorfiche sinonime -----------------------------------Polimorfiche non sinonime Una deviazione significativa da questa attesa permetterà di rigettare l’ipotesi nulla di evoluzione neutrale Selezione positiva < Mutazioni adattative (quindi selezionate positivamente) non sinonime saranno soprattutto in stato fissato (differenze tra specie) > X aumenta Selezione negativa > I cambiamenti non sinonimi non si fissano: selezionate purificante < X SELEZIONE POSITIVA Mc Donald Kreitman (1991) Numero di differenze fissate sinonime e nonsinonime e di polimorfismi in sequenze di glucoso-6-fosfato deidrogenasi tra Drosophila melanogaster e D. simulans SELEZIONE POSITIVA _____________________________________________________ Differences ________________________ Type of change Fixed Polymorphic _____________________________________________________ Synonymous 26 36 Nonsynonymous 21 2 _____________________________________________________ Data da Eanes et al. (1993). Comparazioni basate su 32 sequenze di D. melanogaster e 12 sequenze di D. simulans, lunghezza dell’allineamento: 1705 bp. Problema: Il risultato dipende dalla grandezza del campione studiato Aumentando il campione è possibile solo aumentare il numero dei polimorfismi, non quello delle differenze fissate polymorphic fixed synonymous X Y nonsynonymous Z W Come identificare la selezione positiva: Ka/Ks (o dN / dS..stessa cosa!!) NB: non stiamo più parlando di MK test!!!!!! • Ka/Ks fra due o più sequenze • Metodi approssimati (disponibili ad esempio in MEGA) • Metodi di maximum likelihood (PAML) • Ka/Ks per una particolare linea evolutiva in un albero filogenetico • Ka/Ks per specifiche regioni di un gene (e specifici aminoacidi) Come identificare la selezione positiva: Ka/Ks Test basato sul rapporto tra sostituzioni nonsinonime e sinonime dN/dS: è la stessa cosa!! Assunzioni: 1. Solo mutazioni nonsinonime possono migliorare le funzioni di una proteina 2. Le mutazioni sinonime non contribuiscono alla fitness Come identificare la selezione positiva: Ka/Ks =ω ω=1 Neutral ω>1 positive sel ω<1 purifying sel Distanze fra sequenze:coding sites Seq1 Seq2 KS KA Ser TCA ↕ TCG Ser Thr ACT ↕ ACA Thr Sin Sin Glu GAG GAG Glu Non Sin Met ATG ↕ ATA Ile Cys Leu TGT TTA ↕ TGT CTA Cys Leu Sin Basta contare? NO! Distanze fra sequenze:coding sites Metodo di Nei & Gojobori (1986) Distanze fra due o più sequenze 1. Conto i siti sin e nonsin nelle 2 sequenze 2. Conto le differenze sin e nonsin tra le sequenze 3. Correggo per sostituzioni multiple 3a: approximate methods Miyata and Yasunaga Nei and Gojobori MEGA 3b: metodo di maximum likelihood (ML) basato su un modello esplicito di sostituzione dei codoni (Box 2) PAML (Yang) Testo se ω differisce significativamente da 1 3a: test Z 3b: confronto modelli con un likelihood ratio test (modello zero: ω =1) Spazio dei parametri Superficie espolarata in modo esaustivo MCMC ω=1 Neutral ω>1 ω<1 positive sel purifying sel Esempi di KA/KS estremi (>>1): (1)Glycophorin C = proteina della membrana dei globuli rossi che serve come recettore per la proteina del Plasmodium falciparum che lega l’eritrocita, quindi media una delle vie di invasione di P. falciparum’s invasion nell’uomo). (2)Granulysin = proteina secreta dalle T cells citotossiche quando queste attaccano cellule infette. Crea fori nei patogeni come Mycobacterium tuberculosis e li distrugge. Indice apoptosi nelle cellule infette. Elevati KA/KS sono frequenti in geni che hanno a che fare con la riproduzione sessuale come geni coinvolti nel comportamento legato all’accoppiamento, nella fertilizzazione, spermatogenesi, eiaculazione, o determinazione del sesso. Selezione positiva in una particolare linea evolutiva Colobines C H Hominoids Ka/Ks per specifiche regioni di un gene (e specifici aminoacidi) Sperm lysin Red: Nonsynonymous/Synonymous >> 1 Green: Nonsynonymous/Synonymous ~ 1 Gray: Nonsynonymous/Synonymous << 1 42 One of the highest KA/KS ratios (= 5.15) for a fulllength protein was found in the 18-kilodalton protein in the acrosomal vesicle at the anterior of the sperm cell of several abalone species. 43 It is thought that sex-related genes are subject to positive selection for short periods of time during speciation as a means of erecting reproductive barriers that restrict gene flow between the speciating populations.