Lezione 3 I geni nelle popolazioni (2) Deriva genetica Cambiamenti casuali delle frequenze alleliche dovuti alle dimensioni finite delle popolazioni Questo tipo di evoluzione dovuto alla deriva non si può predire; è causale o stocastico L’effetto della deriva dipende dalla dimensione della popolaizone ed è più forte in piccole popolazioni Una forza evolutiva di grande efficacia Deriva genetica Un approccio stocastico Probabilità: breve ripasso Genetica ed evoluzione hanno una natura stocastica I possibili risultati di un processo stocastico si chiamano eventi. (Un processo deterministico ha solo un possibile risultato) La probabilità di un evento è la frazione di risultati (tutti i casi possibili) in cui si verifica tale evento (casi favorevoli). La probabilità di un evento A viene indicata con P(A). 0<P<1 La somma delle probabilità di tutti gli eventi mutuamente esclusivi è 1 n ∑ P(i) = 1 i=1 Deriva genetica Selezione: cambiamenti direzionali Deriva genetica: cambiamenti random Un approccio stocastico Le frequenze alleliche possono cambiare anche per effetto del caso Generazione 0 Le frequenze alleliche nel pool dei gameti riflettono le frequenze alleliche degli adulti della generazione parentale frequenza allele bianco 0.50 0.50 1 0.60 0.60 2 0.80 0.80 3 0.40 Un esempio di deriva. Immaginiamo una specie rara tenuta in uno zoo la cui popolazione conti 6 individui diploidi. In totale ci sono 12 cromosomi (numerati 112 nella generazione 0) che possono portare alleli diversi (colori). Assumiamo che tutti gli allleli abbiano la stessa fitness, quindi siamo in condizioni di evoluzione neutrale. Dopo un piccolo numero di generazioni ogni cromosoma porta un allele identico per discesa (identity by descent, IBD) = fissazione. Guardando indietro nel tempo, il tempo di coalescenza tra glli alleli della poolazione presente è 7 generazioni. Deriva genetica Selezione: cambiamenti direzionali Deriva genetica: cambiamenti random Un approccio stocastico Modello di Wright‐Fisher (popolazione ideale) La dimensione della popolazione rimane costante Le generazioni non sono sovrapposte Tutti gli alleli hanno la stessa probabilità di essere campionati Sex ratio = 1 Se non c’è selezione e la dimensione della popolazione è infinita le frequenze alleliche non cambiano da una generazione alla successiva (HWE), ma se le dimensioni sono finite le frequenze alleliche fluttuano per via del campionamento Deriva genetica ⎛ n⎞ k P(k) = ⎜ ⎟ p (1− p)n − k ⎝ k⎠ Distribuzione binomiale La distribuzione binomiale dà la probabilità di k successi in n prove Quando 2N gameti vengono campionati da un pool di gameti infinito la probabilità Pi che quel campione contenga esattamente i alleli di tipo A1 è data dalla funzione di probabilità binomiale Pochè Pi è sempre > 0 per popolazioni in cui i due alleli coesistono (0 < p < 1), le frequenze alleliche possono cambiare di generazione in generazione senza l’intervento della selezione Deriva genetica La frequenza pt di A1 al tempo t è una variabile random Media di pt E(pt ) = p0 Varianza Dipendenza della varianza da N 0.3 0.25 N 25 0.15 N 250 N 1000 0.1 0.05 0 1 20 40 60 80 100 120 140 160 180 200 220 240 260 280 300 320 340 360 380 400 420 440 460 480 Varianza 0.2 Tempo (generazioni) Deriva genetica La frequenza pt di A1 al tempo t è una variabile random E(pt ) = p0 non cambia col tempo! Aumenta col tempo! Frequenze alleliche N piccole N grandi Campionamento random ↓ Fluttuazioni random generazioni Deriva genetica Modello di Wright‐Fisher non realistico: Sewall Wright (1931) introdusse il concetto di dimensione effettiva (Ne) delle popolazioni che definì come la dimensione di una popolazione ideale che avrebbe lo stesso effetto di campionamento casuale delle frequenze alleliche della popolazione reale Deriva genetica Consideriamo una popolazione con dimensione reali (census size) = N in cui la frequenza dell’allele A1 alla generazione t = p. Se il numero di individui che si riproduce = N, allora la varianza della frequenza dell’allele A1 nella generazione successiva, pt+1, si può ottenere dall’equazione della varianza ponendo t = 1 Deriva genetica Dato che non tutti gli individui nella popolazione prendono parte al processo riproduttivo la varianza è più grande di quella predetta da: pt (1− pt ) V( p t+1 ) = 2N La dimensione effettiva della popolazione è il valore che sostituisce N per soddisfare l’equazione: pt (1− pt ) V( p t+1 ) = 2N e Deriva genetica Modello di Wright Fisher: non realistico Esempi: •le generazioni si sovrappongono → alcuni individui al tempo t non contribuiscono al pool genico della generazione successiva perché non fertili (non maturi, oltre il periodo fertile) DEVELPEMENTAL STRATIFICATION Nei and Imazumi (1966): uomo Ne ≈ N/3 •Il numero di maschi e femmine che si riproducono non è uguale (es. specie poligame) Behavioural ecology 2004 Deriva genetica Modello di Wright Fisher: non realistico •Il numero di maschi e femmine che si riproducono non è uguale (es. specie poligame) Se una popolazione ha Nm maschi e Nf femmine, Ne è data da: SOLO se la sex ratio è di 1:1 (sex ratio “fisheriana” ) allora N = Ne In ogni altro caso N > Ne Deriva genetica Qual è la dimesione effettiva di un alveare? N ≈ 100000 Nf = 1 Nm >> 1 Ne = 4 Deriva genetica Anche variazoni nel lungo periodo possono rendere Ne < N Esempi: Catastrofi ambientali Modelli di riproduzione ciclica Eventi di estinzione e ricolonizzazione di una regione geografica “the lemming cycle” Lemmings breed at regular intervals in such vast numbers as to cause mass migration, for instance, in Lapland. In Greenland, population cycle of the collared lemming is particularly regular, varying over 4‐year periods. According to recent research, the cyclic population dynamics in Greenland are explained by predator‐prey interaction, and not the biological attributes of lemmings or the limited food resources, as was previously assumed. (http://www.helsinki.fi/research/news/2003/week46.htm) Deriva genetica La dimensione della popolazione varia nel tempo. Supponendo che ci siano n generazioni non sovrapposte, la dimensione effettiva è data dalla media armonica delle dimesioni della popolazione nel tempo: Media armonica generazioni La media armonica è più vicina ai valori bassi che a quelli alti Deriva genetica Se una popolazione subisce un collo di bottiglia (bottleneck) la “long‐term effective population size” è molto ridotta, anche se la popolazione ha ripreso da tempo la sua dimensione reale pre‐collo di bottiglia Deriva genetica Dimensioni della popolazione umana nella storia Long‐term (~2 million years) effective population size Ne = 10,000 Dato un tempo sufficientemente lungo la deriva inevitabilmente porta alla fissazione o alla perdita di una forma allelica Sostituzione genica Sostituzione per deriva Dopo un certo numero di generazioni che dipende dalla dimensione della popolazione, ogni cromosoma porta un allele identico per discesa (identity by descent, IBD) = fissazione. Sostituzione genica codominanza Sostituzione per selezione A2 dominante A1 dominante A1 = forma ancestrale A2 = forma derivata Sostituzione genica Processo per il quale un allele mutante sostituisce la forma più comune o “wild type” Tempo di fissazione Mutante → Fissazione Probabilità di fissazione Tasso di sostituzione= numero di sostituzioni / tempo Sostituzione genica Processo per il quale un allele mutante sostituisce la forma più comune o “wild type” Mutante → Fissazione Probabilità di fissazione Da che cosa dipende? 1. Dalla frequenza iniziale q 2. Dal coefficiente di selezione s (selezione!) 3. Dalla dimensione effettiva Ne (deriva!!) Sostituzione genica Processo per il quale un allele mutante sostituisce la forma più comune o “wild type” Mutante → Fissazione Probabilità di fissazione Kimura (1962): la probabilità di fissazione di A2 è data da Dimensione effettiva Coefficiente di selezione Frequenza iniziale di A2 Sostituzione genica Mutante Se s tende a 0: assenza di selezione = neutralità → Fissazione Probabilità di fissazione quando x è piccolo e –x ≈ 1‐x Se Nesq è piccolo, cioè quando s→0, l’equazione si riduce a P ≈ q La probabilità di fissazione di un allele neutrale è pari alla sua frequenza nella popolazione Sostituzione genica Mutante Se s è ≠ 0: presenza di selezione → Fissazione Probabilità di fissazione Se N è la dimensione della popolazione, la frequenza iniziale di un nuovo allele sarà q=1/(2N) Sostituiamo q con 1/(2N) Probabilità di fissazione di un nuovo allele quando s ≠ 0 Sostituzione genica Mutante → Fissazione Probabilità di fissazione Probabilità di fissazione di un nuovo allele quando s ≠ 0 Se Ne è grande, quindi Ne → N Probabilità di fissazione di un nuovo allele quando s è piccolo (ricorda: e –x ≈ 1‐x) ed Ne → N Per valori positivi e piccoli di s e grandi valori di N Sostituzione genica Per valori positivi di s e grandi valori di N Quindi se una mutazione vantaggiosa insorge in una popolazione grande e ha un vantaggio selettivo inferiore al 5% (s < 0.05, piccolo), la probabilità che si fissi è approssimativamente il doppio del suo vantaggio selettivo Esempio: la probabilità di fissazione di una nuova mutazione codominante con s = 0.01 è 2%. Sostituzione genica Per valori positivi di s e grandi valori di N Dan Graur Probabilità di fissazione Dimensione della popolazione Mutazione neutrale Mutazione vantaggiosa (s = 0.01) Mutazione deleteria (s = –0.001) 1.000 0.05% 2% 0.004% 10.000 0.005% 2% ~10–20 P = q = 1/2N P = 2s Sostituzione genica Tempo di fissazione Nel caso di un nuovo allele mutante neutrale (q=1/2N) il tempo di fissazione è stato calcolato da Kimura e Ohta (1969) Se la mutazione ha un vantaggio selettivo di s si può approssimare a Tempo di fissazione Allele neutrale Allele selezionato Tempo di fissazione Sostituzione genica Tasso di sostituzione Numero di mutanti che raggiungono la fissazione nell’unità di tempo Mutazione neutrale Mutazioni neutrali avvengono con un tasso µ per gene per generazione Il numero di mutanti per locus in una popolazione diploide di dimensione N sarà 2N µ per generazione La probabilità di fissazione di queste mutazioni è P= 1/(2N) Il tasso di sostituzione è K = 2N µ P K = 2N µ (1/2N)= µ Kimura 1968: Evolutionary rate at the molecular level, Nature Sostituzione genica Tasso di sostituzione K = µ se la mutazione è neutrale N grande = molte mutazioni ma P= 1/(2N) quindi poche si fissano N piccolo = poche mutazioni ma molte di queste si fissano Il tasso di sostituzione è INDIPENDENTE da N! Sostituzione genica Tasso di sostituzione Se la mutazione è sottoposta a selezione positiva il tasso di sostituzione si ottiene moltiplicando il numero di mutazioni per generazione, 2N µ per la probabilità di fissazione P = 2s K = 4Nsµ Il tasso di sostituzione è DIPENDENTE da N, s e µ