Lezione 3
I geni nelle popolazioni (2)
Deriva genetica
Cambiamenti casuali delle frequenze alleliche dovuti alle dimensioni finite delle popolazioni
Questo tipo di evoluzione dovuto alla deriva non si può predire; è causale o stocastico
L’effetto della deriva dipende dalla dimensione della popolaizone ed è più forte in piccole popolazioni
Una forza evolutiva di grande efficacia Deriva genetica
Un approccio stocastico
Probabilità: breve ripasso
Genetica ed evoluzione hanno una natura stocastica
I possibili risultati di un processo stocastico si chiamano eventi. (Un processo deterministico ha solo un possibile risultato) La probabilità di un evento è la frazione di risultati (tutti i casi possibili) in cui si verifica tale evento (casi favorevoli). La probabilità di un evento A viene indicata con P(A). 0<P<1
La somma delle probabilità di tutti gli eventi mutuamente esclusivi è 1
n
∑ P(i) = 1
i=1
Deriva genetica
Selezione: cambiamenti direzionali
Deriva genetica: cambiamenti random
Un approccio stocastico
Le frequenze alleliche possono cambiare anche per effetto del caso
Generazione
0
Le frequenze alleliche
nel pool dei gameti
riflettono le frequenze
alleliche degli adulti
della generazione
parentale
frequenza allele bianco
0.50
0.50
1
0.60
0.60
2
0.80
0.80
3
0.40
Un esempio di deriva. Immaginiamo una specie rara tenuta in uno zoo la cui
popolazione conti 6 individui diploidi. In totale ci sono 12 cromosomi (numerati 112 nella generazione 0) che possono portare alleli diversi (colori). Assumiamo che
tutti gli allleli abbiano la stessa fitness, quindi siamo in condizioni di evoluzione
neutrale.
Dopo un piccolo numero di generazioni ogni cromosoma porta un allele identico
per discesa (identity by descent, IBD) = fissazione.
Guardando indietro nel tempo, il tempo di coalescenza tra glli alleli della
poolazione presente è 7 generazioni.
Deriva genetica
Selezione: cambiamenti direzionali
Deriva genetica: cambiamenti random
Un approccio stocastico
Modello di Wright‐Fisher (popolazione ideale)
La dimensione della popolazione rimane costante
Le generazioni non sono sovrapposte
Tutti gli alleli hanno la stessa probabilità di essere campionati
Sex ratio = 1
Se non c’è selezione e la dimensione della popolazione è infinita le frequenze alleliche non cambiano da una generazione alla successiva (HWE), ma se le dimensioni sono finite le frequenze alleliche fluttuano per via del campionamento Deriva genetica
⎛ n⎞ k
P(k) = ⎜ ⎟ p (1− p)n − k
⎝ k⎠
Distribuzione binomiale
La distribuzione binomiale dà la probabilità di k successi in n
prove
Quando 2N gameti vengono campionati da un pool di gameti infinito la probabilità Pi che quel campione contenga esattamente i alleli di tipo A1
è data dalla funzione di probabilità binomiale
Pochè Pi è sempre > 0 per popolazioni in cui i due alleli coesistono (0 < p < 1), le frequenze alleliche possono cambiare di generazione in generazione senza l’intervento della selezione
Deriva genetica
La frequenza pt di A1 al tempo t è una variabile random
Media di pt E(pt ) = p0
Varianza
Dipendenza della varianza da N
0.3
0.25
N 25
0.15
N 250
N 1000
0.1
0.05
0
1
20
40
60
80
100
120
140
160
180
200
220
240
260
280
300
320
340
360
380
400
420
440
460
480
Varianza
0.2
Tempo (generazioni)
Deriva genetica
La frequenza pt di A1 al tempo t è una variabile random
E(pt ) = p0 non cambia col tempo!
Aumenta col tempo!
Frequenze alleliche
N piccole
N grandi
Campionamento random
↓
Fluttuazioni random
generazioni
Deriva genetica
Modello di Wright‐Fisher non realistico: Sewall Wright (1931) introdusse il concetto di dimensione effettiva (Ne) delle popolazioni che definì come la dimensione di una popolazione ideale che avrebbe lo stesso effetto di campionamento casuale delle frequenze alleliche della popolazione reale
Deriva genetica
Consideriamo una popolazione con dimensione reali (census size) = N
in cui la frequenza dell’allele A1 alla generazione t = p. Se il numero di individui che si riproduce = N, allora la varianza della frequenza dell’allele A1 nella generazione successiva, pt+1, si può ottenere dall’equazione della varianza ponendo t = 1
Deriva genetica
Dato che non tutti gli individui nella popolazione prendono parte al processo riproduttivo la varianza è più grande di quella predetta da: pt (1− pt )
V( p t+1 ) =
2N
La dimensione effettiva della popolazione è il valore che sostituisce N per soddisfare l’equazione:
pt (1− pt )
V( p t+1 ) =
2N
e
Deriva genetica
Modello di Wright Fisher: non realistico
Esempi: •le generazioni si sovrappongono → alcuni individui al tempo t non contribuiscono al pool genico della generazione successiva perché non fertili (non maturi, oltre il periodo fertile) DEVELPEMENTAL STRATIFICATION
Nei and Imazumi (1966): uomo Ne ≈ N/3
•Il numero di maschi e femmine che si riproducono non è uguale (es. specie poligame)
Behavioural ecology 2004
Deriva genetica
Modello di Wright Fisher: non realistico
•Il numero di maschi e femmine che si riproducono non è uguale (es. specie poligame)
Se una popolazione ha Nm maschi e Nf femmine, Ne è data da:
SOLO se la sex ratio è di 1:1 (sex ratio “fisheriana” ) allora N = Ne
In ogni altro caso N > Ne
Deriva genetica
Qual è la dimesione effettiva di un alveare?
N ≈ 100000
Nf = 1
Nm >> 1
Ne = 4
Deriva genetica
Anche variazoni nel lungo periodo possono rendere Ne < N
Esempi:
Catastrofi ambientali
Modelli di riproduzione ciclica
Eventi di estinzione e ricolonizzazione di una regione geografica
“the lemming cycle”
Lemmings breed at regular intervals in such vast numbers as to cause mass migration, for instance, in Lapland. In Greenland, population cycle of the collared lemming is particularly regular, varying over 4‐year periods. According to recent research, the cyclic population dynamics in Greenland are explained by predator‐prey interaction, and not the biological attributes of lemmings or the limited food resources, as was previously assumed. (http://www.helsinki.fi/research/news/2003/week46.htm)
Deriva genetica
La dimensione della popolazione varia nel tempo.
Supponendo che ci siano n generazioni non sovrapposte, la dimensione effettiva è data dalla media armonica delle dimesioni della popolazione nel tempo:
Media armonica
generazioni
La media armonica è più vicina ai valori bassi che a quelli alti
Deriva genetica
Se una popolazione subisce un collo di bottiglia (bottleneck) la “long‐term
effective population size” è molto ridotta, anche se la popolazione ha ripreso da tempo la sua dimensione reale pre‐collo di bottiglia
Deriva genetica
Dimensioni della popolazione umana nella storia
Long‐term (~2 million years) effective population size
Ne = 10,000
Dato un tempo sufficientemente
lungo la deriva inevitabilmente porta
alla fissazione o alla perdita di una
forma allelica
Sostituzione genica
Sostituzione per deriva
Dopo un certo numero di generazioni che dipende dalla dimensione della
popolazione, ogni cromosoma porta un allele identico per discesa (identity by
descent, IBD) = fissazione.
Sostituzione genica
codominanza
Sostituzione per selezione
A2 dominante
A1 dominante
A1 = forma ancestrale
A2 = forma derivata
Sostituzione genica
Processo per il quale un allele mutante sostituisce la forma più
comune o “wild type”
Tempo di fissazione
Mutante
→ Fissazione
Probabilità di fissazione
Tasso di sostituzione= numero di sostituzioni / tempo
Sostituzione genica
Processo per il quale un allele mutante sostituisce la forma più
comune o “wild type”
Mutante
→ Fissazione
Probabilità di fissazione
Da che cosa dipende?
1. Dalla frequenza iniziale q
2. Dal coefficiente di selezione s (selezione!)
3. Dalla dimensione effettiva Ne (deriva!!)
Sostituzione genica
Processo per il quale un allele mutante sostituisce la forma più
comune o “wild type”
Mutante
→ Fissazione
Probabilità di fissazione
Kimura (1962): la probabilità di fissazione di A2 è data da
Dimensione effettiva Coefficiente di selezione Frequenza iniziale di A2
Sostituzione genica
Mutante
Se s tende a 0: assenza di selezione = neutralità
→ Fissazione
Probabilità di fissazione
quando x è piccolo
e –x ≈ 1‐x
Se Nesq è piccolo, cioè quando s→0, l’equazione si riduce a P ≈ q
La probabilità di fissazione di un allele neutrale è pari alla sua frequenza nella popolazione
Sostituzione genica
Mutante
Se s è ≠ 0: presenza di selezione → Fissazione
Probabilità di fissazione
Se N è la dimensione della popolazione, la frequenza iniziale di un nuovo allele sarà
q=1/(2N)
Sostituiamo q con 1/(2N)
Probabilità di fissazione di un nuovo allele quando s ≠ 0
Sostituzione genica
Mutante
→ Fissazione
Probabilità di fissazione
Probabilità di fissazione di un nuovo allele quando s ≠ 0
Se Ne è grande, quindi Ne → N
Probabilità di fissazione di un nuovo allele quando s è piccolo (ricorda: e –x ≈ 1‐x) ed Ne → N Per valori positivi e piccoli di s e grandi valori di N
Sostituzione genica
Per valori positivi di s e grandi valori di N
Quindi se una mutazione vantaggiosa insorge in una popolazione grande e ha un vantaggio selettivo inferiore al 5% (s < 0.05, piccolo), la probabilità che si fissi è approssimativamente il doppio del suo vantaggio selettivo
Esempio: la probabilità di fissazione di una nuova mutazione codominante con s = 0.01 è 2%.
Sostituzione genica
Per valori positivi di s e grandi valori di N
Dan Graur
Probabilità di fissazione
Dimensione
della
popolazione
Mutazione
neutrale
Mutazione
vantaggiosa
(s = 0.01)
Mutazione
deleteria
(s = –0.001)
1.000
0.05%
2%
0.004%
10.000
0.005%
2%
~10–20
P = q = 1/2N
P = 2s
Sostituzione genica
Tempo di fissazione
Nel caso di un nuovo allele mutante neutrale (q=1/2N) il tempo di fissazione è stato calcolato da Kimura e Ohta (1969)
Se la mutazione ha un vantaggio selettivo di s si può approssimare a Tempo di fissazione
Allele neutrale
Allele selezionato
Tempo di fissazione
Sostituzione genica
Tasso di sostituzione
Numero di mutanti che raggiungono la fissazione nell’unità di tempo
Mutazione neutrale
Mutazioni neutrali avvengono con un tasso
µ per gene per generazione
Il numero di mutanti per locus in una popolazione diploide di
dimensione N sarà
2N µ per generazione
La probabilità di fissazione di queste mutazioni è P= 1/(2N)
Il tasso di sostituzione è K = 2N µ P
K = 2N µ (1/2N)= µ
Kimura 1968: Evolutionary rate at the molecular level, Nature
Sostituzione genica
Tasso di sostituzione
K = µ se la mutazione è neutrale
N grande = molte mutazioni ma P= 1/(2N) quindi poche si fissano
N piccolo = poche mutazioni ma molte di queste si fissano
Il tasso di sostituzione è INDIPENDENTE da N!
Sostituzione genica
Tasso di sostituzione
Se la mutazione è sottoposta a selezione positiva il tasso di sostituzione si ottiene moltiplicando il numero di mutazioni per generazione, 2N µ per la probabilità di fissazione P = 2s
K = 4Nsµ
Il tasso di sostituzione è DIPENDENTE da N, s e µ