Tesi di laurea Andrea Chiariello

UNIVERSITA' DEGLI STUDI DI NAPOLI
FEDERICO II
FACOLTA' DI SCIENZE MATEMATICHE,
FISICHE E NATURALI
TESI DI LAUREA IN FISICA
Teoria neutrale dell'evoluzione molecolare
Relatore
Candidato
Prof. Gennaro Miele
Andrea Maria Chiariello
matr. N85/007
ANNO ACCADEMICO 2010/2011
Indice
Introduzione
1
Capitolo 1: Teoria neutrale
3
1.1 Le forze evolutive: drift genetico e mutazione
1.2
Il concetto di dimensione effettiva Ne
3
9
1.3 Coalescente
11
1.4 Relazione tra la natura stocastica del drift e il determinismo di G e H
13
Capitolo 2: Teoria di Darwin e pressione selettiva
16
2.1 I parametri della selezione
16
2.2 I tre tipi di selezione
18
2.3 Equilibrio selezione – mutazione e interazione selezione – drift
20
2.4 Ambiente e migrazione
23
Capitolo 3: Un modello di evoluzione
27
Appendice
32
A.1 La legge di Hardy – Weinberg
32
A.2 Dimostrazione sulla probabilità di fissazione
34
Bibliografia
35
Introduzione
L’oggetto della trattazione esposta in questo lavoro è una presentazione delle due teorie
evoluzionistiche fondamentali: la teoria di Darwin, basata sul concetto di selezione naturale, e la
teoria neutrale, di più recente sviluppo, ad opera di Motoo Kimura, basata sull’idea che le mutazioni
neutrali sono responsabili ( principalmente ) dell’evoluzione.
Le questioni affrontate nelle seguenti pagine sono soprattutto incentrate sugli aspetti matematici
presenti nelle teorie suddette, con particolare attenzione ai vari modelli utilizzati per descriverne i
sistemi considerati, ovvero le popolazioni. Da questo punto di vista, lo studio di tali sistemi si basa
su metodi sviluppati nell'ambito della Meccanica Statistica, come l'analisi del punto finale per
verificare l'esistenza di un valore di equilibrio, applicato a grandezze che descrivono lo stato della
popolazione, oppure la teoria della diffusione, applicata a un insieme di individui. Grazie a questo
approccio, di cui il presente lavoro vuole essere un esempio introduttivo, è possibile modellizzare
sistemi di notevole complessità, dapprima considerando situazioni ideali semplici da descrivere, e
poi passando ad un livello superiore tenendo conto di fenomeni precedentemente trascurati,
rendendo così la descrizione maggiormente conforme alla realtà.
Di una popolazione ciò che interessa in questo caso è la descrizione della sua struttura genetica,
nonché delle forze che agiscono in essa e ne determinano l’evoluzione. Naturalmente, una totale
conoscenza di questo genere è impossibile perché significherebbe non solo descrivere il genoma e
la posizione di ogni individuo ad ogni istante, ma anche i cambiamenti casuali che continuamente
intervengono a modificare lo stato della popolazione.
E’ necessario pertanto semplificare la complessità delle popolazioni reali sia dal punto di vista
genetico, sia dal punto di vista delle sue dinamiche relative alla riproduzione: per quanto riguarda il
primo aspetto, si considererà il processo evolutivo soltanto di uno o pochi “loci” ( cioè dei luoghi
sui cromosomi che contengono un certo gene ); d’altro canto, si supporrà che l’accoppiamento
avvenga in modo del tutto casuale, o, come si dice usualmente, che ci sia un regime di “random
mating”. Più precisamente, con random mating si indica la circostanza secondo cui gli individui si
accoppiano ignorando completamente il fenotipo, la parentela, la posizione geografica.
Una prima applicazione di queste semplici ipotesi è rappresentata dalla legge di Hardy – Weinberg,
che descrive l’equilibrio di un singolo locus somatico in una popolazione diploide, composta da un
numero infinito di individui, trascurando qualunque tipo di forza evoluzionaria agente in essa (come
le mutazioni del DNA). Nella situazione più elementare, si considera un locus in cui segregano (
ovvero il locus può essere caratterizzato da varianti geniche differenti ) due alleli A1 e A2 con
frequenze p e q rispettivamente, in una qualche generazione; la legge afferma che le frequenze
1
genotipiche x( AiAj ) relative al locus in questione dipendono, all’equilibrio, soltanto dalle
frequenze alleliche p e q secondo le relazioni:
x( A1A1 ) = p2
x( A1A2 ) = 2pq
x( A2A2 ) = q2.
Poiché le frequenze p e q sono uguali per tutte le generazioni, essendo infinito il campione, una
volta raggiunto l’equilibrio, la legge di Hardy – Weinberg implica che le frequenze genotipiche
restano anch’esse le stesse per le varie generazioni. Inoltre, essendo le quantità p e q legate dalla
relazione q = 1 – p, è sufficiente la conoscenza della sola p ( oppure q ) per prevedere la struttura
genetica della popolazione.
In una popolazione ermafrodita, nota p, il tempo necessario affinché il sistema raggiunga
l’equilibrio è di una generazione, mentre per una popolazione sessuata, dove le frequenze alleliche e
e genotipiche dipendono, in generale, dal sesso, sono necessari due cicli di random mating. In
APPENDICE A.1 è discussa la dimostrazione di quanto affermato.
Naturalmente, le popolazioni reali sono ben lungi dall’essere caratterizzate dalle condizioni
dell’equilibrio di Hardy – Weinberg; tuttavia, esistono esempi concreti di raggruppamenti umani
locali che presentano frequenze genotipiche relative a certi geni in accordo con le previsioni della
legge suddetta, a testimonianza del fatto che tali gruppi hanno storicamente seguito un ciclo
compatibile, almeno approssimativamente, con un regime di random mating. La distribuzione delle
frequenze relative all’allele della fosfatasi alcalina nella popolazione inglese è un esempio di questo
fenomeno.
2
Capitolo 1
Teoria neutrale
Tradizionalmente, lo studio dell'evoluzione è basato solo sulle strutture visibili degli organismi,
come le ali degli uccelli, i colli delle giraffe, i denti dei cavalli e così via. Il principio guida
nell'interpretazione sui cambiamenti dei fenotipi è stato il concetto di selezione naturale, sviluppato
da Darwin nell'opera “L' Origine della Specie”, di cui si parlerà in seguito. All'epoca di Darwin,
tuttavia, non erano ancora noti i meccanismi di trasmissione dei caratteri, scoperti da Mendel, e
soprattutto non era conosciuto il DNA e la sua struttura. Con la nascita della genetica molecolare, è
stato possibile indagare sui processi evolutivi a un livello più profondo rispetto a quello basato
esclusivamente sull'osservazione dei fenotipi.
Attraverso studi comparati di sequenze di amminoacidi relative a proteine omologhe tra organismi
affini, ad esempio l'emoglobina nei vertebrati, è possibile ricostruire il percorso dei cambiamenti
degli amminoacidi e stimare il loro tasso di sostituzione. Da questi si deduce poi il tasso di
sostituzioni dei nucleotidi nei geni che codificano per le proteine in esame. Si trova che il tasso di
accumulazione di mutazioni nelle varie specie nel corso dell'evoluzione è molto più alto di quello
previsto dalla teoria di Darwin. Da qui lo sviluppo della teoria neutrale, secondo cui la grande
maggioranza delle sostituzioni mutanti che provocano l'evoluzione e della variabilità tra le specie
non sono causate dalla selezione naturale, ma da fissazione casuale di mutanti neutrali o quasi
neutrali rispetto alla selezione. Nella teoria si ammette comunque la possibilità di mutazioni non
neutrali, che sono quindi oggetto di selezione, favorevoli per l'adattamento dell'individuo che ne è
portatore; tuttavia queste mutazioni avvengono con una frequenza talmente bassa da contribuire
poco all'evoluzione complessiva. L'evoluzione effettiva è dunque dovuta ad una matrice puramente
casuale, laddove il destino dei mutanti che compaiono nella popolazione, se equivalenti alle forme
preesistenti, è completamente affidato al caso.
1.1 Le forze evolutive: drift genetico e mutazioni
Come già detto, le ipotesi alla base della legge di Hardy – Weinberg sono troppo semplici per
descrivere una popolazione reale; innanzitutto, è necessario tenere conto, nelle dinamiche evolutive,
della dimensione finita della popolazione, ovvero del numero di individui presenti, che nel modello
3
precedente risulta infinito. Come conseguenza, si devono considerare i cambiamenti casuali nelle
frequenze alleliche ( costanti nella popolazione di Hardy - Weinberg ), dipendenti da due fattori
principali: la diversità del numero di figli dei vari individui e la legge di Mendel. Consideriamo per
esempio una popolazione di quattro elementi, 2 maschi e 2 femmine, e consideriamo un locus in cui
segregano 2 alleli, bianco e nero; supponiamo che le frequenze alleliche siano p = q = ½ e che i
genotipi siano 2 omozigoti (maschi ) e 2 eterozigoti ( femmine ), come mostrato in FIGURA 1.
Nella seconda generazione una possibile distribuzione delle frequenze alleliche è quella
rappresentata in figura, dove il risultato della ricombinazione è p = 3/8 per il nero e q = 5/8 per il
bianco, diverse dalla prima generazione. Ripetiamo comunque che la variazione delle frequenze
alleliche è un processo rigorosamente stocastico.
Prima
generazione
Maschi
Femmine
Gameti
Random mating
Seconda
generazione
FIGURA 1: Esempio di variazione delle frequenze alleliche dopo un ciclo di random mating
Questi cambiamenti sono indicati genericamente con la locuzione “drift genetico”; affiancando a
quest'ultimo le mutazioni del codice genetico, si ottiene l'insieme delle due forze fondamentali per
l'evoluzione nella teoria neutrale. Per comprendere quantitativamente l'azione del drift consideriamo
una popolazione diploide di N individui ermafroditi e introduciamo una variabile G che ne descrive
lo stato geneticamente. Questa variabile è definita come la probabilità che due geni distinti, relativi
4
ad un certo locus, scelti a caso nell'insieme dei 2N totali siano identici per stato, ovvero sono
caratterizzati dalla stessa sequenza nucleotidica e codificano quindi per lo stesso carattere. In
pratica, G è una misura della varietà genetica nella popolazione: se G = 0, tutti gli alleli sono
diversi tra loro; se G = 1, non c'è
varietà e l'allele è unico. Nello spirito della teoria neutrale, supponiamo che tutti gli alleli siano
equivalenti rispetto alla pressione selettiva, cioè nessuno presenta un vantaggio per sopravvivere
rispetto agli altri.
Dopo una generazione, il valore di G cambia secondo la relazione:
G' = 1 / 2N + ( 1 – 1 / 2N ) G ;
nella generazione successiva, due geni scelti a caso possono essere uguali in due modi: i due geni
sono copie dello stesso gene nella generazione precedente, e ciò avviene con probabilità 1 / 2N,
oppure non sono copie dello stesso gene, ma i loro geni genitori sono identici tra loro, e questo
avviene con probabilità ( 1 – 1 / 2N ) G.
A questo punto, conviene introdurre la quantità H = 1 – G, tale che:
H' = 1 – G' = ( 1 – 1 / 2N ) H
da cui:
ΔH = – H / 2N.
Poiché H rappresenta la probabilità che due geni scelti a caso sono diversi per stato, si nota che il
drift tende a diminuire la varietà genetica della popolazione, essendo la variazione di H negativa
sempre. L'effetto del drift è inoltre più blando nelle popolazioni con N grande, e quindi si manifesta
su tempi molto lunghi. Supponendo che H0 sia il valore iniziale di H, dopo t generazioni si ha:
Ht = H0 ( 1 – 1 / 2N )t.
Il tempo necessario affinché Ht si dimezzi è dato da:
t1/2 = 2Nln2 ,
che è proporzionale ad N, in accordo con quanto osservato in precedenza sull'effetto del drift in
5
popolazioni grandi.
Se il drift tende ad eliminare la varietà genetica nella popolazione, ciò significa che sopravviverà un
solo allele tra quelli presenti inizialmente; tale evento si chiama fissazione dell'allele in questione.
La probabilità di un evento simile è data proprio dalla frequenza iniziale dell'allele stesso. Questo è
vero per tutti gli alleli che segregano nel locus considerato. Il motivo di questa semplice quanto
importante affermazione sta nel fatto che gli alleli sono equivalenti, uguali insomma agli occhi della
selezione naturale.
L'altra grande forza responsabile dell'evoluzione di una popolazione è la mutazione del codice
genetico. Questa agisce in maniera opposta al drift introducendo di continuo nuovi alleli,
compensando l'effetto di appiattimento del drift e arricchendo la varietà dell'insieme dei geni
presenti. Le mutazioni rappresentano una generica variazione della sequenza nucleotidica che
costituisce un certo gene, comportando quindi una possibile modificazione del carattere per cui quel
gene codifica; si possono distinguere due tipi di mutazioni: sostituzioni semplici di un solo
nucleotide ( o equivalentemente di una base ) nella catena, oppure cambiamenti strutturali come
delezioni o inserzioni di uno o più nucleotidi, fino ad arrivare alla trasposizione di segmenti di DNA
più lunghi. Dal confronto fra geni omologhi di organismi all'interno di varie specie, risulta che le
sostituzioni di singoli nucleotidi sono molto più frequenti; ne segue che queste mutazioni
rappresentano i principali cambiamenti a livello molecolare dovuti all'evoluzione. Nell'ambito delle
sostituzioni di singoli nucleotidi, si distinguono poi quelle che causano sostituzioni di amminoacidi
nella catena che codificano e quelle che lasciano invariata la sequenza ( sostituzioni silenti ), dovute
alla degenerazione del codice genetico.
All'interno di una popolazione, è l'interazione fra le due tendenze citate a favorire l'evoluzione. Per
descriverla quantitativamente, il punto di partenza è il modello di una popolazione soggetta al drift
discussa in precedenza, introducendo questa volta la probabilità di mutazioni; lo scopo è trovare
l'espressione della variabile H che descrive lo stato del sistema, quando questo è all'equilibrio.
Si definisce un tasso di mutazione u all'interno di un gamete, relativamente ad un locus specifico,
che è il numero medio di mutazioni che intervengono ad ogni generazione; questa quantità
rappresenta in pratica la probabilità di mutazione per generazione. Poiché in una popolazione
diploide di N individui si hanno 2N cromosomi in totale, ad ogni generazione compariranno, in
media, 2Nu mutanti. In questo modello, si suppone che ogni mutazione genera una sequenza
nucleotidica unica, non preesistente nella popolazione. Questa ipotesi è lecita in quanto nelle
popolazioni reali segregano un numero grande in generale di alleli, che però risulta piccolo se
confrontato con il numero totale di possibili sequenze per un locus di un certo gene. Si parla
pertanto di modello “ad infiniti alleli”; ad esempio, per un locus di 1000 nucleotidi, ci sono 4 1000
possibili sequenze, nonché 3000 possibili mutanti raggiungibili con una singola sostituzione, per
6
cui la probabilità di tornare all'allele iniziale con una ulteriore sostituzione è di 1/3000, del tutto
trascurabile.
Anche in questo caso si assume un regime di random mating; in tal modo il valore di G dopo una
generazione è dato da:
G' = ( 1 – u )2 ( 1 / 2N + ( 1 – 1 / 2N ) G ) ;
questa espressione differisce dalla precedente per la presenza del fattore ( 1 – u )2,
che rappresenta la probabilità che due geni presi a caso non abbiano subito una mutazione. Poiché u
risulta in generale piccolo ( da 10-5 fino a 10-9 circa ), si sviluppa ( 1 – u )2 al primo ordine 1 – 2u;
trascurando i contributi in u / N, si ha:
G' = 1 / 2N + ( 1 – 1 / 2N ) G – 2uG.
Portando G a primo membro e dividendo per dt, si ottiene l'equazione differenziale:
dG / dt = 1 / 2N – ( 2u + 1 / 2N ) G
la quale ha per soluzione :
G = Geq + ( Geq – G0 ) exp[ – ( 2u + 1 / 2N ) t ] ,
laddove:
Geq = 1 / ( 4Nu + 1 ).
Questa quantità rappresenta il valore atteso di G all'equilibrio. Se la popolazione non è
all'equilibrio, essa tende a questo stato con una “velocità” di ( 1 + 4Nu ) / 2N per generazione. Ciò
significa che se la dimensione è grande, è necessario un tempo estremamente lungo affinché venga
raggiunto l'equilibrio.
Considerando che H = 1 – G, risulta:
Heq = 1 – Geq = 4Nu / ( 1 + 4Nu ).
Alternativamente, è possibile ricavare questa relazione imponendo che la variazione di H sia nulla
7
all'equilibrio, ovvero:
H' = 1 – G' = 1 – 1 / 2N + ( 1 / 2N – 1 ) ( 1 – H ) + 2u ( 1 – H ) = ( 1 – 1 / 2N ) H + 2u ( 1 – H ) .
La variazione di H ad ogni generazione è:
ΔΗ = – H / 2N + 2u ( 1 – H ) ;
e all'equilibrio, dovendo essere ΔΗ = 0, si ha:
H = Heq = 4Nu / ( 1 + 4Nu ) .
Dall'espressione di ΔΗ si nota che le mutazioni introducono una tendenza all'aumento di H,
descritta dalla quantità ΔuH = 2u ( 1 – H ), che è sempre positiva. Se u = 0, cioè eliminando la
possibilità di mutazioni, ΔΗ assume la forma trovata per la popolazione soggetta al solo drift.
L'intensità relativa tra drift e mutazione è descritta dalla quantità 4Nu: se questa è piccola, allora la
tendenza dominante è il drift, e la variabilità genetica è rimossa quasi del tutto dalla popolazione;
viceversa, se 4Nu è grande, la mutazione domina e la popolazione è molto varia.
Il modello appena esposto consente di calcolare il tasso di sostituzione k di mutazioni neutrali, che è
dato dal numero medio di mutazioni subentranti ad ogni generazione per la frazione v di quelle che
si fissano nella popolazione: la prima quantità è data da 2Nu, mentre la seconda è data da
v
= 1 / 2N, che è la frequenza iniziale di un allele mutante ( nel modello ad infiniti alleli ), e
rappresenta proprio la probabilità di fissazione dell'allele stesso, ammesso che questo sia neutrale;
se l'allele non fosse neutrale, ma soggetto ad una pressione selettiva, l'espressione della probabilità
v va sostituita con una più generale che tiene conto della non neutralità del mutante, come si vedrà
in seguito. Il tasso k risulta pertanto:
k = 2Nuv = u ,
cioè il tasso di sostituzione, e quindi l'evoluzione, di alleli neutrali è uguale al tasso di mutazione
degli stessi, e risulta quindi indipendente dalla dimensione della popolazione.
Si è detto che u è il tasso di mutazione per allele per generazione; poiché un allele è una sequenza di
nucleotidi, allora u risulterà dalla composizione delle mutazioni che avvengono sui singoli siti
nell'allele. A questo livello, si suppone che ogni qual volta ci sia una mutazione, questa coinvolge
sempre un sito diverso; in altre parole, la sequenza di nucleotidi è considerata infinita, e per questo
8
si parla di modello ad “infiniti siti”. Conseguenza di ciò è che il tasso di mutazione per nucleotide,
U = u / n, con n numero di nucleotidi nella sequenza, è molto basso; il tasso di sostituzione per sito
K è ovviamente K = U. Da tutto ciò risulta inoltre che, se è noto K, è possibile risalire ad u
assumendo che le varie mutazioni occorse nel tempo siano neutrali. Ad esempio, la Drosophila
melanogaster e la Drosophila erecta differiscono per 36 dei 768 nucleotidi del gene che codifica per
l'alcool deidrogenasi ADH; assumendo, come risulta da studi sui geni, che le due specie si sono
separate 23 milioni di anni fa e che ci sono state esattamente 36 sostituzioni lungo le linee parentali
che hanno condotto alle due specie, allora il tasso di sostituzione per sito è:
K = ( 36 / 768 ) / ( 2*23000000) mutazioni/sito*anno ≈ 10-9
Il fattore 2 a denominatore tiene conto del fatto che il tempo che separa le due specie è la somma
dei tempi che conducono fino all'antenato comune. Assumendo che le sostituzioni siano neutrali,
deve essere K = U, per cui, supponendo che la Drosophila produce una generazione all'anno, il tasso
di mutazione per generazione è proprio il valore calcolato in precedenza.
Poiché il tasso di sostituzioni dipende solo dal tasso di mutazioni, che dipende a sua volta dal gene,
è ragionevole aspettarsi che il tasso di sostituzioni sia approssimativamente lo stesso per diversi
gruppi di specie. In effetti questa è una previsione abbastanza corretta confermata dai dati
sperimentali, dove il tasso di evoluzione annuale per una data molecola, ad esempio l'emoglobina, è
costante per linee parentali di diverse specie, in accordo con la teoria neutrale. Di contro,
l'espressione di k che si ricava sulla base della teoria di Darwin, come si vedrà, dipende da
parametri strettamente correlati con il tipo di specie, cosa che contrasta con le osservazioni
sperimentali, deponendo quindi maggiormente a favore della teoria neutrale.
1.2 Il concetto di dimensione effettiva Ne
Nei modelli utilizzati finora per descrivere le popolazioni si è assunto, tra le altre cose, che la
dimensione resti constante al variare delle generazioni; ovviamente, per le popolazioni reali, ciò non
è vero. Le dimensioni fluttuano casualmente e in maniera spesso larga, rendendo il sistema
estremamente complesso da trattare. E' pertanto conveniente ridurre la complessità della realtà,
riconducendo il sistema ad uno equivalente molto più semplice da descrivere matematicamente.
Questo obiettivo si realizza in modo elegante definendo una dimensione effettiva Ne, che
rappresenta la dimensione di una popolazione idealizzata conforme al modello di Wright – Fisher,
in cui la popolazione è ermafrodita e soggetta al random mating, in cui inoltre le generazioni non si
9
sovrappongono e la dimensione è costante. Nel caso di una popolazione soggetta a variazioni della
dimensione, Ne si ricava imponendo che il tasso di decadimento della variabile H introdotta in
precedenza è lo stesso per la popolazione ideale e per quella reale.
Supponiamo ad esempio che, nella prima generazione, sia N1 la dimensione della popolazione reale,
N2 nella seconda e così via. Il valore di H nella generazione t-esima sarà:
Ht+1 = Ht ( 1 – 1 / 2Nt ) ,
e quindi:
Ht = H0 Πi ( 1 – 1 / 2Ni ) .
Dalla definizione di dimensione effettiva si ottiene:
H0 ( 1 – 1 / 2Ne )t = H0 Πi ( 1 – 1 / 2Ni ) .
Riscrivendo il primo membro come esponenziale del logaritmo naturale, che poi diventa una
somma di logaritmi, e sviluppando questi ultimi al primo ordine, si ottiene exp[ – t/2Ne ], mentre,
procedendo il maniera analoga per il secondo membro, si ricava l'uguaglianza:
exp[ – t / 2Ne ] = exp[ – Σi = 0 1 / 2Ni ] ,
da cui:
Ne = 1 / [ ( 1 / t ) Σi = 0 1 / Ni ] .
Questa espressione per la dimensione effettiva coincide con la media armonica delle dimensioni che
la popolazione reale assume durante le varie generazioni. Il risultato è molto interessante perché la
media armonica è molto sensibile ai valori piccoli che la compongono. Quindi, per popolazioni che
subiscono brusche diminuzioni nella dimensione, dovuti per esempio a flussi migratori o
cambiamenti climatici, la dimensione effettiva sarà considerevolmente più piccola di quella tipica.
Un evento simile viene chiamato “collo di bottiglia” o “bottleneck”.
Un altro fattore che influenza la dimensione effettiva è la diversità del numero di individui
10
appartenenti a sessi differenti nelle popolazioni diploidi, dove il numero di maschi è Nm e il numero
di femmine è Nf. La dimensione effettiva si ottiene partendo dalla varianza della frequenza allelica
p', assegnata la frequenza p della generazione precedente ( di cui si dimostra l'espressione nel
paragrafo 1.4 ):
var( p' | p ) = p ( 1 – p ) / 2N .
Si uguaglia quindi la varianza della popolazione reale con quella di una popolazione idealizzata di
dimensione Ne, e si ricava la relazione:
Ne = p ( 1 – p ) / 2 [ p ( 1 – p ) / 8Nm + p ( 1 – p ) / 8Nf ] ,
che fornisce, semplificando, l'espressione cercata:
Ne = 4Nm Nf / ( Nm + Nf ) .
Anche in questo caso, la dimensione effettiva dipende principalmente dal numero di individui
appartenenti al sesso con meno esponenti, e inoltre si riduce alla dimensione reale N se Nm = Nf =
N /2
1.3 Coalescente
Nel paragrafo 1.1 si è detto che la quantità 4Nu fornisce una misura della varietà genetica della
popolazione. Posto 4Nu = θ, è quindi di notevole interesse avere una stima di questo parametro, che
si può ottenere efficacemente con la tecnica del coalescente. Questo rappresenta l'insieme delle
stirpi di un set di alleli preso dalla popolazione, partendo da ciascun allele del set e andando a
ritroso nel tempo fino all'antenato comune. Si tratta quindi di una sorta di albero genealogico per
alleli. In FIGURA 2 è rappresentato un coalescente a 4 alleli; le generazioni t i indicate sono quelle
in cui si registra un antenato comune tra due alleli. In questa circostanza, si dice che è intervenuta
una coalescenza, e il numero di linee parentali si riduce di uno.
Consideriamo un set di n alleli. Naturalmente, non c'è modo di sapere le relazioni di parentela tra i
vari alleli del set e nemmeno i tempi ti che portano ad un antenato comune; questi tempi sono
comunque legati tra loro dalla relazione:
11
t2
t3
t4
FIGURA 2: Coalescente di 4 alleli
Tc = ntn + ( n – 1 ) ( tn-1 – tn ) + ….. + 2( t2 – t3 ) ,
dove Tc è il tempo totale nel coalescente, ovvero la somma dei prodotti dei tempi che intercorrono
tra due coalescenze consecutive per il numero di linee presenti in questo intervallo di tempo. Per
esempio, con riferimento alla figura, alla quarta generazione sono presenti quattro linee, tra la terza
e la quarta ce ne sono tre, e così via. Se u è il tasso di mutazioni neutrali, allora il valore atteso del
numero di mutazioni è uTc; in realtà di questo numero si ha già una stima, che è il numero di siti di
segregazione Sn presenti sui vari alleli del set e per i quali essi differiscono tra loro. Per dare una
stima del tempo Tc, è necessario dare una stima dei singoli ti, che si ottiene nel seguente modo.
La probabilità Q che tutti gli alleli nel set non abbiano antenati comuni nella generazione
precedente è data dalla quantità:
Q = ( 1 – 1 / 2N ) ( 1 – 2 / 2N ) ( 1 – 3 / 2N ) … ( 1 – ( n – 1 ) / 2N ) ≈ 1 – 1 / 2N – 2 / 2N – …
… – ( n – 1 ) / 2N ,
dove sono stati trascurati i contributi in ( 1 / N )2 e superiori. La probabilità P che esiste almeno una
coppia di questi alleli aventi un antenato comune è quindi:
P = 1 – Q = [ 1 + 2 + … + ( n – 1 ) ] / 2N = n ( n – 1 ) / 4N .
La generazione in cui si verifica una generica coalescenza è rappresentata da una variabile
discreta ) indicata con un indice i, descritta da una distribuzione di probabilità geometrica dove la
12
(
probabilità di successo è proprio P; poiché la media di una distribuzione geometrica è 1 / P – 1, la
generazione attesa E( ti ) in cui avviene l'evento di una coalescenza sarà:
E( ti ) = 4N / [ i ( i – 1 ) ] – 1 ≈ 4N / [ i ( i – 1 ) ] ,
dove l'approssimazione vale se i << N; da questa si ricava il tempo totale nel coalescente Tc:
E( Tc ) = Σi = 2 i E( ti ) = 4N Σi = 2 1 / ( i – 1 ) ,
essendo i il numero di linee dopo l' i-esima generazione. Il numero atteso di mutazioni è quindi:
E( Sn ) = u E( Tc ) = ( 4Nu ) Σi = 2 1 / ( i – 1 ) = θ Σi = 2 1 / ( i – 1 )
Disponendo del numero di mutazioni nel set di alleli Sn, si ottiene finalmente la stima del parametro
θ.
1.4 Relazione tra la natura stocastica del drift e il determinismo di
GeH
L'andamento di G e H, come si nota, è monotòno. Questo è apparentemente in contrasto con il fatto
che alla base di tutto ci sono dei cambiamenti casuali. Le previsioni ben delineate che si ottengono
dalle leggi ricavate su G e H si conciliano con il background stocastico dell'evoluzione se si
considera che leggi stesse ne rappresentano una tendenza media. Se prendiamo un set di
popolazioni con le stesse condizioni iniziali, ciascuna presenterà un percorso evolutivo diverso
dagli altri; quindi, per ogni sistema, ci saranno vari valori di G e H ad ogni generazione. La loro
media fornirà i valori calcolati di G e H, e l' evoluzione della media è data proprio dalle leggi
trovate.
Per dimostrare quanto affermato, consideriamo una popolazione e un locus biallelico dove segrega
con frequenza p un allele A. La probabilità di ritrovare un solo allele A nella generazione
successiva è data dalla sua frequenza, mentre la probabilità di ritrovare i alleli del tipo A è la stessa
probabilità di avere i esiti positivi su un insieme di 2N esperimenti indipendenti, dove la probabilità
di successo è p per ogni esperimento.
Questa definizione è proprio quella di distribuzione binomiale, pertanto la probabilità cercata è:
13
P( i alleli A ) = [ ( 2N )! / i! ( 2N – i )! ] pi q2N - i .
La media di una variabile binomiale ( i in questo caso ) è E( i ) = 2Np ( E sta per “expected” );
poiché nella generazione successiva la frequenza è p' = i / 2N, la frequenza attesa in questa nuova
generazione sarà:
E( p' ) = E( i / 2N ) = E( i ) / 2N = p ;
la frequenza media, quindi, non cambia. Allo stesso modo, la variazione media di p è tale che:
E( p' – p ) = E( i / 2N – p ) = E( i / 2N ) – p = 0 .
La varianza della variazione è data da:
var( p' – p ) = var( i / 2N – p ) = var( i ) / ( 2N )2 = p ( 1 – p ) / 2N
poiché la varianza della variabile binomiale i è 2Np ( 1 – p ). Si vede quindi che maggiore è la
dimensione della popolazione, minore è la dispersione delle frequenze alleliche attorno al loro
valore iniziale, come conseguenza del fatto che la grandezza del campione assorbe le fluttuazioni
casuali.
A questo punto, si introduce una nuova variabile, analoga alla quantità G, detta omozigosità della
popolazione, indicata con G e definita come:
G t = pt2+ qt2 = pt2+ ( 1 – pt )2 ;
il suo valore medio in una qualche generazione t + 1 è:
E( Gt+1 ) = E( p2t+1 ) + E( q2t+1 ) = var( pt+1 ) + [ E( pt+1 ) ]2 + var( qt+1 ) + [ E( qt+1 ) ]2 = pt qt / 2N + pt2
+
pt qt / 2N + qt2 = 1 / 2N + ( 1 – 1 / 2N ) ( pt2 + qt2 ) = 1 / 2N + ( 1 – 1 / 2N ) Gt ,
dove si è tenuto presente che 2pq + p2 + q2 = 1.
14
Mediando sulla distribuzione di p alla generazione t, si ottiene una uguaglianza tra quantità non
random che è la stessa soddisfatta dalla G definita inizialmente; resta da trovare quindi la relazione
tra G e G: dalla definizione di omozigosità, si vede che questa rappresenta la probabilità di scegliere
consecutivamente due geni uguali dallo stesso set complessivo; questo evento si può verificare in
due modi: può accadere che venga scelto il medesimo ( fisicamente, oltre che dal punto di vista
della sequenza ) gene due volte di seguito, e ciò ha probabilità 1 / 2N, oppure possono essere due
geni diversi, ma uguali per stato, e ciò si verifica con probabilità ( 1 – 1 / 2N ) G. Si ottiene quindi
per una generica generazione, diciamo ad esempio quella iniziale, la relazione cercata:
G0 = 1 / 2N + ( 1 – 1 / 2N ) G0 ;
si vede quindi che G e G seguono la stessa equazione, ma differiscono per la condizione iniziale, in
modo meno evidente per popolazioni grandi, per le quali l'omozigosità infatti è una stima di G. Si
definisce eterozigosità la quantità:
H=1–G,
la cui evoluzione è data da:
Ht = H0( 1 – 1 / 2N )t ,
e poiché H0 = ( 1 – 1 / 2N ) H0 , si ha:
Ht = H0( 1 – 1 / 2N )t +1 .
E' dimostrato pertanto che le quantità H e G descrivono un comportamento medio di sistemi
caratterizzati dalle fluttuazioni casuali delle variabili binomiali p e q, delle quali è impossibile
prevedere l'evoluzione generazione dopo generazione, ma di cui è possibile invece dare la
probabilità delle varie “strade” che possono seguire, e quindi ricavarne dei valori di aspettazione.
15
Capitolo 2
Teoria di Darwin e pressione selettiva
Nella trattazione svolta fino a questo punto sono state prese in considerazione popolazioni in cui gli
alleli relativi ad un locus particolare sono del tutto equivalenti dal punto di vista della pressione
selettiva: tutte le mutazioni che compaiono nel modello precedente hanno la stessa probabilità di
sopravvivere degli individui già presenti. Consideriamo qui il caso in cui gli individui sono soggetti
alla selezione naturale. Poiché il concetto di selezione naturale, introdotto da Darwin, è esposto in
maniera massimamente chiara nella Introduzione della sua opera, “L'Origine della Specie”,
riportiamo il passo testualmente:
“Gli individui che nascono di ciascuna specie sono più numerosi di quanti ne possono
sopravvivere, e quindi la lotta per l'esistenza si ripete di frequente; ne consegue che qualsiasi
vivente, che sia variato seppure di poco, ma in senso a lui favorevole nell'ambito delle condizioni di
vita, che a loro volta sono complesse ed alquanto variabili, avrà maggiori possibilità di
sopravvivere e, quindi, sarà selezionato naturalmente. In virtù del possente principio
dell'ereditarietà, ciascuna varietà, selezionata in via naturale, tenderà a perpetuare la sua nuova
forma modificata.”
2.1 I parametri della selezione
Consideriamo una popolazione ermafrodita, il cui processo evolutivo è scandito da cicli consecutivi
di random mating e selezione. Se nella generazione iniziale è presente, in un certo locus, un allele (
non neutrale questa volta ) A con frequenza p, questo passerà alla generazione successiva di neonati
con una frequenza attesa sempre di valore p; le frequenze genotipiche saranno conformi alle
aspettazioni descritte dalla legge di Hardy – Weinberg, poiché l'accoppiamento è random, mentre i
neonati, nel loro percorso verso l'età adulta ( quando cioè sono in grado riprodursi ), saranno
soggetti alla selezione naturale. Questa nuova forza evolutiva è descritta da una probabilità di
sopravvivenza che dipenderà dal fenotipo, e quindi, ad un livello più profondo, dal genotipo.
Supponendo che gli alleli che segregano nel locus in questione siano due, A e a, assegniamo quindi
16
ai tre genotipi possibili AA, Aa e aa le quantità, che vengono definite “viabilità”, w AA , wAa e waa
rispettivamente; questi oggetti hanno lo scopo di quantificare l'effetto della selezione, in quanto,
dopo la sua azione, le frequenze x dei genotipi saranno variate secondo le le relazioni:
x( AA ) = p2 wAA / wm ,
x( Aa ) = 2p ( 1 – p ) wAa / wm , x( Aa ) = ( 1 – p )2 waa / wm ,
dove wm è una costante di normalizzazione, data da:
wm = p2 wAA + 2p ( 1 – p ) wAa + ( 1 – p )2 waa ,
e rappresenta la viabilità media della popolazione.
Insieme con le frequenze genotipiche, cambiano anche le frequenze alleliche; pertanto, dopo la
selezione, ci sarà una nuova frequenza p' data da:
p' = ( p2 wAA + pq waa ) / wm ,
da cui si ottiene la variazione Δsp in frequenza:
Δsp = pq [ p( wAA – wAa ) + q( wAa – waa ) ] / wm .
Dividendo le varie viabilità per wAA ( o equivalentemente per waa ), è possibile definire delle
viabilità relative che per i tre genotipi sono rispettivamente 1, wAa / wAA e waa / wAA . Ciascuna di
queste quantità la indichiamo con il nome di fitness relativo, ognuno riferito al suo genotipo.
Riscriviamo le ultime due nel seguente modo:
wAa / wAA = 1 – hs
waa / wAA = 1 – s ;
il parametro s è chiamato coefficiente di selezione, ed è una misura del fitness relativo tra i genotipi
aa e AA: se s è positivo, aa è meno vantaggioso di AA, mentre se s è negativo, è vero il contrario.
Supponendo, senza perdere di generalità, che AA è più vantaggioso, si può porre 0 < s < 1. Il
parametro h tiene conto del cosiddetto effetto eterozigote, e rappresenta una misura della dominanza
degli alleli a e A. Si possono avere le seguenti situazioni:
h=0:
A dominante
h=1:
A recessivo
17
0<h<1:
dominanza incompleta
h<0:
sovradominanza
h>1:
sottodominanza .
I primi due casi si presentano raramente nelle popolazioni reali, mentre gli altri tre sono di maggiore
interesse per l'evoluzione. Il caso h = ½ rappresenta la situazione di un eterozigote esattamente a
metà tra i due omozigoti per la selezione. Con questi nuovi parametri, l'espressione di Δsp può
essere riscritta come:
Δsp = pqs [ ph + q( 1 – h )] / wm
wm = 1 – 2pqsh – sq2 .
Supponendo che s > 0, il segno di Δsp è determinato dalla quantità ph + q( 1 – h ), che verrà
analizzata nel seguente paragrafo.
2.2 I tre tipi di selezione
La selezione in generale può essere di due tipi: positiva o negativa. La prima interviene quando un
gene mutante aumenta il fitness degli individui che ne sono portatori, favorendone la diffusione
nella popolazione, mentre la seconda interviene se il gene mutante diminuisce il fitness e tende ad
essere eliminato.
Poiché la selezione agisce primariamente sul fenotipo, l'evoluzione del genotipo è determinata dagli
effetti della pressione selettiva sui fenotipi. Conviene pertanto considerare la selezione su questi due
livelli separatamente. Per quanto riguarda la selezione fenotipica, questa si suddivide in tre tipi:
stabilizzante, direzionale, distruttiva.
Consideriamo un generico carattere ( ad esempio l'altezza ) e consideriamo la distribuzione dei suoi
valori nella popolazione; supponiamo che questa distribuzione segua l'andamento di una
distribuzione normale. Si dice che c'è selezione stabilizzante quando l'optimum del fitness si ha per
valori del carattere vicino alla media della distribuzione. Gli individui che hanno una misura
maggiore o minore di quella media sono selezionati negativamente. In pratica, essa taglia fuori gli
estremi. Per questo motivo tale selezione è anche definita centripeta o normalizzante.
L'altro tipo di selezione è quella direzionale, e si manifesta quando l'optimum fenotipico è spostato
rispetto alla media dei valori del carattere considerato, con l'effetto di “direzionare” i valori dei
fenotipi verso l'optimum; in questo tipo di selezione Darwin individua la causa fondamentale
18
dell'evoluzione. Il terzo tipo di selezione, quella distruttiva, interviene quando esistono due o più
optima dei fenotipi, e rappresenta la situazione opposta alla selezione stabilizzante.
Per quantificare l'effetto della selezione sulla genetica della popolazione, è necessario andare oltre i
fenotipi ed assegnare direttamente ai genotipi i valori dei fitness, come è stato fatto all'inizio del
capitolo. I tre tipi di selezione fenotipica possono quindi essere ricondotti ai casi elencati per i vari
valori di h.
Il caso della selezione stabilizzante corrisponde al caso di overdominanza, caratterizzato da h < 0,
in cui l'eterozigote è più vantaggioso dei due omozigoti. In questo caso, supponendo s > 0, si vede
dall'espressione di Δsp che quando p ( frequenza dell'allele A ) è vicino allo zero, l'incremento è
positivo, e la frequenza allelica aumenta, mentre se p è vicino all'unità, l'incremento è negativo e p
diminuisce, in un meccanismo di feedback negativo. In altre parole, p tende ad un valore di
equilibrio pe, diverso da zero e da 1, che si ricava ponendo Δsp = 0. Si ottiene in tal modo:
pe = ( h – 1 ) / ( 2h – 1 ) .
Se si verifica una deviazione dalla frequenza pe , positiva o negativa, il sistema reagisce in modo da
riportarsi all'equilibrio: si tratta quindi di un equilibrio stabile.
La selezione direzionale è invece ricondotta al caso relativo alla dominanza incompleta ( 0 < h < 1
), in cui il fitness del genotipo AA è maggiore di quello di Aa, che a sua volta è maggiore del
fitness di aa. L'incremento di p in questo caso è positivo qualunque sia il suo valore iniziale; in tal
modo, l'allele A tende a fissarsi sempre nella popolazione; la velocità di questo processo dipende
invece dal valore iniziale di p, e raggiunge il suo massimo per p = ½, cioè quando c'è il massimo
della varietà genetica, mentre quando p è molto piccolo o quando è quasi 1, ovvero quando c'è poca
varietà, Δsp è quasi nullo. La situazione p = 0 rappresenta un equilibrio instabile, mentre p = 1 è un
equilibrio stabile.
La selezione distruttiva si ha quando c'è underdominanza, cioè per h > 1, dove l'eterozigote ha un
fitness minore di entrambi gli omozigoti. Questo caso è opposto a quello della selezione
stabilizzante, come detto in precedenza: infatti l'incremento di p è negativo se il suo valore è minore
di pe, tendendo quindi a zero, mentre è positivo se p è maggiore di pe, tendendo ad 1 in questo caso.
Quando p = pe, le frequenze alleliche non cambiano; si tratta comunque di un equilibrio altamente
instabile, in cui anche la più piccola variazione di p causa un cambiamento radicale del sistema. La
variazione di p può essere causata facilmente dal drift.
19
2.3 Equilibrio selezione-mutazione e interazione selezione-drift
Consideriamo una popolazione diploide soggetta al random mating. Supponiamo che in locus
segreghino due alleli A1 e A2 , dove A2 risulta dalla mutazione di A1 ed è deleterio per l'individuo
che ne è portatore. Se assumiamo che il rapporto tra i due alleli sia di dominanza incompleta, la
selezione sarà allora di tipo direzionale, e tenderà ad eliminare dalla popolazione l'allele A 2, che
però continua a comparire a causa di nuove mutazioni dell'allele A1. L'effetto delle mutazioni sulla
frequenza p dell'allele A1 è rappresentato da una sua variazione Δup rispetto alla generazione
successiva, ed è data da:
Δup = p ( 1 – u ) – p = – up ,
dove u è il tasso di mutazioni, per cui ( 1 – u ) è la probabilità che non avvengano mutazioni. Se la
selezione è sufficientemente intensa da mantenere la frequenza dei mutanti A2, q = 1 – p, molto
piccola, si ha:
Δup = – u ( 1 – q ) = – u + qu ≈ – u ,
mentre la variazione Δsp dovuta esclusivamente alla selezione, ricavata in precedenza, si riduce,
con queste ipotesi, alla quantità:
Δsp = pqs [ ph + q( 1 – h ) ] / wm ≈ qhs .
All'equilibrio, la somma delle due variazioni deve essere zero, e questo fornisce l'espressione di qe:
qe = u / hs .
Questa relazione è in accordo con l'osservazione sperimentale secondo cui gli alleli rari sono più
comuni in eterozigoti piuttosto che in omozigoti, e quindi è ragionevole aspettarsi che la frequenza
di tali alleli dipenda dal fitness dell'eterozigote hs.
Per quantificare l'intensità della selezione, si introduce una quantità L, detta carico genetico,
definita dalla relazione:
20
L = ( wop – wm ) / wop ,
dove wop è il fitness del genotipo più vantaggioso. Il fitness medio wm per una popolazione
all'equilibrio selezione – mutazione è:
wm = 1 – 2peqehs – qe2 s ≈ 1 – 2qehs = 1 – 2u ,
quindi la presenza dell'allele A2 deleterio diminuisce il fitness medio di una quantità 2u. Il carico
genetico, in questo caso, vale pertanto 2u, poiché wop = 1 .
Consideriamo adesso l'azione del drift su una popolazione soggetta alla selezione naturale.
Dal modello teorico sulla selezione direzionale, risulta che l'allele più vantaggioso raggiunge
sempre fissazione. In realtà questo è vero per alleli con frequenza non troppo piccola, ma non lo è
per alleli unici o aventi poche copie nella popolazione, e ciò accade a causa del drift. La selezione
infatti diventa debole per gli alleli rari, poiché Δsp contiene p come fattore: ad esempio, se
p = 1 / 2N, la forza della selezione è proporzionale al prodotto s / 2N, ed è quindi minore
dell'effetto del drift che è proporzionale a 1 / 2N. Se la frequenza dell'allele diventa più consistente,
allora l'intensità della selezione dipende dal coefficiente s: se s >> 1 / 2N, allora la selezione
domina sul drift e condiziona fortemente il destino degli alleli più comuni.
In generale pertanto, quando compare in una popolazione di dimensione finita, a causa di una
mutazione, un nuovo allele più vantaggioso rispetto agli altri, questo sarà perduto a causa del drift.
Questo è possibile dimostrarlo utilizzando la formula per la probabilità P( p ) di fissazione di un
allele soggetto alla selezione assegnata la sua frequenza iniziale p quando h = ½ ( questo
interessantissimo risultato è dimostrato in APPENDICE A.2 ):
P( p ) = ( 1 – exp[ – 2Nsp ] ) / ( 1 – exp[ – 2Ns ] ) .
Infatti, per p = 1 / 2N, la probabilità vale:
P( 1 / 2N ) = ( 1 – exp[ – s ] ) / ( 1 – exp[ – 2Ns ] ) ,
la quale, se s è abbastanza piccolo e 2Ns abbastanza grande, si riduce all'espressione:
P( 1 / 2N ) ≈ s .
21
Poiché nel caso considerato il vantaggio selettivo per l'eterozigote vale s / 2 ( hs con h = ½ ), si può
interpretare la probabilità di fissazione degli alleli rari come una funzione di questa quantità, il che
è in accordo con l'osservazione sperimentale di alleli rari collocati principalmente in eterozigoti.
Ad esempio, se il vantaggio selettivo di una mutazione è l' 1% nell'eterozigote ( tutt'altro che
trascurabile in popolazioni grandi ), allora la probabilità di fissazione di questo allele è soltanto del
2%.
La formula sopra utilizzata consente anche di calcolare la probabilità di fissazione di un allele
deleterio. Supponendo che│s│sia piccolo, poiché questa volta s è negativo, questa probabilità è
data da:
P ( 1/2N ) ≈ s / ( 1 – exp[ – 2Ns ] ) ,
e diventa molto piccola se │2Ns│ >> 1, ma più consistente se │2Ns│ ≈ 1.
Osserviamo che l'espressione della probabilità di fissazione ha un valore generale: essa infatti, oltre
a fornire informazioni su alleli selezionati, fornisce anche la probabilità di fissazione di alleli
neutrali, ottenuta facendo tendere a zero il coefficiente di selezione s e valutando questo limite per
la funzione P. Ovviamente, il risultato è 1 / 2N, come già anticipato nel paragrafo 1.1. Definendo
quindi P0 questo valore, è interessante considerare il rapporto P / P0 per alleli debolmente
selezionati:
P / P0 = 2Ns / ( 1 – exp[ – 2Ns ] ) ,
rappresentato graficamente in FIGURA 3. Come si nota, per valori negativi di s, ovvero per alleli
deleteri, la probabilità di fissazione di alleli neutrali è maggiore, mentre per valori di s positivi, e
quindi per alleli vantaggiosi, la probabilità di fissazione è maggiore; per s = 0, l'allele è neutrale,
dunque il rapporto vale 1.
22
FIGURA 3: Andamento di P / P0 per alleli debolmente selezionati
Queste espressioni sono utilizzabili per calcolare il tasso di sostituzione ks di alleli soggetti a
selezione, analogamente a quanto fatto nell'ambito della teoria neutrale: in quel caso, questa
quantità è stata ricavata come prodotto del numero medio di mutazioni che subentrano in ogni
generazione, 2Nu, per la loro probabilità di fissazione, 1 / 2N; nella circostanza della selezione, il
tasso ks si deriva allo stesso modo, con la differente espressione per la probabilità di fissazione. Si
ha pertanto:
ks = 2NuP( 1 / 2N ) = 2Nu ( 1 – exp[ – s ] ) / ( 1 – exp[ – 2Ns ] ) ,
e da questa, utilizzando la formula approssimata per P( 1 / 2N ), si ottiene:
ks = 2Nus .
Questo risultato era già stato anticipato nel capitolo precedente: il tasso di sostituzione di alleli non
neutrali dipende da quantità specifiche, variabili da popolazione a popolazione, come lo sono la
dimensione N, il coefficiente di selezione s e il tasso di mutazione di alleli vantaggiosi u. Ciò
implica che ks dipende fortemente dall'ambiente ( poiché vi dipende s ), e dalla specie ( poiché vi
dipende u ), in contrasto con la costanza ( approssimativa ) del tasso di sostituzione, per una data
proteina, di alleli neutrali.
Come conseguenza di tutti questi risultati sull'interazione selezione - drift, supponiamo che ci siano
dei cambiamenti ambientali e che intervengano delle mutazioni in vari loci tali da consentire
l'adattamento al nuovo ambiente. La prima di queste mutazioni che si fissa, determina un percorso
evolutivo della popolazione; poiché però l'allele che si fissa per primo è fondamentalmente casuale,
l'evoluzione adattativa che ne risulta è anch'essa casuale. In altre parole, l'evoluzione è un processo
irripetibile.
23
2.4 Ambiente e migrazione
Si è visto che la selezione stabilizzante ha luogo quando c'è overdominanza, cioè quando h < 0 e
l'eterozigote è più vantaggioso di entrambi gli omozigoti. E' possibile tuttavia che si verifichi una
selezione di questo tipo senza che h < 0, e ciò avviene a causa dei cambiamenti ambientali, ignorati
nei modelli proposti fino a questo punto. Immaginiamo quindi una popolazione diploide e un locus
in cui segregano due alleli A1 e A2, in una situazione di dominanza incompleta. Supponiamo inoltre
che questa si sviluppi in un ambiente vario, in cui alcuni genotipi sono favoriti in certe regioni, e
altri genotipi sono favoriti in regioni diverse dalle precedenti. In altre parole, stiamo supponendo
che i fitness dipendono dallo spazio.
Una immediata applicazione del modello appena descritto è rappresentata da un ambiente diviso in
due zone, laddove nella prima è favorito l'allele A1, nella seconda l'allele A2. Se non si verificano
fenomeni di migrazione, allora l'allele A1 si fisserà nella prima zona e l'allele A2 si fisserà nella
seconda: la specie complessivamente sarà polimorfica nel locus in questione, senza che h < 0.
Naturalmente le popolazioni reali sono soggette alle migrazioni; di queste se ne deve tener conto nel
nostro modello. Consideriamo allora un ambiente suddiviso in n regioni, ognuna caratterizzata da
una dimensione relativa ci. Ad ogni generazione, dopo la selezione all'interno di ciascuna zona, una
frazione m di geni presi a caso dalle rispettive subpopolazioni sono scambiati con geni di altre
subpopolazioni; lo scambio con geni appartenenti ad una particolare zone avviene con una
probabilità proporzionale al coefficiente c di quella regione. Ad ogni zona, corrisponde un diverso
fitness relativo ai tre genotipi. La frequenza pi' dell'allele A1 nell'i-esima zona dopo la selezione e la
migrazione è data da:
pi' = ( 1 – m ) ( pi + Δspi ) + m Σjcj ( pj + Δspj )
dove Δspi è la variazione di pi in ogni zona dovuta alla selezione locale. L'espressione discende dal
fatto che un allele A1 può essere autoctono ( probabilità ( 1 – m ) ) o provenire da un'altra zona (
probabilità m ), nel qual caso la probabilità di essere A1 è la frequenza di A1 su tutta la popolazione
dopo la selezione.
Consideriamo a questo punto due casi notevoli: m = 0, cioè nessun flusso migratorio, e m = 1, cioè
migrazione totale; in entrambi i casi, si suppone 0 < h < 1.
Quando m = 0, l'allele favorevole nella zona i-esima si fissa, per cui la frequenza pi sarà 0 oppure 1.
La frequenza complessiva è data dalla media pesata delle varie frequenze:
24
p = Σicipi ;
quando in almeno una delle zone sarà fissato A2 e nelle altre A1, o viceversa, ci sarà polimorfismo
nella specie senza l'occorrenza della overdominanza.
Consideriamo ora il caso più complesso m = 1. La frequenza totale p, dopo selezione e migrazione,
sarà data dall'espressione:
p' = Σicipi' = ( 1 – m ) Σici ( pi + Δspi ) + m ΣiciΣjcj ( pj + Δspj ) =
Σicipi + ΣiciΔspi =
p + ( Δsp )m ,
dove ( Δsp )m rappresenta la media pesata delle variazioni sulle n zone. Da qui si ottiene:
Δsp = ( Δsp )m ,
ovvero la variazione di p nell'intera popolazione è uguale alla variazione media tra le varie
subpopolazioni. Poiché m = 1, le frequenze alleliche in ogni zona sono le stesse all'inizio di ogni
ciclo di selezione, come discende dall'espressione di pi'. Posto quindi pi = p, risulta:
Δsp = pq Σici [ p( wiA1A1 – wiA1A2 ) + q( wiA1A2 – wiA2A2 ) ] / wim .
Supponiamo adesso h = ½, e poniamo wiA1A1 = 1 + si, wiA2A2 = 1 – si, wiA1A2 = 1; con queste
posizioni, l'espressione precedente diventa:
Δsp = pq Σi ( cisi ) / ( 1 + si ( p – q ) ) .
Per verificare la possibilità di polimorfismo in questo caso, che è di dominanza incompleta, si studia
Δsp quando p e q sono prossimi a zero. Nel primo caso, poiché p ≈ 0 e q ≈ 1, risulta che il segno
dell'incremento dipende dalla quantità:
Σi( cisi ) / ( 1 – si ) ≈ Σici( si + si2 ) ;
affinché Δsp > 0, deve essere Σici( si + si2 ) > 0, pertanto:
25
– Σicisi < Σici si2 .
Allo stesso modo, quando q è in prossimità dello zero e p ≈ 1, affinché Δsp < 0, deve essere:
Σicisi < Σici si2 .
In generale quindi, condizione sufficiente per il polimorfismo è:
│Σicisi│< Σici si2 ,
da cui, considerando le quantità si variabili random, si ottiene la relazione approssimata:
│E( si )│< Var( si ) ;
tale disuguaglianza implica che il polimorfismo è tanto più probabile quanto più vario è l'ambiente.
Questa relazione inoltre può essere soddisfatta solo se alcune si sono positive e altre negative; tale
condizione, necessaria sia quando m = 0 sia quando m = 1, è anche sufficiente nel caso m = 0 ma
non lo è per m = 1. Questo avviene poiché la migrazione, quando c'è dominanza incompleta,
favorisce il polimorfismo in misura minore a causa dell'effetto di mediazione sulle numerose
fluttuazioni ambientali che mantengono la varietà.
26
Capitolo 3
Un modello di evoluzione
Diamo qui la descrizione di un modello dinamico elaborato come programma informatico. Il
modello descrive l'evoluzione di una popolazione diploide di tipo Wright - Fisher costituita da un
numero N di individui, nella quale è presente un carattere poligenico il cui fenotipo dipende da geni
situati su un numero g di loci, che abbiamo fissato a cinque. In ogni locus segregano due alleli,
chiamati 1 e 2. Il programma è strutturato in maniera tale da gestire l'evoluzione della popolazione
in due modi: questa può essere soggetta soltanto al drift genetico, per cui gli alleli sono neutrali e
tutti i fenotipi sono equivalenti, oppure può essere sottoposta all'azione della selezione naturale
stabilizzante. In questo secondo caso, si rende necessaria l'introduzione del fitness di ciascun
individuo, che è definito nel seguente modo: per ognuno dei genotipi relativi ai cinque loci, che
sono ( 1, 1 ), ( 1, 2 ) e ( 2, 2 ), abbiamo assegnato un numero intero m che vale 0, 1 o 2
rispettivamente; il valore fenotipico M del carattere è dato quindi dalla somma degli m sui vari loci,
e può assumere, nel nostro caso, tutti i valori interi compresi fra 0 e 10. L'optimum fenotipico μ è
fissato a 5. Come curva del fitness è stata considerata una gaussiana F( M, μ ) di altezza massima 1,
centrata su μ ( FIGURA 4 ). L'azione della selezione si esplica attraverso l'estrazione di un numero
casuale y compreso tra zero e 1 che viene confrontato con F( M, μ ): se y < F( M, μ ), l'individuo
sopravvive, viceversa viene sostituito con un altro individuo generato in maniera casuale, e avente
pertanto un valore fenotipico in generale diverso dall'individuo soppresso dalla selezione. Viene
mantenuta in tal modo costante la dimensione della popolazione.
27
FIGURA 4: Curva del fitness ( in blu ) con S = 1 e distribuzione del valore fenotipico M ( in rosso )
Con la struttura appena proposta, l'effetto della selezione è quello di far evolvere la specie verso
l'optimum, che tuttavia non è geneticamente unico, ma può essere realizzato con diverse
combinazioni di genotipi, in modo da mantenere il polimorfismo. L'intensità della selezione viene
controllata attraverso un parametro S, che rappresenta la varianza della curva del fitness: minore è
S, più stretta è la gaussiana e quindi è più intensa la selezione.
Dal punto di vista dell'implementazione informatica, la popolazione è organizzata come una matrice
avente 2N righe, che rappresentano i “cromosomi”, e g colonne, che individuano i loci. Con questo
formalismo, un individuo è rappresentato da una coppia ( la specie è diploide ) di righe ( possiamo
dire il suo genoma ) consecutive. La popolazione iniziale è generata in maniera random assegnando
arbitrariamente le frequenze { pi } dell'allele 1 per ognuno dei vari locus, e questo viene fatto
tramite l'introduzione di un array di g oggetti. Generata la popolazione iniziale, questa viene fatta
evolvere ( con o senza selezione ), per un numero T più o meno grande di generazioni; il
programma mostra le frequenze alleliche { pi }, le frequenze genotipiche e le eterozigosità dei vari
loci durante il susseguirsi delle generazioni. Nel seguito sono presentati gli output di alcune
simulazioni eseguite con il programma appena descritto.
Plot 1:
28
N = 100
Eterozigosità
Il grafico mostra l'andamento delle frequenze alleliche p relative all'allele 1, in una popolazione di
100 individui soggetti esclusivamente al random drift, tutti con una frequenza iniziale di 0.5. Si
notano le forti oscillazioni dovute alla dimensione ridotta del campione, che in pratica esaurisce
l'evoluzione dopo 50 generazioni poiché in 3 dei 5 loci l'allele di tipo 1 raggiunge fissazione, mentre
negli altri due si fissa l'allele di tipo 2. L'eterozigosità ( a destra è rappresentata quella del locus
arancione ) di tutti i loci decade quindi a 0, secondo le previsioni del modello del drift.
Plot 2:
N = 1000
N = 10000
Anche questi grafici mostrano le frequenze p, e le condizioni iniziali sono le stesse del caso
precedente, ma sono riferite a popolazioni costituite da 1000 ( a sinistra ) e 10000 individui ( a
destra ). Si nota che al crescere di N le oscillazioni random delle frequenze diventano molto più
addolcite, poiché le fluttuazioni sono assorbite dalla grandezza del campione. Si evidenzia inoltre
29
una evoluzione più lenta, poiché nessuno degli alleli raggiunge fissazione dopo 100 generazioni in
entrambi i casi, anche se si intravede la tendenza alla fissazione o alla rimozione nel caso N = 1000,
mentre nel secondo gli andamenti si mantengono circa costanti, poiché rappresenta, essendo N
grande, una approssimazione di una popolazione di Hardy – Weinberg.
Le seguenti simulazioni riguardano l'evoluzione di un carattere che dipende da 10 geni, di cui 5
sono soggetti a selezione, mentre gli altri sono neutrali. In questo modo, è possibile confrontare
direttamente gli andamenti delle frequenze di alleli selezionati e di alleli non selezionati.
Plot 3:
Nei grafici di questa simulazione ( in alto nella pagina seguente ), gli andamenti delle frequenze
degli alleli soggetti alla selezione sono rappresentati in arancione, mentre gli alleli neutrali sono
rappresentati in blu. E' evidente che la selezione è la forza evolutiva più importante per la
popolazione con N maggiore, dove il drift è più blando poiché 1 / 2N è piccolo. Come si nota, le
frequenze arancioni evolvono in maniera tale da conferire agli individui un valore fenotipico vicino
o uguale all'optimum che è fissato a 5. E' interessante notare che l'optimum è raggiunto in modo da
favorire gli omozigoti, eccetto per uno solo dei cinque loci, dove la frequenza si mantiene attorno a
N = 1000
N = 10000
0.5. Il fatto che si ritrovano nella popolazione solo omozigoti per quattro dei cinque loci è dovuto
alla maggiore probabilità con cui si raggiunge in tal modo l'optimum fenotipico, rispetto ad una
situazione di tutti eterozigoti sui cinque loci, che è fenotipicamente equivalente, ma non lo è sul
piano della statistica. La selezione, in questo senso, induce una rottura della simmetria genotipica
nella popolazione.
30
Plot 4:
Popolazione 1
Popolazione 2
Questa simulazione confronta l'evoluzione di due popolazioni aventi 2000 individui ciascuna, e
soggette alla stessa pressione selettiva. In arancione e in blu sono, come prima, sono rappresentate
rispettivamente le frequenze di alleli selezionati e di alleli neutrali. Per seguire l'evoluzione di
singoli locus, abbiamo reso distinguibili due di questi indicando con il rosso la frequenza di uno
degli alleli selezionati, e in verde quella di un allele neutrale. Si nota subito che nella prima
popolazione il rosso ( indichiamo così l'allele per semplicità ) si fissa, mentre nella seconda
popolazione è rimosso: sebbene i due sistemi partano dalle stesse condizioni iniziali e siano
soggetti alla stessa selezione, questi evolvono in maniera del tutto diversa. L'evoluzione non si
ripete.
Conviene introdurre a questo punto il parametro FST, che rappresenta una misura della
differenziazione genetica tra popolazioni: se questo è piccolo, allora esse sono simili, mentre un
valore più consistente con l'unità implica una maggiore diversità; la stima di questa quantità relativa
alle frequenze dell'allele rosso e dell'allele verde è riportata in funzione del tempo nel seguente
grafico:
31
Le popolazioni sono simili se consideriamo l'allele verde ( di cui si intravede l'andamento per t
molto grande ), mentre sono geneticamente diverse per il locus in cui segrega l'allele rosso,
testimoniando l'unicità dei percorsi evolutivi seguiti.
Appendice
A.1 La legge di Hardy – Weinberg
Nella Introduzione, è stata citata la legge di Hardy – Weinberg come esempio di applicazione di
ipotesi semplici per descrivere un sistema complesso come una popolazione. In particolare abbiamo
considerato la distinzione tra popolazione ermafrodita e sessuata, affermando nel primo caso che
l'equilibrio è raggiunto dopo una generazione, mentre nel secondo caso è raggiunto dopo due
generazioni. Giustifichiamo qui il risultato.
Consideriamo una popolazione ermafrodita di infiniti individui e supponiamo che la frequenza
dell'allele A1 sia p ( quindi q = 1 – p è la frequenza di A2 ); assumiamo un regime di random
mating, e consideriamo la riproduzione degli individui. La probabilità che lo spermatozoo sia A1 è
32
p, mentre la probabilità che la cellula uovo sia A1 è anch'essa p, e quindi la probabilità di avere uno
zigote A1A1 è p2; in modo analogo si ottiene che la probabilità di uno zigote A2A2 è q2. La
probabilità che lo zigote sia invece A1A2 è data dalla somma delle probabilità che l'uovo sia A1 e lo
spermatozoo sia A2, ed è pq, oppure che l'uovo sia A2 e lo spermatozoo A1, anch'essa pq, fornendo
complessivamente 2pq. L'equilibrio pertanto è raggiunto dopo una sola generazione.
Per quanto riguarda il caso di popolazione sessuata, nella prima generazione le frequenze
genotipiche dipendono dal sesso: indichiamo quindi x( AiAj ) quelle relative ai maschi e y( AiAj )
quelle relative alle femmine. In un ciclo di random mating, possiamo avere nove coppie di genotipi
che si uniscono, e per ognuna si possono avere uno, due o tre possibili genotipi per i figli. Se si
accoppiano due omozigoti uguali, allora i figli sono di certo omozigoti; se si accoppiano un
omozigote e un eterozigote allora i figli potranno essere sia omozigoti ( dello stesso tipo del
genitore ), sia eterozigoti, ed entrambi gli eventi hanno ½ come probabilità di successo; se si
accoppiano due eterozigoti, allora i figli potranno essere omozigoti di entrambi i tipi con probabilità
¼ ciascuno, oppure eterozigoti con probabilità ½; se poi si accoppiano due omozigoti diversi, i figli
saranno di certo eterozigoti. Tutto ciò è riassunto in tabella nella pagina seguente.
A questo punto, la frequenza genotipica x'( A1A1 ), nella nuova generazione, è:
x'( A1A1 ) = y( A1A1 ) x( A1A1 ) + ( y( A1A1 ) x( A1A2 ) ) / 2 + ( y( A1A2 ) x( A1A1 ) ) / 2 +
( y( A1A2) x( A1A2) ) / 4 = ( x( A1A1) + x( A1 A2 ) / 2 ) ( y( A1A1) + y( A1A2 ) / 2 ) = pm pf
Tipo di coppia
Frequenza di
accoppiamento
Probabilità dei genotipi per i
figli nella seconda generazione
Femmine
maschi
A1A1
A1A1
y(A1A1) x(A1A1) 1
A1A1
A1 A2
y(A1A1) x(A1A2) ½
½
A1A1
A2A2
y(A1A1) x(A2A2)
1
A1 A2
A1A1
y(A1A2) x(A1A1) ½
½
A1 A2
A1 A2
y(A1A2) x(A1A2) ¼
½
¼
A1 A2
A2A2
y(A1 A2) x(A2A2)
½
½
A2A2
A1A1
y( A2A2) x(A1A1)
1
A2A2
A1 A2
y( A2A2) x(A1A2)
½
A2A2
A2A2
y( A2A2) x(A2A2)
A1A1
A1 A2
A2A2
½
1
Tabella riassuntiva dei possibili accoppiamenti
33
dove pm e pf sono le frequenze alleliche dell'allele A1 nei maschi e nelle femmine.
Analogamente si ottiene per il genotipo A2A2 la frequenza qm qf, mentre per A1A2 si ricava:
x'( A1A2 ) = y( A1A1 ) x( A2A2) + y( A2A2 ) x( A1A1 ) + ( y( A1A1 ) x( A1A2) ) / 2 +
+ ( y( A1 A2) x( A1A1) ) /2 + ( y( A1A2 ) x( A1A2 ) ) / 2 + ( y( A1 A2) x( A2A2) ) / 2 +
+ ( y( A2A2 ) x(A1 A2) ) / 2 = pmqf + pfqm .
Le quantità calcolate sono le stesse sia per i maschi sia per le femmine, poiché il locus in questione
non dipende dal sesso. La frequenza dell'allele A1 è quindi:
p' = x'( A1A1 ) + x'( A1 A2 ) / 2 = pm pf + ( pmqf + pfqm ) / 2 = ( pm + pf ) / 2 ,
uguale per entrambi i sessi; siamo quindi in una situazione intermedia dove non c'è ancora
l'equilibrio di Hardy – Weinberg, ma le frequenze alleliche sono diventate uguali per entrambi i
sessi, come nella popolazione ermafrodita alla prima generazione. Pertanto, dopo un altro random
mating, pervenendo così alla terza generazione, le probabilità di ottenere i vari genotipi hanno la
stessa forma di quelle discusse nel primo caso, e sono ( p' )2, ( q' )2 e 2p'q'. L'equilibrio di Hardy –
Weinberg è raggiunto in due generazioni.
A.2 Dimostrazione sulla probabilità di fissazione
Nel paragrafo 2.3 si è fatto uso dell'espressione P( p ) della probabilità di fissazione di un allele A
soggetto alla selezione assegnata la sua frequenza iniziale e in condizioni di dominanza incompleta
con h = ½. Diamo qui la dimostrazione di questo risultato.
Il punto di partenza è una decomposizione integrale della funzione P, che consente di esprimerla
nella forma:
P( p ) = ∫ f( p, p + δp )P( p, p + δp ) d( δp ) ,
dove f( p, p + δp ) è la densità di probabilità di una variazione δp nella frequenza allelica p nella
generazione successiva e l'integrazione è svolta su tutti i possibili valori di δp ( si suppone che la
popolazione sia grande abbastanza da poter considerare la variabile p continua ).
34
A questo punto si sviluppa al secondo ordine la probabilità di fissazione P( p, p + δp ) nella
generazione successiva e si pone:
∫ f( p, p + δp ) δp d( δp ) = E( δp│p ) = M( p ) ,
∫ f( p, p + δp ) ( δp )2 d( δp ) ≈ var( δp│p ) = V( p );
sostituendo queste quantità nell'espressione precedente e sottraendo P( p ) ad ambo i membri si
ottiene l'equazione differenziale:
(V( p ) / 2) P''( p ) + M( p ) P'( p ) = 0 ,
con le condizioni al contorno:
P( 0 ) = 0 , P( 1 ) = 1.
La soluzione generale di questa equazione è:
p
P( p ) =
G x
0
x
1
G x
x
0
,
dove G( x ) è:
G( x ) = exp[ – ∫ [ 2M( x ) / V( x ) ]dx ]
Occorre comunque dare le espressioni esplicite di M( p ) e V( p ) per specializzare la soluzione, e
queste dipendono dal tipo di situazione che si considera. La più semplice è quella dove l'allele A è
caratterizzato da un coefficiente s ed è tale che l'eterozigote ha vantaggio selettivo s, mentre
l'omozigote ha vantaggio 2s; si ha quindi:
M( p ) = pqs , V( p ) = pq ( 1 / 2N ) ,
che forniscono:
35
G( x ) = exp[ – 4Nsx ] ,
da cui si ottiene la soluzione:
P( p ) = ( 1 – exp[ – 4Nsp ] ) / ( 1 – exp[ – 4Ns ]) .
Più in generale, tenendo conto dell'effetto eterozigote attraverso il parametro h definito in
precedenza, si ha:
M( p ) = pqs ( h + ( 1 – 2h ) p ) , V( p ) = pq ( 1 / 2N ) ,
e quindi:
G( x ) = exp[ – ( 4Nshx + 2Ns ( 1 – 2h ) x2 )] = exp[ – ( 4Nshx – 2Nsx + 2Nsx + 2Nsx2
– 4Nshx2 ) ] = exp[ – ( 2Nsx ( 2h – 1 ) ( 1 – x ) + 2Nsx ) ] ,
che, per h = ½, diventa:
G( x ) = exp[ – 2Nsx ] ;
la soluzione con questa condizione è:
P( p ) = ( 1 – exp[ – 2Nsp ] ) / ( 1 – exp[ –2Ns ]) .
Questa è l'espressione utilizzata nel paragrafo 2.3, dimostrata con la cosiddetta teoria della
diffusione.
36
Bibliografia
John H. Gillespie, 1998. Population Genetics. The Johns Hopkins University Press.
Motoo Kimura, 1983. The neutral teory of molecular evolution. Cambrige University Press.
Motoo Kimura, 1962. On the probability of fixation of mutant genes in a population. Genetics.
B. S. Weir and C. Clark Cockerham, 1984. Estimating F-statistics for the analysis of population
structure. Evolution.
David T. Suzuki and Anthony J. F. Griffiths, 1980. Genetica, principi di analisi formale. Zanichelli.
37
38