dispensa per il corso di zootecnica generale e miglioramento genetico

Università degli Studi di Camerino
Dipartimento di Scienze ambientali
APPUNTI DI
GENETICA AGRARIA
PROFESSOR CARLO RENIERI
Anno Accademico 2007-'08
1. LA GENETICA.
La genetica è la scienza dell‟eredità e delle variazioni; essa cerca di spiegare, attraverso delle leggi, la
rassomiglianza e le differenti esistenti tra individui. L‟eredità è la trasmissione dei caratteri, e quindi
dei geni, dai genitori ai loro discendenti. Le variazioni sono le differenze che esistono tra gli individui
di una popolazione per un determinato carattere.
2. IL DNA.
Oggi si dà per scontato che il materiale genetico è il DNA. Già nel 1928 lo statunitense Griffith
dimostrò che una sostanza iniettata al Diplococcus pneumoniae lo trasformava da avirulento in
virulento. Nel 1944 Avery identificò il DNA e dal 1952 tutta la comunità scientifica lo accettò come il
materiale genetico alla base dell'eredità.
L'acido desossiribonucleico è costituito da una sequenza di quattro molecole fondamentali denominate
nucleotidi, che differiscono solamente per il fatto di contenere ciascuno una differente base azotata;
ogni nucleotide risulta composto da uno zucchero a cinque atomi di carbonio (desossiribosio), da un
gruppo fosfato e da una delle quattro basi azotate; da un punto di vista strutturale, le basi sono a due a
due simili: da una parte adenina e guanina (purine, con un doppio anello) e dall'altra citosina e timina
(pirimidine, ad anello singolo). La struttura di un nucleotide è quindi composta dall'anello del
desossiribosio che lega il gruppo fosfato al suo carbonio 5' ed una delle quattro basi al carbonio 1'.
Nel 1953, James Watson e Francis Crick proposero il primo modello della molecola del DNA che
conteneva in sé l'indicazione di come il DNA potesse svolgere le sue funzioni di conservazione e
trasmissione dell'informazione genetica. La struttura proposta da questi autori è quella di una doppia
elica avvolta a spirale con avvitamento destrorso (cioè in senso orario). Ciascuna elica è formata da
una catena di nucleotidi tenuti insieme da legami covalenti; più precisamente si tratta di legami fosfodiesterici nei quali un gruppo fosfato forma un ponte tra la posizione 3' di un pentoso e la posizione 5'
del pentoso successivo. Ciascuna catena avrà ad una sua estremità un gruppo 5' libero ed all'estremità
opposta un gruppo 3' libero; le due eliche sono tenute insieme dai legami idrogeno che si stabiliscono
tra le basi complementari (A-T e C-G) per la presenza di due atomi elettronegativi che condividono un
protone. I legami ad idrogeno che uniscono le due catene sono molto più deboli di quelli covalenti che
uniscono due nucleotidi contigui nella stessa catena; per motivi sterici i legami ad idrogeno possono
formarsi solo fra adenina e timina (2 legami) e fra citosina e guanina (3 legami): il differente numero
di legami ad idrogeno che lega le coppie di basi azotate complementari spiega la diversa densità che il
DNA può avere (è più denso se più ricco in citosina e guanina). Il modello richiede che le due catene
siano anti-parallele, decorrano cioè in senso 5'-3' l'una e in senso 3'-5' l'altra: in altri termini l'estremità
5' di un filamento si trova di fronte all'estremità 3' dell'altro.
Il modello proposto da Watson e Crick nel 1953 è ancora sostanzialmente valido: è il ß-DNA, dove
l'andamento della spirale e dei filamenti è regolare e si può distinguere un solco minore (fra le due
catene) ed un solco maggiore (quello dovuto alla spiralizzazione vera e propria). E' importante
sottolineare che, in periodi successivi, sono state descritte altre conformazioni della molecola
dell'acido desossiribonucleico. Queste differenti conformazioni strutturali del DNA sono state messe in
rapporto a specifiche sequenze nucleotidiche della molecola stessa. Ad esempio, alcune sequenze
caratterizzate da un regolare alternarsi di basi pirimidiniche e puriniche sono in grado di indurre la
conversione da una normale doppia elica destrorsa ad una forma Z sinistrorsa, caratterizzata da uno
scheletro portante di DNA molto più irregolare, seghettato, e dalla presenza di un unico solco minore
che sostituisce i due solchi maggiore e minore della classica struttura ß. Altro caso simile è quello per
cui le cosiddette ripetizioni invertite (cioè una sequenza seguita sullo stesso filamento dalla sua
sequenza complementare disposta in ordine inverso) inducono nella molecola la comparsa di una
struttura caratteristica "a croce": ciò è dovuto alla tendenza delle basi ad appaiarsi nell'ambito dello
stesso filamento, con il conseguente ripiegarsi del filamento stesso. Il DNA è dunque una molecola
estremamente flessibile e reattiva, in grado di interagire con tutta una serie di molecole cellulari grazie
anche ad una continua modificazione conformazionale.
2
LA DUPLICAZIONE DEL DNA.
Il meccanismo di replicazione del DNA è semiconservativo: la doppia elica madre darà due doppie
eliche figlie, formate ciascuna da un filamento parentale e da un filamento neoformato; erano stati in
precedenza proposti anche altri modelli che però non hanno trovato conferma (ad esempio, il modello
conservativo, il modello dispersivo). La doppia elica si srotola e forma una doppia Y (la "forcina di
replicazione"): la base della Y si srotola progressivamente mentre le due braccia fungono da stampo
(template) per il nuovo filamento. L'intero meccanismo di replicazione è basato sulla
complementarietà delle basi azotate. Lo srotolamento necessita di 3 proteine specifiche: la replicasi
srotola il tratto da replicare, la proteina SSB si lega al filamento srotolato ed impedisce la sua
degradazione e riunione, la proteina ligasi controlla la zona non despiralizzata proteggendola da
trazioni ed altri traumi. La DNApolimerasi aggiunge un nucleotide ad un tratto preesistente: non è in
grado di iniziare ex novo, ma necessita di un primer (può aggiungere nucleotidi solo all'estremità 3': il
verso di formazione della catena è pertanto 5'-3'); l'energia della scissione del gruppo energetico
fosfato è utilizzata per legare il nucleotide. La DNApolimerasi ha anche il compito di scindere
eventuali legami erronei fra le basi. Il primer è dato dalla RNApolimerasi. Il filamento 3'-5' viene
sintetizzato a tratti, sempre nel verso 5'-3', con un numero elevato di primer di RNA; i tratti sono detti
frammenti di Okazaki. Quando la DNApolimerasi trova al termine di un tratto il primer di un tratto
vicino lo scinde e lo risintetizza come DNA (sostituisce RNA con DNA). I vari frammenti di Okazaki
sono uniti dalla DNAligasi. Negli eucarioti la replicazione del DNA non comincia in un solo punto ma
contemporaneamente ed indipendentemente in più "forcine di replicazione": questi punti, detti "bolle
di replicazione", confluiscono e sono infine uniti dalla DNAligasi; per dimostrare la molteplicità dei
siti di replicazione si è ricorsi a timidina triziata, cioè marcata con trizio, e si è seguita la distribuzione
della radioattività dopo la replicazione.
LA DIVISIONE FUNZIONALE DEL DNA.
Le dimensioni del genoma vengono espresse in numero di paia di basi (1 Kb = 1.000 paia di basi).
Salendo nella scala evolutiva si nota una certa tendenza all'aumento delle dimensioni del genoma, ma
non vi è una esatta corrispondenza fra la complessità fenotipica o il livello evolutivo di un organismo e
la grandezza del suo genoma: ad esempio, il genoma di una salamandra e quello del grano tenero
hanno entrambi dimensioni superiori al genoma dell'uomo. Bisogna tenere conto non solo del numero
6
di paia di basi ma anche del numero di geni. Il genoma di Eschirichia coli è composto da 4x10 paia di
basi e considerando un gene in media codificato in 2-3 Kb si può sostenere che il genoma di questo
batterio contiene poche migliaia di geni, come si è potuto anche controllare fenotipicamente; il genoma
8
di Drosophyla melanogaster ha circa 2x10 paia di basi, ma è stato dimostrato contenere solo 5.000
9
geni circa; il genoma dell'uomo (Homo sapiens) ha circa 3x10 paia di basi, e contiene circa 50.000100.000 geni.
In realtà, mentre nei batteri le dimensioni del genoma sono proporzionali al numero dei geni, negli
eucarioti ciò non si verifica. Come mai aumenta molto il DNA ma proporzionalmente non i geni?
Esiste del DNA eucariotico che non funziona? In effetti negli eucarioti c'è molto DNA ripetuto: alcune
centinaia di basi vengono ripetute più volte. Per studiare questo fenomeno si utilizza la cinetica della
denaturazione; il DNA viene frammentato e poi denaturato (cioè trasformato da un doppio filamento
in due filamenti singoli, in genere aumentando la temperatura); quando si riabbassa la temperatura il
DNA si rinatura, cioè si ritrasforma in doppio filamento mediante l'appaiamento delle basi
complementari: più esistono sequenze ripetute e più rapida è la rinaturazione (ci sono più probabilità di
appaiamento fra frammenti complementari).
3
In base alla quantità di ripetizioni vengono distinte negli eucarioti 3 classi di DNA:
5
- DNA altamente ripetuto, che rappresenta da 0 al 50% del DNA, nel quale esistono oltre 10 copie
delle stesse sequenze, come ad esempio nel caso del DNA satellite;
- DNA mediamente ripetuto, che rappresenta dal 10 al 40% del DNA e con sequenze ripetute fra 10 e
5
10 volte, come nel caso dei geni per rRNA, tRNA istoni;
- DNA a sequenza unica, che non è cioè ripetuto, e rappresenta il 40-80% del DNA (ad esempio, i geni
dell'emoglobina, dell'ovoalbumina).
Il DNA satellite è costituito da sequenze altamente ripetute: ultracentrifugando in gradiente di cloruro
di cesio, all'interno della provetta il DNA si stratifica in una banda corrispondente alla propria "densità
di galleggiamento"; nei procarioti si ha una sola banda, mentre negli eucarioti in prossimità della
banda principale si hanno altre bande, da cui il nome di DNA satellite; il fenomeno è legato al diverso
contenuto in coppie di basi guanina-citosina, che provoca una densità diversa da quella della banda
principale.
Da un punto di vista funzionale il DNA può essere distinto in codificante e non codificante, a seconda
che dia o meno esito alla sintesi di una proteina. Il genoma è composto da parti funzionalmente
discontinue: la parte non codificante (introne) viene trascritta ma non dà alcuna proteina, mentre la
parte codificante darà gli esoni e quindi le proteine.
Per quale motivo nel DNA si ripetono più volte le stesse sequenze? Un'ipotesi era che più erano le
sequenze e più poteva essere quantitativamente la sintesi della proteina, ma si è visto che più che dalla
trascrizione la sintesi proteica è limitata da altre fasi. Si tratta di una specie di copie di riserva, in caso
di mutazioni? Il DNA ripetuto modifica la probabilità che le mutazioni, che sono casuali, riguardino
delle sequenze funzionalmente importanti? Si tratta di famiglie multigeniche, cioè di geni molto simili
sia nelle sequenze nucleotidiche che nella proteina prodotta (ad esempio, le globine dell'emoglobina,
oppure le cheratine della lana), con una qualche testimonianza evolutiva? Se il DNA ripetuto non è
codificante, a che cosa può servire? E' forse la forma più semplice di parassitismo?
IL CODICE GENETICO.
In che modo la sequenza nucleotidica del DNA determina la sequenza aminoacidica delle proteine? E'
il concetto di codice genetico. Il primo problema era di stabilire se nel codice c'erano o no delle
sovrapposizioni, cioè di stabilire se un nucleotide poteva essere "letto" più di una volta, in diverse
posizioni del codice: ad esempio, nel caso di una sequenza ATTGCTCAG, se il codice è senza
sovrapposizione, i primi tre aminoacidi sono codificati dalle triplette ATT, GCT, CAG, mentre se il
codice è con sovrapposizioni, i primi tre aminoacidi sono codificati dalle triplette ATT, TTG, TGC.
Nel 1961 venne accertato che non ci sono sovrapposizioni: infatti, se muta una sola base muta nella
corrispondente proteina un solo aminoacido; il codice con sovrapposizione farebbe invece prevedere
che al cambiamento di un solo nucleotide corrisponda il cambiamento di più aminoacidi contigui (fino
a tre). In realtà ci può essere una specie di sovrapposizione perché il DNA può essere letto con
differente "frame" (lettura spostata di una o due basi) e quindi dare differenti proteine: si dicono
proteine modificate per scivolamento ("shifting"); si tratta però non di una sovrapposizione nella
lettura del codice genetico per una proteina ma di differenti fasi di lettura dello stesso tratto di DNA
che codifica per proteine differenti.
Le lettere a disposizione del codice genetico sono le 4 basi azotate. Con due basi azotate si potrebbero
2
specificare 4 possibilità, cioè 16 differenti aminoacidi, mentre con tre si possono teoricamente
3
specificare 64 differenti aminoacidi (4 ); essendo 20 gli aminoacidi c'è un problema di eccesso di
possibilità. Ai 20 aminoacidi bisogna aggiungere un codon per il segnale di inizio della trascrizione ed
uno per il segnale di fine della trascrizione, ma ne esistono anche che non specificano nulla (e quindi
fanno immediatamente interrompere la trascrizione); si tratta inoltre di un codice degenerato, perché
un aminoacido può essere indicato da più di un codon. Esperimenti condotti da Brenner (con mutanti
del locus rII del fago T4) hanno dimostrato che un codon è effettivamente di tre lettere (e non più di
tre).
Il meccanismo di duplicazione del DNA è molto efficiente: in E. coli, in un minuto vengono replicate
4
50.000 basi e in una generazione c'è solo un errore su un milione di replicazioni del DNA.
LE MUTAZIONI.
Occasionalmente, durante la replicazione del DNA, possono verificarsi degli errori che vengono
trasmessi alla generazione successiva.
Potrebbe avvenire ad esempio che venga sostituito per errore un nucleotide: è una mutazione
puntiforme; l'RNA-polimerasi non è in grado di individuare l'errore, per cui l'informazione errata viene
trascritta con conseguenze più o meno gravi; il cambio di una base azotata può dare un differente
aminoacido o un codice non-senso, che interrompe la sintesi proteica, ma anche non provocare nulla se
il nuovo codice è per lo stesso aminoacido (il codice genetico è un codice degenerato). Se un
aminoacido diverso viene introdotto in una proteina l'attività della stessa potrà essere più o meno
modificata (negativamente la maggior parte delle volte, positivamente qualche rara volta, ed in
quest'ultimo caso il mutante potrà risultare favorito nella selezione). Se il nuovo codon derivante dalla
sostituzione di un singolo nucleotide non codifica per alcun aminoacido, una volta giunto a questo
livello, il processo di trascrizione si arresta: se ciò avviene subito dopo l'inizio del gene, l'assenza
pressoché totale della proteina ha generalmente gravi conseguenze nell'organismo mutante.
Altro tipo di mutazione puntiforme è la perdita di un nucleotide (delezione); in questo caso l'RNApolimerasi non ha più la corretta chiave di lettura (reading frame) e tutti i codon a valle della
mutazione (e quindi i corrispondenti aminoacidi) assumono significati diversi. Questo tipo di
mutazione viene definita frameshift. Le stesse conseguenze si hanno per l'inserzione di un nucleotide.
In certi casi possono andare perduti o essere inseriti interi tratti di DNA. Si indicano con il termine di
introsoni o trasposoni dei tratti di DNA più o meno lunghi, con sequenze terminali costanti, in grado
di spostarsi da un punto ad un altro del genoma: la loro inserzione generalmente abolisce l'attività del
gene.
E' stato osservato che le coppie di nucleotidi non mutano tutte con la stessa frequenza: in certi siti la
probabilità di mutazione è fino a 100 volte più elevata che in altri ("hot spots", cioè "punti caldi"). Un
esempio di hot spot è il gene lact di E. coli: c'è un punto, a 200 basi dall'inizio del gene, dove la
citosina è metilata in posizione 5'; normalmente la citosina è trasformata dalla desaminazione
ossidativa in uracile, che viene riconosciuto come estraneo al DNA, allontanato e risostituito da
citosina: la 5-metil-citosina è però trasformata dalla desaminazione ossidativa in timina, che è una
normale base del DNA: ne consegue che un filamento resta normale mentre quello mutato, nella
replicazione, avrà un appaiamento timina-adenina invece che citosina-guanina.
L'RNA.
L'informazione genetica contenuta nel DNA controlla la sintesi delle proteine: tale informazione viene
trascritta in mRNA e trasferita dal nucleo ai ribosomi, dove l'mRNA fornisce il messaggio per la sintesi
della proteina; l'RNA è quindi il tramite tra il DNA e le proteine: senza di esso l'informazione genetica
rimarrebbe inerte e non potrebbe essere espressa.
A differenza di quanto visto nel DNA, nell'RNA il filamento è singolo invece che
doppio, nei nucleotidi è presente l'uracile al posto della timina, lo zucchero è il
ribosio invece che il desossiribosio; nel desossiribosio il gruppo chimico legato
al carbonio in posizione 2 è un atomo di idrogeno, mentre nel ribosio nella
stessa posizione è presente un ossidrile.
La scelta evolutiva del DNA come molecola deputata alla conservazione dell'informazione genetica è
legata alle differenze chimiche esistenti fra DNA ed RNA; infatti, quando i ribonucleotidi sono uniti a
formare l'RNA, l'ossidrile in posizione 2 del ribosio rimane libero, e ciò rende l'RNA meno stabile del
DNA dal punto di vista chimico: in soluzione acquosa l'RNA va incontro a rapida idrolisi. Negli
esperimenti che tendono a ricostruire in laboratorio il "brodo primordiale" da cui si ritiene abbia avuto
origine la vita, si ha prima la polimerizzazione dell'RNA: ciò fa ritenere che l'RNA abbia
evolutivamente preceduto il DNA, il quale sarebbe originato da una trascriptasi inversa
(DNApolimerasi-RNAdipendente) ed avrebbe in seguito soppiantato il DNA grazie alla sua maggiore
5
stabilità, che lo rende intrinsecamente più adatto per conservare l'informazione per lunghi periodi di
tempo.
LA TRASCRIZIONE.
La trascrizione avviene ad opera della RNApolimerasi; la RNApolimerasi si lega al DNA in
corrispondenza di un promotore, il quale è differente per i vari geni ma è sempre caratterizzato da una
sequenza costante di 6 basi azotate (TATAAT).
La formazione dell'RNA è analoga a quella del DNA, ma non c'è bisogno di un primer; il verso della
sintesi è sempre lo stesso (sul filamento 5'-3'). La sintesi dell'mRNA inizia quando l'RNA polimerasi
comincia a trascrivere il DNA 10-20 nucleotidi a valle della sequenza TATAAT. L'RNA polimerasi
srotola per un breve tratto la doppia elica di DNA ed inizia la trascrizione: l'enzima si muove lungo il
DNA aggiungendo i ribonucleotidi (complementari ai desossiribonucleotidi del DNA) al 3' del
nucleotide terminale del filamento nascente di RNA. Prima che la lunghezza del trascritto abbia
superato i 30 nucleotidi, l'estremità 5' libera del filamento di RNA neosintetizzato viene ricoperta da
una specie di struttura protettiva di guanosina metilata, legata per mezzo di un gruppo trifosfato. La
trascrizione continua finché l'enzima non oltrepassa una sequenza del DNA che rappresenta il segnale
di termine della trascrizione stessa (in genere AAUAAA): circa 20 nucleotidi più a valle il trascritto
viene scisso ed un enzima aggiunge una coda di 150-200 adenin-nucleotidi all'estremità 3' del trascritto
(poli-A).
Nei procarioti si ha una sola RNA-polimerasi, mentre negli eucarioti si hanno tre diversi enzimi: uno
per la produzione di mRNA, uno per la produzione di rRNA ed uno per la produzione di tRNA.
LA TRADUZIONE.
Il trascritto primario passa dal nucleo al citoplasma e viene tradotto a livello di ribosomi;
intervengono a questo punto l'RNA transfer (tRNA) e l'RNA ribosomiale (rRNA).
Il tRNA è un filamento corto, di 70-80 nucleotidi; esso ha una caratteristica struttura ripiegata, e lega
ad una estremità un determinato aminoacido ed alla estremità opposta presenta un'ansa con l'anticodon
per quell'aminoacido, ovvero il codon complementare; l'estremità a cui si lega l'aminoacido è sempre
la stessa per tutti gli aminoacidi, in quanto è lo stesso enzima che lega l'aminoacido al tRNA a farsi
carico del riconoscimento dell'anticodon.
L'rRNA si trova legato ad alcune proteine insieme alle quali costituisce le due subunità
ribonucleoproteiche (una maggiore ed una minore) che formano il ribosoma; nei procarioti il
ribosoma ha un coefficiente di sedimentazione (misurato in Svedberg) di 70 S e le due subunità hanno
rispettivamente 50 S e 30 S; negli eucarioti il coefficiente di sedimentazione del ribosoma è di 80 S e
quello delle due subunità di 60 S e di 40 S: nella subunità grande ci sono 3 molecole di RNA, (una
grande, di circa 4500 nucleotidi, due piccole di circa 160 e 120 nucleotidi), mentre nella piccola c'è
una sola molecola di RNA (di circa 1800 nucleotidi).
L'RNA messaggero (mRNA) "scivola" sull'rRNA un codon alla volta e ad uno ad uno si uniscono alla
catena proteica nascente i vari aminoacidi portati dall'tRNA che ha l'anticodon corrispondente; in
genere nei procarioti c'è all'inizio della sintesi sempre lo stesso aminoacido, che successivamente viene
allontanato.
La sequenza dei codon sull'mRNA, dipendente dall'informazione contenuta nel DNA, determina a sua
volta l'ordine degli aminoacidi nella proteina.
LA MATURAZIONE DELL'RNA.
Sin dal 1960 esperimenti effettuati marcando con isotopi radioattivi l'mRNA hanno dimostrato che
alcune molecole di mRNA isolate a livello nucleare hanno dimensioni superiori (ad esempio, 5.000bs)
a quelle dei medesimi mRNA isolati dopo il trasferimento nel citoplasma (ad esempio, 1.000bs): infatti
l'mRNA marcato non si riibridizza completamente con il DNA denaturato, perché delle parti di DNA
non si ritrovano nell'mRNA citoplasmatico. I precursori nucleari vengono tagliati e riuniti per dare
origine agli RNA maturi, senza alterazioni all'estremità protettiva di guanosina metilata ed alla coda di
6
poli-A, che si ritrovano anche nell'mRNA maturo. Questo processo di maturazione dell'mRNA è
indicato con il termine di splicing.
I geni degli organismi eucarioti sono discontinui, costituiti cioè da tratti effettivamente codificanti
(indicati con il termine di esoni) inframmezzati da sequenze che non hanno alcuna funzione
codificante (introni). Sia gli esoni che gli introni vengono trascritti dall'RNA-polimerasi in un
trascritto primario: tale trascritto subisce una maturazione a livello nucleare che comporta
l'allontanamento delle porzioni introniche; l'mRNA maturo che arriva ai ribosomi contiene pertanto
solamente la porzione esonica, l'unica ad essere effettivamente espressa. Lo splicing dell'mRNA non
avviene invece nei batteri dove i geni sono continui.
Durante il processo di maturazione, un ruolo fondamentale nell'allontanamento degli introni è svolto
dalle snRNP, costituite da un gruppo di molecole proteiche legate ad un'unica molecola di RNA: si
tratta di un RNA particolare, ricco di uracile (RNA U). Nel trascritto primario, nel punto di passaggio
tra esoni ed introni, esistono delle sequenze caratteristiche ricche di guanina ed uracile: le snRNP si
legano a tali sequenze G-U e tagliano la catena RNA in quel punto. Gli introni vengono così
allontanati mentre gli esoni vengono saldati tra loro dando origine all'RNA messaggero maturo.
Agli scienziati che hanno scoperto la discontinuità dei geni è stato assegnato nel 1993 il premio Nobel.
L'ESPRESSIONE DEI GENI.
Le scoperte sulla discontinuità funzionale dei geni sono state fatte nel corso delle ricerche
sull'espressione dei geni: le diverse cellule di un organismo hanno tutte lo stesso DNA, per cui come si
spiegano le differenze? Un problema di fondamentale importanza nello studio del genoma è
rappresentato dalla regolazione dell'espressione genica: è chiaro che una cellula, in un determinato
istante, non contiene tutti gli mRNA codificati dal suo DNA, ma trascrive alcuni geni e produce le
proteine corrispondenti solo quando ne ha la necessità.
Nei procarioti non ci sono introni (quelli identificati sono trascurabili), mentre negli eucarioti si è posto
immediatamente il problema di stabilire quale importanza può avere la maturazione dell'RNA nella
regolazione dell'espressione genica. Secondo una teoria si ipotizzava che la scelta di quale proteina
produrre, in quale cellula ed in quale momento, fosse legata alla maturazione differenziale di un'unica
molecola di mRNA trascritta in maniera totale ed indifferenziata in tutte le cellule: ad esempio, un
trascritto contenente più esoni avrebbe potuto essere tagliato e poi nuovamente saldato in modo da
includere nell'mRNA maturo tutti o solo alcuni degli esoni, purché fossero conservati gli esoni alle
estremità del gene (contenenti il "cappuccio" protettivo di guanosina metilata in posizione 5' e la coda
di poli-A in posizione 3'), e che gli esoni fossero rimasti nello stesso ordine. Sono stati effettivamente
scoperti diversi geni che si comportano in questo modo: si tratta di "unità di trascrizioni complesse",
che codificano per più mRNA (ottenuti mediante splicing differenziale). Un esempio di unità di
trascrizioni complesse è rappresentato dal segmento di DNA che codifica per la calcitonina, ormone
prodotto a livello della tiroide: è stato osservato che tale sequenza si ibridizza anche con un mRNA
prodotto nell'ipofisi. Il trascritto primario che si trova nelle cellule tiroidee si ritrova anche a livello
dell'ipofisi e contiene due siti poli-A; nella tiroide viene accettato come segnale terminale il primo sito
poli-A: i primi quattro esoni vengono saldati e danno origine ad un mRNA che codifica per la
calcitonina; nell'ipofisi invece lo stesso trascritto primario termina in corrispondenza del secondo sito
poli-A: al momento della saldatura il quarto esone viene allontanato insieme agli introni, mentre
vengono uniti il quinto ed il sesto esone, dando così origine all'mRNA per una proteina,
completamente diversa dalla calcitonina, nota come CGRP.
Con la scoperta delle più recenti tecniche di biologia molecolare si è accertato che l'importanza dello
splicing nella regolazione dell'espressione genica è relativa; la regolazione è effettuata essenzialmente
attraverso un controllo della trascrizione primaria, quando alcuni geni vengono trascritti ed altri no:
non si ha tanto una trascrizione indifferenziata seguita da una maturazione differenziale dell'mRNA,
ma direttamente una trascrizione differenziale del DNA. L'importanza della trascrizione differenziale è
stata dimostrata isolando e clonando dei geni; vennero isolate e clonate delle sequenze nucleotidiche
per proteine specifiche del fegato e per delle proteine non-specifiche; questi geni sono stati posti su un
filtro di nitrocellulosa e messi a contatto con il trascritto primario, marcato con isotopi radioattivi, di
7
cellule epatiche, renali e cerebrali: il trascritto delle cellule epatiche si ibridizzava sia con i geni per le
proteine del fegato che con i geni delle proteine non specifiche, mentre il trascritto primario delle
cellule renali e quello delle cellule cerebrali si ibridizzava solo con le sequenze nucleotidiche per le
proteine non-specifiche.
Come è controllata l'attivazione e la disattivazione del gene? E' questo un problema particolarmente
sentito da chi si occupa di ingegneria genetica, perché inserire un gene estraneo in un genoma (animali
transgenici) è relativamente semplice, ma controllare l'espressione di questo gene è un problema
ancora non risolto. Le conoscenze disponibili riguardano soprattutto i procarioti.
Esperimenti condotti principalmente sul fago lambda hanno evidenziato come l'espressione genica può
essere controllata da proteine regolatrici che si legano a siti specifici del segmento di DNA: tali
proteine vengono indicate con il termine di repressori. Il repressore si lega ad una specifica sequenza
di DNA denominata operatore, situata immediatamente accanto al promotore, cioè accanto a quella
breve sequenza di DNA che rappresenta il punto di attacco dell'RNA polimerasi e quindi di inizio della
trascrizione: la presenza del repressore sul sito operatore impedisce il legame della RNA polimerasi al
promotore e di conseguenza la trascrizione del gene. Nel fago lambda è stato anche evidenziato un
meccanismo di autoamplificazione: l'RNA polimerasi non si lega al promotore del gene ma al
promotore del gene per la proteina che funge da repressore.
Molto spesso un solo repressore controlla l'espressione coordinata di più geni: tale sistema nel suo
complesso viene definito operone. Un esempio è l'operone lact di E. coli, che comprende tre geni (Z,
Y, ed A) responsabili del catabolismo del lattosio attraverso la sintesi di tre enzimi (ß-galattosidasi,
permeasi, transacetilasi). Il gene lact di E. coli è un sistema inducibile: se non c'è lattosio nel mezzo, il
repressore si lega all'operatore ed inibisce la trascrizione dei geni per le tre proteine enzimatiche che
dovrebbero catabolizzare il lattosio; se invece nel mezzo c'è lattosio, questo si lega al repressore che,
così modificato nella forma, non è più in grado di inattivare l'operatore: l'RNA polimerasi trascrive
l'informazione per i tre geni Z, Y ed A in un'unica molecola di RNA policistronico. L'operone lact è un
esempio di sistema inducibile nel senso che la sintesi di un enzima è indotta dalla presenza del suo
substrato.
Esistono anche dei sistemi reprimibili, nei quali il prodotto finale determina il blocco della trascrizione
dei geni per gli enzimi responsabili della sintesi del prodotto stesso: un esempio è l'operone trp,
responsabile della sintesi del triptofano. Il meccanismo di controllo dell'espressione genica di un
sistema reprimibile comporta la presenza sul DNA di un'altra regione specifica denominata
attenuatore, responsabile di una riduzione della velocità di trascrizione dell'mRNA in presenza del
prodotto finale (triptofano): l'assenza di questa regione in alcuni mutanti è associata ad una produzione
continua e massiccia di triptofano.
GLI INTRONI, GLI ESONI E L'EVOLUZIONE.
Fino agli anni '60 la maggior parte degli studiosi riteneva che i batteri, per la loro semplicità, dovessero
essere simili alle prime cellule ancestrali e che gli eucarioti si fossero evoluti da procarioti primordiali.
Lo splicing del trascritto primario, costantemente presente negli eucarioti, avviene molto raramente
nei procarioti che non contengono, se non in quantità trascurabile, introni: di conseguenza gli esoni
venivano considerati come delle complessità introdotte relativamente tardi nel corso dell'evoluzione.
La prima cosa ad essere messa in dubbio fu che i batteri fossero effettivamente gli organismi più
antichi. Woese e collaboratori tracciarono una mappa delle genealogie cellulari confrontando le
sequenze nucleotidiche degli rRNA di differenti organismi; si utilizzava una particolare subunità 16 S
dell'rRNA perché è una struttura precedente la stessa cellula ed è una molecola che non ha mai mutato
la sua attività funzionale; si digeriva l'rRNA con ribonucleasi che spezzavano la catena in
corrispondenza della guanina e si confrontavano i frammenti di almeno 6 basi azotate (una ventina di
frammenti circa): più le sequenze sono conservate, maggiore è la probabilità che gli organismi
discendano da un antenato comune. Ci si rese conto che gli archibatteri, un piccolo gruppo di
metanobatteri, non rientravano nell'albero filogenetico dei batteri classici: essi non erano più vicini dal
punto di vista filogenetico agli eubatteri di quanto lo fossero agli eucarioti. Si è quindi ipotizzata
l'esistenza di tre linee evolutive separate, discendenti da un unico progenitore comune definito
8
"progenote": eubatteri ed archibatteri sarebbero evoluti direttamente dal progenote, mentre gli
eucarioti deriverebbero dalla fusione di un eucariote ancestrale con due tipi di eubatteri; l'eucariote
ancestrale avrebbe dato origine al nucleo della cellula, mentre mitocondri e cloroplasti sarebbero
derivati rispettivamente dai solfobatteri purpurei e dai cianobatteri (determinando le sequenze
dell'rRNA contenuto nei mitocondri si è dimostrato che sono analoghe a quelle dei solfobatteri
purpurei, mentre le sequenze dell'rRNA dei cloroplasti sono analoghe a quelle dei cianobatteri).
L'origine di eucarioti e procarioti è quindi da considerare indipendente e contemporanea; essendo il
nucleo degli eucarioti antico quanto i batteri, ed essendo il nucleo la sede dove avviene la maturazione
dell'mRNA, non vi è alcuna ragione per ritenere che tale processo abbia avuto inizio solo più tardi.
Addirittura la maturazione dell'RNA potrebbe essere iniziata ancora prima della comparsa del
progenote: probabilmente sin dall'inizio la molecola era caratterizzata dalla presenza di esoni ed introni
e ciò sembrerebbe confermato anche dalla posizione che introni ed esoni occupano in molti geni
moderni; ad esempio, nei geni che codificano per le emoglobine, per le immunoglobuline e per altri
enzimi, ogni esone codifica per un dominio della molecola proteica riconoscibile come unità
funzionale: è poco plausibile ritenere che l'introduzione degli introni avvenuta casualmente possa aver
determinato questa precisa suddivisione e molto più probabile invece uno sviluppo graduale dello
splicing che avrebbe portato alla sintesi di proteine più grandi e più utili.
E' molto probabile che i geni dei primi archibatteri ed eubatteri fossero discontinui e che, attraverso
un'evoluzione durata innumerevoli generazioni, i batteri oggi esistenti abbiano eliminato quasi
totalmente le sequenze non codificanti dal loro genoma; il DNA degli eucarioti, uomo compreso, si è
invece evoluto più lentamente (maggior intervallo di generazione): i geni degli eucarioti presentano
quindi "inutili" introni ed il sistema di traduzione è rimasto ancorato ad un complesso procedimento di
maturazione, evolutivamente già superato dalle cellule procariote. Non tutti gli studiosi condividono
però queste ipotesi: alcuni ritengono che l'organizzazione del genoma in esoni ed introni sia
evolutivamente più recente.
3. LA GENETICA FATTORIALE
Tra le varie specializzazioni della genetica, quella detta fattoriale o formale (o, più
imprecisamente, Mendeliana) studia l‟eredità e le variazioni dei caratteri “qualitativi”, per cui si parla
di eredità qualitativa o semplice e di variazione di tipo qualitativo. La definizione di un carattere
qualitativo non è sempre facile e molto spesso essa risponde più a criteri soggettivi creati dagli studiosi
che non alla realtà biologica del carattere stesso. Per poter dare le basi di studio della genetica
fattoriale bisogna cercare di definire nel modo più rigoroso possibile che cosa si debba intendere per
carattere qualitativo.
Alla trattazione dell‟argomento si fa procedere una serie di definizioni necessarie per affinare
la terminologia che sarà utilizzata.
ALCUNE DEFINIZIONI
Prima di continuare riteniamo opportuno dare alcune informazioni che ci saranno utili nel
prosieguo.
Il gene rappresenta l‟unità funzionale dell‟eredità; ciascun gene è formato da una sequenza di
DNA che porta l‟informazione per la costituzione di un particolare polipeptide.
Per locus si intende la localizzazione fisica di un gene su di un cromosoma: in un locus un
individuo ha due geni omologhi provenienti ciascuno da uno dei due genitori.
Un locus si dice polimorfo quando è rappresentato da due o più geni alleli. Tali alleli derivano
da cambiamenti occasionali di un presunto gene normale (o non alterato), detti mutazioni.
L‟organismo che porta il gene alterato è chiamato mutante; l‟organismo che porta il gene
normale, tipo selvaggio.
Due geni sono alleli quando sono situati nello stesso locus ed hanno un‟azione differente su di
uno stesso carattere (ad es. in caso di locus biallelico saranno all‟eliche le coppie Aa e aA).
9
Un locus è monomorfo quando è rappresentato solo da uguali; due geni uguali si dicono
identici quando hanno la stessa origine genealogica, cioè derivano da un gene presente in un antenato
comune ai due individui portatori o trasmettitori dei due geni.
Il fenotipo è l‟espressione fisica di un carattere in un individuo in un ambiente dato; può essere
osservato e misurato.
Il genotipo di un individuo per un determinato carattere è dato dall‟insieme dei geni che
contribuiscono all‟espressione di questo carattere.
Un individuo è omozigote in un locus se i due geni che esso possiede sono uguali (AA, aa); è
eterozigoti se i due geni che esso possiede sono alleli (A e a).
Nella genetica fattoriale, per incrocio si intende la riproduzione tra varietà diverse di individui;
si parlerà successivamente di incrocio monoibrido per gli incroci implicanti una sola coppia di alleli, di
incrocio di ibrido quando le coppie di alleli sono due, di incrocio poliibrido quando l‟incrocio interessa
più coppie di alleli.
La generazione parentale (P), rappresenta la generazione di partenza nell‟incrocio: ad essa
seguono la prima generazione filiale o F1, la seconda o F2 ecc.
Per back-cross si intende l‟accoppiamento tra un individuo F1 con uno dei suoi genitori o con
un individuo dello stesso genotipo del genitore: il back-cross può essere perciò “paterno” o “materno”
a seconda del genitore interessato.
I CARATTERI QUALITATIVI
Perché si possa definire qualitativo un carattere devono sussistere due condizioni, relative la
prima al sistema ereditario che ne è alla base, la seconda all‟espressione della variabilità dello stesso.
Un carattere qualitativo è determinato da un sistema ereditario semplice, cioè costituito da uno
o pochi loci che interagiscono tra loro. I geni appartenenti al(ai) locus (i) hanno un‟azione importante,
sempre identificabile e definibile. Per tale proprietà tali geni sono detti maggiori in confronto ad altri,
detti minori perché la loro azione è scarsamente rilevante e di difficile valutazione; questi ultimi
intervengono nell‟eredità dei caratteri qualitativi.
Quando esiste variazione del carattere nella popolazione, questa si presenta sempre in maniera
discontinua. Le varie espressioni del carattere possono cioè essere raggruppate in classi ben separabili
le une dalle altre e sempre facilmente identificabili. È sempre possibile perciò ottenere una
classificazione del carattere in fenotipo ben separabili. All‟opposto, una gran numero di caratteri
presenta una variabilità che non può essere suddivisa in fenotipi ben definiti perché essa è costituita da
una gamma continua di fenotipi con tutti i possibili intermediari da un tipo all‟altro; tali caratteri sono
detti a variazione continua o quantitativi.
Nei caratteri qualitativi, lo studio del meccanismo ereditario si basa sull‟analisi della
discendenza in incroci individuali conosciuti e determinati; essi prendono il nome di segregazioni.
La variabilità del carattere della popolazione si basa sull‟analisi per enumerazione dei soggetti
di ciascuna classe e su calcoli di proporzioni.
La definizione di carattere qualitativo necessita perciò della contemporanea presenza delle
condizioni di eredità semplice e di variazione discontinua. Se prese individualmente, infatti, esse non
sono in grado di definire con sicurezza un carattere qualitativo per l‟esistenza di due situazioni
particolari e cioè eredità semplici che si presentano a variazione continua e, all‟inverso, caratteri
pologenici (e quindi ad eredità complessa) che presentano un‟espressione fenotipica tipicamente
discontinua i cosiddetti caratteri a soglia.
Gli esempi del primo tipo sono stati descritti soprattutto nella genetica vegetale ed un autore,
Weber (1959-1960 a,b) ha anche messo a punto un sistema di analisi statistica capace di evidenziare
tale situazione sia nelle segregazioni monoibride che di ibride. Un esempio di tale situazione è
rappresentata dalla distribuzione dell‟attività della fosfatasi acida del globulo rosso. L‟analisi
elettroforetica dell‟enzima eritrocitari fosfatasi acida mostra che si possono chiaramente distinguere sei
genotipi determinati da tre alleli. Gli alleli danno luogo ad enzimi che possiedono qualche differenza
nella loro attività enzimatica: A è il meno attivo, B ha un‟attività intermedia. C‟è il più attivo. Gli
individui eterozigoti mostrano attività che sono quasi esattamente intermedie fra quelle dei rispettivi
10
omozigoti. Ciascuno di tali genotipi presenta perciò un‟attività enzimatica che si distribuisce in
maniera continua; i fenotipi però non possono venire distinti sulla base della sola attività enzimatica
perché le distribuzioni tendono a sovrapporsi. Se si considera l‟attività edematica della popolazione
generale senza distinguere i diversi genotipi, si ottiene una distribuzione perfettamente continua che
maschererebbe completamente l‟eredità semplice che ne è alla base.
Di maggiore interesse è l‟altra eccezione rappresentata dai caratteri a soglia. Sono infatti di
questo tipo alcuni caratteri di grande interesse zootecnico, quali la predisposizione individuale a varie
malattie, la prolificità che compare in specie tendenzialmente unipare e la mortalità perinatale e
neonatale intesa nel suo insieme. Fanno parte di tale gruppo anche alcuni caratteri anatomici quali il
numero di vertebre nel topo e, forse, nel suino domestico e il numero di data soprannumerarie del topo.
Si definiscono a soglia quei carattere che non mostrano una variazione continua, ma che in un
individuo sono presenti o assenti. Al di sotto di tale discontinuità fenotipica, però, esiste una variazione
continua nella disposizione a manifestare questi caratteri; vi è inoltre ciascuna combinazione
genotipica è soggetta all‟influenza dell‟ambiente, per cui la distribuzione della disposizione stessa è il
frutto dell‟interazione tra i genotipi e l‟ambiente. La soglia è perciò un punto lungo la distribuzione
della disposizione che separa le classi fenotipiche; quando cioè la disposizione si trova al di sotto della
soglia l‟individuo presenta una certa espressione fenotipica; quando invece è al di sopra, l‟individuo
presenta l‟altra espressione. Esistono caratteri che presentano più di due classi fenotipiche per cui
esistono lungo la curva di distribuzione due o più soglie.
Ritornando perciò alle definizioni di partenza, per poter parlare di carattere qualitativo bisogna
dimostrare che la variazione discontinua sia legata ad un determinismo ereditario semplice. Tale
dimostrazione può essere ottenuta attraverso studi di segregazione dei caratteri (nel caso in cui si
dimostri che essi producano proporzioni fenotipiche particolari, ripetibili e quindi prevedibili), sia nel
caso di rapporti allelici all‟interno di un locus sia nel caso di analisi dell‟azione di più loci
contemporaneamente, cioè della segregazione di più caratteri diversi gli uni dagli altri. Le proporzioni
a cui fare riferimento sono parecchie; le prime furono introdotte all‟inizio del „900 da un gruppo di
genetisti europei e statunitensi che riscoprirono i lavori realizzati a metà del secolo precedente da un
monaco boeme, Gregorio Mendel, dal quale la branca della genetica dei caratteri semplici ha preso
nome genetica mendeliana. L‟originalità degli studi di Mendel riposa essenzialmente sul metodo
utilizzato per gli studi, e cioè sull‟utilizzo di segregazioni e sulla valutazione statistica degli stessi. A
partire dai suoi studi si è poi creato un vero e proprio “corpus” dottrinale, che ha progressivamente
rivisto, alla luce delle sempre maggiori conoscenze, le basi teoriche dei caratteri e, soprattutto, è
riuscito ad associare l‟analisi del comportamento ereditario dei caratteri alla realtà genetica dei
individui. Solo per memoria storica si deve ricordare che la teorizzazione mendeliana era basata su tre
postulati:
- Il principio del carattere unità, secondo il quale ciascun carattere è determinato dall‟azione di un
solo fattore ereditario che viene trasmesso alla discendenza per mezzo della riproduzione sessuale.
- Il principio della purezza dei gameti, secondo il quale i gameti maschili e femminili prodotti dai
individui ibridi sono puri, cioè contengono uno e uno solo dei geni determinanti i due caratteri di
una coppia allelomorfa.
- Il principio della indipendenza dei caratteri, per il quale ogni carattere è indipendente rispetto agli
altri.
Dei tre postulati rimane valido solo il secondo: gli altri due sono stati negati dai genetisti
attraverso gli studi successivi.
LE LEGGI DELLA TRASMISSIONE EREDITARIA
a) LA TEORIA CROMOSOMICA DELL’EREDITÀ E LE CONSEGUENZE A LIVELLO GENETICO
DELLA MEIOSI
Tutte le leggi della trasmissione ereditaria dei caratteri trovano la loro giustificazione in due
situazioni particolari:
a) la ripartizione dei cromosomi negli individui disploidi;
11
b) le conseguenze della meiosi a livello genico.
Il corredo cromosomico di un individuo diploide è costituito da coppie di cromosimini
omologhi, di derivazione uno paterna e l‟altro materna. Ciò fa sì che ogni individuo possieda per un
locus qualsiasi sempre due geni, uno portato dal cromosoma paterno e l‟altro da quello materno. Le
situazioni che si possono presentare sono diverse a seconda dei geni che si incontrano. Innanzi tutto i
due geni possono essere uguali, cioè avere stessa sequenza nucleotidica e stessa funzione sintetica, per
cui l‟individuo sarà genotipicamente omozigote. Oppure l‟individuo può portare due geni diversi, cioè
due geni alleli (o semplicemente due alleli), quindi esso sarà eterozigote. Le possibilità di omozigosi
ed eterozigosi saranno in relazioni al polimorfismo esistente all‟interno del locus nella popolazione.
Ciò non toglie che ogni singolo individuo potrà avere due e solo due geni contemporaneamente. Fa
eccezione alla regola dell‟omologia cromosomica la coppia eterocromosomica, che nei mammiferi è
presente nei maschi ed è costituita da un cromosoma X e da uno Y, completamente diversi tra loro. Nei
volatili la coppia eterocromosomica è invece femmine.
Una coppia di cromosomi porta generalmente un numero piuttosto elevato di loci, che
rappresentano un gruppo di associazione, i gruppi saranno perciò tanti quante sono le coppie
cromosomiche, cioè n, ad eccezione del maschio nei mammiferi e delle femmine nei volatili, dove
saranno n-1. Poiché il cromosoma si trasmette interno dai genitori ai figli, è evidente che i loci
appartenenti allo stesso gruppo di associazione saranno trasmessi insieme.
È ampiamente risaputo che per meiosi si intende un processo di divisione cellulare che
interessa le cellule germinale, cioè le ovocellule e gli spermatozoi. Il significato cromosomico di tale
divisione riposa nella possibilità di produrre gamete dotati di un corredo ridotto della metà rispetto a
quello delle cellule germinale indifferenziate; solo un dei due cromosomi omologhi di ciascuna coppia,
cioè entra nella costituzione dei gamete.
L‟unione di due gamete “aploidi” (cioè a numero n di cromosomi) permette la ricostruzione di
uno zigote a corredo “diploide”. Il passaggio casuale dei cromosomi di ciascuna coppia nei gameti ha
conseguenze importantissime nella distribuzione dei geni. Se un individuo è eterozigote, infatti,
produrrà due tipi di cromosomi e quindi due tipi di gameti, uno portatore solo del primo allele e l‟altro
solo del secondo. Se esistono nello stesso gruppo di associazione altri loci polimorfi, ciascun allele di
ogni locus si combinerà con gli alleli degli altri nel cromosoma in maniera del tutto casuale, ciascun
cromosoma cioè è portatore di una combinazione all‟elica del tutto originale rispetto a ciascun altro
cromosoma della sua coppia; i gameti prodotti non sono perciò equivalente da un punto di vista
genetico, ma sono portatori di forme geniche differenti. In un individuo il cui numero di cromosomi è
uguale a X, il numero Y totale di combinazioni cromosomiche possibili è pari a:
Y = 2x.
La meiosi è importante anche per il fenomeno del crossing-over cioè dello scambio di frazioni
di DNA tra cromosomi omologhi.
Tale fenomeno permette infatti di creare nuove combinazioni gametiche rispetto a quelle che si
avrebbero normalmente e quindi rappresenta un importante fattore di variabilità nelle popolazioni.
B) MECCANISMI DI CREAZIONE DELLE SERIE POLIALLELICHE
Una buona parte dei loci che costituiscono il menoma degli individui eucaristici e procariatici
presentano più forme geniche, per cui parleremo di serie poliallelica quando in uno stesso locus sono
identificabili uno o più alleli. Bisogna ricordare naturalmente che un individuo normale non può
portare, nelle specie diploidi, più di due alleli differenti per ogni locus, posti ciascuno su uno dei due
cromosomi omologhi.
I meccanismi attraverso i quali si creano serie polialleliche sono attualmente abbastanza
conosciuti. Qui di seguito verranno rapidamente ricordati.
Le mutazioni geniche o mutazioni puntiformi rappresentano modificazioni chimiche
nucleotidiche dovute a sottrazione addizione o altre modifiche riguardanti singoli geni o piccoli gruppi
di geni.
12
L‟alterazioni di almeno un gene di un cromosoma si può definire mutazione quanto è stabile,
compatibile con la vita e trasmissione alle cellule figlie. Questa proprietà fanno sì che la mutazione
rappresenti un fonte importante di variabilità genetica tra gli individui di una popolazione.
Esistono mutazioni somatiche e mutazioni germinali: le prime avvengono in cellule somatiche
del corpo e non sono trasmesse alla discendenza, le seconde si verificano in cellule germinali del
testicolo o dell‟ovario e si possono trasmettere alla discendenza.
Gli individui nei quali avviene una mutazione somatica vengono definiti mosaici genetici
perché hanno due cloni cellulari geneticamente distinti.
Le mutazioni geniche riconoscono tre meccanismi:
a) La sostituzione di basi – una coppia di basi viene sostituita da una coppia differente. La
sostituzione provoca una sostituzione aminoacidica.
b) La delezione di basi – la lettura scala di una base azotata.
c) L‟inserzione di basi – si ha uno spostamento della lettura del codice.
La delezione e l‟inserzione cambiano il gene per cui si ha la sintesi di una proteina diversa; in
certi casi, la delezione blocca la normale sintesi proteica.
La sostituzione è invece abbastanza conservativa ed è la causa, insieme la crossing-over, della
variabilità genetica all‟interno di una popolazione.
Gli effetti della sostituzione aminoacidica dipendono dalla regione polipeptidica ove essi
avvengono. Tali cambiamenti possono essere drastici, lievi o addirittura nulli. Quest‟ultimo evento si
può verificare quando:
- la sostituzione avviene in una regione che può tollerarla senza subire cambiamenti;
- la sostituzione avviene tra aminoacidi simili (ad esempio, leucina con isoleucina);
- la sostituzione avviene tra codoni che codificano tutti per lo stesso aminoacido.
In tutti questi casi il fenotipo risulterà normale la mutazione verrà svelata mediante
elettroforesi.
Altre situazioni portano, invece a risultati più evidenti. Una mutazione si dice non senso
(nonsense) quando crea, in una regione codificante, un codono di terminazione; il gene perde perciò la
capacità codificante.
La mutazione frame-shift provoca lo slittamento del codice di lettura. Infine, la mutazione di
senso (missense), può esistere in due situazioni differenti, la trasversione e la transizione. La prima
consiste in una sostituzione di basi puriniche con basi pirimidiniche, e viceversa; la seconda nella
sostituzione di purine epirimidine tra loro. In entrambi i casi, la mutazione di senso produce un nuovo
gene. È soprattutto attraverso questo meccanismo che la mutazione genica diviene la principale causa
della formazione delle serie polialleliche: all‟interno di una popolazione, cioè uno stesso locus non
contiene sempre lo stesso gene selvaggio, ma si arricchisce di una serie più o meno numerosa di alleli,
con conseguente aumento della variabilità della popolazione stessa. Generalmente l‟allele selvaggio
rimane però il più frequente.
Le mutazioni possono essere classificate in varie maniere; accenneremo alle principali.
Un primo sistema può essere rappresentato dall‟età d’insorgenza, nella quale il criterio è
rappresentato dall‟in cui compare il fenotipo associato alla mutazione.
In funzione degli effetti letali che una mutazione può provocare possiamo avere:
- mutazioni letali, cioè incompatibili con la vita del soggetto o capaci di provocare sterilità maschile
o femminile (letalità di tipo evoluzionistico);
- mutazioni condizionali, cioè mutanti letali che si esprimono solo in determinati ambienti (sono
infatti temperatura-sensibili, per cui in certi casi la temperatura crea una “condizione restrittiva”, in
altri crea una “condizione permissiva”).
In relazione alla capacità di influenzare altre mutazioni si distinguono:
- mutazioni Enhancer, le quali intensificano gli effetti fenotipici di altre mutazioni;
- mutazioni soppressive, che riducono, invece, questi stessi effetti.
In entrambi i casi si parla di mutazioni modificatrici.
Le mutazioni instabili costituiscono una categoria di mutazioni individuata da pochissimi anni;
esse sono responsabili di alcune malattie ereditarie dell‟uomo, tra cui il ritardo mentale conseguente
alla fragilità del cromosoma X e la distrofia miotonia. Nel primo caso il meccanismo della mutazione
13
consiste in due fasi successive: la prima, chiamata “permutazione”, interessa solo i soggetti che
trasmettono la malattia senza esserne colpiti (i maschi normali portatori e la maggior parte delle
femmine portatrici); la seconda, detta “mutazione completa” interessa tutti i soggetti colpiti. Le
permutazioni si manifestano con un moderato aumento della lunghezza di un piccolo frammento di
DNA mentre le mutazioni complete consistono in un aumento significativo della grandezza del
frammento precedentemente aumentato durante la maturazione delle cellule sessuali femminili, in
conseguenza all‟instabilità della regione del DNA che porta il gene in questione. La mutazione
completa si associa a mutilazione; del DNA limitrofo. Ciò che appare infine è una espansione
progressiva di una parte di un gene, composta dalla ripetizione di tre nucleotidi (CGG). Gli uomini
portatori di una permutazione la trasmettono a tutte le figlie senza eccezione; esse sono perciò tutte
portatrici sane. Allorché una donna trasmette la permutazione, questa diviene spesso una mutazione
completa, associata ad un ritardo mentale nel 100% dei figli maschi e nel 50% delle femmine.
La mutazione instabile spiega nel caso del ritardo mentale associato a fragilità della X il
particolare andamento di tale patologia che interessa circa un terzo delle femmine portatrici e,
soprattutto, può essere trasmessa anche da maschi che non presentano né ritardo mentale né siti fragili.
Nella distrofia miotinica il meccanismo è diverso; si tratta della ripetizione di trinucleotidi CTG nel
gene che codifica per una proteina regolatrice, la proteina chinasi… in questo caso però non si osserva
un fenomeno tutto o niente (permutazione/mutazione), ma piuttosto un aumento della gravità della
malattia con l‟aumentare della espansione. Inoltre, in questa mutazione manca la mutilazione del
DNA. L‟instabilità di sequenze di DNA nella sindrome dello X fragile e nella distrofia mioclonica
sembra legata alla lunghezza delle sequenze ripetute, ma al momento non è chiaro se essa interessa
ogni sequenza lunga composta da motivi semplici o solamente certi motivi specifici, creando una
conformazione anormale del DNA e, conseguentemente, delle difficoltà alla replicazione.
I recenti progressi della genetica molecolare hanno dimostrato che la mutazione genica non è
l‟unico meccanismo capace di provocare variazione genetica del DNA; per questo si parla di nuove
fonti di variazioni genetiche.
I principali fenomeni chiamati in causa sono:
- la ricombinazione per omologia, nei due meccanismi del crossino-over illegittimo e della
conversione genica;
- i vari riarrangiamenti cromosomici;
- la mobilizzazione di transposon (elementi genetici mobili);
- la mobilizzazione di retrovirus;
- la retrotrasposizione;
- il trasferimento naturale dei geni tra specie diverse;
- le cosiddette variazioni somaclonali.
La ricombinazione per omologia rappresenta uno scambio di DNA tra sequenze all‟eliche
portate ciascuna da due cromosomi omologhi. Si differenzia ulteriormente in crossing over ineguale e
conversione gemica.
Il crossing-over ineguale (ricombinazione ineguale) crea una situazione di asimmetria fra due
cromosomi. Due sequenze di DNA, A e B, omologhe e ripetute in tandem si ricombinano in modo
ineguale con conseguente asimmetria tra i due cromosomi: uno dei due, infatti, porta tre sequenze
mentre l‟altro avendo subito una delezione ne avrà una sola.
La ricombimnazione produce dei geni ibridi e si traduce in una ripartizione ineguale dei geni
sui due cromosomi omologhi per amplificazioni e contrazioni di intere zone del menoma.
Un esempio di crossing-over ineguale è l‟emoglobina detta “lepore”, che nell‟uomo provoca
una anemia molto grave: essa è il risultato di una ricombinazione ineguale della famiglia multigenica
dell‟emoglobina umana data da un appaiamento difettoso di due cromosomi omologhi durante la
divisione meiotica di due geni al cromosoma numero 11.
La conversione genica consiste in un trasferimento di una parte di un gene in un altro, con
formazione di un gene chimerico. Poiché il gene donatore resta inalterato, si può supporre che tale
trasferimento di DNA avvenga durante la sintesi del DNA nel corso della meiosi. Al termine del
fenomeno della conversione genica, si avrà la presenza di geni normali su uno dei due cromosomi
omologhi e la presenza, sull’altro di un gene normale e di un gene chimerico.
14
La conversione genica è, probabilmente, un meccanismo relativamente generico che può
realizzarsi sia tra due alleli sia tra sequenze ripetute codificanti e non. Essa provoca due effetti:
introduce una grande variabilità ma nel contempo omogeinizza le sequenze in modo tale da provocare
notevole vicinanza tra i membri di una famiglia multigenica.
All‟opposto della ricombinazione per omologia, esiste anche una ricombinazione illegittima;
essa riguarda segmenti di DNA che non hanno omologia di sequenze ed è frequente soprattutto nelle
sequenze ridondanti.
Il meccanismo d‟azione di una ricombinazione per omologia è abbastanza ben conosciuto.
Una endonucleasi provoca una rottura cromosomica (Nick); partendo da tale punto i filamenti
possono srotolarsi per un breve tratto per appaiarsi poi al filamento complementare dell‟altro duplex.
Le regioni dove un filamento integro di uno dei due duplex si appaia con il filamento che ha subito la
rottura dell‟altro duplex vengono definite eteroduplex; dopo la formazione degli eteroduplex gli
scheletri di zucchero e fosfato dei filamenti sono saldati dalla DNA-LIGASI. Il cambiamento di
struttura spaziale comporta la formazione di una struttura a forma della lettera greca chi. Si può
comunque giungere alla riconversione della struttura a chi in due duplex separati per azione di nick di
un‟altra endonucleasi in due dei filamenti, scambio fra questi e definitiva saldatura da parte della
DNA-LIGASI. Il verificarsi della ricombinazione dipende dal modo in cui si risolve la struttura a chi:
esistono all‟uopo due possibilità:
a) la formazione di duplex non ricombinanti;
b) la formazione di duplex ricombinanti.
In entrambi i casi permangono aree di DNA aventi eteroduplex. Gli errori di appaiamento
possono essere riparati:
a) attraverso la correzione automatica nella successiva replicazione;
b) attraverso il meccanismo del mismatch repair che consiste nell‟asportazione, dal filamento di
DNA, del nucleotide erroneamente appaiato e nella sua sostituzione con quello giusto. Il tutto
avviene per l‟azione di due enzimi; una endonucleasi che rompe lo scheletro di zucchero e fosfato
nei pressi dei nucleotidi appaiati male e una esonucleasi che asporta un tratto di questo filamento;
producendo un‟interruzione che comprende le coppie appaiate male. Se il mismatch repair si
applica al fenomeno della conversione genica, il risultato sarà un allele convertito nell‟altro.
Alcune aberrazioni cromosomiche (duplicazioni, delezioni, inversioni) possono essere
responsabili di variazioni geniche attraverso vari meccanismi quali la delezione e la duplicazione di
parti o di tutto un gene, l‟inattivazione conseguente a rottura, l‟avvicinamento del gene a nuovi
promotori o a sequenze enhancers o soppressive, la creazione di trascritti antisenso o capaci di inibire
dei promotori.
I transposons sono elementi genetici dotati di capacità traspositiva, replicativi e di escissione
autonome; essi possono perciò alterare la struttura di un gene attraverso vari meccanismi quali
l‟inserimento all‟interno di un gene con conseguente in attivazione dello stesso, l‟alterazione della
trascrizione di geni contigui, l‟escissione reciproca ecc. i trasposons degli eucarioti sono classificati in
4 classi, e mostrano polimorfismo sia nella localizzazione che nel numero di copie presenti,
generalmente molto alto. La prima famiglia comprende i cosiddetti retrotrasposons, elementi simili ai
retrovirus. I retrasposons, elementi simili ai retrovirus. I retrotrasposons presentano ripetizioni dirette
di ciascuna estremità (LTRs) essenziali per l‟inserzione nel DNA ospite. Si traspongono al DNA
eucaristico tramite un RNA intermedio. Presentano nella loro struttura fino a tre geni: il primo è simile
al gene gag del retrovirus, dove ha funzione di codificazione di proteine interne strutturali; il secondo è
simile al gene pol del retrovirus e codifica per una trascrittasi inversa; il terzo non è sempre presente e
non ha similitudini con geni retrovirali. La seconda classe è costituita dai retrotrasposons non virali, i
quali si traspongono al DNA eucaristico per mezzo di un RNA intermedio. Presentano nella loro
struttura due geni, uno simile al gene gag l‟altro al gene pol dei retrovirus. Quest‟ultimo codifica per
una trascrittasi inversa. La terza classe è costituita da elementi con piccole ripetizioni terminali
invertite, tra i quali alcuni contengono un gene che codifica per una traspostasi la quale permette la
loro trasposizione diretta nel dna eucaristico. L‟ultima classe, la meno conosciuta è rappresentata
infine da elementi con lunghe ripetizioni terminali.
15
Un meccanismo d‟azione identico ai trasposons hanno i retrovirus, virus a RNA capaci di
sintetizzare a scopo replicativi un DNA intermedio il quale può così inserirsi nel dna di cellule ospiti e
di provocare variazioni.
La retrotrasposizione consiste nella formazione di pseudogeni come conseguenza di una
trascrizione inversa dell‟mRNA e conseguente inserzione degli stessi nei cromosomi.
Il trasferimento di geni tra specie diverse è stato osservato naturalmente e dimostrato
sperimentalmente. Il trasferimento naturale chiama in causa sia i retrovirus che i plasmidi; quello
artificiale consiste nella creazione di animali transgenici.
Infine, le variazioni somaclonali sono state dimostrate in culture cellulare vegetali, le quali
acquisiscono, con un meccanismo ancora sconosciuto, un elevato tasso di mutazioni. Sebbene mai
dimostrate negli animali, esse potrebbero essere responsabili delle variazioni che si producono tra
animali geneticamente identici prodotti attraverso manipolazioni in vitro quali l‟embryo splitting e la
traspiantazione nucleare.
c) ESPRESSIONE FENOTIPICA DEI GENI CODIFICANTI
In un individuo diploide i cromosomi vanno sempre in coppia (con l‟eccezione degli
eterocromosomi nei maschi) per cui in uno stesso locus si avranno sempre due geni. Nel caso
dell‟esistenza di due o più alleli l‟individuo potrà essere omozigote per uno degli alleli o eterozigote.
Gli omozigoti manifestano il carattere derivante dall‟azione biosintetica dei due geni uguali, i quali si
esprimono entrambi. Fanno eccezione a tale regola i cosiddetti alleli nudi e i geni portati da uno dei
due cromosomi X nella femmina (inattivazione funzionale di uno dei cromosomi X nella femmina o
fenomeno di Lyon). L‟espressione fenotipica dell‟eterozigote, invece, dipende non solo dalle capacità
biosintetiche dei due geni, ma anche delle interazioni che i loro trascritti intratterranno tra loro una
volta sintetizzati. Infine, esistono alcune situazioni particolari nelle quali l‟attività biosintetica dei geni
è più complicata di quella che normalmente si esplica.
d) ECCEZIONI ALL’ESPRESSIONE FENOTIPICA DEGLI OMOZIGOTI
GLI ALLELI NULLI
Si definiscono alleli nulli o silenziosi geni che in condizioni di omozigosi presentano una
attività biosintetico che non può essere messa in evidenza con le tecniche analitiche anche più
sofisticate o, addirittura, non hanno più alcuna attività biosintetica.
L‟azione di tali alleli è evidente soprattutto a livello enzimatico, dove di solito rappresentano il
livello più basso della variazione quantitativa dell‟attività enzimatica stessa.
Per la loro caratteristica sono geni difficilissimi da essere individuati; anche in eterozigoti,
infatti, essi passano solitamente inosservati, a meno che non si ricorra all‟analisi genealogica delle loro
segregazioni.
Un esempio interessantissimo di allele nullo è rappresentato da una variante genetica alle αs1
Caseine nella capra, presente negli animali che dimostrano assenza di tale proteina nel latte.
Un altro esempio interessante è rappresentato dall‟allele recessivo al locus Agouti (chiamato
“non agouti”). Tale locus è responsabile della sintesi delle feomelanine; l‟allele recessivo inibisce
completamente dalle attività biosintetica, permettendo all‟animale di apparire completamente nero.
L’INATTIVAZIONE FUNZIONALE DELLA X
Benché gli individui di sesso maschile siano emizogoti per il cromosoma X (essi ne hanno una
solo copia), la quantità minima dei prodotti di espressione dei geni localizzati sul cromosoma X,
quale l‟attività della glucosio-6-fosfato deidrogenasi (G6PD) nei globuli rossi, è identica a quella
osservata negli individui di sesso femminile che hanno due cromosomi X. Quindi, deve esistere un
meccanismo di compensazione di queste attività enzimatiche. Gli studi indipendenti di 4 specialisti
in genetica, ARY LYON, LIANNE RUSSEL, ERNEST BEUTLER E SUSUMO OHNO , hanno
16
permesso la comprensione di questo meccanismo attualmente conosciuto sotto il nome di “ipotesi di
Lyon” (figura 8).
Secondo questa ipotesi:
a) nelle cellule somatiche, l‟inattivazione di un cromosoma X avviene precocemente nella vita
embrionale;
b) l‟inattivazione è aleatoria, vale a dire che può essere inattivato il cromosoma X paterno o quello
materno;
c) l‟inattivazione è completa, sarebbe a dire la quasi totalità del cromosoma X è inattivato;
d) l‟inattivazione del cromosoma X è permanente e trasmessa in modo clonale; se il cromosoma
X di origine paterna è inattivo in una data cellula, tutte le cellule provenienti da questa cellula
madre esprimeranno un cromosoma X attivo di origine materna, invece il cromosoma X di
origine paterna rimarrà inattivo. Il risultato della “Lyonizzazione” è che l‟individuo di sesso
femminile è un mosaico di cellule, ognuna essendo fondamentalmente emizigote per l‟uno o
l‟altro dei cromosomi X.
Esistono delle eccezioni alle regole enunciate riguardanti l‟inattivazione dell‟X. Questa
inattivazione è certo aleatoria, ma un X di struttura anormale, sarebbe a dire portatore di una
delezione, è preferibilmente inattivato. D‟altra parte, negli individui portatori di una traslocazione su
un cromosoma X, è il cromosoma X che è generalmente inattivato.
Benché l‟inattività del cromosoma X sia estesa alla sua quasi totalità, non è mai completa.
Almeno due geni all‟estremità del braccio corto della X, quelli codificanti per l‟antigene Xg e
l‟enzima steroide sulfatasi sfuggono all‟inattivazione. Inoltre certi geni sui bracci lunghi della X
(Xq26) sfuggono alla inattivazione per mantenere la funzione ovarica fino all‟età normale della
menopausa.
Infine, è evidente che mentre l‟inattivazione della X è permanente nella maggior parte delle
cellule somatiche, essa deve essere reversibile nello sviluppo delle cellule germinali.
L’ESPRESSIONE FENOTIPICA DEGLI ETEROZIGOTI
a) DOMINANZA SEMPLICE O MENDELIANA
Si parla di dominanza totale quando tutti gli eterozigoti presentano il fenotipo corrispondente a
uno dei genotipi omozigoti, che assumerà perciò il nome di dominante. Il fenotipo corrispondente
all‟altro genotipo omozigote è chiamato invece recessivo.
La dominanza e la recessività associate ad un solo locus biallelico dovrebbero essere più
propriamente chiamate dominanza semplice o recessività semplice per evitare confusioni con altri
significati che nella genetica delle popolazioni ed in quella quantitativa vengono attribuiti al termine.
La dominanza si esplica con diversi meccanismi. Il più semplice consiste nell‟inattività
dell‟attività funzionale dell‟allele recessivo: più spesso, soprattutto a livello enzimatico, l‟enzima
prodotto dal gene dominante presenta una maggiore velocità di azione o una maggiore affinità con il
substrato o ancora una maggiore resistenza all‟attività catalitica di quello prodotto dal recessivo; altre
volte, la proteina prodotta dal gene dominante ha un‟azione soppressiva su quella prodotta dal
recessivo.
La dominanza e la recessività in un locus producono delle proporzioni caratteristiche, sia a
livello fenotipico che genotipico. Due di tali proporzioni derivano dalle prime due leggi di Mendel. La
prima, detta della dominanza dei caratteri recita “se si accoppiano tra loro soggetti che presentano due
forme diverse dallo stesso carattere (ad esempio, due diversi colori), i soggetti che nascono porteranno
tutti una delle due forme, che sarà perciò definita dominante, rispetto all‟altra, detta recessiva”. La
seconda, o legge della segregazione dei caratteri; “riaccoppiando tra loro i soggetti nati dagli
accoppiamenti di cui alla prima legge, ¾ dei nuovi nati avrà fenotipo dominante e ⅓ fenotipo
recessivo”; ricompare cioè in questa generazione il carattere che era scomparso nella precedente. Esse
fanno riferimento infatti a due dei sei possibili sistemi di segregazioni per un locus biallelico. Il primo
consiste nella segregazione tra omozigoti dominanti e omozigoti recessivi; tutti gli F1 che da essi
17
derivano sono eterozigoti e presentano tutti fenotipo dominante. Il secondo consiste nella segregazione
di soggetti eterozigoti; in questo caso si avranno due fenotipi, uno dominante ed uno recessivo, e tre
genotipi, i due omozigoti e l‟eterozigote; quest‟ultimo sarà fenotipicamente identico a uno degli
omozigoti che prende così il nome di dominante, in opposizione all‟altro che sarà invece recessivo. Il
rapporto fenotipico di segregazione sarà di tre feonotipi dominato ogni uno recessivo; ad esso
corrisponde un rapporto di ¼ di omozigoti dominanti, 2/4 di eterozigoti e ¼ di omozigoti recessivi.
La tabella 1 e 2 riportano tutti e 6 i sistemi di segregazione possibili.
L‟implicazione pratica più importante della dominanza semplice è che i soggetti omozigoti
dominante e quelli eterozigoti non sono fenotipicamente distinguibili.
b) DOMINANZA INTERMEDIA E CODOMINANZA
Pur se spesso considerati sinonimi, i termini di dominanza intermedia e di codominanza fanno
riferimento in realtà a due situazioni differenti.
Nel primo caso, l‟espressione fenotipica dell‟eterozigote è intermedia rispetto a quella dei due
omozigoti. Espressione intermedia non vuol dire necessariamente che l‟eterozigote è perfettamente
intermedio, ma che si trova tra l‟espressione fenotipica dei due omozigoti. La dominanza intermedia è
molto spesso presente nel comportamento di alcuni enzimi responsabili di malattie metaboliche, e ciò
permette di ottenere una rapida diagnosi della condizione di portatore (cioè di individuo a genotipo
eterozigote).
Nella codominanza, invece, l‟eterozigote mostra le proprietà di entrambi gli alleli. Gli esempi
di quest‟ultima situazioni sono numerosi.
Le due situazioni possono essere trattate insieme perché in entrambe è possibile distinguere gli
eterozigoti dai due omozigoti dominanti.
Nelle segregazioni corrispondenti ai vari tipi di accoppiamento per un locus biallelico, perciò
esiste sempre perfetta corrispondenza tra i rapporti fenotipici e quelli genotipici.
c) I PARAMETRI DI PENETRANZA ED ESPRESSIVITÀ
La penetranza è un parametro che caratterizza l‟azione di ogni genotipo. Essa può essere
quantificata come proporzione di individui che mostrano l’effetto fenotipico usuale del genotipo in
esame.
Se un dato genotipo occasionalmente non è in grado di produrre il suo fenotipo usuale, esso
mostra solo una manifestazione parziale per cui si dice che tale genotipo è incompletamente
penetrante.
Per i caratteri dominanti, la penetranza incompleta interessa solitamente gli eterozigoti, che
appaiono come fenotipi recessivi (Aa, aa); più raramente possono essere interessati gli omozigoti
recessivi, che appariranno come eterozigoti dominanti (aa, Aa).
È anche possibile che l‟omozigote dominante appaia come il recessivo (AA, aa).
La scelta dei fenotipi interessati è del tutto occasionale. Una parziale spiegazione a tale
occasionalità può derivare dall‟azione di condizionamento sull‟espressione fenotipica di un genotipo
operata da altri geni non alleli e da condizioni ambientali (modificazione della dominanza) e certe
combinazioni geniche rappresentino situazioni genetiche non bilanciate; nella vita prenatale esse
possono perciò essere influenzate da differenti fattori fisiologici per cui, interagendo con piccole cause
esterne, possono perdere la capacità di produrre un certo fenotipo; in tal caso, essendo l‟influenza
fisiologica e quella ambientale del tutto casuali, solo una certa parte dei genotipi sarà interessato;
l‟altra parte rimarrà perfettamente penetrante.
La penetranza è un parametro esclusivamente genotipico: esso non può essere in alcun caso
attribuito ad un singolo gene, inoltre, la penetranza non deve essere confusa con l‟azione di geni
soppressori o inibitori, come in alcuni casi di epistasi.
La stima del parametro di penetranza richiede:
- la conoscenza del tipo di eredità del carattere considerato;
- la frequenza relativa dei casi in cui il genotipo manca nell‟esprimere il carattere appropriato.
18
Quando è penetrante, uno stesso genotipo può presentare una serie di manifestazioni
fenotipiche. Questa situazione prende il nome di espressività di un genotipo. Generalmente i caratteri
qualitativi a penetranza totale si presentano fenotipicamente uniformi; sono i caratteri a penetranza
ridotta che possono presentarsi non uniformi da un punto di vista fenotipico.
L‟espressività variabile si associa sempre perciò alla penetranza ridotta. Essa può essere
spiegata chiamando in causa diverse situazioni:
- possono esistere geni particolari, detti modificatori che cambiano solo leggermente l‟effetto
fenotipico di geni maggiori. Il ruolo di tali geni non è ben conosciuto ed è difficile stabilire i loro
rapporti di segregazione;
- le condizioni ambientali, combinate con la base genetica, possono cambiare entro certi limiti la
manifestazione fenotipica di un genotipo;
- infine, alcuni caratteri possono essere controllati non da un singolo gene maggiore, ma da più geni
e vari loci con effetto cumulativo.
d) LA PLEIOTROPIA
La pleiotropia rappresenta una proprietà di un gene e consiste nella sua capacità di sintetizzare
più caratteri contemporaneamente. In tutti gli organismi viventi, molte vie biosintetiche sono spesso
interconnesse e interdipendenti. È possibile perciò che i prodotti di una catena metabolica possano
essere utilizzati da altre e viceversa. Un gene può perciò manifestarsi con più di una espressione
fenotipica. Nella maggior parte dei casi, un carattere sarà molto ben evidente, mentre gli altri
appariranno più come effetti secondari, spesso anche mal collegabili al principale; molte malattie
monogenetiche presentano tale meccanismo di manifestazione fenotipica. Più raramente, le
manifestazioni importanti sono varie, ma sempre piuttosto simili tra loro. L‟insieme delle espressioni
fenotipiche di un gene fa parlare di effetti pleiotropici.
La pleiotria può essere confusa con l‟associazione, soprattutto se questa è completa o manifesta
bassa frequenza di crossing-over. L‟associazione va considerata possibile rispetto alla pleiotropia
quando:
- i due caratteri, ciascuno conosciuto come entità genetica specifica, sono presenti solo in uno scarso
numero di famiglie;
- anche un solo individuo presenta uno solo dei due caratteri;
- entrambi i caratteri presentano espressività totale;
- nessun legame biochimico o fisiologico è conosciuto o è plausibile tra i due caratteri.
Un esempio classico di falsa pleiotropia è rappresentato dai caratteri dell‟ipertermia maligna
conseguente ad anestesia con alitano e ipertrofia muscolare nel suino.
Facciamo degli esempi:
e) LA LETALITÀ
Certi alleli si manifestano con la morte dell‟individuo prima della maturità, nel periodo pre o
post-natale; vengono definiti perciò letali.
Un gene si definisce letale quando in doppia dose porta a morte l‟individuo portatore.
Il fenomeno si realizza cioè allo stadio diploide, allo stadio omozigote.
Inoltre la mortalità si può avere anche allo stadio di gamete: i gameti portatori del gene sono
non viabili.
In generale: gli omozigoti muoiono, mentre gli eterozigoti sopravvivono, ma risultano spesso
poco fecondi, poco resistenti e più predisposti alle malattie.
La letalità fu scoperta da Cuenot nei suoi studi sui topi di laboratorio “yellow”. Accoppiando
topi gialli tra di loro, Cuenot constatò che non era mai possibile ottenere linee gialle pure; all‟interno di
una popolazione si ottenevano sempre degli individui che per ⅔ erano gialli e per il restante terzo
erano neri. Ciò è spiegato dal fatto che i topi gialli sono tutti eterozigoti poiché gli omozigoti non
nascono, il gene responsabile del colore giallo è dunque letale.
I geni letali possono essere:
19
dominanti: portano a morte sia l‟omozigote dominante che l‟eterozigote; di solito possono
sopraggiungere per mutazione di un allele recessivo:
b) recessivi: portano a morte solo l‟omozigote recessivo; l‟eterozigote è perfettamente normale o
presenta qualche piccola deficienza.
Ancora possono essere:
- autosomici;
- legati al sesso.
Quelli di tipo autosomico hanno spesso penetranza incompleta, o sono pleiotropici. A volte,
infine, la loro espressione può essere limitata dal sesso.
Certi geni letali sono situati sui cromosomi sessuali: il cromosoma X è dunque il solo a poter
portare questi geni, in quanto nel maschio la presenza di un solo gene letale recessivo sul cromosoma
X porta a morte.
La trasmissione avverrà invece per mezzo di eterozigoti femmine. Queste danno:
- nella progenitura maschile o letalità o normalità perché l‟unico X del maschio viene dalla madre;
- nella progenitura femminile metà omozigote normale, metà omozigote portatrice poiché il maschio
porta solo l‟allele normale.
a)
MASCHIO L
X
FEMMINA LI
se M
½ [L]
normale
½ [l]
muore
se F
½ LL
normale
½ LI
normale
portatrice
Nascono perciò ⅔ di femmine ed ⅓ di maschi.
L‟accoppiamento di maschi con femmine letali eterozigoti da un rapporto di 2 a 1 in favore
delle femmine.
f) L‟ETEROGENEITÀ GENETICA
Quando una o più mutazioni o variazioni genetiche producono lo stesso carattere, si parla di
eterogeneità genetica. Essa può conseguire sia all‟azione di mutanti differenti ad un singolo locus, ed
allora si parla di eterogeneità all’elica sia all‟azione di geni mutati appartenenti a loci diversi,
eterogeneità non allelica. Entrambe le forme sono state ampiamento dimostrate sia nell‟uomo che in
vari animali domestici. Molto frequentemente essa compare in malattie monogenetiche quali
l‟albinismo, l‟emofilia ecc.
Molto spesso l‟eterogeneità può essere svelata attraverso delle differenze che comunque
esistono tra i caratteri eterogenei a livello fenotipico, fisiologico o biochimico. A volte invece, l‟unica
possibilità di distinzione deriva da appropriate indagini genetiche. Tre in particolare vanno considerati:
- metodi genetici veri e propri, che analizzino cioè comportamento ereditario dei geni in esame;
- studi su cellule somatiche in coltura;
- analisi di genetica molecolare.
I metodi genetici sono:
- l‟individuazione di un meccanismo ereditario differente; alcuni caratteri si presentano identici
fenotipicamente, ma presentano modelli ereditari diversi (dominanti o recessivi, autosomici o legati al
sesso ecc.).
- il non allelismo dei recessivi, dimostrabile attraverso il test di complementazione. Esso consiste
nell‟accoppiare tra loro soggetti a fenotipo recessivi provenienti da famiglie, popolazioni o razze
diverse. Se il carattere recessivo è dovuto allo stesso gene, tutti i soggetti nati saranno a loro volta
20
recessivi. Se c‟è invece eterogeneità non all‟elica, tutti i soggetti che nasceranno non presenteranno il
fenotipo recessivo, perché i due geni recessivi appartengono a loci diversi e quindi si incontreranno
con i rispettivi alleli dominanti. Essi saranno cioè tutti doppi eterozigoti a fenotipo dominante. Un
esempio di applicazione del test di complementazione ad un carattere che dimostra eterogeneità non
all‟elica è l‟albinismo delle razze Bruna Alpina e Simmhental.
- le relazioni di associazione. Come spiegato in seguito, i loci etrogenei possono essere posti in
cromosomi diversi e non omologhi e quindi appartenere a gruppi di associazione diversi.
g) L‟IMPRINTING PARENTALE DEI GENI
Uno dei principi basilari della genetica è quello dell’equivalenza degli incroci reciproci: un
gene, indipendentemente dal genitore che lo trasmette, si comporta sempre allo stesso modo. Tale
regola gode di due eccezioni ben conosciute:
- i caratteri legati a geni posti su cromosomi sessuali X e Y;
- quelli portati dal DNA mitocondriale.
Di entrambe queste situazioni tratteremo nelle parti successive.
Un terzo tipo di eccezione è rappresentato dal cosiddetto imprinting parentale dei geni. Si tratta
di un processo che, in maniera temporale e reversibile lascia un‟impronta di tipo diverso nei geni
trasmessi dal genitore di sesso maschile e in quelli trasmessi dal genitore di sesso femminile. La prole
che riceve geni marcati dalla madre sarà diversa da quella che riceve i geni marcati dal padre. È perciò
importante il fatto che un gene venga trasmesso da un genitore piuttosto che dall’altro.
Scoperto da pochi anni, ancora adesso poco si sa sulla natura molecolare del fenomeno e sul
meccanismo attraverso il quale si instaura. Esso comunque dipende dalla non espressione di alcuni
geni posti o sul cromosoma di origine materna o su quello di origine paterna. In questo caso, quindi, la
codificazione sarebbe sempre emizigote perrhe uno dei due geni risulta inattivato.
L‟imprinting parentale dei geni è stato individuato grazie al diverso comportamento degli
individui affetti dalla stessa delezione del cromosoma 15 nell‟uomo. Pur essendo coinvolto lo stesso
frammento cromosomico, se ad essere coinvolto è il 15 di origine paterna, si avrà la sindrome di
Prader-Willi, se il 15 di origine materna la sindrome di Angelman. Le due sindromi sono clinicamente
molto diverse, perché diversi sono i geni attivi coinvolti dalla delezione.
h) L‟EFFETTO DI POSIZIONE
Un gene mutato non viene espresso allo stesso modo in relazione al tipo di cellula in cui viene
a trovarsi. Nella drosofila sono stati individuati dei caratteri i quali, diversamente dalla maggior parte
degli altri caratteri mutanti, nei tessuti colpiti non vengono espressi da tutte le cellule. Questi tessuti
diventano, al contrario, mosaici costituiti da alcune cellule mutate e da altre che appaiono
perfettamente normali.
L‟aliquota delle cellule che esprimono la mutazione è regolata da geni modificatori che
possono far spostare l‟equilibrio da una condizione di tessuto completamente mutante.
Alcuni Autori sostengono che gli effetti di posizione spiegherebbero anche il comportamento di
alcune patologie umane, quali la corea di Huntington. Un gene modificatore che spingesse l‟equilibrio
del mosaicismo verso una condizione di tessuto prevalentemente mutante provocherebbe la comparsa
della corea in un‟età più precoce, mentre un gene modificatore che spingesse l‟equilibrio del mosaico
verso una condizione di tessuto normale porterebbe alla comparsa della malattia in età più avanzata.
21
Tabelle riassuntive sugli incroci biallelici.
GENERAZIONE PARENTALE
GENERAZIONE FILIALE
POSSIBILITÀ
CORRISPONDENZA
RISULTATO
RAPPORTI
FENOTIPICHE
GENOTIPICA
FENOTIPICO
GENOTIPICI
DOMINANTE
Omozigote Dominante AA
per
x
DOMINANT
E
100% OMOZIGOTI
100% DOMINANTI
Omozigote Dominante AA
Omozigote Dominante AA
x
50% OMOZ. DOM. AA
100% DOMINANTI
Eterozigote Aa
Eterozigote Aa
50% ETEROZ. Aa
75% DOMINANTI
25% OMOZ.DOM. e
50% ETEROZ. Aa
25% RECESSIVI
25% OMOZ. REC. Aa
100% DOMINANTI
100% ETEROZIGOTI
50% DOMINANTI
TUTTI ETEROZIGOTI
50% RECESSIVI
TUTTI OMOZ. REC.
100% RECESSIVI
100% OMOZIGOTI
RECESSIVI aa
x
Eterozigote Aa
DOMINANTE
Omozigote Dominante AA
per
x
RECESSIVO
DOMINANTI AA
Omozigote recessivo aa
Eterozigote
x
Omozigote recessivo aa
RECESSIVI
Omozigote recessivo aa
X
x
RECESSIVO
Omozigote recessivo aa
22
Lo stesso quadro può essere osservato in un altro modo:
INCROCIO DI
PARTENZA
SEGREGAZIONE
FENOT IPICA
OTTENUTA
INTERPRETAZIONE
GENOTIPO PARENTALE
1a interpretazione:
entrambi omozigoti
dominanti: AA x AA
INTERPRET.
GENOTIPO
100%
100% DOMINANTI
2a interpretazione
omoz. dom. x eteroz.
AA x Aa
DOMINANTE
50%
50%
PER
75% DOMINANTI
DOMINANTE
25% RECESSIVI
100% DOMINANTI
DOMINANTE
Eterozigote
x
Eterozigote
25%
AA x Aa
25%
Omozigote dominante
x
Omozigote recessivo
AA x aa
50%
100%
PER
RECESSIVO
50% DOMINANTI
50% RECESSIVI
RECESSIVO
PER
RECESSIVO
100% RECESSIVI
Eterozigote
x
Omozigote recessivo
Aa x aa
Omozigote recessivo
x
Omozigote recessivo
aa x aa
50%
50%
100%
23
GENERAZIONE PARENTALE
POSSIBILITA‟
FENOTIP.
CORRISPONDENZA
GENOTIP.
OMOZIGOTE [A]
OMOZIGOTE AA
x
x
OMOZIGOTE [A]
GENERAZIONE FENOTIPICA
RISULTATO
FENOTIPICO
RAPPORTO
100%
OMOZIGOTE AA
100% OMOZIGOTE
[A]
OMOZIGOTE [A]
OMOZIGOTE AA
50% OMOZIGOTI [A]
50%
x
x
INTERMEDIO [Aa]
ETEROZIGOTE Aa
50% INTERMEDI [Aa]
50%
INTERMEDIO [Aa]
ETEROZIGOTE Aa
25% OMOZIGOTI [A]
25%
x
x
50% INTERMEDI [Aa]
50%
INTERMEDIO [Aa]
ETEROZIGOTE Aa
25% OMOZIGOTI [a]
25%
OMOZIGOTE [A]
OMOZIGOTE AA
x
x
100%
OMOZIGOTE [a]
OMOZIGOTE aa
100% INTERMEDI
[Aa]
INTERMEDIO [Aa]
ETEROZIGOTE Aa
50% INTERMEDI [Aa]
50%
x
x
OMOZIGOTE [a]
OMOZIGOTE aa
50% OMOZIGOTI [a]
50%
OMOZIGOTE [a]
OMOZIGOTE aa
x
x
100% OMOZIGOTI [a]
100%
OMOZIGOTE [a]
OMOZIGOTE aa
24
RAPPORTI
FENOTIPICI E GENOTIPICI PRODOTTI DALLA SEGREGAZIONE CONTEMPORANEA DI
PIÙ LOCI POLIMORFI (POLIIBRIDISMO)
In questo capitolo verranno analizzate due diverse situazioni collegate tra loro dal fatto che
l‟osservazione non interessa più solo alleli ad un locus ma geni posti su più loci. Il primo problema
consiste nel valutare se esistono, nella segregazione contemporanea di più caratteri differenti e quindi
di più loci, modelli ripetibili e prevedibili. Ci occuperemo cioè delle conseguenze della collocazione
cromosomica dei loci. Le situazioni che analizzeremo sono quelle dell‟indipendenza, dell‟associazione
e del crossing-over. Nella seconda parte analizzeremo invece come e con quali modelli i loci possono
interagire funzionalmente tra loro; affronteremo cioè il capitolo delle diverse forme di interazione tra
loci.
a) INDIPENDENZA ED ASSOCIAZIONE
La collocazione dei geni appartenenti a loci diversi sui cromosomi produce due modelli di
segregazione distinti; quello relativo all‟indipendenza e quello relativo all‟associazione. Il primo fa
riferimento a loci posti su coppie di cromosomi non omologhi, l‟altro a loci posti sulla stessa coppia.
Due o più caratteri sono indipendenti quando i loci responsabili sono posti su coppie diverse
di cromosomi. I geni segregano in maniera indipendente e si ricombinano a caso.
Per comprendere la terza legge e dettare la regola generale attraverso semplici formule
matematiche, ci serviremo della descrizione dell‟esperimento compiuto dallo stesso Mendel: si tratta
dell‟arcinoto accoppiamento di varietà di piselli dei quali s voglia studiare il colore e l‟aspetto della
superficie.
È noto che Mendel osservò che i colori possibili erano due: giallo e verde, e due erano anche i
possibili aspetti della superficie: liscia e rugosa.
I due caratteri risultano essere indipendenti; inoltre per il carattere “colore” il giallo è
dominante sul verde e per il carattere “aspetto della superficie” il liscio è dominante sul rugoso.
Indichiamo il carattere “colore” Y se giallo (yellow) e y se verde, evidenziamo invece il
carattere “aspetto della superficie” S se liscio (smooth), s se rugoso.
Per prima cosa si compie la fecondazione tra individui dominanti per entrambi i caratteri ed
individui recessivi per entrambi i caratteri: gli F1 che si ottengono sono fenotipicamente come gli
individui dominanti mentre nel genotipo, sono tutti degli eterozigoti:
CARATTERE COLORE: GIALLO YY
VERDE yy
P
F1
SSYY
CARATTERE SUPERFICIE: LISCIO
RUGOSO ss
x
SS
ssyy
SsYy
Ovviamente dalla generazione parentale P si ottengono i seguenti gameti: SY per gli individui
dominanti e sy per gli individui recessivi.
Se ora accoppiamo fra loro gli individui della F1, avremo quattro tipi di gameti diversi: SY, Sy,
sY, sy ed in F2 avremo così le seguenti combinazioni:
F2
25
m SY
Sy
sY
Sy
SY
SSYY
SSYy
SsYy
SsYy
Sy
SSyY
SSyy
SsYy
Ssyy
sY
sSYY
sSYy
ssYY
SsYy
sy
sSyY
sSyy
ssyY
Ssyy
f
Questo schema è noto come Quadrato di Paneth.
Nel genotipo avremo cioè:
1/16
2/16
1/16
2/16
4/16
2/16
1/16
2/16
1/16
DOPPIO OMOZIGOTE DOMINANTE
OMOZIGOTE DOMINANTE + ETEROZIGOTE
OMOZIGOTE DOMINANTE + RECESSIVO
ETEROZIGOTE + OMOZIGOTE DOMINANTE
DOPPIO ETEROZIGOTE
ETEROZIGOTE + RECESSIVO
RECESSIVO + OMOZIGOTE DOMINANTE
RECESSIVO + ETEROZIGOTE
DOPPIO OMOZIGOTE RECESSIVO
SSYY
SSyY
SSyy
SsYY
SsYy
Ssyy
ssYY
ssyY
ssyy
Per due coppie di geni abbiamo cioè 9 genotipi diversi e 16 combinazioni variate di coppie di
gameti.
La regola generale si deduce da queste ultime affermazioni: detto n il numero di coppie di geni
che si sta studiando, avremo: 3n genotipi e 4n combinazioni.
Nel caso specifico infatti avremo 32=9 genotipi e 42=16 combinazioni.
Anche per i fenotipi si possono dettare delle regole generali.
La prima riguarda il numero di fenotipi diversi che si ottengono al momento dell’incrocio; la
formula è:
2n
avendo n. lo stesso significato che abbiamo visto per il genotipo; in effetti nell‟esempio dei piselli si
ottengono 22=4 fenotipi diversi e per la precisione: doppi dominanti, doppi recessivi, dominante per il
primo-recessivo per il secondo, recessivo per il primo-dominante per il secondo.
Ma, sempre attraverso una semplice formula, è possibile conoscere anche quanti individui,
nella totalità dei soggetti ottenuti, mostreranno ciascuno dei 2n fenotipi:
(3 + 1)n
Nel nostro caso n è 2 e quindi avremo:
(3 + 1)2 = 9:3:3:1 e cioè:
9 DOPPI DOMINANTI
26
3 DOMINANTI PER IL PRIMO-RECESSIVI PER IL SECONDO
3 RECESSIVI PER IL PRIMO-DOMINANTI PER IL SECONDO
1 DOPPI RECESSIVI
Per dimostrare la veridicità del concetto d‟indipendenza dei caratteri, è possibile separare i
risultati ed analizzarli individualmente rispetto ad ogni singolo locus.
Quindi si moltiplica la probabilità che un individuo abbia certe caratteristiche oppure abbia le
caratteristiche differenti.
Ancora nel nostro esempio:
3/4 * 3/4 = 9/16
3/4 * 1/4 = 3/16
1/4 * 3/4 = 3/16
1/4 * 1/4 = 1/16
Per un dato numero totale di individui prodotti, il numero atteso di ciascun fenotipo si ottiene
moltiplicando il numero totale per la frazione attesa.
Riteniamo necessario, a questo punto, riassumere le regole che abbiamo enunciato, anche
perché con le stesse formule si possono conoscere altre proprietà; ripetendo che n è il numero delle
coppie di geni (all‟eliche o eterozigoti), abbiamo:
a) il numero dei fenotipi forniti dalla F1;
b) il numero dei fenotipi differenti per “test-cross” di un poliibrido della F1, se c‟è dominanza
completa di un allele sull‟altro in ciascun locus;
c) il numero dei fenotipi differenti ottenuti in F2 (F1 x F1) se c‟è dominanza completa di un allele
sull‟altro in ciascun locus.
3n
a) il numero dei genotipi differenti in F2;
b) il numero di fenotipi differenti in F2 se c‟è codominanza in ciascun locus.
4n
a) il numero di combinazioni gametiche differenti che si ottengono a partire dalla F1;
b) la taglia minima che deve avere la popolazione per ottenere una ricombinazione completa di tutti i
gameti ottenuti in F1.
A queste formule aggiungiamo:
y=2x
che corrisponde al numero totale di combinazioni cromosomiche prodotte in ogni meiosi (y), dove “x”
corrisponde al numero apolide di cromosomi della specie, e
M = ½ (g2 + g)
dove M è il numero di incroci differenti possibili, mentre “g” rappresenta il numero dei genotipi
differenti possibili con un numero n di coppie di alleli.
Nella descrizione della legge dell‟indipendenza, Mendel tenne fermo il principio della
dominanza completa; tale presupposto risulta essere più l‟eccezione che la regola: osserviamo quindi
cosa accade nella realtà quando si osservi l‟attività di due o più coppie di loci.
EFFETTO DELLA SEGREGAZIONE INDIPENDENTE DEI GENI
A
B
C
D
E
F
G
N
2n
4n
3n
2n
3n-2n
2n
1
2
4
3
2
1
2
2
4
16
9
4
5
4
27
3
8
64
27
8
19
8
4
16
256
81
16
65
16
1024
1084576
59049
1024
58025
1024
10
Legenda:
A: Numero
B: Differ eter.
C: Numero “dim.”
D: Differ
E: Differ.
F: Differ
G: Differ. Caso
RAPPORTI FENOTIPICI IN F2 NEL DI IBRIDISMO IN LOCI NON ASSOCIATI
RELAZIONE FRA GLI ALLELI DEI GENITORI DI IBRIDI
PROPORZIONE FENOTIPICHE ATTESE NEGLI ADULTI
NELLA GENERAZIONE F2
PRIMO LOCUS
SECONDO LOCUS
Dominante-Recessivo
Dominante-Recessivo
9:3:3:1
Dominante-Recessivo
Codominante
3:6:3:1:2:1
Codominante
Dominante-Recessivo
1:2:1:2:4:2:1:2:1
Dominante-Recessivo
Recessivo letale (1)
3:1:6:2
Codominante
Recessivo letale (1)
1:2:1:2:4:2
Recessivo letale (1)
Recessivo letale (1)
4:2:2:1
Dominante-Recessivo
Recessivo letale (2)
9:3
Codominante
Recessivo letale (2)
3:6:3
Recessivo letale
Recessivo letale (2)
9:
(1): Gli eterozigoti sono riconoscibili dagli omozigoti dominanti.
(2): Gli eterozigoti non sono riconoscibili dagli omozigoti dominanti.
4.4.1.2 L‟ASSOCIAZIONE ED IL CROSSING- OVER LEGITTIMO
Due o più geni non alleli sono detti associati quando sono situati sullo stesso cromosoma, che
può essere sia un‟autonoma, che un eterocromosoma.
Avranno quindi tendenza a rimanere insieme nel corso della formazione dei gameti.
L’associazione può considerarsi stabilita quando, nei risultati d un reincrocio, le rispettive
proporzioni delle 4 categorie fenotipiche sono significativamente differenti dalle proporzioni 1:1:1:1;
oppure se in una generazione F2 classica (F1 x F1), le proporzioni rispettive delle differenti categorie
sono significativamente differenti dalle proporzioni 9:3:3:1 caratteristiche dell‟indipendenza dei due
geni.
L‟associazione può essere:
28
-
Completa, quando non è seguita da crossing-over. In questo caso i geni sono sempre trasmessi
assieme quando derivano dallo stesso genitore. La segregazione indipendente dei caratteri manca
completamente e la situazione può essere confusa con la pleiotropia.
- Incompleta, quando presenta crossing-over e perciò ricombinazione. Le diverse paia di alleli
vengono perciò ripartite, almeno parzialmente, in modo indipendente.
Nell‟associazione incompleta, cioè, avviene uno scambio tra paia di alleli di cromosomi
omologhi: è questo il fondamentale processo del crossing-over.
La comparsa di nuove ricombinazioni ha dimostrato che il crossing-over è quindi lo scambio di
frammenti cromosomici tra cromatidi di cromosomi omologhi alla meiosi.
Per le quattro possibilità fenotipiche che derivano da due coppie di geni allelici avremo:
- due combinazioni con i geni associati allo stesso modo dei cromosomi parentali: vengono dette
“combinazioni parentali”;
- due combinazioni con i geni che derivano dal crossing-over e sono dette “fenotipi ricombinati o
ricombinanti”.
La pratica dimostrazione di quanto detto ci viene dalla descrizione degli esperimenti compiuti
da T.H. Morgan sul moscerino della frutta, la Drosophila melanogaster.
Questo piccolo insetto ha un patrimonio genetico pari a 8 cromosomi dei quali due sessuali.
Fra i molti caratteri che Morgan studiò, prederemo in considerazione la forma delle ali ed il
loro colore.
Per la forma delle ali il locus AA riconosce in A (dominante) la forma di ali “normali”, mentre
in a (recessivo) la forma di ali “vestigiali”.
Per il colore delle ali il locus BB riconosce in B (dominante) il colore “normale”, mentre in b
(recessivo) il colore “sicuro”.
Morgan incrociò individui doppi dominanti ma eterozigoti nel genotipo con individui doppi
recessivi: rispettando la legge di Mendel ci si sarebbe dovuto attendere 4 fenotipi (AaBb, Aabb, aaBb,
aabb) con frequenza 1:1:1:1 ovvero con percentuale di comparsa del 25%.
Invece si ottennero due combinazioni con percentuale totale dell‟83% e le restanti due con il
restante 17%; e cioè:
Doppio recessivo
aabb
Doppio dominante
AABB
FENOTIPI PARENTALI 83%
1° locus dom., 2° locus rec.
RICOMBINANTI 17%
1° locus rec., 2° locus dom.
Il fenomeno dipendeva proprio dal fatto che c‟è associazione fra A e B da un lato e fra a e b
dall‟altro: A e B si trovano sullo stesso paio di cromosomi omologhi.
L‟associazione diminuisce sempre il numero di possibilità gametiche e nel caso degli
eterozigoti la diminuzione è sempre della metà; inoltre mentre le condizioni fenotipiche rimangono le
stesse, muta la frequenza di manifestazione.
Nella fattispecie la frequenza dei ricombinati è sempre minore rispetto a quella dei parentali e
comunque mai superiore al 50% in particolare, se i fenotipi ricombinanti non compaiono per niente si
può parlare di associazione completa.
Un doppio eterozigote per due geni associati può avere due costituzioni possibili:
- CIS (= coupling) quando due alleli dominanti sono sullo stesso cromosoma mentre i due recessivi
sono sull‟omologo;
29
TRANS (= repulsion) quando i due alleli dominanti si trovano su cromosomi diversi e l‟allele
dominante di una coppia ed il recessivo dell‟altra coppia, mentre il recessivo della prima coppia ed
il dominante della seconda sono sull‟omologo.
Per accertarci dell‟eventuale presenza dei fenomeni di crossing-over e all‟interno di questi della
presenza di costituzioni “cis” o “trans” dobbiamo sempre partire dagli eterozigoti perché
l‟accoppiamento degli omozigoti non ci mostra nulla di significativamente diverso. Nel caso più
semplice dell‟associazione tra due loci biallelici, modificazioni significative in F2 dei rapporti
fenotipici 9:3:3:1 o 1:1:1:1 possono far sospettare l‟esistenza di associazione e crossing-over.
Sperimentalmente sono stati messi a punto tre metodi di segregazione atti a svelare l‟esistenza
di associazione e crossing-over, essi sono:
- il metodo del reincrocio o di Hutt;
- il metodo degli eterozigoti o di Fisher;
- il metodo per i geni legati al sesso.
Il metodo del reincrocio o metodo di Hutt è noto anche come “metodo della radice quadrata”;
consiste nell‟accoppiare individui eterozigoti F1 con individui doppi omozigoti recessivi. La frequenza
attesa mendeliana è 1:1:1:1: si valuta se la frequenza osservata risulta significativamente diversa da
quella attesa; il calcolo avviene mediante l‟applicazione del chi quadrato.
Con il metodo di Hutt possiamo poi osservare se l‟associazione ha costituzione “cis” o “trans”;
infatti, nel caso di due loci biallelici A a, B b, se le percentuali maggiori saranno a favore dei fenotipi
AaBb e aabb l‟associazione avrà costituzione “cis”, mentre se le percentuali saranno maggiori per
Aabb e aaBb la costituzione prevalente sarà “trans”.
Infatti mentre per il doppio omozigote recessivo l‟unico gamete è ab per l‟eterozigote i gameti
possono essere: AB, Ab, aB, ab; qualora la costituzione sia “cis” avremo prevalenza dei gameti
prevalete la costituzione in “trans” i gameti più frequenti saranno Ab e ab con discendenza Aabb e
aaBb.
In altri termini, la frequenza del fenotipo doppio recessivo in F2 può servire a stimare:
- la frequenza de gameti parentale se in F1 gli alleli recessivi sono in posizione “cis”;
- la frequenza dei gameti ricombinati se in F1 essi sono in “trans”.
Facciamo un esempio: le galline di razza Leghorn presentano associazione tra il locus I ed il
locus F; il locus I ha I dominante con il carattere “colore bianco” e il recessivo con il carattere
“colorato”, il locus F ha F dominante con il carattere “piumaggio increspato” e f recessivo con il
carattere “piumaggio normale”.
Partendo da soggetti eterozigoti IiFf (repulsion) ottenuti da genitori bianchi normali Iiff e
genitori pigmentati increspati iiFF; tali eterozigoti F1 appaiono bianchi increspati; accoppiamoli con
soggetti iiff pigmentati normali, otterremo le seguenti percentuali:
40,15 % colorati increspati iiFf
40,15 % bianchi normali
Iiff
11,40 % bianchi increspati IiFf
8,30 % normali
iiff
Tra le possibili ipotesi che permettono di spiegare tale segregazione, quella mendeliana di
indipendenza è da rifiutare data la differenza significativa fra le frequenze attese e quelle osservate
rispetto ad un accoppiamento fra un eterozigote ed un doppio recessivo. Lo stesso dicasi per l‟ipotesi
del Linkage completo in quanto di dovrebbero avere solo due combinazioni; infatti il gene dominante
di un carattere è legato al gene recessivo dell‟altro carattere: I è associato a f, mentre i è associato a F;
esiste la repulsione a realizzare l‟associazione si di uno stesso cromosoma fra geni dominanti e fra geni
recessivi; le due combinazioni dovrebbero essere perciò:
-
bianchi normali Iiff
colorati increspati iiFf
entrambi nella frequenza del 50%.
Resta perciò da considerare l‟ipotesi del Linkage con crossing-over. È infatti necessario
ammettere l‟esistenza di un Linkage, poiché una proporzione molto elevata di animali di fenotipo [if] e
30
[If] presenta repulsione dei geni dominanti e recessivi fra di loro; ma la presenza dei due altri fenotipi
[if] e [IF] riunenti i geni dominanti fra di loro ed i recessivi fra di loro in debole frequenza (19,7%) e
per conseguenza lontana dalla proporzione mendeliana (50% ovvero 25% + 25%), suppone un
crossing-over che condiziona parzialmente il linkage.
Partendo sempre da soggetti eterozigoti IiFf bianchi increspati ottenuti però da genitori bianchi
increspati IIFF e colorati normali iiff è possibile analizzare la fase di coupling.
In F2 abbiamo:
45,5 %
36,3 %
12,0 %
6,2 %
bianchi increspati
colorati normali
bianchi normali
colorati increspati
IIFF
iiff
Iiff
iiFF
Le ipotesi mendeliana e l‟ipotesi del Linkage completo non sono ammissibili per gli stessi
motivi indotti poco sopra; valida risulta invece la terza ipotesi ovvero quella del Linkage con crossingover: infatti c‟è una netta tendenza dei geni dominanti I e F ad associarsi fra loro e la stessa tendenza
mostrano i geni recessivi.
La presenza dei fenotipi [If] e [iF] in debole proporzione suppone la realizzazione del 18,2% di
ricombinazione fra I ed f da una parte, i ed F dall‟altra.
Il metodo di Hutt è il sistema più rapido per mettere in evidenza i linkage in zootecnia: esso
permette infatti l‟utilizzo di un numero piuttosto limitato di soggetti.
Il metodo di Fischer o degli eterozigoti è molto più complesso e si applica quando si è
impossibilitati ad utilizzare il metodo di Hutt. Consiste nell‟accoppiare due eterozigoti e nell‟osservare
se la frequenza ottenuta è significativamente diversa da quella attesa e che è pari, per due loci biallelici
a 9:3:3:1. Vediamo per questo secondo metodo un esempio di Linkage in fase di repulsion:
P
IIff
F1
x
iiFF
IiFf
Ora accoppiamo individui eterozigoti e chiamiamo
p = la probabilità di ricombinazione [IF + if]
1-p = la probabilità di linkage
[If + iF]
La probabilità di apparizione di ciascun gamete sarà la seguente:
gameti probabilità
IF
if
iF
If
p/2
p/2
1-p/2
1-p/2
Attraverso una tabella a doppia entrata sarà possibile calcolare la frequenza teorica dei quattro
possibili fenotipi in una generazione F2:
IF p/2
if p/2
If 1-p/2
iF 1-p/2
31
IF p/2
[IF]p2/4
[if]p2/4
If p/2
[If] (1-p2/4)
If 1-p/2
[iF] (1-p2/4)
iF 1-p/2
La soma di queste frequenze è pari a uno.
Di regola se r è la frequenza di crossing-over o frequenza di ricombinazione tra due geni
associati Aa e Bb, i gameti formati dagli eterozigoti per entrambe le paia di alleli avranno frequenze
dipendenti dalla combinazione genica originale.
Quindi quando i geni sono in condizione di coupling (AB o ab) si forma un totale di r gameti
ricombinanti, dei quali ½ r sono Ab ed ½ sono aB. La frequenza totale dei gameti parentali, che prima
era 1, verrà quindi ridotta di r; cioè ciascuno dei due tipi parentali (AB, ab) verrà formato con una
frequenza ½ - ½r.
Analogamente, geni eterozigoti in condizione repulsion (Ab o aB) formeranno r gameti
ricombinanti (AB, ab) e perderanno la frequenza di r gameti parentali (Ab, aB).
La conoscenza delle frequenze di ricombinazione e la conoscenza della condizione di coupling
e di repulsion dei geni implicati nell‟incrocio rendono possibile la previsione delle frequenze
genotipiche della discendenza di eterozigoti per geni associati.
Ad esempio se la ricombinazione tra due geni associati Aa e Bb è del 10% e l‟eterozigote porta
questi geni in condizione di coupling, le frequenze dei gameti AB, Ab, aB e ab sono rispettivamente,
0,45, 0,05, 0,05, 0,45. Una semplice scacchiera 4x4 potrà fornire poi le frequenze di ciascuna delle 16
possibili combinazioni; ad esempio la frequenza del doppio recessivo aabb sarà 0,45x0,45=0,2025.
Il metodo di Fisher può essere applicato anche in altra maniera.
In questo caso si segnalano i fenotipi in F2 nel modo seguente:
AB con a1;
Ab con a2;
aB con a3;
ab con a4;
se gli eterozigoti della F1 sono in cis (AB/abxAB/ab), allora calcoliamo il rapporto:
a3 x a3
-------------------------- = z
a1 x a4
se gli eterozigoti della F1 sono in trans (Ab/aBxAb/aB), il rapporto sarà:
a1 x a4
------------------------- = z
a2 x a3
Il valore di z si desume da apposite tabelle.
Il metodo per i geni legati al cromosoma x è molto semplificato, dato che nella discendenza di
un incrocio i maschi ereditano i loro cromosomi x solo dalla madre; ogni evento di ricombinazione
verificatosi nella gametogenesi femminile si nota immediatamente nei figli maschi, i quali, già in
possesso di un solo cromosoma x mostrano sempre gli effetti dei geni legati al sesso, siano essi
dominanti recessivi.
32
La natura parentale o ricombinata dei gameti formati dalla femmina è osservabile
direttamente nella discendenza F2 maschile senza che il genotipo dei maschi F1 intervenga.
Studiando i fenomeni di crossing-over, si è scoperto che i cromatidi di un cromosoma possono
subire più di un crossing-over. Il processo influenza i tipi di gameti che si formano.
Il più frequente è il crossing-over doppio, detto anche crossing-over a due filamenti: sono
interessati a questo fenomeno gli stessi due cromatidi in entrambi i chiasmi: si formano perciò due
cromosomi doppi.
È importante notare che in tali condizioni i due geni estremi presi in esame possono non
manifestare ricombinazione; infatti, nei cromosomi rimaneggiati varia soltanto la posizione del gene
centrale rispetto ai due geni laterali; i crossing-over doppi derivano cioè da chiasmi doppi: in essi si
muove soltanto il gene centrale, mentre nei crossing-over semplici si sposta uno solo dei geni
terminali.
Sono stati individuati anche doppi crossing-over simultanei.
L‟interferenza è un fenomeno per il quale la formazione di un chiasma riduce la probabilità
d‟apparizione di un secondo chiasma nella regione vicina.
In tal caso il numero osservato di cromatidi doppiamente rimaneggiati risulta essere inferiore a
quello deducibile dalla distanza. L‟interferenza si calcola attraverso la seguente formula:
interferenza = 1 – coincidenza
% cromatidi rimaneggiati
osservati
dove coincidenza = -----------------------------------------% cromatidi rimaneggiati
calcolati
Una applicazione interessante del Linkage seguito da crossing-over è rappresentato dalla
costituzione delle cosiddette carte cromosomiche, ovvero la disposizione dei geni nel cromosoma
d‟appartenenza.
Lo studio delle carte cromosomiche ha due scopi ben precisi:
a) localizzare i geni uno in rapporto all’altro.
b) Calcolare le distanze che li separano.
L‟unità di misura per calcolare la distanza fra un gene e l‟altro è il centimorgan, detta anche
unità d ricombinazione, che corrisponde alla probabilità di apparizione di un crossing-over tra due
punti di un cromosoma. Si può anche dire che 1 centimorgan è quella parte di cromatide con
probabilità 1% di subire un crossing-over e avere da esso forme ricombinate; per questo si può
definire la probabilità dell‟1% come frequenza di ricombinazione. Perciò, conoscendo il numero medio
di crossing-over su un paio di cromosomi, si può risalire con forte probabilità all‟esatta lunghezza della
carta di questo gruppo di associazione (ricordiamo che per gruppo di associazione intendiamo tutti i
geni situati su di un determinato cromosoma). Questa lunghezza si ottiene moltiplicando il numero
medio di chiasmi per 50.
Comunque, affinché un crossing-over sia svelabile, esso deve avvenire fra due punti conosciuti:
se i punti sono sconosciuti le ricombinazioni non saranno riconoscibili.
Il crossing-over non sarà svelabile nemmeno nel caso in cui esso avvenga all‟interno di una
zona delimitata da due geni conosciuti, senza interessare direttamente questi due geni.
In entrambi questi casi, i prodotti derivati da tali meiosi ci appariranno identici ai parentali di
partenza.
Nel secondo caso si potrà ricorrere ad un terzo gene situato fra i due estremi.
Naturalmente possono esistere anche crossing-over multipli. Quando tra i due geni estremi si
presentano più di 15 unità di ricombinazione, è possibile avere crossing-over doppi: aumentando tale
distanza, aumenterà anche la frequenza dei doppi crossing-over e siccome questi non danno luogo a
ricombinazione genetica tra i geni terminali, si ottengono distanze viziate per difetto.
La difficoltà si supera mediante il test dei tre punti.
33
Prima di studiare il modo per stabilire la frequenza dei chiasmi, elenchiamo alcune regole
propedeutiche:
1) ogni punto di un cromosoma ha una probabilità non nulla di essere punto di rottura o chiasma; ogni
punto ha la stessa probabilità di esserlo;
2) in media, un bivalente (due cromosomi omologhi) subisce un chiasma;
3) il numero di chiasmi è proporzionale alla lunghezza del cromosoma, precisando che:
- la proporzionalità non è diretta, o meglio è diretta fino ad una certa lunghezza del cromosoma
poi il numero rimane costante nonostante l‟allungarsi dello stesso;
- ciascun tipo di cromosoma si caratterizza per un numero medio di chiasmi;
4) si può caratterizzare lo spazio situato fra due punti di un cromosoma, cioè fra due loci, in base ala
frequenza dei chiasmi che esso produce.
Tale frequenza permette di predire le rispettive proporzioni di gameti parentali e ricombinati;
all‟inverso, la percentuale di gameti ricombinati, ottenuti a partire da un genotipo dato, è il riflesso
diretto della percentuale di chiasmi che si sono avuti fra i due geni in studio.
Secondo la regola di Morgan “la percentuale di ricombinazione tra due geni non alleli è una
misura possibile della loro distanza”; maggiore risulta tale distanza, maggiore è la probabilità che un
chiasma abbia luogo tra i due punti considerati
La distanza in parole viene definita distanza genetica.
La distanza genetica ha delle proprietà:
- additività: prendendo in considerazioni più coppie di geni, la distanza tra la prima coppia e l‟ultima
è data dalla somma delle percentuali di ricombinazione di tutti questi geni, presi a due a due.
L‟additività non ha valore quando intervengono fenomeni di doppio crossing-over
La frequenza dei chiasmi è dunque uguale al doppio della frequenza dei prodotti ricombinati
(cromatidi rimaneggiati), quindi:
A questo punto possiamo elencare i fattori che condizionano la correttezza delle carte
genetiche. Essi sono:
a) la distanza fra geni: l‟addittività della distanza genetica porta ad avere lunghezze superiori a 100
unità poiché la percentuale massima di ricombinazione fra due loci è 50%, i due geni sono situati
molto lontano l’uno dall’altro sullo stesso cromosoma; possono segregare indipendentemente e
sembrare localizzati su cromosomi non omologhi;
b) la numerosità del campione; maggiore è il numero di individui analizzati, più precisa risulterà la
stima della distanza;
c) le distanze medie; per ottenere una distanza media a partire da diverse prove, è necessario
ponderare ciascuna distanza calcolata in ciascun esperimento in funzione della taglia del
campione; per cui se definiamo “n” la taglia di ciascuno dei campioni e “d” la distanza genetica
che gli è propria, avremo:
đ = Σ nd essendo N il numero totale dei N soggetti esaminati
La percentuale di ricombinazione è il riflesso diretto della percentuale di chiasmi che si sono
verificati fra due geni e che, viceversa, la frequenza di chiasmi permette di predire la proporzione
rispettiva di gameti parentali e ricombinati. In nessun caso, sono possibili più del 50% dei gameti
ricombinati (che è come dire che corrisponde a 100 la probabilità che un chiasma abbia luogo). Non ci
si può aspettare infatti più del 50% di ricombinazioni tra due loci, poiché soltanto due dei quattro
cromatidi in una tetrade alla meiosi sono coinvolti in un particolare punto del crossing-over.
Però, se sullo stesso cromosoma 2 geni sono sufficientemente lontani fra di loro affinché la
probabilità che un chiasma abbia luogo sia del 100% ci saranno allora il 50% di gameti parentali ed il
50% di gameti ricombinati.
Veniamo ora alle tecniche di studio della distanza fra geni: innanzitutto dobbiamo precisare che
la distanza genetica ha un significato diverso dalla distanza fisica che separa due geni nello stesso
cromosoma.
I metodi principali sono due ed entrambi sfruttano la tecnica del DNA ricombinante che riesce
a mettere in evidenza i gameti ricombinanti e la loro frequenza di espressione, essi sono:
34
Il primo è applicabile nel caso in cui non ci siano doppi crossing-over, i quali non si osservano
per distanze inferiori a 5 unità e consiste nel reincrocio di un doppio eterozigote.
Il test dei tre punti, invece, vale per distanze maggiori di 5 unità, in cui potrebbero manifestarsi
fenomeni di doppio crossing-over. Consiste nell‟utilizzare un terzo gene tra i due considerati al fine di
svelare un eventuale doppio crossing-over, e si serve anch‟esso del reincrocio ma con un triplo
eterozigote.
In generale, se si considerano 3 geni associati, separati da distanze conosciute, la percentuale di
ricombinanti svelabili tra i due geni esterni A e C, senza utilizzare il gene centrale B, è pari alla
percentuale di ricombinazione tra A e B, alla quale si somma la percentuale di ricombinazione tra B e
C meno due volte la percentuale dei doppi ricombinanti, cioè:
% ric. A-B + % ric. B-C | - 2% doppi ric.
Il calcolo delle distanze genetiche ci permette di ottenere, per ogni cromosoma di un individuo,
l‟esatto ordine dei geni ovvero la loro giusta posizione all‟interno del cromosoma.
Il processo è reso difficoltoso dai doppi crossing-over, anche perché, in assenza di geni
supplementari maggiore sarà la probabilità di avere doppi crossing-over.
Perciò le stime di distanza più sicure si hanno a partire da geni molto legati.
Le distanza genetiche al di sotto delle quali si ha la certezza dell‟assenza di doppi crossing-over
variano da specie a specie.
Ogni percentuale inferiore a questo valore tipico di ogni specie risulta equivalente alla distanza
stessa mentre al di là di questo valore la relazione fra percentuale di ricombinazione e distanza
genetica non è più lineare; la percentuale diviene una sottostima della distanza in parola.
Terminiamo dicendo che, sebbene la distanza fisica e quella genetica non siano in relazione
diretta esse hanno però lo stesso ordine.
b) L‟INTERAZIONE
In questo capitolo tratteremo del concetto di interazione. Si tratta di una situazione prettamente
funzionale, consistente nel rapporto che i prodotti biosintetici dei geni possono intrattenere tra loro.
Allo stato attuale delle conoscenze, possiamo considerare tre tipi di interazione:
- l‟interazione vera e propria o interazione semplice;
- l‟interazione epistatica o epistasi;
- l‟interazione non epistatica.
L‟INTERAZIONE SEMPLICE
Gli enzimi hanno un ruolo attivo in tutto il metabolismo intermedio degli organismi. Le
reazioni del metabolismo intermedio realizzano, tappa per tappa, la trasformazione di una sostanza in
un‟altra e ciascuna tappa è catalizzata da un enzima specifico. L‟insieme delle reazioni che
trasformano un precursore in un prodotto terminale costituisce una via biosintetica. Tutte le vie
biosintetiche, anche le più semplici, implicano vari enzimi codificati da più geni; per ottenere ciascun
metabolita è necessaria l‟azione catalitica di vari enzimi, ciascuno dei quali è codificato da un gene
differente. Siamo in presenza di una interazione genetica semplice in tutti i casi nei quali due o più
geni determinano enzimi che catalizzano differenti tappe di una stessa via biosintetica.
L‟EPISTASI
L‟epistasi è una interazione nella quale geni e loci mascherano o sopprimono l‟azione di geni
situati in altri loci. Si tratta sempre, inoltre di una interazione intergenica, cioè tra geni situati su
coppie di cromosomi non omologhi. È detta anche “soppressione intergenica”. I geni che nascono
vengono detti depistatici, i geni inibiti, nascosti vengono definiti ipostatici.
35
In altri termini i geni che combinano la loro azione producono un effetto che non è il risultato
cumulativo o additivo dei geni stessi.
A livello di segregazione, in un incrocio bifattoriale si ottiene, in F2, un numero di fenotipi
minore di quattro.
Infatti l‟epistasi è responsabile della formazione di sei tipi diversi di proporzioni F2, sempre
che ci sia dominanza completa nel singolo locus:
- per tre di queste si avranno 3 fenotipi;
- per tre solamente 2 fenotipi.
Chiamando per nostra comodità il primo locus AA e il secondo BB, si avranno i seguenti casi:
Epistasi dominante
Il singolo gene è dominante anche in singola dose, ovvero sia in omozigosi (AA) che in
eterozigoti (Aa o aA) sull‟altro locus sia che esso sia in omozigosi (BB o bb) sia che sia in
eterozigoti (bB o Bb).
Il rapporto fenotipico sarà 12:3:1; l‟epistasi si esplica ne 12 perché è in quelli che A si presenta
anche in singola dose: nei restanti quattro casi il primo locus ha sempre l‟omozigosi recessiva e
quindi l‟epistasi non si presenta.
Un esempio può essere dato dal colore del frutto della zucca; infatti quando si ha il paio di alleli
AA il bianco è dominante sulla condizione colorata, quando si ha il paio di alleli BB il giallo è
dominante sul verde, quando si è in epistasi il dominante bianco nasconde l‟effetto di giallo e di
verde. Quindi:
AaBb
12/16
BIANCHI
3/16
GIALLI
x
AaBb
1/16
VERDI
Doppia epistasi dominante
Si definisce anche “Epistasi con azione dei due geni dominanti senza effetto cumulativo”.
In questo caso l‟uno o l‟altro dei geni, se dominante, risulta essere epistatico sull‟altro: quindi o il
singolo gene A è epistativo su tutte le manifestazioni del singolo gene B o il singolo gene B è
epistatico su tutte le manifestazioni del singolo gene A.
Il rapporto dei fenotipi sarà 15:1, avremo cioè solo due fenotipi; l‟epistasi si mostra nei 15 dove A
o B è epistatico anche su bb e su aa rispettivamente: solo il doppio recessivo non subirà il
processo di epistasi.
Come esempio abbiamo la capsula dei semi nella specie botanica Capsella bursa-pastoris. Infatti:
*
*
*
con il paio di alleli AA abbiamo una forma triangolare dominante su quella ovoidale;
con il paio di alleli BB abbiamo una forma triangolare dominante su quella ovoidale;
in epistasi l‟allele dominante in uno o nell‟altro dei due loci nasconde l‟effetto della condizione
ovoidale.
Quindi:
AaBb
x
AaBb
15/16
FORMA
TRIANGOLARE
1/16
FORMA
OVOIDALE
36
Siamo in grado di scoprire la doppia epistasi dominante osservando l‟estrinsecazione del fenotipo
dove solo il doppio recessivo si mostra nell‟aspetto che ci si attende.
Per questa forma è stata prospettata la teoria della duplicazione di un gene: in altri termini A e B
sarebbero due geni indipendenti, ma uguali dal punto di vista funzionale poiché agiscono sullo
stesso carattere.
Epistasi recessiva
In questo caso la coppia epistatica è la coppia aa; per agire deve essere in omozigosi e sempre in
doppia dose perché in singola dose non agisce. Perciò aa risulta epistatico su BB, Bb, Bb e bb.
Il rapporto fenotipico sarà 9:3:4 e l‟epistasi si mostrerà proprio negli ultimi quattro, laddove cioè
troveremo l‟omozigosi recessiva nel primo locus.
Doppia epistasi recessiva
Entrambi gli omozigoti recessivi risultano essere epistatici rispetto agli effetti dell‟altro gene.
Quindi aa mostra epistasi su tutte le manifestazioni di B (BB, Bd, bB e bb) mentre bb mostra
epistasi su tutte le manifestazioni di A (AA, Aa, aA e aa).
Il rapporto fenotipico sarà 9:7 e l‟epistasi si mostrerà sui 7.
In certi casi il rapporto fenotipico potrà essere anche 9:6:1 e cioè quando il doppio recessivo avrà
un carattere diverso dai 6. In altri termini l‟omozigote recessivo dell‟altra coppia.
L‟esempio ci viene ancora dal mondo vegetale ed il colore del fiore nei piselli. Qui abbiamo che il
paio di alleli A da colore rosso scuro dominante sul bianco mentre il paio di alleli B da condizione
colorata dominante su condizione incolore (bianco); in epistasi gli omozigoti recessivi producono
fiori bianchi per entrambi i geni A e B.
Allora:
AaBb
x
9/16
ROSSI SCURI
AaBb
7/16
BIANCHI
Epistasi dominante e recessiva
Si definisce anche “Epistasi con dominante e recessivo che si esprimono allo stesso fenotipo”.
Un gene, se dominante anche in singola dose, è epistatico rispetto all‟altro gene, se omozigote
recessivo e mai in singola dose, è epistatico rispetto al primo.
Cioè: A è epistatico su BB, Bb, bB e bb.
Il genotipo bb è epistatico su AA, Aa, aA e aa.
Il rapporto fenotipico sarà 13:3 e l‟epistasi si mostrerà sui 13 in quanto 9 doppi dominanti, 3
recessivi per il secondo locus e dominanti per il primo tranne aa) ed infine uno doppio recessivo.
L‟esempio proviene dal mondo animale ed è il piumaggio nel pollame nel quale il paio di alleli A
provoca l‟inibizione della condizione colorata carattere dominante sulla comparsa del colore
mentre il paio di alleli B per il quale risulta dominante il colore sulla condizione bianco. In
epistasi l‟inibizione del colore (dominante) impedisce che si manifesti il carattere “colore del
piumaggio” anche quando questa condizione risulta essere geneticamente determinata; il gene per
il colore, se omozigote recessivo, impedisce la comparsa del colore anche quando sia assente
l‟inibitore dominante.
Quindi:
AaBb
x
AaBb
37
13/16
BIANCHI
3/16
COLORATI
(aaBB, aaBb e aabB)
L‟INTERAZIONE NON EPISTATICA
In questo caso geni non alleli, combinando la loro azione, danno origine ad un fenotipo
differente da quello che essi indurrebbero separatamente.
Mentre nella epistasi cambiano le frequenze fenotipiche qui tali frequenze rimangono identiche
rispetto alla legge di Mendel; si ha però un nuovo fenotipo, diverso nella sostanza e non nel numero,
determinato da diversi prodotti finali derivati da vie biosintetiche differenti che contribuiscono
insieme a determinare un carattere comune.
L‟esempio classico è dato dalla forma delle creste dei polli; in tale situazione si ha:
- Il paio di alleli A dà cresta a rosa dominante sulla cresta non a rosa.
- Il paio di alleli B da cresta a pisello dominante su cresta non a pisello.
- Con l‟interazione i due dominanti dei rispettivi locus producono cresta a noce; gli omozigoti
recessivi per cresta a rosa e cresta a pisello producono cresta semplice.
Quindi:
P
Cresta a rosa x
RR pp
Cresta a pisello
rr PP
Gameti
Rp
rP
x
F1
Creste a noce
Rr Pp
RP
Rp
rP
rp
RRPP
noce
RRPp
noce
RrPP
noce
RrPP
noce
Rp
RRPp
noce
RRpP
noce
RrpP
noce
Rrpp
Rosa
rP
rRPP
noce
rRPp
noce
rrPP
pisello
rrPp
pisello
rP
rRpP
noce
rRpp
rosa
rrpP
pisello
rrpp
semplice
RP
38
MODELLI EREDITARI
In questo capitolo affronteremo la classificazione di tutti i possibili modelli ereditari per
caratteri qualitativi finora definiti, in funzione di parametri diversi.
a) IN FUNZIONE DELLA LOCALIZZAZIONE DEL DNA
Poiché negli animali il dna è localizzato sia nel nucleo che nei mitocondri, esistono due modelli
ereditari diversi, che chiameremo nucleare e mitocondriale. Quest‟ultimo è detto anche
citoplasmatico, in considerazione della localizzazione dell‟organello. Il modello nucleare è
classificabile in diverse maniere a seconda della localizzazione cromosomica, del numero degli alleli
per locus, del numero di fenotipi allelomorfi, del sesso degli individui. La particolarità del meccanismo
ereditario dello mtDNA è data dal fatto che la stragrande maggioranza dei mitocondri presenti
nell‟embrione sono di origine ovocitaria e non spermatozoaria, come dimostrato oramai ampiamente
da numerose sperimentazioni. In particolare, nell‟ibridazione interspecifica tra asino e cavallo, il mulo
(asino stallone per cavalla) presenta un mtDNA che assomiglia a quello della cavalla mentre quello del
bardotto (cavallo stallone per asina) è identica a quello dell‟asina. A ciò consegue che l‟eredità
mitocondriale portata dai figli è sempre e solo di origine materna.
Un meccanismo ereditario di tal genere può essere mimato da almeno tre situazioni diverse:
- l‟infezione di agenti che possono essere trasmessi dalla madre al feto;
- un‟eredità autosomica dominante che sia letale per lo spermatozoo;
- una trasmissione mediata da plasmidi citoplasmatici non mitocondriali.
Recenti studi hanno dimostrato che tra DNA nucleare e DNA mitocondriale esistono
interazioni vicendevoli, come dimostrato da alcune patologie di cui informazione è contenuta in uno
dei due DNA, ma la cui espressione è mediata dall‟altro.
b) IN FUNZIONE DELLA LOCALIZZAZIONE DEI GENI SUI CROMOSOMI
La localizzazione dei geni sui cromosomi lascia a considerare modelli ereditari differenti: il
modello autosomico e quelli per i geni legati ai cromosomi sessuali (eterocromosomi).
Nel modello autosomici i geni sono portati dai cromosomi autosomici, che sono pari a 2n – 2.
L‟implicazione essenziale di tale modello è che i maschi e le femmine possono essere interessati in
uguale misura.
I modelli che conseguono alla localizzazione dei geni nei cromosomi sessuali sono diversi. Il
più conosciuto è quello detto associato al cromosoma X o X-Linked. I geni che ne sono responsabili
sono localizzati nei cromosomi X che notoriamente, nei mammiferi, sono 2 nella femmina e uno,
sempre di origine materna, nel maschio. La femmina possiede due cromosomi X e questi si
comportano come una normale coppia autosomica, che potrà essere in condizione sia di eterozigoti che
di omozigosi.
Il maschio, invece, ha un solo cromosoma X per cui presenterà il carattere definito dal gene
presente; per questo si parla di emizogosi. Il modello ereditario associato alla X è detto incrociato o
criss-cross. Infatti, la femmina riceve un X dal padre e uno dalla madre e può trasmettere le sue X sia
alle figlie che ai figli. Il maschio riceve la X dalla madre e la trasmette sempre e solo alle figlie
femmine. I figli maschi ereditano perciò il carattere dalla loro madre e il cromosoma X può saltare
alternativamente da un sesso all’altro in generazioni successive. Ciò spiega perché, mentre gli incroci
reciproci per caratteri autosomici danno risultati identici, ciò non avviene per i carattere legati alla X.
Un aspetto importate di tutta l‟eredità legata al cromosoma X è che manca la trasmissione maschiomaschio (padre-figlio), in quanto il padre trasmette al figlio il cromosoma Y; le figlie ricevono invece
il cromosoma X e quindi porteranno sempre il gene posseduto dal padre. Da un punto di vista
funzionale è importante ricordare che anche la femmina si comporta da emizogote grazie al cosiddetto
39
fenomeno di Lyon o compensazione del dosaggio genico o principio del singolo X attivo, che consiste
nella disattivazione congenita di uno dei due cromosomi X in tutte le cellule somatiche, cosicché in
una femmina solo un cromosoma X è geneticamente attivo e solo i geni situati su di esso sono
operanti. Un caso esemplare di emizigosi nella specie umana è l‟emofilia. Il gene che ne è responsabile
si trova nel cromosoma X; in presenza di emofilia la madre è sempre, al minimo portatrice; indicando
con
Xe il gene normale e con
Xe il gene recessivo,
avremo:
M 2A + XE Xe x F 2A + XE Y
con quattro possibilità gametiche, dal quale deriveranno quattro possibilità zigotiche:
XE XE F normale
Xe XE F portatrice
XE Y M normale
Xe Y M emofilico
Per cui il maschio soffrirà di emofilia se ha il gene sul cromosoma X; la femmina soffrirà di
emofilia solo se la madre sarà portatrice ed il padre emofilico; solo in questo caso avremo infatti un
genotipo XeXe.
Molto più complesso il meccanismo ereditario legato ai geni portatori dal cromosoma Y. Un
tempo tale eredità veniva definita olandrica perché si pensava che tale cromosoma non avesse alcuna
omologia con altri.
Attualmente invece il cromosoma Y viene distinto in tre sottoregioni:
- una sottoregione che occupa gran parte del braccio corto del cromosoma (Yp), che risulta omologa
ad una parte del cromosoma X alla quale si appaia durante la meiosi (regione pseudo autosomale);
- una regione pericentrica;
- una terza regione costituita dal braccio lungo del cromosoma probabilmente inerte.
Recentemente studi di genetica molecolare indicano che il braccio Yp contiene varie sequenze
che non sono omologhe con Xp, ma che lo sono con Yq, Xq o, addirittura, un autosoma.
Tra i geni portati dal cromosoma Y possiamo ricordare SRY (Testis determination factor),
fattore che determina la differenziazione delle gonadi indifferenziate in testicoli; è localizzato
probabilmente in Yp11.2; le sue sequenze sono altamente conservate sia nei mammiferi che negli
uccelli.
c) IN RAPPORTO AL SESSO
L‟eredità portata dai cromosomi X e Y viene anche definita eredità legata al sesso. Mentre nei
mammiferi i due sistemi sono separati, nella drosofila è stata scoperta una parziale omologia tra
cromosoma X e Y nel maschio, con conseguente parziale appaiamento alla meiosi. L‟eredità legata al
sesso può perciò essere ulteriormente suddivisa in:
- eredità completamente legata al sesso;
- eredità incompletamente legata al sesso;
- eredità olandrica vera e propria.
40
I geni completamente legati al sesso sono situati sui segmenti non omologhi del cromosoma X.
Quelli incompletamente legati al sesso sono portati dalla frazioni omologhe di X e di Y, possono
ricombinarsi come i geni autosomici mediante il fenomeno del crossing-over. Infine, i geni olandrici
sono situati sulla porzione non omologa del cromosoma Y.
Negli avicoli è ben definito un gruppo di caratteri legati al sesso che permettono il messaggio
precocissimo dei pulcini. Gli animali vengono definiti autosexing. Nelle principali specie avicole
domestiche la determinazione del sesso è cromosomica secondo il modello “abraxas”, gl
eterocromosomi vengono disegnati con i simboli ZZ e ZW; nel maschio il corredo corrisponde a 2A +
ZZ, mentre nella femmina corrisponde a 2A + ZW. È il maschio cioè ad essere eterogamico. In casi
più rari il meccanismo è di tipo “protenor” inverso, perché gli eterocromosomi del maschio vengono
designati con ZZ e quelli della femmina con ZO.
Tra i principali caratteri autosessanti possiamo ricordare:
Nel piumaggio golden-silver, il silver, detto anche bianco, è dominante (S) e lo è anche in
singola dose, il golden, detto anche giallo, è recessivo (s):
1)
M ss
x
F So
(golden)
(silver)
--------- M Ss
(silver)
x
F So
(golden)
2)
M SS x
F So
(golden)
(silver)
--------- M Ss
(silver)
x F So
(silver)
nel caso 1) la discendenza è sessabile; non lo è nel caso 2).
La barratura delle penne risulta dominante anche in singola dose (B), la sua assenza, detta
anche piumaggio uniforme, risulta essere recessiva (b):
1)
M bb
(uniforme)
2)
M BB
(barrato)
x
F Bo
(barrato)
---------- M Bb
(barrato)
x
F bo ---------- M Bb
(uniforme)
(barrato)
x
F bo
(uniforme)
x
F Bo
(barrato)
la discendenza è sessabile solo nel caso 1).
Riguardo alla velocità di impiumamento, il carattere “impiumamento lento” è dominante anche
in singola dose (K), il carattere “impiumamento rapido” è recessivo (k):
1)
M KK
(rapido)
x
F Ko --------- M Kk
(lento)
(lento)
x F ko
(rapido)
2)
M KK
(lento)
x
F ko --------- M Kk
(rapido)
(lento)
x F Ko
(lento)
la discendenza è sessabile sono nel caso 1).
41
Si definisce associata al sesso quell‟eredità portata da cromosomi autosomici la cui espressione
è però più o meno condizionata dal sesso dell‟individuo in cui i cromosomi si trovano. Essa può essere
ulteriormente distinta in:
- eredità limitata dal sesso;
- eredità influenzata dal sesso.
Si definiscono limitati dal sesso quei caratteri la cui informazione genetica esiste in entrambi i
sessi, ma che si possono esprimere solo in uno dei due: l‟esempio più interessante è dato da tutti i
caratteri che intervengono nella definizione della produzione del latte o delle uova.
Sono invece influenzati da sesso quei caratteri che esistono in entrambi i sessi, si esteriorizzano
in entrambi, ma la loro espressione è più netta in un sesso rispetto all‟altro.
L‟espressione di questi geni è cioè influenzata dagli ormoni sessuali, anche se, a quanto
sembra, solo lo stato eterozigote è influenzato dagli ormoni sessuali. Infatti, mentre l’omozigote
dominante o recessivo hanno lo stesso fenotipo, qualunque sia il sesso, l’eterozigote avrà differente
fenotipo nei due sessi. Il fenomeno è conosciuto come inversione della dominanza.
Un esempio è dato dall‟influenza degli ormoni sessuali sul carattere assenza o presenza di
corna nella specie ovina; il carattere è legato all‟azione di un locus in cui è dominante l‟assenza di
corna sia in omozigosi dominante (PP) sia in eterozigoti (Pp), mentre è recessiva la presenza di corna.
Nell‟incrocio fra arieti privi di corna della razza Suffolk (S) e pecore della razza Dorset (D)
dotate di corna (+ per la presenza e - per l‟assenza) avremo:
P
(-) S M
PP
x
(+) D F
pp
F1
tutti eterozigoti Pp, però:
M (+)
F (-)
L‟interpretazione è che gli ormoni androgeni influenzano l‟estrinsecarsi del carattere e così le
normali proporzioni mendeliane per un locus biallelico a dominanza completa vengono rispettate solo
nel sesso femminile; accoppiando gli F1 tra loro avremo:
F2
MP
p
F
P
PP
Pp
p
pP
pp
nei M : 3 (+) e 1 (-)
nelle F: 3 (-) e 1 (+)
Nei maschi si ha l‟inversione della dominanza, mentre nelle femmine vengono rispettate le
segregazioni normalmente attese.
Alcuni autori pensano che non ci sia solo un‟influenza ormonale, bensì che il locus vada
incontro ad un vero e proprio cambiamento intrinseco: infatti il maschio castrato presenta ugualmente
le corna e perciò si può prospettare la neutralizzazione di P da parte di p.
42
LA G E N E T I C A D I P O P O L A Z I O N E
Mendel morì nel 1884: le leggi che oggi portano il suo nome, e che egli aveva scoperto nel 1866, erano
dimenticate. La "riscoperta" delle leggi di Mendel avvenne nel 1900 ad opera di tre botanici che
lavoravano indipendentemente: H. De Vries (olandese), C. Correns (tedesco) ed E. Tschermak
(ungherese).
Nacque negli stessi anni la genetica delle popolazioni; la legge fondamentale venne individuata dal
matematico inglese G. H. Hardy e dal medico tedesco W. Weinberg (legge di Hardy-Weinberg, 1908).
Genetica delle popolazioni: per genetica si intende "struttura genetica", e dunque è la struttura
genetica delle popolazioni. Ma perché popolazioni e non specie, o razze? La popolazione è in genere
aggettivata: popolazione "mendeliana", che può essere una specie oppure una sub-unità della specie.
Una popolazione mendeliana è una popolazione in cui gli individui sono sottoposti ad un flusso genico
(gene flow), cioè possono "scambiarsi" geni grazie alla riproduzione. Fino a quando degli individui
sono sottoposti al flusso genico? Due sono i meccanismi che possono interrompere il flusso genico: la
speciazione e la creazione di barriere riproduttive. La speciazione è il meccanismo più importante e
comporta l'incapacità riproduttiva per le differenze biologiche esistenti fra gli animali; la barriera
riproduttiva non richiede invece la perdita di capacità riproduttiva, ma l'impossibilità di riprodursi per
motivi spazio-temporali (ad esempio, l'isolamento geografico, come nel caso degli animali selvatici
australiani oppure degli animali che gli Europei hanno portato con loro nelle colonie). Speciazione e
barriere riproduttive possono anche coesistere e variamente intrecciarsi.
La definizione di popolazione mendeliana può adattarsi a specie (come nel caso in cui una specie è una
popolazione molto ristretta), oppure adattarsi a suddivisioni della specie (come nel caso degli animali
domestici, ma a volte anche nel caso di selvatici diffusi in aree molto vaste e con differenti habitat).
Nell'animale domestico le barriere riproduttive principali le crea l'uomo, addirittura all'interno della
popolazione (ad esempio, quando sceglie i riproduttori).
Il soggetto della trattazione teorica può essere un gene qualsiasi facente parte di un locus polimorfo. La
grandezza fondamentale da misurare è la frequenza genica, cioè la frequenza del gene nella
popolazione mendeliana. La frequenza si ha solo se il gene è un allele di un locus polimorfo: cioè nella
popolazione è presente, oltre al gene, il suo o i suoi alleli. Si parla di frequenze, cioè di grandezze
relative (fra 0 ed 1), e che come tali si possono confrontare fra popolazioni mendeliane.
Gli scopi della genetica delle popolazioni sono due:
- definire la struttura genetica della popolazione;
- individuare e studiare le forze che possono provocare delle variazioni all'interno delle popolazioni
(cioè variazioni delle frequenze geniche).
Se si parla di variazione, si tratta di un concetto dinamico; se si cambia, si cambia nel tempo, cioè nel
susseguirsi delle generazioni. Applicheremo dei modelli teorici, che non si differenziano nelle specie
(si applicano alla riproduzione sessuata dei mammiferi, e non si tiene conto di individui che non si
riproducono). Il nostro pool genetico deriva da animali che effettivamente si riproducono.
La struttura di una popolazione è definita da tre grandezze:
- le frequenze fenotipiche;
- le frequenze genotipiche;
- le frequenze geniche.
Biologicamente è la frequenza genica che determina le altre due, ma il nostro cammino pratico è
inizialmente l'opposto, dal fenotipo al genotipo al gene, in quanto non vediamo direttamente il gene ma
solo i suoi effetti. Nella trattazione teorica si può supporre di conoscere la frequenza genica e da questa
arrivare a genotipi e fenotipi: questa potrà essere la via reale in futuro, grazie allo studio diretto del
DNA.
La genetica di popolazione è basata sulla legge di Hardy-Weinberg, o legge dell'equilibrio genetico.
L'equilibrio genetico è il non variare da una generazione alla successiva delle frequenze geniche, e
quindi di quelle genotipiche e fenotipiche. Esiste innanzitutto un equilibrio intra-locus e poi un
equilibrio di tutti i loci (equilibrio effettivo della popolazione).
Bisogna prima di tutto accertare alcune condizioni relative al campione; la popolazione reale in genere
non rispetta le condizioni della popolazione ideale, ma nonostante ciò la legge è nella sostanza valida
43
anche per le popolazioni reali. Fenomeno di Walhund: nel campione non deve esistere
accavallamento di generazioni e la popolazione non deve tendere a distribuirsi per sottopopolazioni.
Nell'uomo in genere le generazioni non si sovrappongono, ma l'accavallamento delle generazioni è la
regola negli animali domestici, dove l'intervallo di generazione è più breve. Walhund dimostrò che in
certe situazioni si può avere l'equilibrio nella popolazione generale e non nelle sottopopolazioni o
viceversa.
Per essere in equilibrio ci deve essere una corretta ripartizione dei sessi, la popolazione deve essere di
effettivo illimitato (cioè la più grande possibile), il sistema riproduttivo deve essere panmittico
(popolazione in panmissia), nella popolazione non devono esistere mutazioni, migrazioni, selezione e
deriva genetica (queste ultime quattro sono proprio le forze che fanno variare l'equilibrio genetico).
La panmissia è la situazione genetica che consegue ad una riproduzione panmittica, cioè ad una
riproduzione realmente e totalmente casuale, in cui tutti gli individui hanno la stessa possibilità di
riprodursi dando una prole fertile che è a sua volta in panmissia. In realtà la riproduzione sessuata non
è mai casuale. Più la popolazione è grande e più tutti i geni hanno la possibilità di esprimere il
corrispondente fenotipo.
I presupposti della legge di Hardy-Weinberg non esistono nelle popolazioni reali: è sufficiente
avvicinarcisi il più possibile (ad esempio, nell'uomo ci sono circa 8 mutazioni per ogni generazione).
Rispetto alla panmissia, il sistema omeogamico tende a far riprodurre fra di loro gli individui più
simili, mentre il sistema eterogamico tende a far riprodurre fra loro individui dissimili; il sistema
omeogamico è tipicamente rappresentato dall'accoppiamento fra parenti, ma nell'uomo anche da criteri
di scelta basati sul colore della pelle, su criteri estetici, su criteri culturali, su criteri intellettivi; il
sistema eterogamico è quello che in genere lega fra loro diverse popolazioni mendeliane:
zootecnicamente è l'incrocio.
La formula matematica della legge di Hardy-Weinberg è rappresentata dal quadrato di un binomio o di
un polinomio:
Due alleli: A a
Frequenze geniche:
f(A) = p
f(a) = q
Frequenze genotipiche:
[AA]
[Aa]
[aa]
Frequenze fenotipiche:
[A]
[a]
[AB] (nella codominanza non c'è differenza fra frequenze genotipiche e fenotipiche)
Fare attenzione al fatto che, in loci codominanti, in genere la notazione Aa è sostituita dalla notazione
AB, dove A e B sono due alleli codominanti dello stesso locus.
Utilizzando il quadrato di Punnet nel caso di un locus biallelico:
¦
p
q
-----------------------------p
¦
pp
qp
¦
q
¦
pq
qq
44
ed essendo:
p+q = 1
e
(p+q)² = p²+2pq+q² = 1
si hanno nella generazione filiale le stesse frequenze geniche della generazione parentale:
f(A) = (2p² + pq + pq) / (2p² + 2pq + 2pq + 2q²) =
= (p² + pq) / (p² + 2pq + q²) = p² + pq = p (p+q) = p
f(a) = (pq + pq + 2q²) / (2p² + 2pq + 2pq + 2q²) =
= (pq + q²) / (p² + 2pq + q²) = pq + q² = q (p+q) = q
Anche nel caso di un locus triallelico con:
f(A) = p
f(B) = q
f(C) = r
calcolando la composizione della generazione filiale con il quadrato di Punnet si ha:
¦
p
q
r
--------------------------------------p
¦
p²
pq
pr
¦
q
¦
qp
q²
qr
¦
r
¦
rp
rq
r²
poiché
p+q+r = 1
e
(p+q+r)² = p²+q²+r²+2pq+2pr+2qr = 1
si ottengono nuovamente le frequenze geniche della generazione parentale:
f(A) = (2p²+pq+pq+pr+pr) / (2p²+2pq+2pr+2pq+2q²+2qr+2pr+2qr+2r²) =
= (p²+pq+pr) / (p²+q²+r²+2pq+2pr+2qr) = p²+pq+pr = p(p+q+r) = p
f(B) = (2q²+pq+pq+qr+qr) / (2p²+2pq+2pr+2pq+2q²+2qr+2pr+2qr+2r²) =
= (q²+pq+qr) / (p²+q²+r²+2pq+2pr+2qr) = q²+pq+qr = q(p+q+r) = q
f(C) = (2r²+pr+pr+qr+qr) / (2p²+2pq+2pr+2pq+2q²+2qr+2pr+2qr+2r²) =
= (r²+pr+qr) / (p²+q²+r²+2pq+2pr+2qr) = r²+pr+qr = r(p+q+r) = r
Anche partendo dalle frequenze genotipiche si può dimostrare la validità della legge di
Hardy-Weinberg:
45
¦
AA
Aa
aa
¦
p²
2pq
q²
--------------------------------------------------------------------4
3
2 2
AA
p²
¦
p
2p q
pq
¦
3
2 2
3
Aa
2pq ¦
2p q
4p q
2pq
¦
2 2
3
4
aa
q²
¦
pq
2pq
q
da cui riassumendo si ha:
4
AA x AA
=
p (tutti AA)
AA x Aa
=
4p q (metà AA e metà Aa)
AA x aa
=
2p q (tutti Aa)
Aa x Aa
=
4p q (1/4 AA, 1/2 Aa, 1/4 aa)
Aa x aa
=
4pq (metà Aa e metà aa)
aa x aa
=
q (tutti aa)
3
2 2
2 2
3
4
e sommando i genotipi simili si ha:
4
3
2 2
AA = p +2p q+p q = p²(p²+2pq+q²) = p²
3
2 2
2 2
3
Aa = 2p q+2p q +2p q +2pq = 2pq(p²+2pq+q²) = 2pq
2 2
3
4
aa = p q +2pq +q = q²(p²+2pq+q²) = q²
Se partiamo da una popolazione che non è in equilibrio, in quanto tempo si raggiunge l'equilibrio
genetico? Generalmente basta una sola generazione di accoppiamento casuale per ottenere l'equilibrio:
dopo una generazione le frequenze geniche non mutano più; ciò è valido indipendentemente dall'entità
del polimorfismo, ovvero non dipende dal numero di alleli presenti al locus considerato. Un'eccezione
è per i loci del cromosoma sessuale X (geni X-linked); ricordiamo che non basta dire genericamente
"legati al sesso" perché esistono anche geni Y-linked, i quali danno l'eredità olandrica, cioè solo
maschile, come nel caso dell'antigene HY, collegato alla repressione e derepressione dello sviluppo
sessuale dell'embrione. Nel caso di un allele X-linked, se le frequenze sono diverse nei due sessi, esse
tendono all'uguaglianza solo all'infinito; nei mammiferi non è mai stata dimostrata complementarietà
totale fra X ed Y, come accade in alcuni esseri inferiori; il maschio non è omozigote o eterozigote,
bensì emizigote, ed il carattere si manifesta comunque, indipendentemente dal fatto che sia dominante
oppure recessivo.
f(XA) = 2/3 f(XAf) + 1/3 f(XAm)
L'eredità si manifesta "criss-cross", o incrociata; i maschi ricevono il cromosoma X dalla madre,
mentre le femmine ricevono un cromosoma X dal padre ed un cromosoma X dalla madre: pertanto la
generazione filiale maschile riceve le frequenze geniche delle femmine della generazione parentale,
mentre la generazione filiale femminile riceve le frequenze geniche medie dei due sessi nella
generazione parentale. Nel tempo, l'andamento delle frequenze nei due sessi ha l'aspetto di una linea "a
dente di sega", con differenze che ad ogni generazione si dimezzano e cambiano di segno.
Per gli alleli legati al cromosoma X, nelle femmine c'è differenza fra frequenze geniche e frequenze
genotipiche, mentre nei maschi (emizigoti) le due frequenze sono uguali. E' molto importante
46
comprendere questi meccanismi per studiare le patologie recessive legate alla X (ad esempio,
l'emofilia).(1)
--------------------------------------------------------------------(1)
Non confondere l‟eredità “legata al sesso” con quella “limitata dal sesso” e con quella “influenzata dal sesso”. L‟eredità legata al
sesso riguarda caratteri portati dall‟eterocromosoma X, ma che possono manifestarsi in entrambi i sessi. L‟eredità limitata dal sesso
riguarda caratteri che sono normalmente ereditati da entrambi i sessi, ma che si manifestano solo il un sesso (ad esempio la produzione
lattea). L‟eredità influenzata dal sesso è quella in cui il carattere si eredità normalmente in entrambi i sessi, ma si manifesta
differentemente nei due sessi (magari per influenza degli ormoni sessuali): ad esempio, il carattere corna si manifesta nei maschi in
maniera più evidente.
ESEMPIO
Locus biallelico X-linked
f(XAm) = pm = 0,2
f(XAf) = pf
= 0,5 (la differenza fra le frequenze di maschi e femmine è -0,3)
Generazione successiva:
pm
= 0,5
pf
= (0,2+0,5)/2 = 0,35 (la differenza fra le frequenze è adesso +0,15)
Generazione successiva:
pm
= 0,35
pf
= (0,5+0,35)/2 = 0,425 (la differenza è adesso -0,075)
Notare che in ogni generazione la frequenza genica nella popolazione è 0,4
esima
[f(XA) = 2/3f(XAf) + 1/3f(XAm)]: alla n
generazione la frequenza genica sarà 0,4 anche in entrambi
i sessi.
GENI X-LINKED
Andamento delle frequenze geniche
1,0
F
r
e
q
u
e
n
z
a
,8
,6
,4
,2
0,0
1
2
3
4
5
6
7
8
9
10
Generazione
maschi
femmine
47
GENI X-LINKED
Andamento delle frequenze geniche
1,0
F
r
e
q
u
e
n
z
a
,8
,6
,4
,2
0,0
1
2
3
4
5
6
7
8
9
10
Generazione
maschi
femmine
48
ESEMPIO
In una popolazione con un locus autosomico biallelico Tt:
TT
Tt
tt
= 0,4
= 0,4
= 0,2
¦
TT
Tt
tt
¦
0,4
0,4
0,2
---------------------------------------------------TT
0,4
¦
0,16 0,16 0,08
Tt
0,4
¦
0,16 0,16 0,08
tt
0,2
¦
0,08 0,08 0,04
(notare che le combinazioni fuori della diagonale sono simmetriche e possono quindi essere facilmente
sommate)
TT
TT
TT
Tt
Tt
tt
x
x
x
x
x
x
TT
Tt
tt
Tt
tt
tt
=
=
=
=
=
=
0,16 (tutti TT)
0,32 (metà TT e metà Tt)
0,16 (tutti Tt)
0,16 (1/4 TT, metà Tt, 1/4 tt)
0,16 (metà Tt e metà tt)
0,04 (tutti tt)
per cui, sommando i genotipi simili, otteniamo:
TT
Tt
tt
=
=
=
0,36
0,48
0,16
Le frequenze ottenute sono diverse da quelle di partenza, ma possiamo dimostrare che l'equilibrio è
stato raggiunto in una sola generazione, in quanto:
¦
TT
Tt
tt
¦
0,36
0,48
0,16
------------------------------------------------------------------------TT
0,36 ¦
0,1296
0,1728
0,0576
Tt
0,48 ¦
0,1728
0,2304
0,0768
tt
0,16 ¦
0,0576
0,0768
0,0256
TT
TT
TT
Tt
Tt
tt
x
x
x
x
x
x
TT
Tt
tt
Tt
tt
tt
=
=
=
=
=
=
0,1296 (tutti TT)
0,3456 (metà TT e metà Tt)
0,1152 (tutti Tt)
0,2304 (1/4 TT, metà Tt, 1/4 tt)
0,1536 (metà Tt e metà tt)
0,0256 (tutti tt)
da cui nuovamente otteniamo:
TT
Tt
tt
=
=
=
0,36
0,48
0,16
49
ESEMPIO
Una popolazione con un locus autosomico biallelico Aa, ma frequenze diverse nei due sessi: ad
esempio, i maschi provengono da una razza con frequenze geniche p e q rispettivamente pari a 0,6 e
0,4, mentre le femmine da un'altra razza con frequenze geniche 0,8 e 0,2 (entrambe le razze erano
comunque, al loro interno, in equilibrio).
Maschi
AA
Aa
aa
= p²
p = 0,8
q = 0,2
= 0,64
Aa = 2pq
aa
q = 0,4
= p² = 0,36
= 2pq = 0,48
= q² = 0,16
Femmine
AA
p = 0,6
= q²
= 0,32
= 0,04
¦
AA
Aa
aa
¦
0,36
0,48
0,16
------------------------------------------------------------------------AA
0,64 ¦
0,2304
0,3072
0,1024
Aa
0,32 ¦
0,1152
0,1536
0,0512
aa
0,04 ¦
0,0144
0,0192
0,0064
AA
AA
AA
Aa
Aa
aa
x
x
x
x
x
x
AA
Aa
aa
Aa
aa
aa
=
=
=
=
=
=
0,2304 (tutti AA)
0,4224 (0,1152+0,3072: metà AA e metà Aa)
0,1168 (0,1024+0,0144: tutti Aa)
0,1536 (1/4 AA, metà Aa, 1/4 aa)
0,0704 (0,0192+0,0512: metà Aa e metà aa)
0,0064 (tutti aa)
per cui, sommando i genotipi simili, otteniamo:
AA
= 0,2304 + 0,2112 + 0,0384
= 0,48
Aa
= 0,2112 + 0,1168 + 0,0768 + 0,0352
= 0,44
aa
= 0,0384 + 0,0352 + 0,0064
= 0,08
Le frequenze geniche sono la media di quelle delle due razze di origine:
p
= 0,48 + 1/2 (0,44)
= 0,7 [cioè (0,6+0,8)/2]
q
= 0,08 + 1/2 (0,44)
= 0,3 [cioè (0,4+0,2)/2]
Si può dimostrare che le frequenze geniche sono già in equilibrio, mentre le frequenze genotipiche
ancora non lo sono: infatti dovrebbe essere
p²
2pq
q²
= 0,7²
= 0,49
= 2 (0,7) (0,3) = 0,42
= 0,3²
= 0,09
50
L'equilibrio delle frequenze genotipiche si raggiunge nella generazione seguente:
¦
AA
Aa
aa
¦
0,48
0,44
0,08
------------------------------------------------------------------------AA
0,48 ¦
0,2304
0,2112
0,0384
Aa
0,44 ¦
0,2112
0,1936
0,0352
aa
0,08 ¦
0,0384
0,0352
0,0064
AA
AA
AA
Aa
Aa
aa
x
x
x
x
x
x
AA
Aa
aa
Aa
aa
aa
=
=
=
=
=
=
0,2304 (tutti AA)
0,4224 (metà AA e metà Aa)
0,0768 (tutti Aa)
0,1936 (1/4 AA, metà Aa, 1/4 aa)
0,0704 (metà Aa e metà aa)
0,0064 (tutti aa)
da cui otteniamo, sommando i genotipi simili:
AA
= 0,2304 + 0,2112 + 0,0484
AA
= 0,2112 + 0,0768 + 0,0968 + 0,0352
= 0,42
AA
= 0,0484 + 0,0352 + 0,0064
= 0,09
= 0,49
e le frequenze geniche:
p = 0,49 + 1/2 0,42 = 0,7
q = 0,09 + 1/2 0,21 = 0,3
IL CONTROLLO DELL'EQUILIBRIO GENETICO.
In pratica è sempre necessario partire da frequenze fenotipiche per arrivare alle frequenze geniche e
stabilire se, in quel determinato locus, esiste una condizione di equilibrio, cioè se quelle frequenze
geniche si trasmetteranno immutate nelle successive generazioni. In un locus polimorfo (biallelico), se
i fenotipi evidenziabili sono solamente due significa che fra i due alleli i rapporti sono di dominanzarecessività, mentre se i fenotipi presenti sono tre i rapporti fra i due alleli sono di codominanza. Nel
locus codominante, esistendo un'assoluta uguaglianza fra frequenza genotipica e frequenza fenotipica,
l'eventuale equilibrio può essere valutato direttamente dalle frequenze fenotipiche: ciò non può essere
fatto per alleli con rapporti di dominanza-recessività.
La valutazione della condizione di equilibrio in un locus consiste nel confrontare le frequenze
genotipiche osservate con le frequenze teoriche, attese secondo la legge di Hardy-Weinberg. Se la
differenza fra frequenze attese ed osservate non è significativa, allora le frequenze genotipiche possono
dirsi "in equilibrio"; il confronto fra frequenze attese ed osservate è fatto mediante il test ² (leggi "chi
quadrato").
51
I dati di partenza per i calcoli sono i valori di p e di q, ovvero le frequenze dei due alleli nella
popolazione; il metodo è differente, a seconda del tipo di rapporto esistente fra i due alleli: nel caso di
codominanza si utilizza il metodo della conta diretta, mentre nel caso di dominanza-recessività il
metodo della radice quadrata del fenotipo recessivo.
Ad esempio, nel caso di codominanza (cioè A=B), abbiamo:
p = f(A) = ([2A + ½[AB] + ½[AB]) / 2n = ([A + ½[AB]) / n
dove n rappresenta il numero degli individui; è stato in pratica sufficiente contare i differenti fenotipi.
Supponiamo si tratti di bovini Shorthorn, che possono essere di mantello bianco, rosso o roano
(eterozigoti); per calcolare la frequenza dell'allele per il rosso si contano i bovini rossi, si sommano a
questi la metà degli individui roani e si divide il tutto per il numero totale di bovini
(rossi+bianchi+roani); per ottenere q si potrebbe utilizzare lo stesso tipo di calcolo, ma è più semplice
q=1-p (poiché p+q=1).
Nel caso di dominanza-recessività fra alleli (cioè A>a), sappiamo che il fenotipo [a] corrisponde al
genotipo [aa], mentre il fenotipo [A] è dato da due genotipi, [AA] e [Aa]: non è possibile cioè stabilire
se un fenotipo dominante è dato da un genotipo omozigote dominante o eterozigote. Le frequenze
geniche possono essere calcolate solo presupponendo che la popolazione sia in equilibrio:
½
q = f(a) = ([a]/n) , (dove n rappresenta il numero degli individui)
e quindi p = f(A) = 1 -q.
E' importante sottolineare che, poiché nel caso di dominanza-recessività le frequenze sono state
ricavate presupponendo che la popolazione sia in equilibrio, non si potrà poi controllare se l'equilibrio
è effettivamente esistente: in altre parole, a partire dalle frequenze geniche calcolate con questo
metodo si otterrebbero come frequenze fenotipiche attese quelle stesse frequenze fenotipiche che erano
state realmente osservate.
Un esempio più complesso è il locus triallelico AB0, quello dei gruppi sanguigni dell'uomo, dove sono
presenti contemporaneamente rapporti di dominanza e codominanza:
A=B
A>0
B>0
f(A) = p
f(B) = q
f(0) = r
[A] = [AA] + [A0]
[B] = [BB] + [B0]
[AB] = [AB]
[0] = [00]
p+q+r = 1
(p+q+r)² = p²+q²+r²+2pq+2pr+2q r= 1
[A] = p²+2pr
[B] = q²+2qr
[AB] = 2pq
[0] = r²
Per meglio comprendere i rapporti di dominanza e codominanza del locus AB0, ricordiamo che l'allele
A fa produrre la proteina omonima (agglutinogeno A), l'allele B fa produrre l'agglutinogeno B, mentre
l'allele 0 ("zero") non fa produrre alcun agglutinogeno.
Si presuppone che la popolazione sia in equilibrio e si comincia quindi il calcolo estraendo la radice
quadrata della frequenza dell'omozigote recessivo [00]=[0]; il valore di r così ottenuto viene poi
utilizzato per calcolare p e q.
52
Ad esempio, avendo osservato in 190.177 avieri britannici la seguente distribuzione dei gruppi
sanguigni:
[A] = 79.334
[B] = 16.279
[AB] = 5.782
[0] = 88.782
si calcola dapprima la frequenza r:
½
r² = 88.782/190.177
r = (0,46684) = 0,6833;
ed utilizzando il valore di r trovato si calcola p e q:
q²+2qr+r² = (q+r)² = (1-p)²
da cui:
½
q+r = ([B]+[0]) = 1-p
½
½
p = 1-([B]+[0]) = 1-(0,5524) = 1-0,7432 = 0,2568
ed analogamente:
p²+2pr+r² = (p+r)² = (1-q)²
da cui:
½
p+r = ([A]+[0]) = 1-q
½
½
q = 1-([A]+[0]) = 1-(0,8840) = 1-0,9402 = 0,0598
Notare che, una volta calcolato p (oppure q), anche la frequenza dell'ultimo allele è stata calcolata
mediante una formula che fa riferimento ad un presunto equilibrio secondo Hardy-Weinberg, e non per
differenza rispetto ad 1 (cioè grazie a p+q+r = 1) oppure utilizzando il genotipo AB (cioè 2pq =
5.782/190.177 = 0,0304). La somma delle frequenze geniche è nel caso esposto 0,9999, cioè inferiore
ad 1: la differenza non è dovuta solamente all'arrotondamento, ma anche al fatto che le frequenze
geniche non sono perfettamente in equilibrio e non tutta l'informazione è utilizzabile (nel nostro caso,
non si è fatto uso dell'informazione data dalla frequenza del genotipo AB). Se si fosse utilizzato il
genotipo AB oppure la somma delle tre frequenze, si sarebbero ottenuti risultati leggermente diversi
(ma probabilmente meno esatti, perché ricavati da una quantità inferiore di informazioni); infatti:
se r = 0,6833 e p = 0,2568, si ha:
q = 1-p-r = 0,0599 oppure 2pq = 5.782/190.177 = 0,0304 e q = 0,0304/0,5136 = 0,0592
mentre se r = 0,6833 e q = 0,0598, si ha:
p = 1-q-r = 0,2569 oppure 2pq = 5.782/190.177 = 0,0304 e p = 0,0304/0,1196 = 0,2542
Ricordiamo ancora una volta che il procedimento illustrato PRESUPPONE che le frequenze siano in
equilibrio, ed una buona corrispondenza dei valori di p e q calcolati con i due procedimenti può
confortare l'ipotesi di equilibrio genetico, la quale NON PUO' PERO' ESSERE DIMOSTRATA.
53
Ad un risultato simile si perviene anche, dopo aver calcolato r, risolvendo due equazioni di secondo
grado, e scegliendo ovviamente la soluzione positiva:
p²+2pr = 79.334/190.177
q²+2qr = 16.279/190.177
p²+1,3666p-0,4172 = 0
q²+1,3666q-0,0856 = 0
p = 0,2570
q = 0,06
Anche in questo caso la somma delle tre frequenze risulta diversa da 1 (p+q+r = 1,0003), e ciò non
solo per l'arrotondamento utilizzato, ma anche per il non perfetto equilibrio secondo Hardy-Weinberg.
Inoltre, se la popolazione fosse perfettamente in equilibrio, si dovrebbero ottenere, utilizzando la
frequenza dell'eterozigote AB oppure la somma totale delle frequenze, gli stessi risultati:
dato r = 0,6833 e p = 0,2570:
q = 1-0,6833-0,2570 = 0,0597 oppure 2pq = 0,0304 e q = 0,0304/0,514 = 0,0591
dato r = 0,6833 e q = 0,06:
p = 1-0,6833-0,06 = 0,2567 oppure 2pq = 0,0304 e p = 0,0304/0,12 = 0,2533
Solo il metodo della conta diretta permette effettivamente di valutare se l'equilibrio genetico è presente
o meno in una popolazione: quando si fa uso, anche parzialmente (come nel caso del locus AB0), della
radice quadrata di un fenotipo recessivo non si può verificare se l'equilibrio è presente o meno, in
quanto l'equilibrio è indispensabile premessa al calcolo di una frequenza genica mediante la radice
quadrata di un fenotipo recessivo.
Come si fa a stabilire se le frequenze geniche sono in equilibrio secondo Hardy-Weinberg? Bisogna
confrontare le frequenze osservate con le frequenze attese. Dalla popolazione mendeliana si estrae un
campione, e già questa operazione può essere una fonte di errore se non effettuata correttamente;
parleremo inoltre di significatività delle differenze, in quanto le differenze stesse potrebbero essere
dovute al caso: la popolazione potrebbe cioè essere in equilibrio, ma presentare, per il semplice fatto
della casualità delle segregazioni, delle distribuzioni di frequenze leggermente diverse da quelle
teoricamente attese secondo la legge di Hardy-Weinberg (è solo questa l'origine delle differenze in una
popolazione mendeliana in equilibrio che sia stata interamente campionata). Un locus è in equilibrio
quando le differenze fra frequenze osservate ed attese non sono significative. Bisogna evitare gli errori
di campionamento, quali ad esempio:
- che la popolazione mendeliana sia suddivisa in sottopopolazioni;
- che le eventuali differenze di generazione non siano considerate;
- che il campione non sia casuale (random).
Si utilizza il test ² (leggi "chi quadrato"):
² = [(O-E)²/E]
cioè la sommatoria dei quadrati degli scarti fra frequenze osservate (Observed) e frequenze attese
(Expected) divisi per le corrispondenti frequenze attese non deve superare dei valori tabulari,
determinati in base ad un livello di significatività prescelto, generalmente il 5% (P  0,05), ed ai gradi
di libertà su cui si basa il confronto.
Generalmente parlando, affinché da una popolazione (cioè da un insieme costituito da tutte le possibili
osservazioni) si possa ricavare un campione (le osservazioni effettivamente utilizzate per la
descrizione della popolazione o per un confronto fra popolazioni) adatto a fini statistici bisogna
soddisfare i criteri di randomizzazione e rappresentatività del campione: ovvero, il campione deve
essere random, cioè casuale nella composizione, e rappresentativo della popolazione da cui è stato
estratto, cioè racchiudere in sé le caratteristiche della popolazione di cui fa parte. Solo se i criteri di
rappresentatività e casualità del campione sono soddisfatti, le conclusioni si possono statisticamente
ritenere valide non solo per il campione, ma anche per la popolazione.
54
Una volta stabilita la frazione di campionamento, cioè la quantità o percentuale di dati da campionare,
il campionamento vero e proprio può essere effettuato con varie modalità, da scegliere a seconda delle
circostanze. Il campionamento può essere:
- casuale semplice (con o senza ripetizione);
- sistematico;
- a grappolo;
- stratificato;
- a stadi.
Se, ad esempio, si dovesse campionare la popolazione frisona italiana, un campionamento casuale
semplice significherebbe estrarre a sorte dall'elenco degli animali da campionare (per semplificare
questa operazione sono disponibili delle tabelle di numeri casuali oppure delle funzioni che generano
una serie di numeri pseudo-casuali): nel caso di campionamento senza ripetizione, un animale già
estratto non verrebbe incluso nella popolazione per successive estrazioni, mentre nel caso di un
campionamento con ripetizione un animale parteciperebbe alle successive estrazioni, per cui potrebbe
entrare nel campione due o più volte (è un caso abbastanza raro in zootecnia: ad esempio, si pescano in
una vasca dei pesci e si rileva su di loro ciò che interessa, quindi li si rigetta nella stessa vasca e si
procede ad una nuova pesca; lo stesso potrebbe verificarsi separando momentaneamente delle pecore
da un gregge: in questo caso però la ripetizione può essere evitata identificando gli animali con una
matricola o semplicemente marcandoli). Un campionamento sistematico potrebbe essere effettuato, ad
esempio, entrando nelle varie stalle e scegliendo in ogni stalla il primo animale che si ha modo di
osservare (il campionamento sistematico può essere soggetto ad un errore sistematico, quando il
criterio seguito introduce una fonte di errore: ad esempio, gli animali potrebbero essere disposti nella
stalla per sesso o per età, per cui si sceglierebbe, senza saperlo, sempre un maschio oppure sempre
l'animale più giovane); con un campionamento a grappolo, si metterebbero nel campione tutti gli
animali di alcune stalle; con un campionamento stratificato si sceglierebbero gli animali nelle diverse
stalle in proporzione, ad esempio, al sesso ed alla consistenza nelle varie stalle: per poter effettuare un
campionamento stratificato è dunque necessario conoscere alcune caratteristiche della popolazione;
con un campionamento a stadi, verrebbero scelti ad esempio solo gli animali di alcune regioni e, con
più stadi, gli animali di alcune province nelle regioni già scelte e, con un ulteriore stadio, gli animali di
alcuni comuni di alcune province delle regioni scelte.
Il ² è un indice di dispersione ideato da Pearson, utilizzato per calcolare la probabilità di osservare
una determinata ripartizione di frequenze rispetto a quelle attese in base ad una ipotesi.
(O - E)²
² =  -------------------E
dove:
O è la frequenza osservata;
E è la frequenza attesa.
Notare che il valore di ² dipende dal numero dei termini della sommatoria (o meglio dal numero dei
termini della sommatoria stessa che sono realmente "liberi", cioè dal numero dei gradi di libertà). Si
utilizzano le frequenze assolute, e non le frequenze relative, perché alle frequenze viene attribuito un
valore differente a secondo del numero di osservazioni da cui le frequenze stesse sono state ricavate. Il
valore di ² è tanto più elevato quanto più è elevata la differenza fra la frequenza osservata e la
frequenza attesa, ed aumenta in ragione del quadrato di questa differenza: un differenza di 3, rispetto
ad una di 1, provocherà un aumento del numeratore di 9 volte (man mano che ci si allontana dalla
frequenza attesa, è sempre assai meno probabile che un ulteriore scostamento unitario della frequenza
osservata dalla attesa si possa verificare casualmente); il valore è tanto più basso quanto più elevata è
la frequenza attesa: su un numero più elevato di osservazioni è più probabile uno scostamento casuale.
55
Questo test non può essere utilizzato nel caso una qualsiasi delle frequenze presenti nel calcolo sia
inferiore a 5: in tale circostanza si ricorre ad un test analogo, il "test esatto di Fisher", oppure, se
possibile, si riuniscono le classi di frequenza meno rappresentate in classi più ampie.
Nel caso di piccoli campioni, con classi superiori a 5 ma inferiori a 100, può essere utilizzata nel
calcolo la correzione di Yates (o correzione di continuità), che consiste nel sottrarre e sommare 0,5,
prima dell'elevazione al quadrato, rispettivamente al più elevato scostamento positivo ed al più elevato
scostamento negativo.
La funzione di distribuzione del ² è data da:
½n-1
f(²) =
½(²)
(²)
e
-----------------½n
2 (n/2)
dove:
² è il valore trovato di ²;
n sono i gradi di libertà.
La funzione  (leggi "gamma") è, per un numero positivo, pari al fattoriale del numero stesso al quale
sia stato sottratto 1 (ovvero n=(n-1)!).
Dato un numero di gradi di libertà, ogni valore di ² ha quindi una propria possibilità di essere
osservato, calcolabile in base alla funzione di frequenza riportata. Generalmente, se non si fa uso di
programmi statistici su elaboratori elettronici, i quali forniscono il valore esatto delle probabilità del ²
calcolato per gli opportuni gradi di libertà, si utilizza un'apposita tabella: nelle diverse colonne sono
riportati i valori di ² per dei livelli standard di probabilità, mentre le righe rappresentano i diversi
gradi di libertà.
G.d.L.
1
2
....
10
20
....
100
....
¦
¦
¦
¦
¦
¦
¦
¦
¦
¦
¦
Probabilità di valori superiori
0,500
0,45
1,39
....
9,34
19,34
....
99,33
....
....
....
....
....
....
....
....
....
....
0,050
3,84
5,99
....
18,31
31,41
....
124,34
....
0,010
6,63
9,21
....
23,21
37,57
....
135,81
....
0,001
10,83
13,82
....
29,59
45,32
....
149,45
....
La probabilità con cui accettare o rifiutare un'ipotesi corrisponde al livello di sicurezza con cui si vuole
ritenere valide le proprie conclusioni: viene pertanto fissata dallo sperimentatore a seconda del caso; in
genere, in zootecnia vengono considerate significative le differenze per cui P  0,05.
Il concetto di gradi di libertà è un concetto assimilabile solo con un po' di esperienza: si tratta del
numero di osservazioni realmente indipendenti: ad esempio, per un locus poliallelico, nella verifica
dell'equilibrio genetico i gradi di libertà sono pari al numero degli alleli meno 1 (ma è possibile trovare
testi in cui i gradi di libertà sono pari al numero dei fenotipi meno uno, oppure al numero dei fenotipi
meno il numero degli alleli), mentre nel caso del controllo di una segregazione i gradi di libertà sono
pari al numero dei fenotipi osservati meno 1.
56
IPOTESI: dominanza completa.
Aa x Aa
Frequenze osservate (totale 4889):
AA + 2Aa = 3655
aa = 1234
Frequenze attese:
AA + 2Aa = 3/4 (4889) = 3666,75
aa = 1/4 (4889) = 1222,25
²1gdl = (3655-3.66675)²/3666,75 + (1234-1222,25)²/1222,25 = 0,1507
Il valore di ² è inferiore a quello tabulare per P0,05 ed 1 g.d.l., per cui la segregazione osservata è in
accordo con l'ipotesi.
IPOTESI: codominanza.
Aa x Aa
Frequenze osservate (totale 3536):
AA = 868
Aa = 1782
aa = 886
Frequenze attese:
AA = 1/4 (3536) = 884
2Aa = 1/2 (3536) = 1768
aa = 1/4 (3536) = 884
²2gdl = (868-884)²/884 + (1782-1768)²/1768 + (886-884)²/884 = 0,405
Il valore di ² è inferiore a quello tabulare per P0,05 e 2 g.d.l., per cui la segregazione osservata è in
accordo con l'ipotesi.
IPOTESI: letalità omozigote recessivo.
Aa x Aa
Frequenze osservate (totale 1282):
AA = 414
2Aa = 868
57
Frequenze attese:
AA = 1/3 (1282) = 427,3
2Aa = 2/3 (1282) = 854,7
X²1gdl = (414-427,3)²/427,3 + (868-854,7)²/854,7 = 0,621
Il valore di ² è inferiore a quello tabulare per P0,05 ed 1 g.d.l., per cui la segregazione osservata è in
accordo con l'ipotesi.
IPOTESI: segregazione diibrido AaBb.
In F2 sono stati osservati su un totale di 4082 fenotipi:
[AB] = 2458
[Ab] = 603
[aB] = 598
[ab] = 423
Frequenze attese (9:3:3:1):
[AB] = 9/16 (4082) = 2296,125
[Ab] = 3/16 (4082) = 765,375
[aB] = 3/16 (4082) = 765,375
[ab] = 1/16 (4082) = 255,125
²3gdl = (2458 - 2296,125)²/2296,125 + (603 - 765,375)²/765,375 + (598 - 765,375)²/765,375 + (423 - 255,125)²/255,125 = 192,926
Poiché il valore di ² osservato è superiore a quello tabulato per 3 g.d.l. e P0,001, dobbiamo
escludere l'ipotesi di segregazione indipendente del diibrido AaBb. Controlliamo allora se,
separatamente, le coppie alleliche Aa e Bb segregano nel rapporto 3 ad 1:
[A] = 3061
[a] = 1021
attese = 3/4 (4082) = 3061,5
attese = 1/4 (4082) = 1020,5
²1gdl = (3061-3061,5)²/3061,5 + (1021-1020,5)²/1020,5 = 0,0003
[B] = 3056
[b] = 1026
attese = 3/4 (4082) = 3061,5
attese = 1/4 (4082) = 1020,5
²1gdl = (3056-3061,5)²/3061,5 + (1026-1020,5)²/1020,5 = 0,0395
In entrambi i casi il valore di ² è inferiore a quello per 1 g.d.l e P0,05, per cui le due coppie alleliche
segregano, ciascuna per suo conto, nel rapporto atteso di 3 ad 1, ma complessivamente non nelle
classiche frequenze 9:3:3:1. Per dimostrare che si tratta di una segregazione non indipendente, come
nel caso di due loci posti sullo stesso cromosoma, verifichiamo per differenza l'interazione dei due loci
nella segregazione:
58
Segregazione
g.d.l.
X²
significatività
----------------------------------------------------------------------------------------------------------------AaBb
3
192,93
P0,001
Aa
1
0,0003
non significativo
Bb
1
0,040
non significativo
----------------------------------------------------------------------------------------------------------------"interazione"
1
192,89
P0,001
Si può dunque concludere che si tratta effettivamente di un diibrido, in cui la segregazione delle due
coppie alleliche non è però indipendente.
CONTROLLO EQUILIBRIO GENETICO: A=a (2595 osservazioni).
[AA] = 1760
[Aa] = 620
[aa] = 215
p = (1760 + ½ 620)/2595 = 0,798
q = (215 + ½ 620)/2595 = 0,202
Frequenze attese in base alla legge di Hardy-Weinberg:
[AA] = p² (2595) = 1652,5
[Aa] = 2pq (2595) = 836,6
[aa] = q² (2595) = 105,9
²1gdl = (1760-1652,5)²/1652,5 + (620-836,6)²/836,6 + (215-105,9)²/105,9 = 175,47
Il valore di ² osservato è superiore a quello tabulare per 1 g.d.l. e P0,001, per cui la popolazione non
è da considerare in equilibrio secondo Hardy-Weinberg.
CONTROLLO EQUILIBRIO GENETICO: Z=z (in un gruppo sanguigno di 2047 bovini Jersey).
[ZZ] = 542
[Zz] = 1043
[zz] = 462
p = (542 + ½ 1043)/2047 = 0,5195
q = (462 + ½ 1043)/2047 = 0,4805
Frequenze attese in base alla legge di Hardy-Weinberg:
[ZZ] = p² (2047) = 552.44
[Zz] = 2pq (2047) = 1021,94
[zz] = q² (2047) = 472,61
²1gdl = (542-552,44)²/552,44 + (1.043-1.021,94)²/1.021,94 + (462-472,61)²/472,61 = 0,8695
Il valore di ² osservato è inferiore a quello tabulare per 1 g.d.l. e P0,05, per cui la popolazione è da
considerare in equilibrio secondo Hardy-Weinberg, e le differenze fra le frequenze osservate ed attese
sono da attribuire al caso.
59
IPOTESI: appartenenza di un campione ad una popolazione (locus AB0, 1000 osservazioni).
Frequenze ipotizzate nella popolazione: p = 0,35, q = 0,25, r = 0,4.
Campione osservato:
[A] = 400
[B] = 260
[AB] =175
[0] = 165
Frequenze attese:
(p²+2pr) 1000 = 402,5
(q²+2qr) 1000 = 262,5
(2pq) 1000 = 175
(r²) 1000 = 160
²2gdl = (400-402,5)²/402,5 + (260-262,5)²/262,5 + (175-175)²/175 + (165-160)²/160 = 0,1956
Poiché il ² è inferiore a quello tabulato per P0,05 e 2 g.d.l., la distribuzione osservata è compatibile
con quella attesa: il campione può effettivamente appartenere ad una popolazione con le frequenze
alleliche indicate.
TABELLE DI CONTINGENZA: servono a verificare se due o più caratteri sono indipendenti (ancor
prima di aver chiarito il determinismo genetico dei caratteri stessi).
Mantello: fenotipo chiaro o scuro.
Occhi: fenotipo chiaro o scuro.
Mantello
Occhi
OSSERVAZIONI
----------------------------------------------------------------------Scuro
scuri
1605
Scuro
chiari
95
Chiaro
scuri
395
Chiaro
chiari
405
In totale, su 2500 animali, 1700 hanno mantello scuro ed 800 lo hanno chiaro, mentre, per quanto
riguarda il colore degli occhi, 2000 li hanno chiari e 500 scuri; la probabilità di avere mantello scuro è
dunque 0,68 (cioè 1700/2500) e quella di averlo chiaro 0,32 (cioè 800/2500, o anche 1-0,68); la
probabilità di avere occhi scuri è 0,8 (cioè 2000/2500), quella di avere occhi chiari 0,2 (cioè 500/2500,
o anche 1-0,8). Se i due caratteri fossero indipendenti, in base al principio della probabilità composta,
gli animali con mantello ed occhi scuri dovrebbero essere 1360 (cioè 0,68 x 0,8 x 2500), quelli con
mantello scuro ed occhi chiari 340 (cioè 0,68 x 0,2 x 2500), quelli con mantello chiaro ed occhi scuri
640 (cioè 0,32 x 0,8 x 2500), ed infine quelli con mantello ed occhi chiari 160 (cioè 0,32 x 0,2 x 2500).
In altre parole, dei 1700 animali con mantello scuro, 1360 (80%) dovrebbe avere occhi scuri e 340
(20%) occhi chiari, mentre gli 800 animali con mantello chiaro dovrebbero avere, in base alle stesse
percentuali, 640 occhi scuri e 160 occhi chiari.
Il tutto può essere riassunto nella seguente tabella di contingenza:
M
A
N
T
E
L
L
O
S
c
u
r
o
C
h
ia
r
o
O
C
C
H
I
O
s
s
e
r
v
a
t
i
A
t
t
e
s
i O
s
s
e
r
v
a
t
i
A
t
t
e
s
i T
O
T
A
L
E
S
c
u
r
i
1
6
0
5
1
3
6
0
3
9
5
6
4
0
2
0
0
0
C
h
ia
r
i
9
5
3
4
0
4
0
5
1
6
0
5
0
0
T
O
T
A
L
E
1
7
0
0
8
0
0
2
5
0
0
60
In una tabella di contingenza, il numero dei gradi di libertà si calcola con la formula
gdl = (r-1) x (c-1)
dove r è il numero delle righe e c il numero delle colonne della tabella; nel nostro caso, (2-1) x (2-1) =
1 g.d.l. (tabella 2 x 2).
²1gdl = (1605-1360)²/1360 + (395-640)²/640 + (95-340)²/340 + (405-160)²/160 = 689,625
Poiché il valore di ² trovato supera il valore tabulare per P0,001 ed 1 g.d.l., dobbiamo concludere
che i due caratteri non sono indipendenti, e cioè gli animali con mantello scuro hanno più
frequentemente occhi scuri, mentre quelli con mantello chiaro hanno più frequentemente occhi chiari
(potrebbe ad esempio trattarsi di loci associati).
STIMA DELLA FREQUENZA DEI PORTATORI. Supponiamo che in un locus biallelico l'allele
recessivo a sia responsabile di una grave malattia: in altre parole, che gli omozigoti recessivi aa siano
soggetti ad una selezione naturale o artificiale che li porta a non riprodursi. I genotipi possibili alla
nascita sono tre (AA, Aa ed aa), ma gli accoppiamenti possibili, dato che aa non è in grado di
riprodursi, si riducono da 6 a 3:
ACCOPPIAMENTO
RISULTATO
---------------------------------------------------------------------AA
x
AA
tutti AA
AA
x
Aa
½ AA + ½ Aa
AA
x
aa
accoppiamento impossibile
Aa
x
Aa
¼ AA + ½Aa + ¼ aa
Aa
x
aa
accoppiamento impossibile
aa
x
aa
accoppiamento impossibile
Vediamo dunque che la nascita degli omozigoti recessivi aa è determinata dalla frequenza degli
eterozigoti (portatori, fenotipicamente sani, del gene per la malattia): esprimiamo allora le frequenze
in termini di q. La frequenza degli eterozigoti, nell'intera popolazione (compresi gli omozigoti
recessivi) è data da 2pq = 2q(1-q); la frequenza degli eterozigoti nella popolazione di individui
normali è data da 2pq / (p²+2pq) = 2q(1-q) / [(1-q)²+2q(1-q)] = 2q / (1-q+2q) = 2q/(1+q).
ESEMPIO: su 55715 bambini nati in 3 anni a Birmingham (G.B.), 5 erano affetti da fenilchetonuria.
Stimare la frequenza dei portatori nella popolazione totale e fra gli individui sani.
½
f(a) = q = (5/55715) = 0,0095
frequenza dei portatori sui bambini nati = 2q(1-q) = 0,019 x 0,9905 = 0,0188
frequenza dei portatori nella popolazione sana = 2q/(1+q) = 0,019/1,0095 = 0,0188
Poco meno del 2% della popolazione è costituita da portatori sani: a causa della bassa frequenza di
soggetti affetti dalla malattia le due frequenze sono praticamente uguali.
61
GENOTIPI INUNLOCUS BIALLELICO
1,0
F
r
e
q
u
e
n
z
e
,8
,6
,4
,2
0,0
0
0,25
0,5
0,75
1
Frequenza di a
AA
Aa
aa
ALLELE RECESSIVOLETALE a
,070000
P
O
R
T
A
T
O
R
I
,060000
,050000
,040000
,030000
/
S
A
N
I
,020000
,010000
0,000000
0,00001 0,0001
0,001
AFFETTI / NATI
Se le frequenze geniche non variassero da una generazione alla successiva le popolazioni avrebbero
scarsa possibilità di modificarsi; in realtà le popolazioni sono in un continuo divenire, e le nuove
generazioni sono sempre diverse dalle precedenti. Occorre, come già ripetuto più volte, superare il
concetto statico di razza; all'inizio vennero definiti degli standard, ed alcuni standard di razza sono
rimasti invariati per almeno 150 anni; ancora oggi è difficile far capire agli stessi tecnici la necessità di
aggiornare frequentemente gli standard di razza.
Quali sono le forze che fanno variare le popolazioni? Sono quelle forze che fanno variare le frequenze
geniche da una generazione all'altra, e che fanno in tal modo variare in misura maggiore o minore
l'equilibrio genetico (lo possono far perdere e far attestare su equilibri diversi). La perdita
dell'equilibrio genetico può essere molto pericolosa per una popolazione, soprattutto se riguarda più
loci.
Le forze in grado di far variare l'equilibrio genetico sono 4:
- mutazione;
- migrazione (o flusso genico);
- selezione (riproduzione differenziale dei genotipi);
- deriva genetica.
Mutazione, migrazione e selezione provocano delle pressioni sistematiche: conoscendole, si può
62
prevedere quali saranno le frequenze geniche nelle generazioni successive; in altre parole, i
cambiamenti prodotti da mutazioni, migrazioni e selezione sono prevedibili sia in intensità che in
direzione. q (leggi "delta q") è la misura dello spostamento della frequenza genica q da una
generazione a quella successiva all'azione della forza stessa.
La deriva genetica agisce attraverso una pressione dispersiva: pur conoscendo le frequenze geniche,
non si è in grado di prevedere le frequenze della generazione successiva; è una situazione che bisogna
cercare di evitare. Nelle popolazioni che vanno scomparendo lo stato "preagonico" della popolazione
stessa è rappresentato dalla deriva genetica. Si può solo ipotizzare il grado delle modificazioni dovute
alla deriva genetica, ma non la direzione.
Mutazioni, migrazioni e deriva genetica provocano delle variazioni fortuite, solo la selezione sembra
avere un aspetto "finalistico" di adattamento del fenotipo degli animali; inoltre mutazioni, migrazioni e
deriva genetica agiscono su tutti i loci, mentre la selezione interessa esclusivamente i loci non neutri;
con la selezione i loci neutri possono variare per il cosiddetto "effetto autostop", cioè "trascinati" dai
loci non neutri soggetti a selezione con i quali i loci neutri in oggetto sono associati.
Le mutazioni, anche quelle ricorrenti, hanno praticamente nessuna forza nel far variare le frequenze
geniche: richiederebbero un numero elevatissimo di generazioni. Ugualmente pochissima forza hanno
le migrazioni, per le quali occorre però fare una distinzione fra popolazioni omogenee e popolazioni
non omogenee (erosione genetica). Nel far variare le frequenze la forza più importante è la selezione.
La deriva genetica esiste sempre, ma è importante solo se la popolazione è piccola.
LA SELEZIONE.
La selezione fu definita come termine da Charles Darwin (1809-1882); è il metodo con cui l'uomo
"migliora" le popolazioni per i suoi fini. Bisogna distinguere una selezione gametica da una selezione
zigotica; la selezione gametica è anche detta genica, quella zigotica è anche definita genotipica. La
selezione gametica o genica è la riproduzione differenziale dei geni: dato un locus biallelico, un allele
ha una capacità riproduttiva superiore all'altro allele perché il gamete con il primo allele si riproduce
meglio del gamete con il secondo allele; è un modello teorico, difficile da comprendere (il gamete è
espressione del genotipo dell'animale che si riproduce, non dei geni che il gamete stesso porta),
ricavato da animali inferiori: non ha significato zootecnico, ed è stato ipotizzato ad esempio come una
possibile ipotesi circa le frequenze geniche dei gatti senza coda dell'isola di Man. Nella selezione
zigotica la selezione non si verifica sul gene ma sulla combinazione degli alleli di un locus polimorfo
(è molto più semplice da capire, giacché il genotipo selezionato si è espresso nel fenotipo). La
selezione naturale è in realtà una selezione del fenotipo. Nella selezione zigotica o genotipica la
selezione agisce nella riproduzione differenziale dei genotipi all'interno di un locus polimorfo.
Non esiste un solo tipo di selezione: tratteremo la selezione con coefficienti selettivi costanti, ma ne
esistono altri tipi.
TIPI DI SELEZIONE
1234567-
selezione a coefficienti costanti
selezione dipendente dalla frequenza
selezione dipendente dalla densità
valore selettivo ineguale nei due sessi
selezione ciclica
selezione disruptiva
interazione fra tipi di selezione diversa
Nella selezione a coefficienti costanti, i valori selettivi sono costanti e non variano al variare delle
frequenze alleliche. Nella selezione dipendente dalla frequenza i valori selettivi variano al variare delle
frequenze alleliche; la correlazione fra il valore selettivo di un genotipo e la sua frequenza è negativa:
un genotipo sarà cioè avvantaggiato dal diminuire della sua frequenza. Nella selezione dipendente
dalla densità c'è un variare della fitness dipendente dalla densità della popolazione in un habitat ben
definito. Nella selezione con valore selettivo ineguale nei due sessi lo stesso allele è soggetto a
63
pressioni selettive differenti a seconda del sesso. Nella selezione ciclica la fitness cambia ciclicamente,
con il variare ciclico dell'ambiente (ad esempio, con le stagioni). Nella selezione disruptiva, due
sottopopolazioni separate da una diversa nicchia ecologica, possono riprodursi ed entrare in un nuovo
equilibrio. I tipi di selezione citati possono inoltre avvenire anche contemporaneamente.
La selezione può anche essere distinta in stabilizzatrice, direzionale, ciclica e diversificante. Nella
selezione stabilizzatrice viene selezionato il fenotipo medio (se pensiamo ad una curva normale, si
riproducono gli individui prossimi alla media); nella selezione direzionale viene selezionato uno dei
due fenotipi estremi (cioè gli individui vicini ad una estremità della curva normale): è il caso tipico
degli animali in produzione zootecnica, in cui l'uomo seleziona i migliori; nella selezione ciclica dei
fattori ciclici, come ad esempio l'alternarsi delle stagioni, favoriscono in un certo periodo gli individui
vicini ad un estremo della curva normale ed in un periodo successivo quelli prossimi all'altro estremo
(ad esempio, un mantello bianco quando c'è la neve invernale ed un mantello selvaggio in estate); nella
selezione diversificante i due estremi fenotipici vengono selezionati contemporaneamente (si
riproducono cioè solo i fenotipi alle due estremità della curva normale, mentre gli intermedi vengono
eliminati).
Una distinzione molto semplice è quella fra selezione naturale e selezione artificiale: nella selezione
naturale è l'ambiente che condiziona la riproduzione dei genotipi, nella selezione artificiale è l'uomo.
La selezione artificiale è principalmente effettuata su popolazioni domestiche estremamente
migliorate, sulle quali la selezione naturale non è praticamente più attiva; la selezione naturale è attiva
soprattutto sulle razze primarie. Lo stesso Darwin ipotizzò la presenza di un altro tipo di selezione, la
selezione sessuale, sulla cui esistenza ed eventualmente importanza si hanno ancora oggi pareri
controversi; la selezione sessuale è basata sulla preferenza di un sesso ad accoppiarsi con particolari
fenotipi dell'altro sesso: è probabilmente alla base dei dimorfismi sessuali più esasperati, che
probabilmente non sopravviverebbero alla selezione naturale (ad esempio, la coda di alcuni uccelli
maschi, come il pavone, è indispensabile per il corteggiamento ma è sicuramente svantaggiosa perché
rende l'animale stesso più vulnerabile ai predatori).
Studieremo la selezione a coefficienti selettivi costanti, con particolare riferimento a quella
direzionale, cioè alle selezione dei genotipi "estremi". La selezione è la riproduzione differenziale dei
genotipi polimorfi. Ogni genotipo ha una sua misura del valore riproduttivo, la fitness, termine già
introdotto da Darwin; la definizione di fitness è molto complessa, e noi cercheremo di semplificarla
utilizzandola in termini relativi, cioè di rapporti fra le efficienze riproduttive dei diversi genotipi. La
fitness è dapprima un fenomeno relativo ad un locus, poi relativo all'insieme di loci di un individuo,
infine della popolazione di individui con quei loci. La fitness è definibile solo per i loci non neutri, che
complessivamente non sono molti.
Per la fitness si valutano due elementi: la fertilità e la "viabilità" (un francesismo che potremmo
tradurre in compatibilità con la vita).
1)- selezione dovuta ad una differente viabilità (=compatibilità con la vita) nelle varie fasi di sviluppo
- selezione gametica
- selezione zigotica (prenatale e postnatale)
2)- selezione dovuta ad una differente fertilità
- alcuni genotipi sono meno fertili di altri
- alcuni tipi di accoppiamento sono incompatibili e la fertilizzazione non avviene
3)- selezione familiare (Haldane, 1924) [di scarsa importanza in zootecnia]: i discendenti di un certo
accoppiamento possono avere nel complesso una diversa viabilità in relazione al genotipo di
ciascun componente della famiglia.
Che cosa è la fitness? Abbiamo visto che si compone di fertilità e viabilità. Possiamo tentare di
definirla in maniera assoluta o in maniera relativa.
In termini assoluti, la fitness di un genotipo potrebbe essere definita come il numero medio di figli nati
vivi e vitali nella carriera riproduttiva di un individuo caratterizzato da quel genotipo: ad esempio, se
64
in una popolazione da 100 omozigoti recessivi ad un locus biallelico nascono 200 individui, la fitness è
200/100=2. Esistono però alcuni problemi nel definire la fitness in questi termini: ad esempio, l'allele
recessivo potrebbe essere "dannoso" rispetto al dominante, ma dall'esempio illustrato ciò non si
capisce; inoltre se il carattere è raro è difficile avere un campione sufficientemente ampio; la fitness
dipenderebbe non solo dal genotipo esaminato ma anche dai possibili accoppiamenti (ad esempio, per
+
il fattore Rh ed Rh nell'uomo): in tal caso la fitness varierebbe anche al variare delle frequenze
geniche; alcuni caratteri potrebbero essere evidenti solo nella vita adulta.
Una migliore definizione, sempre in termini assoluti, di fitness di un genotipo è dato dal numero medio
di figli per gli individui con quel determinato genotipo, prendendo in considerazione la generazione
parentale e quella filiale nella stessa fase di sviluppo. Con questa definizione si tiene conto sia della
fertilità che della viabilità del genotipo.
La fitness relativa di un genotipo in una popolazione è una grandezza proporzionale al numero medio
di figli che tale genotipo produce e che contribuiscono alla generazione successiva: per rendere
proporzionale la fitness si confrontano le differenti fitness dei genotipi presenti nella popolazione.
Ad esempio:
GENOTIPO
AA
Aa
aa
-----------------------------------------------------------fitness assoluta
5
3
2
fitness relativa
2,5
1,5
1
(dando valore unitario alla fitness più bassa)
fitness relativa
0,5
0,3
0,2
(la somma totale delle fitness è 1)
fitness relativa
1
0,6
0,4
(dando valore unitario alla fitness più elevata)
Per esprimere la fitness relativa si utilizza in genere l'ultimo metodo, si dà cioè valore 1 alla fitness più
elevata: ciò non deve però essere inteso come assenza di selezione per tale genotipo (nel nostro caso
AA), ma indica solamente che quello è il genotipo con la massima capacità riproduttiva. I genotipi con
fitness inferiore ad 1 hanno un coefficiente di selezione (anch'esso relativo), pari ad 1-fitness. La
fitness viene generalmente indicata con w, il coefficiente di selezione con s.
Nell'esempio, i coefficienti di selezione per l'eterozigote e l'omozigote recessivo sono:
sAa
=
1-0,6 =
0,4
saa
=
1-0,4 =
0,6
E' ovvio che potremmo anche esprimere la fitness come 1-s, cioè nel nostro caso:
wAA =
1-sAA =
1-0
=
1
wAa =
1-sAa =
1-0,4 =
0,6
waa
=
1-saa =
1-0,6 =
0,4
Nel caso in cui l'eterozigote ha una fitness minore di entrambi gli omozigoti, la popolazione tende a
diventare omozigote per il gene con la maggior frequenza iniziale: teoricamente, nel caso le frequenze
di partenza siano uguali, la situazione è in equilibrio (con gli eterozigoti si elimina uno stesso numero
di alleli A ed a, per cui se gli alleli hanno uguale frequenza si elimina anche un'identica frazione di
geni A ed a, lasciando così invariate le frequenze), ma ovviamente anche un minimo effetto delle
deriva genetica porta ad uno squilibrio che, per quanto piccolo, è l'inizio della tendenza alla fissazione
del gene più frequente. Se un allele è incondizionatamente vantaggioso (cioè l'animale omozigote per
questo gene ha una maggiore fitness dell'animale omozigote per l'altro allele, indipendentemente dal
fatto che la fitness dell'eterozigote sia come quella dell'uno o dell'altro omozigote) tende a fissarsi nella
popolazione; viceversa, se un allele è incondizionatamente svantaggioso (cioè l'animale omozigote per
questo gene ha una minore fitness dell'animale omozigote per l'altro allele, indipendentemente dal fatto
che la fitness dell'eterozigote sia come quella dell'uno o dell'altro omozigote) tende a scomparire dalla
popolazione (ovvero è l'altro allele che tende a fissarsi).
Un caso più complesso è il polimorfismo bilanciato o vantaggio dell'eterozigote; un famoso esempio è
quello dell'anemia falciforme: un modello di equilibrio simile a questo è chiamato in causa anche in
65
numerose situazioni zootecniche (ad esempio, nascita di ovini a vello colorato). L'anemia falciforme è
dovuta ad un gene mutato S, codominante con il gene non mutato A, il quale codifica per una
particolare emoglobina in cui un aminoacido è sostituito da un altro: tale sostituzione provoca, a basse
tensioni di ossigeno, una particolare disposizione spaziale delle molecole di emoglobina all'interno
dell'eritrocita, il quale assume conseguentemente la caratteristica forma a falce che dà il nome alla
malattia. L'omozigote SS è affetto da una gravissima forma di anemia; l'eterozigote AS (o SA) ha una
forma subclinica di anemia, ed è riconoscibile per la presenza nello striscio di sangue di un certo
numero di forme eritrocitarie a falce; l'omozigote AA è l'individuo normale.
Date queste premesse, ci si dovrebbe aspettare che la selezione naturale abbia nel tempo abbassato la
frequenza q dell'allele S: gli individui SS infatti di regola non si riproducono; in alcune popolazioni
umane la frequenza dell'allele S risulta invece elevata. Una prima ipotesi potrebbe essere che la
frequenza dell'allele S, nonostante la selezione naturale, non diminuisce perché c'è una mutazione
ricorrente dell'allele A in S: tale ipotesi è però da scartare, sia perché la frequenza q è troppo elevata
per essere mantenuta da una mutazione, sia perché la mutazione stessa non è stata mai riscontrata in
analisi di gruppi familiari. L'osservazione che la frequenza dell'allele S nelle popolazioni umani è
proporzionale all'incidenza della malaria, nonché la maggior resistenza degli eterozigoti alla malaria
sia in infezioni sperimentali che naturali hanno portato all'ipotesi di una maggior fitness
dell'eterozigote rispetto al normale genotipo AA negli habitat dove la malaria è endemica: a favore di
tale ipotesi potrebbero esserci diverse basi fisiologiche, ad esempio l'eritrocita con emoglobina SA
potrebbe non essere un ambiente di vita adatto per il parassita, oppure l'organismo potrebbe meglio
individuare e neutralizzare il parassita con le proprie difese macrofagiche quando, alle basse tensioni
di ossigeno (come nei capillari), il globulo rosso tende a modificare la propria forma.
Nel modello esposto entrambi i genotipi omozigoti hanno una fitness inferiore a quella
dell'eterozigote; indichiamo con s1 il coefficiente selettivo dell'omozigote AA e con s2 il coefficiente
selettivo contro l'omozigote SS. Se q è la frequenza dell'allele S in una generazione, quale sarà la
frequenza q1 dello stesso allele nella generazione successiva?
GENOTIPO ¦
AA
AS
SS
---------------------------------------------------------------------fitness
¦
1-s1
1
1-s2
q1=
q²(1-s2)+pq
--------------1-s1p²-s2q²
e poiché p=1-q si ha
q1=
q²(1-s2)+q(1-q)
------------------1-s1p²-s2q²
=
q²-q²s2+q-q²
----------------1-s1p²-s2q²
=
q-q²s2
------------1-s1p²-s2q²
Avendo calcolato la frequenza dell'allele S nella nuova generazione, è anche possibile calcolare la
differenza di frequenza dell'allele stesso fra le due generazioni:
q
=
q1-q
=
q-s2q²
-------------- - q
1-s1p²-s2q²
=
q-s2q²-q(1-s1p²-s2q²)
-------------------------- =
1-s1p²-s2q²
66
3
=
q-s2q²-q+s1p²q+s2q
------------------------ =
1-s1p²-s2q²
q(-s2q+s1p²+s2q²)
----------------------1-s1p²-s2q²
=
q[s1p²+s2q(-1+q)]
--------------------1-s1p²-s2q²
poiché è q=1-p si ha
q
=
q[s1p²+s2q(-1+1-p)]
------------------------1-s1p²-s2q²
=
q(s1p²-s2qp)
-----------------1-s1p²-s2q²
pq(s1p-s2q)
=
-------------1-s1p²-s2q²
E' possibile anche calcolare delle frequenze di equilibrio, ovvero delle frequenze in cui q=0:
pq(s1p-s2q)
--------------- = 0
1-s1p²-s2q²
Una prima soluzione si ha quando pq=0, il che è possibile, essendo p+q=1, solo quando p=1 e q=0
oppure p=0 e q=1: in altri termini, quando il locus è fisso.
Una seconda soluzione si ha quando s1p-s2q=0, ovvero quando s1p=s2q, da cui si può ricavare
s1p=s2(1-p)
¦
¦
¦
¦
¦
s1p+s2p=s2
p=s2/(s1+s2)
s2q=s1(1-q)
s2q+s1q=s1
q=s1/(s1+s2)
Esistono dunque delle frequenze di equilibrio, ma vengono sempre raggiunte in un simile modello? Sì,
perché se la frequenza q è minore di quella di equilibrio, e conseguentemente p è maggiore, s 1p-s2q è
positivo, e quindi q è positivo, per cui la frequenza q aumenta e p diminuisce; se, al contrario, la
frequenza q è superiore a quella teorica all'equilibrio, e di conseguenza p è inferiore, s 1p-s2q è
negativo, e quindi q è negativo, per cui q diminuisce e p aumenta.
ESEMPIO
fitness
AA
=
AS
=
SS
=
1-1/9 =
1-0
=
1-1
=
8/9
1
0
frequenze all'equilibrio
p
=
1/(1+1/9)
=
q
=
(1/9)/(1+1/9) =
0,9
0,1
67
genotipi alla nascita con frequenze all'equilibrio (totale 100)
AA
=
100 p²
=
100(0,9)²
=
81
AS
=
100 2pq
=
200(0,9)(0,1) =
18
SS
=
100 q²
=
100(0,1)²
=
1
genotipi dopo la selezione
AA
=
81(8/9)
=
72
AS
=
18(1)
=
18
SS
=
1(0)
=
0
-------------------------------------------------totale
90
Si può controllare che le frequenze geniche dopo la selezione sono rimaste
uguali:
p
=
(72+18/2)/90
=
0,9
q
=
(18/2)/90
=
0,1
Invece, partendo da una frequenza dell'allele S inferiore a quella di equilibrio, la frequenza stessa
aumenta:
p
q
=
=
0,99
0,01
genotipi alla nascita (totale 10000)
AA
=
10000 p²
=
10000(0,99)²
AS
=
10000 2pq
=
20000(0,99)(0,01)
SS
=
10000 q²
=
10000(0,01)²
=
=
=
9801
198
1
genotipi dopo la selezione
AA
=
9801(8/9)
=
8712
AS
=
198(1)
=
198
SS
=
1(0)
=
0
----------------------------------------------------totale
8910
frequenze geniche dopo la selezione
p
=
(8712+198/2)/8910 =
q
=
(198/2)/8910
=
0,989
0,011
Al contrario, partendo da una frequenza dell'allele S superiore a quella di equilibrio, la frequenza si
riduce:
p
q
=
=
0,8
0,2
68
genotipi alla nascita (totale 100)
AA
=
100 p²
=
AS
=
100 2pq
=
SS
=
100 q²
=
100(0,8)²
200(0,8)(0,2)
100(0,2)²
=
=
=
64
32
4
genotipi dopo la selezione
AA
=
64(8/9)
=
56,889
AS
=
32(1)
=
32
SS
=
4(0)
=
0
------------------------------------------------------totale
88,889
frequenze geniche dopo la selezione
p
=
(56,889+32/2)/88,889 =
q
=
(32/2)/88,889
=
0,82
0,18
L'andamento delle frequenze geniche è dunque prevedibile; si può anche, al contrario, risalire al
numero di generazioni trascorse dalla comparsa della mutazione.
POLIMORFISMOBILANCIATO
FREQUENZA DI EQUILIBRIODELL'ALLELEA
1,0
F
R
E
Q
U
E
N
Z
A
,8
,6
,4
,2
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
FITNESSAA
fitness BB=0,2
fitness BB=0,6
fitness BB=0,4
fitness BB=0,8
Supponiamo ora di avere un campione di individui adulti, ricavato da una popolazione che si
presuppone aver ormai raggiunto l'equilibrio: come si calcolano i valori di fitness?
Essendo la popolazione in equilibrio, le frequenze alla nascita dovrebbero essere come quelle negli
adulti: possiamo allora calcolare le frequenze geniche e da queste le frequenze genotipiche attese
secondo la legge di Hardy-Weinberg; la fitness relativa viene calcolata in base ai rapporti fra frequenze
osservate ed attese, espressi in proporzione al valore più elevato.
ESEMPIO
Frequenze genotipiche negli adulti (totale 12387)
AA
=
9365
AS
=
2993
SS
=
29
Frequenze geniche di equilibrio
p
=
(9365+2993/2)/12387
q
=
(29+2993/2)/12387
=
=
0,877
0,123
69
Frequenze attese secondo Hardy-Weinberg
AA
=
12387 p²
=
9527,2
AS
=
12387 2pq
=
2672,4
SS
=
12387 q²
=
187,4
Rapporti fra frequenze osservate ed attese
AA
=
9365/9527,2
=
0,983
AS
=
2993/2672,4
=
1,12
SS
=
29/187,4
=
0,155
Fitness
AA
=
AS
=
SS
=
0,983/1,12
1,12/1,12
0,155/1,12
=
=
=
0,878
1
0,138
Se le frequenze non sono in equilibrio per il calcolo della fitness occorrono due campioni, uno relativo
alla popolazione prima della selezione ed uno relativo alla popolazione dopo l'azione della forza
selettiva: la fitness relativa può essere espressa dal rapporto fra la frequenza genotipica nella
popolazione dopo la selezione e la frequenza genotipica nella popolazione non ancora selezionata,
sempre in proporzione al genotipo che ha la fitness più elevata.
ESEMPIO
Campione prima della selezione, ovvero nati (totale 287)
AA
=
189
AS
=
89
SS
=
9
Campione dopo la selezione, ovvero adulti (totale 654)
AA
=
400
AS
=
249
SS
=
5
Frequenze genotipiche dei neonati
AA
=
189/287
=
AS
=
89/287
=
SS
0,6585
0,3101
=
9/287
=
0,0314
Frequenze genotipiche degli adulti
AA
=
400/654
=
0,6116
AS
=
249/654
=
0,3807
SS
=
5/654
=
0,0076
Rapporti fra le frequenze genotipiche
AA
=
0,6116/0,6585 =
0,9288
AS
=
0,3807/0,3101 =
1,2277
SS
=
0,0076/0,0314 =
0,2420
70
Fitness
AA
=
AS
=
SS
=
0,9288/1,2277 =
1,2277/1,2277 =
0,2420/1,2277 =
0,7565
1
0,1971
E' possibile notare che la frequenza dell'allele S nei due campioni è diversa, a conferma del probabile
non equilibrio:
q(neonati)
q(adulti)
=
=
(9+89/2)/287 =
(5+249/2)/654 =
0,1864
0,1980
La frequenza di equilibrio è (1-0,7565)/[(1-0,7565)+(1-0,1971)]=0,2327
Più semplice nel calcolo è:
Rapporti fra le osservazioni
AA
=
400/189
=
AS
=
249/89
=
SS
=
5/9
=
2,1164
2,7978
0,5556
Fitness
AA
=
AS
=
SS
=
0,7565
1
0,1986
2,1164/2,7978 =
2,7978/2,7978 =
0,5556/2,7978 =
Le differenze rispetto ai valori calcolati in precedenza sono dovute agli arrotondamenti, in quanto i due
metodi sono matematicamente equivalenti:
Fitness
AA
=
AS
=
SS
=
[(400/654)/(189/287)] / [(249/654)/(89/287)] = (400/189) / (249/89)
[(249/654)/(89/287)] / [(249/654)/(89/287)] = 1
[(5/654)/(9/287)] / [(249/654)/(89/287)] = (5/9) / (249/89)
Se non si fossero campionati i neonati e si fosse utilizzato il metodo precedentemente applicato per una
popolazione in equilibrio si sarebbe giunti a conclusioni errate, come dimostrano i calcoli seguenti:
Frequenze osservate negli adulti (totale 654)
AA
AS
=
249
SS
=
5
Frequenze attese
AA
=
654 p²
AS
=
654 2pq
SS
=
654 q²
=
=
=
=
400
654 (0,80199)²
1308 (0,80199)(0,19801)
654 (0,19801)²
=
=
420,64
207,71
=
25,64
71
Rapporto fra frequenze osservate ed attese
AA
=
400/420,64 =
0,95093
AS
=
249/207,71 =
1,19879
SS
=
5/25,64
=
0,19501
Fitness
AA
=
AS
=
SS
=
0,95093/1,19879
1,19879/1,19879
0,19501/1,19879
=
=
=
0,79324
1
0,16267
Il modello con vantaggio selettivo dell'eterozigote viene anche indicato come superdominanza: si
intende in tal modo dire che l'eterozigote domina, relativamente alla fitness, su entrambi gli omozigoti;
attenzione a non confondere fitness e carattere: è ovvio che, riguardando la fitness il fenotipo, essa è
influenzata dal tipo di eredità, cioè da come il genotipo si esprime nel fenotipo (cioè dal fatto che i due
alleli abbiano rapporti di dominanza e recessività completa, A>a, oppure di codominanza, A=B, e dalla
penetranza nell'eterozigote). Non confondere, ad esempio, un eterozigote con superdominanza intesa in
senso mendeliano, come una maggior quantità del carattere (che, se svantaggioso, potrebbe dare minor
fitness), con la superdominanza intesa come maggior fitness dell'eterozigote: fare quindi attenzione,
nelle successive figure, alla differente simbologia Aa e AB. Il vantaggio selettivo dell'eterozigote è un
modello frequentemente utilizzato in zootecnia per spiegare alcune situazioni particolari (nascita di
agnelli a vello colorato, insorgenza della resistenza a rodenticidi o insetticidi).
Relativamente alla fitness dell'eterozigote possiamo ipotizzare, oltre alla superdominanza in cui
l'eterozigote ha fitness relativa 1 ed i due omozigoti sono soggetti a due coefficienti selettivi s1 e s2,
altre quattro possibilità: la dominanza completa, l'assenza di dominanza, la dominanza parziale e la
sottodominanza. Nella dominanza completa l'eterozigote ha la stessa fitness di un omozigote: la
selezione si ha solo contro un omozigote oppure nella stessa misura contro un omozigote e
l'eterozigote; nell'assenza di dominanza la fitness dell'eterozigote è la media delle fitness dei due
omozigoti (ovvero il coefficiente selettivo dell'eterozigote è la metà di quello dell'omozigote
sfavorito); nella dominanza parziale la fitness dell'eterozigote è intermedia fra quella dei due
omozigoti (ma non è la media delle due fitness): è in genere più vicina alla fitness dell'omozigote
"dominante", ovvero di quello che ha fitness 1, (la cui fitness penetra appunto parzialmente
nell'eterozigote); nella sottodominanza la fitness dell'eterozigote è inferiore alla fitness di entrambi gli
omozigoti (che hanno in genere entrambi fitness 1).
SUPERDOMINANZA
0
fitness
1
|-------------------------------------------------------------------------------------------------------|
BB
AA
AB
0
fitness
1
|-------------------------------------------------------------------------------------------------------|
AA
AB
BB
72
DOMINANZA COMPLETA
0
fitness
1
|-------------------------------------------------------------------------------------------------------|
aa
AA
Aa
0
fitness
1
|-------------------------------------------------------------------------------------------------------|
AA
aa
Aa
ASSENZA DI DOMINANZA
0
fitness
1
|-------------------------------------------------------------------------------------------------------|
BB
AB
AA
AB ha carattere intermedio oppure A>B con penetranza 50%
DOMINANZA PARZIALE
0
fitness
1
|-------------------------------------------------------------------------------------------------------|
BB
AB
AA
I caso: AB ha carattere più simile ad AA che a BB
II caso: A>B ma con penetranza parziale
Solo nel secondo caso è possibile avere:
0
fitness
1
|-------------------------------------------------------------------------------------------------------|
BB
AB
AA
SOTTODOMINANZA
0
fitness
1
|-------------------------------------------------------------------------------------------------------|
AB
BB
AA
0
fitness
1
|-------------------------------------------------------------------------------------------------------|
AB
AA
BB
Come già illustrato per la superdominanza (vantaggio selettivo per l'eterozigote), anche per la
dominanza completa, la assenza di dominanza, la dominanza parziale e la sottodominanza si
potrebbero calcolare le frequenze geniche nelle successive generazioni: si tratta comunque di tutte
situazioni che portano, a differenza del vantaggio selettivo per l'eterozigote, alla fissazione di un allele
(l'allele favorito nei casi di dominanza completa, dominanza parziale ed assenza di dominanza, oppure
l'allele più frequente nel caso di sottodominanza con omozigoti di fitness 1).
73
Poiché con la sola eccezione della superdominanza l'esito finale della selezione è la fissazione del
locus, l'interesse non è tanto nel calcolo delle frequenze di equilibrio e del tempo necessario per
raggiungere l'equilibrio, come appunto nel caso della superdominanza, bensì nel calcolo del tempo
necessario per raggiungere la fissazione.
Ad esempio, supponiamo di selezionare contro un omozigote recessivo:
genotipo
frequenza iniziale
coefficiente selettivo
fitness
contributo gametico
AA
p²
0
1
p²
Aa
2pq
0
1
2pq
aa
q²
s
1-s
q²(1-s)
(totale = 1)
(totale = 1-sq²)
Le frequenze genica dell'allele recessivo nella successiva è pertanto:
q1 =
q²(1-s) + pq
---------------1-sq²
da cui, poiché p=1-q, si ricava:
q - q²s
q1 = ----------1-sq²
La differenza nelle frequenze geniche fra due generazioni successive è:
q =
q1 - q = -sq²(1-q)/(1-sq²)
Supponiamo che degli omozigoti recessivi aa siano stati favoriti dalla selezione naturale perché meglio
mimetizzati, e che l'allele a abbia raggiunto una frequenza di 0,8; con il cambio di stagione, le
modifiche del paesaggio rendono però gli animali aa sfavoriti, perché più visibili ai predatori, e lo
svantaggio è pari ad una fitness 0,5: come si modificheranno le frequenze nelle due generazioni
successive?
q1 =
q - q²s
0,8 - 0,8² (0,5)
0,48
------------ = ------------------------- = ------1-sq²
1 - 0,8² (0,5)
0,68
q2 =
q1 - q1²s
------------1-sq1²
= 0,70588
0,70588 - 0,70588² (0,5)
= ------------------------------- = 0,60829
1 - 0,70588² (0,5)
Infatti:
AA
Aa
aa
= p² = (1-0,8)²
= 2pq = 2 (1-0,8) (0,8)
= q² = 0,8²
= 0,04
= 0,32
= 0,64
74
¦
AA
Aa
aa
¦
0,04
0,32
0,64
------------------------------------------------------------------------AA
0,04 ¦
0,0016
0,0128
0,0256
Aa
0,32 ¦
0,0128
0,1024
0,2048
aa
0,64 ¦
0,0256
0,2048
0,4096
AA
Aa
aa
= 0,0016 + 0,0064 + 0,0064 + 0,0256
= 0,0064 + 0,0256 + 0,0064 + 0,0512 + 0,1024 + 0,0256 + 0,1024
= 0,0256 + 0,1024 + 0,1024 + 0,4096
= 0,04
= 0,32
= 0,64
Azione della selezione:
AA
=
0,04
Aa
=
0,32
aa
= 0,64 (0,5) = 0,32
--------------------------------TOTALE
0,68
f(A) = [0,04 + ½ (0,32)] / 0,68 = 0,29412
f(a) = [0,32 + ½ (0,32)] / 0,68 = 0,70588
Trasformiamo le frequenze e calcoliamo la generazione successiva:
AA = 0,04 / 0,68 = 0,05882
Aa = 0,32 / 0,68 = 0,47059
aa = 0,32 / 0,68 = 0,47059
¦
AA
Aa
aa
¦
0,05882
0,47059
0,47059
-----------------------------------------------------------------------------------------------------AA
0,05882
¦
0,00346
0,02768
0,02768
Aa
0,47059
¦
0,02768
0,22145
0,22145
aa
0,47059
¦
0,02768
0,22145
0,22145
AA = 0,00346 + 0,01384 + 0,01384 + 0,05536
= 0,0865
Aa = 0,01384 + 0,02768 + 0,01384 + 0,11073 + 0,11073 + 0,02768 + 0,11073 = 0,41523
aa = 0,05536 + 0,11073 + 0,11073 + 0,22145
= 0,49827
Le frequenze sono ancora:
f(A) = 0,0865 + ½ 0,41523 = 0,29412
f(a) = 0,49827 + ½ 0,41523 = 0,70589
Ma dopo l'azione della selezione:
AA =
0,0865
Aa =
0,41523
aa = 0,49827 (0,5) = 0,24914
-------------------------------------TOTALE
0,75087
f(A) = [0,0865 + ½ (0,41523)] / 0,75087 = 0,39170
f(a) = [0,24914 + ½ (0,41523)] / 0,75087 = 0,60830
(le leggere differenze sono dovute agli arrotondamenti)
75
Controlliamo le differenze delle frequenze fra una generazione e la successiva:
q =
q1 - q = -sq²(1-q)/(1-sq²) = -0,8² (0,5) (1 - 0,8) / (1 - 0,8² x 0,5) = 0,09412
q = q2-q1 = -sq1²(1-q1)/(1-sq1²) = -0,70588²(0,5)(1-0,70588)/(1-0,70588² x 0,5) = 0,09759
ed infatti 0,70588-0,8 = -0,09412 ed ancora 0,60829-0,70588= -0,09759.
Nel caso la selezione artificiale contro l'omozigote recessivo sia totale (o sia totale la selezione
naturale contro questo genotipo, come nel caso di un gene recessivo letale), si ha s=1, per cui nella
prima generazione:
q1 =
q - q²
---------- =
1-q²
q
------1+q
nella seconda generazione:
q1
q2 = -----1+q1
e sostituendo nella formula di q2 il valore già trovato per q1 si ha:
q
q2 = -----1+2q
La frequenza alla generazione t è analogamente:
qt =
q
-----1+tq
da cui si ricava:
q-qt
t = ------- = (1/qt) - (1/q)
q qt
Ad esempio, quante generazioni di selezione totale contro l'omozigote recessivo occorrono per
dimezzare la frequenza 1/20000 di un genotipo omozigote recessivo?
½
½
q = (1/20000) = (0,00005) = 0,00707
½
½
qt = (1/40000) = (0,000025) = 0,005
t = 1/0,005 - 1/0,00707 = 200 - 141 = 59
In generale, poiché i cambiamenti delle frequenze geniche dipendono non solo dall'intensità di
selezione, ma anche dalle frequenze geniche iniziali, la selezione è efficace soprattutto quando q ha
frequenze "medie", mentre frequenze di q molto elevate o molto basse riducono l'effetto della
selezione. Nel caso della selezione contro un omozigote recessivo, quando questo è poco frequente la
selezione è particolarmente inefficace, perché il gene è presente principalmente negli eterozigoti.
76
EFFETTODELLASELEZIONE
SELEZIONECONTROL'OMOZIGOTERECESSIVO
1,0
F
R
E
Q
U
E
N
Z
A
D
I
a
,9
,8
,7
,6
,5
,4
,3
,2
,1
0,0
100 GENERAZIONI DI SELEZIONE
fitness aa=0
fitness aa=0,6
fitness aa=0,2
fitness aa=0,8
fitness aa=0,4
Come si può spiegare biologicamente il vantaggio selettivo dell'eterozigote? Potrebbe trattarsi di
pleiotropia (cioè il gene influisce su due aspetti, come dimostrato nell'uomo per un allele S che in
doppia dose causa l'anemia falciforme ma in eterozigosi conferisce resistenza alla malaria), oppure di
una stretta associazione fra due geni (che noi confondiamo in uno solo), oppure avere una spiegazione
molecolare, cioè da due codici genetici diversi derivano due proteine che, nel caso di isoenzimi,
potrebbero avere complessivamente una adattabilità superiore.
L'assenza di dominanza è una situazione rara. La dominanza completa è una situazione molto
frequente, caratteristica ad esempio di molte malattie metaboliche: il problema è proprio nella
difficoltà ad individuare gli eterozigoti (portatori di malattie neonatali monofattoriali); nella
dominanza completa è difficile selezionare per il dominante se l'eterozigote ha la stessa fitness del
dominante (ci si trascina dietro l'eterozigote, proprio perché non c'è selezione contro di esso), mentre
selezionare per il dominante è facile se l'eterozigote ha la stessa fitness dell'omozigote recessivo (la
selezione è infatti di pari intensità contro l'omozigote recessivo e l'eterozigote): nella selezione
artificiale il problema si potrebbe risolvere se il gene fosse codominante (si potrebbero identificare gli
eterozigoti e decidere se sottoporli o meno a selezione). Ad esempio, nei caprini l'assenza di corna è un
carattere dominante, pleiotropico con aspetti dell'apparato genitale sia maschile che femminile in grado
di causare ipofertilità o addirittura sterilità, dovuti ad alterazioni dell'epididimo nei maschi e
pseudoermafroditismo nelle femmine.
Il carico genetico è una misura che fa riferimento non al singolo genotipo ma a tutti i possibili genotipi
ad un determinato locus e definisce il valore ottimale di riproduzione del locus stesso. Il carico
genetico è la diminuzione relativa della fitness media di una popolazione rispetto alla fitness che si
avrebbe qualora tutti gli individui della popolazione stessa avessero il genotipo con la massima
fitness; per diminuzione relativa si intende che la diminuzione è rapportata alla fitness massima.
wmassima - wmedia
carico genetico = ------------------------wmassima
Se per convenzione diamo valore 1 alla fitness massima, il carico genetico è pari a 1-wmedia: tale
formula rappresenta chiaramente la misura in cui una popolazione si discosta da una costituzione
genetica "perfetta".
Il carico genetico misura quanti individui in una popolazione sono destinati ad una "morte genetica". Il
carico genetico può essere, anche in una popolazione in equilibrio, mantenuto da diverse situazioni, fra
77
le quali le più semplici sono il carico genetico da mutazione ed il carico genetico da segregazione (o
bilanciato). Nel carico genetico da mutazione l'equilibrio è mantenuto da una mutazione ricorrente
sfavorevole, la quale comporta la "morte genetica" di un certo numero di individui; anche una
mutazione favorevole è però in grado di generare una carico genetico "di transizione", perché la
mutazione favorevole va a sostituire degli alleli, un tempo vantaggiosi, divenuti svantaggiosi proprio
per la comparsa della mutazione più favorita (il carico è detto "di transizione" perché esiste solo fino a
quando l'allele favorevole non si fissa). Il carico genetico da segregazione è anche detto carico
bilanciato, e riguarda quei loci in cui l'equilibrio è mantenuto dal vantaggio selettivo dell'eterozigote;
in questo caso è pari a (s1 s2)/(s1+s2), in quanto:
frequenza iniziale
fitness
frequenza dopo la selezione
AA
p²
1-s1
p² (1-s1)
Aa
2pq
1
2pq
aa
q²
1-s2
q² (1-s2)
Il carico genetico è:
p²s1 + q²s2
e sostituendo a p e q le rispettive frequenze all'equilibrio si ha:
[s2/(s1+s2)]²s1 + [s1/(s1+s2)]² s2 = (s2²s1+s1²s2)/(s1+s2)² =
= s2s1(s2+s1)/(s1+s2)² = s2s1/(s1+s2)
Nella popolazione utilizzata come esempio per mostrare l'equilibrio genetico nel caso dell'anemia
falciforme era:
genotipo
AA
AS
SS
fitness
0,878
1
0,138
coefficiente selettivo
0,122
0
0,862
In base a questi dati è possibile calcolare il carico genetico:
carico genetico = (0,122)(0,862)/(0,122+0,862) = 0,107
Se ne deduce che il 10,7% degli individui è destinato ad una "morte genetica"; infatti a partire dalle
frequenze di equilibrio:
p = 0,877
q = 0,123
frequenze genotipiche alla nascita (su 100 nati):
AA
= 100 p²
= 76,9
AS
= 200 pq
= 21,6
SS
= 100 q²
= 1,5
78
frequenze genotipiche alla riproduzione (ovvero nati x fitness):
AA
= 76,9 (0,878)
= 67,5
AS
= 21,6 (1)
= 21,6
SS
= 1,5 (0,138)
= 0,2
--------Totale 89,3
Carico genetico = 100-89,3 = 10,7%
Le altre tre forze che, oltre alla selezione, concorrono a far variare le frequenze geniche, e cioè
mutazioni, migrazioni e deriva genetica, non possiedono la stessa potenza della selezione.
LE MUTAZIONI.
Le mutazioni, pur essendo fortuite, possono sotto certi aspetti agire sistematicamente, e quindi essere
prevedibili in forza e direzione. Tutti i loci possono teoricamente mutare: piccole variazioni delle
frequenze geniche richiedono però moltissime generazioni. La mutazione è una variazione, spesso
puntiforme, della sequenza del DNA: è una variazione strutturale a cui può, a volte, conseguire la
variazione funzionale del gene.
Le mutazioni possono essere distinte in ricorrenti e non ricorrenti. Le mutazioni ricorrenti (ad
esempio l'albinismo) sono quelle che interessano un determinato locus ad ogni generazione e con un
-5
tasso di mutazione fisso (in genere nell'ordine di 10 ). Le mutazioni non ricorrenti sono quelle che
compaiono fortuitamente senza essere associate ad un tasso di mutazione determinato, per cui la
possibilità di ritrovare l'allele mutato nella generazione successiva dipende praticamente solo
dall'eventuale riproduzione di individui mutati (ad esempio, una razza statunitense di pecore senza
coda, l'acondroplasia Ancon delle pecore, molte malattie monofattoriali); una mutazione non ricorrente
ha elevatissima probabilità di essere persa nel corso delle generazioni, e quindi di non riuscire a
modificare le frequenze geniche.
Calcolare un tasso di mutazione, proprio a causa della bassa frequenza dell'evento, è molto difficile.
Nell'uomo si stima che ad ogni generazione si verifichino circa 8 mutazioni.
Le mutazioni ricorrenti possono essere ulteriormente distinte in mutazioni dirette e mutazioni inverse:
u = tasso di mutazione diretto (A1 diventa A2)
v = tasso di mutazione inverso (A2 diventa A1)
In presenza della sola mutazione diretta, partendo da una frequenza p la frequenza nella generazione
n
successiva è p(1-u) e, dopo n generazioni, p(1-u) .
Se esiste anche la mutazione inversa, partendo dalla frequenza p nella generazione successiva si avrà:
p1 = p - up + vq
da cui si ricava:
p = p1 - p = p - up + vq -p = vq -up
All'equilibrio non si ha variazione di frequenze geniche, per cui da vq - up = 0 si possono ricavare le
frequenze all'equilibrio:
p= v/(u+v)
q= u/(u+v)
Ad esempio, con i seguenti tassi di mutazione:
-5
-6
u = 10
v = 10
le frequenze di equilibrio sono:
-5
10
1
qe = ---------------------------- = ------------- = 10/11 = 0,9091
79
-5
-6
10 + 10
1 + 1/10
-6
10
1/10
pe = ---------------------------- = ------------- = 1/11 = 0,0909
-5
-6
10 + 10
1 + 1/10
Infatti:
-5
-6
-5
-5
p0 = 1/11
p1 = 1/11 - 10 1/11 + 10 10/11 = 1/11 - 10 /11 + 10 /11 = 1/11
q0 = 10/11
q1 = 10/11 + 10 1/11 - 10 10/11 = 10/11 + 10 /11 - 10 /11 = 10/11
-5
-6
-5
-5
In maniera analoga a quanto fatto per l'equilibrio da vantaggio selettivo per l'eterozigote, anche nel
caso di mutazione diretta ed inversa si può dimostrare che l'equilibrio non solo esiste, ma viene
effettivamente raggiunto indipendentemente dalle frequenze iniziali: inoltre, a differenza di quanto
accade per la superdominanza, se anche il locus fosse inizialmente monomorfo, la possibilità di
mutazioni in entrambi i versi porterebbe comunque alla presenza di due alleli, che raggiungerebbero
poi nel tempo l'equilibrio.
Se q0 < qe, e quindi p0 > pe, allora:
q1 = q0 + up0 - vq0
e
p1 = p0 - up0 + vq0
e
p1 < p0
da cui, poiché up0 > vq0, si ricava:
q1 > q0
Utilizzando per un nuovo esempio gli stessi tassi di mutazione dell'esempio precedente e le frequenze
iniziali:
q0 = 0,8
p0 = 0,2
si ha:
q1 = q0 + up0 - vq0 = 0,8 + 0,00001 x 0,2 - 0,000001 x 0,8 = 0,8000012
p1 = p0 - up0 + vq0 = 0,2 - 0,00001 x 0,2 + 0,000001 x 0,8 = 0,1999988
Invece, se q0 > qe, e quindi p0 < pe, si ha:
q1 = q0 + up0 - vq0
e
p1 = p0 - up0 + vq0
e
p1 > p0
da cui, poiché up0 < vq0, si ricava:
q1 < q0
Ad esempio, utilizzando ancora una volta i tassi di mutazione
-5
u = 10
-6
v = 10
80
e le seguenti frequenze iniziali:
q0 = 0,05
p0 = 0,95
si ha:
q1 = q0 + up0 - vq0 = 0,05 + 0,00001 x 0,95 - 0,000001 x 0,05 = 0,05000945
p1 = p0 - up0 + vq0 = 0,95 - 0,00001 x 0,95 + 0,000001 x 0,05 = 0,94999055
Ricordiamo ancora che gli spostamenti nelle frequenze geniche dovuti alle mutazioni sono
generalmente molto più lenti di quelli dovuti alla selezione.
LE MIGRAZIONI.
La migrazione è una forza sistematica; per migrazione si intende, in senso pratico, lo spostamento di
riproduttori da una popolazione ad un'altra (dalla popolazione che immigra alla popolazione ricevente);
in senso teorico per migrazione si intende un flusso genico da una popolazione ad un'altra: per avere il
flusso genico occorre che gli individui si riproducano, e pertanto la definizione teorica e quella pratica
vengono a coincidere. Le frequenze geniche che mutano sono essenzialmente quelle della popolazione
ricevente.
Per la migrazione bisogna considerare due aspetti:
1 - numerosità e struttura genetica della sottopopolazione immigrante;
2 - la differenza di frequenze geniche fra sottopopolazione immigrante e popolazione ricevente.
Se non ci sono differenze nelle frequenze geniche fra la sottopopolazione che immigra e la
popolazione ricevente le frequenze geniche non cambiano. Se in una popolazione non arrivano nuovi
riproduttori per migrazione è più probabile che l'effetto della deriva genetica sia importante.
Per spiegare la migrazione si farà uso del modello più semplice possibile, in cui:
1 - all'immigrazione consegue la possibilità riproduttiva fra immigrati e popolazione ricevente;
2 - emigrano in uguale misura maschi e femmine;
3 - emigra un campione casuale, rappresentativo della popolazione.
E' comunque difficile che queste tre condizioni siano contemporaneamente rispettate: ad esempio, alle
migrazioni umane seguono spesso barriere culturali che ostacolano la riproduzione fra immigrati e
popolazione ricevente.
POPOLAZIONE I
f(A)=pI
POPOLAZIONE R
f(A)=p0
sia m il tasso di migrazione nei due sessi; nella popolazione R, dopo la migrazione, a determinare p1.
cioè la frequenza dell'allele A saranno due componenti: la frazione m di animali immigrati e la frazione
1-m della popolazione ricevente, con le rispettive frequenze dell'allele, e cioè pI e p0.
p1 = m pI + (1-m) p0 = p0 + m (pI-p0)
La frequenza di A dopo la migrazione è dunque la media delle frequenze di A nella popolazione
immigrata ed in quella ricevente, ponderate per la relativa numerosità [mp I+(1-m)p0]: dipende dalla
frequenza della popolazione ricevente, dal tasso di migrazione e dalla differenza nelle frequenze
geniche fra sottopopolazione immigrata e popolazione ricevente [p0 + m (pI-p0)].
81
La differenza tra le frequenze geniche prima e dopo la migrazione dipende solo dal tasso di migrazione
e dalla differenza di frequenze geniche fra sottopopolazione immigrata e popolazione ricevente (non
dipende cioè dalla frequenza né della sottopopolazione immigrata né della popolazione ricevente);
infatti:
p = p1 - p0 = m (pI-p0)
Perché ci sia una variazione delle frequenze geniche la sottopopolazione immigrata e la popolazione
ricevente debbono avere frequenze diverse.
Se la migrazione interessa solo animali di un sesso (ad esempio solo i maschi), il tasso di migrazione
globale per i due sessi è m/2, per cui:
p1 = p0 + m/2 (pI-p0)
Invece che rispetto alla popolazione ricevente, la differenza di frequenze geniche può essere indicata
rispetto alla popolazione immigrante:
pi
= p1 - pi = pr + m (pi - pr) - pi = pr(1-m) - pi(1-m) = (1-m)(pr-pi)
Si può dimostrare che, dopo n generazioni, la differenza di frequenze geniche fra la popolazione
immigrata e la popolazione immigrante è:
n
pi = pn - pi = (1-m) (pr-pi)
da cui si ricava la frequenza genica della popolazione immigrata dopo n generazioni:
n
pn = (1-m) (pr-pi) + pi
Ad esempio, in una popolazione la frequenza di un allele è 0,1: se, con un tasso di migrazione del
10%, immigra un'altra popolazione, nella quale lo stesso allele ha frequenza 1, quale sarà la frequenza
della popolazione immigrata dopo 4 generazioni di immigrazione?
m = 0,1
n=4
pr = 0,1
pi = 1
n
pn = (1-m) (pr-pi) + pi
4
p4 = (1-0,1) (0,1-1) + 1 = 0,6561 (-0,9) + 1 = 0,40951
In genere, se il tasso di migrazione è basso, la migrazione non ha un evidente impatto genetico nella
popolazione ricevente (a meno che non sia accompagnata da un'appropriata selezione): il ripetersi di
successive migrazioni può comunque portare a cambiamenti rapidi, come dimostra la tabella seguente.
82
f(A) NELLA POPOLAZIONE R
TASSO DI MIGRAZIONE (m)
0,5
0,1
0,01
frequenza iniziale
gen. 1
gen. 2
gen. 3
...
gen. 5
...
gen. 10
gen. 20
gen. 50
gen. 100
0
0
0
0,50
0,75
0,87
...
0,97
...
1,00
1,00
1,00
1,00
0,10
0,19
0,27
...
0,41
...
0,65
0,88
1,00
1,00
0,01
0,02
0,03
...
0,05
...
0,10
0,18
0,40
0,63
La migrazione di animali di un solo sesso è molto frequente: quasi sempre si fanno immigrare dei
maschi; è un modello di incrocio, in cui alla immigrazione dei nuovi maschi consegue però la mancata
riproduzione di maschi della popolazione ricevente. Incrociando tori di razze da carne con bovine
frisone si pratica una migrazione di soli maschi su sole femmine, senza un successivo atto riproduttivo
della generazione dei prodotti. Il caso più semplice è quello dell'incrocio di sostituzione, come nel caso
della sostituzione della razza bovina sarda con la bruna alpina: in 5-7 generazioni la sostituzione è da
ritenersi completata. E' addirittura possibile che una specie migri su un'altra specie (ibridazione
interspecifica): ad esempio, bovino con zebù, maiale con cinghiale; asino e cavalla producono il mulo,
ma il prodotto non è fertile, per cui non si può considerare questo incrocio un modello migratorio.
Nel modello migratorio la conoscenza delle frequenze di partenza è molto importante, ma in alcuni
casi non è possibile: ad esempio, ci si può trovare di fronte ad una popolazione in cui il mescolamento
è già avvenuto, senza che siano disponibili dati precedenti alla immigrazione; è possibile, conoscendo
le caratteristiche della popolazione immigrata, ricostruire la struttura genetica della popolazione
ricevente: si tratta di un modello zootecnico di erosione genetica; uno studio classico è quello delle
frequenze geniche nelle razze caprine giapponesi, erose dalla Saanen. L'erosione genetica sta
attualmente interessando le nostre popolazioni ovine (Gentile di Puglia e Sopravissana soprattutto).
Ad esempio, si è interessati a conoscere le frequenze geniche originarie di una popolazione che ha
subito un'immigrazione. Supponiamo che la popolazione immigrata presenti per un determinato allele
frequenza 0,4 e che la popolazione immigrante presenti invece per lo stesso allele frequenza 1; le
ricerche permettono di stimare il tasso di migrazione in 1% e, in base al rapporto fra il tempo trascorso
da quando è incominciata l'introduzione di animali della razza immigrante e l'intervallo di generazione
caratteristico della specie, in 20 il numero di generazioni per cui è avvenuta l'immigrazione. In base
alla formula
n
pn = (1-m) (pr-pi) + pi
ed essendo
n = 20
m = 0,01
pn = 0,4
pi = 1
si ha:
20
0,4 = (1 - 0,01) (pr - 1) + 1
83
0,4 = 0,81791 (pr - 1) + 1
da cui si ricava
pr = (0,4 - 1 +0,81791) / 0,81791 = 0,267
In altri casi è possibile stabilire le frequenze alleliche, oltre che della popolazione immigrante e della
popolazione immigrata, anche della originaria popolazione ricevente (o perché tali frequenze sono
state calcolate in precedenti studi o perché la popolazione si è conservata in purezza in alcune zone): si
può in questi casi, stimando come nell'esempio precedente il numero di generazioni in base al rapporto
fra tempo trascorso ed intervallo di generazione, calcolare il tasso di migrazione.
Ad esempio:
n = 10
pr = 0,65
pi = 1
pn = 0,88
Sostituendo i valori nella formula
n
pn - pi = (1-m) (pr-pi)
si ricava:
10
0,88 - 1 = (1-m) (0,65-1)
10
(1-m) = (0,88-1)/(0,65-1) = 0,34286
1/10
1-m = (0,34286)
1/10
m = 1 - (0,34286)
= 1 - 0,898 = 0,102
LA DERIVA GENETICA.
La deriva genetica (o drift o effetto Sewall Wright, dal nome dello scienziato che ne delineò
l'importanza) non è una forza sistematica, bensì è dispersiva; la deriva genetica casuale è un processo
per cui le frequenze geniche sono soggette a fluttuazioni dovute al caso: è strettamente legata alla
numerosità della popolazione. La deriva genetica si accompagna spesso ad altri tre processi dispersivi:
la suddivisione delle popolazioni naturali in sottopopolazioni molto differenziate, la diminuzione della
variabilità genetica delle piccole popolazioni, l'aumento della frequenza degli omozigoti a discapito
degli eterozigoti (in maniera particolare quando si tratta di consanguineità).
La conoscenza della deriva genetica è essenziale per lo studio delle piccole popolazioni, il cui
comportamento è diverso da quello delle popolazioni mendeliane, che sono teoricamente infinite.
L'evento più frequente alla nascita è che la generazione filiale abbia le stesse frequenze geniche dei
genitori, ovvero la frequenza attesa della generazione filiale è la frequenza della generazione parentale:
possono però verificarsi scostamenti dalle frequenze geniche attese, in entrambe le direzioni, con
probabilità ben precise; tali scostamenti sono in genere maggiori nelle popolazioni di minori
dimensioni; se infatti la popolazione è piccola, anche il numero dei gameti è piccolo e, ad ogni
generazione, il campione casuale che passa alla generazione successiva è affetto da fluttuazioni
aleatorie, il cui risultato è la impossibilità di prevedere la struttura genica della popolazione nel
passaggio da una generazione alla successiva.
La deriva genetica è un cambiamento di frequenze geniche casuale che tutte le popolazioni possono
84
seguire, indipendentemente dalla numerosità. Kidd e Cavalli Sforza studiarono i bovini norvegesi,
rimasti totalmente isolati da altre razze, ed i bovini islandesi, portati sull'isola dai Vichinghi norvegesi,
ed in seguito mai erosi da altre razze; utilizzando alcuni geni neutri (gruppi sanguigni ed altri
polimorfismi ematici), per i quali le variazioni di frequenza non possono essere imputate a fenomeni
selettivi, i due autori stabilirono la distanza genetica fra le due popolazioni, determinata dalla deriva
genetica: riuscirono anche a dimostrare che l'effetto dei fondatori era limitato. E' però difficile
distinguere con certezza, anche per geni neutri, che cosa è dovuto alla deriva genetica e che cosa è
dovuto alla selezione: secondo una teoria, nessun gene è neutro; i geni potrebbero essere distinti in
geni selettivamente attivi e geni selettivamente non attivi, i quali verrebbero selezionati passivamente
per associazione (linkage) con geni attivi: il fenomeno è detto "effetto autostop".
Nelle piccole popolazioni l'imparentamento fra gli animali porta alla consanguineità ed all'aumento
dell'omozigosi: alla fissazione porta anche la deriva genetica.
ESEMPIO DI EFFETTO DELLA DERIVA GENETICA
2 individui, un maschio ed una femmina, entrambi eterozigoti Aa
n=2
p = 0,5
differenti gameti prodotti: 2n = 4
q = 0,5
2n
promemoria: (p+q)
differenti combinazioni possibili: 2n+1 = 5
possibili combinazioni di r alleli A: (2n)! / [r! (2n-r)!]
r 2n-r
probabilità di ogni combinazione con r alleli A: p q
r 2n-r
probabilità di una frequenza allelica: {(2n)! / [r! (2n-r)!]} p q
(distribuzione binomiale)
A
4
3
2
1
0
--- GENERAZIONE SUCCESSIVA --a
probabilità
4
0
p
=
0,0625
3
1
4p q =
0,25
2 2
2
6p q =
0,375
3
3
4pq =
0,25
4
4
q
=
0,0625
p
1
0,75
0,5
0,25
0
q
0
0,25
0,5
0,75
1
In un questo esempio la probabilità che, in una sola generazione, uno o l'altro dei due alleli si fissi è
complessivamente il 12,5%. L'ipotesi più probabile è il mantenimento delle stesse frequenze (37,5%).
In due casi le frequenze geniche sono diventate 0,75 e 0,25 (oppure 0,25 e 0,75, cosa che non farà
differenze ai fini dell'esempio). Che cosa succederà nella successiva generazione, ammettendo che la
numerosità sia invariata e che sia ancora possibile accoppiare gli animali? Si tratterebbe di una
popolazione composta sempre da un maschio ed una femmina, o identica a quella iniziale, o con il
locus ormai fissato, o infine formata da un animale omozigote per uno qualsiasi dei due alleli e un altro
animale eterozigote.
In quest'ultimo caso:
n=2
p = 0,75
differenti gameti prodotti: 2n = 4
q = 0,25
2n
promemoria: (p+q)
differenti combinazioni possibili: 2n+1 = 5
possibili combinazioni di r alleli A: (2n)! / [r! (2n-r)!]
r 2n-r
probabilità di ogni combinazione con r alleli A: p q
r 2n-r
probabilità di una frequenza allelica: {(2n)! / [r! (2n-r)!]} p q
(distribuzione binomiale)
85
--- GENERAZIONE SUCCESSIVA --a
probabilità
4
0
p
=
0,31641
3
1
4p q =
0,42188
2 2
2
6p q =
0,21094
3
3
4pq =
0,04687
4
4
q
=
0,00391
A
4
3
2
1
0
p
1
0,75
0,5
0,25
0
q
0
0,25
0,5
0,75
1
Anche in questo caso la probabilità maggiore è il mantenimento delle stesse frequenze geniche
(42,188%), ma le probabilità di fissazione del locus sono complessivamente aumentate (32,032%), con
aumento della probabilità di fissare l'allele più frequente. Si noti che la probabilità di un aumento della
frequenza dell'allele più frequente è superiore alla probabilità di una diminuzione della frequenza
dell'allele stesso.
Con la probabilità composta si possono calcolare, a partire dalla generazione iniziale, la probabilità
delle frequenze geniche dopo due generazioni:
Generazione iniziale
P totale
p
q
0,5 0,5
Prima generazione
P1
0,0625
0,25
0,375
0,25
0,0625
p
q
1
0
0,75
0,5
0,25
0
0,25
0,5
0,75
1
Seconda generazione
P2
p
q
P1 x P2
1
0
0,0625
0,31641 1
0
0,07910
0,42188 0,75
0,25
0,10547
0,21094 0,5
0,5
0,05274
0,04687 0,25
0,75
0,01172
0,00391 0
1
0,00098
0,0625 1
0
0,02344
0,25
0,75
0,25
0,09375
0,375
0,5
0,5
0,14063
0,25
0,25
0,75
0,09375
0,0625 0
1
0,02344
0,00391 1
0
0,00098
0,04687 0,75
0,25
0,01172
0,21094 0,5
0,5
0,05274
0,42188 0,25
0,75
0,10547
0,31641 0
1
0,07910
1
1
0,0625
1
0
86
p
q
1
0,75
0,5
0,25
0
0
0,25
0,5
0,75
1
--- probabilità totali dopo due generazioni --0,0625 + 0,07910 + 0,02344 + 0,00098
0,10547 + 0,09375 + 0,01172
0,05274 + 0,14063 + 0,05274
0,01172 + 0,09375 + 0,10547
0,00098 + 0,02344 + 0,07910 + 0,0625
= 0,16602
= 0,21094
= 0,24611
= 0,21094
= 0,16602
TOTALE
1,00003
Se la taglia della popolazione iniziale fosse stata più ampia, le probabilità di fissazione alla prima
generazione sarebbero state inferiori:
4 individui, 2 maschi e 2 femmine, tutti eterozigoti Aa
n=4
p = 0,5
differenti gameti prodotti: 2n = 8
q = 0,5
2n
promemoria: (p+q)
differenti combinazioni possibili: 2n+1 = 9
possibili combinazioni di r alleli A: (2n)! / [r! (2n-r)!]
r 2n-r
probabilità di ogni combinazione con r alleli A: p q
r 2n-r
probabilità di una frequenza allelica: {(2n)! / [r! (2n-r)!]} p q
(distribuzione binomiale)
A
8
7
6
5
4
3
2
1
0
a
0
1
2
3
4
5
6
7
8
GENERAZIONE SUCCESSIVA
----------- probabilità ----------8
p
=
0,00391
7
8p q
=
0,03125
6 2
28 p q
=
0,10937
5 3
56 p q
=
0,21875
4 4
70 p q
=
0,27343
3 5
56 p q
=
0,21875
2 6
28 p q
=
0,10937
7
8 pq
=
0,03125
8
q
=
0,00391
p
1
0,875
0,75
0,625
0,5
0,375
0,25
0,125
0
q
0
0,125
0,25
0,375
0,5
0,635
0,75
0,875
1
Nella deriva genetica una generazione non ha "memoria storica" di cosa è successo nelle generazioni
precedenti. Con il tempo, l'accumulo di eventi casuali porta sempre alla fissazione di un allele ed alla
perdita (estinzione) di tutti gli altri; la probabilità che un allele si fissi dipende dalla sua frequenza
iniziale; il tempo (misurabile come numero di generazioni) necessario per la fissazione di un allele
varia da caso a caso, ma è in rapporto con la dimensione della popolazione: più la popolazione è estesa,
maggiore è il numero di generazioni necessario per raggiungere la fissazione.
87
La variazione casuale delle frequenze geniche è dispersiva, comporta cioè l'impossibilità di prevedere
il verso della variazione: l'intensità della variazione può invece essere predetta; la varianza della
variazione di frequenza (²p) dipende dalle frequenze geniche iniziali e dalla numerosità della
popolazione:
²p
p0 q0
= -------2N
dove:
N
= numero di individui che compongono la popolazione
p0 e q0 = frequenze dei due alleli di un locus biallelico.
La formula soprariportata è quella che, in una distribuzione binomiale, rappresenta la varianza di un
campione di dimensione 2N ricavato da una popolazione con frequenze p0 e q0.
Ad ogni generazione c'è un nuovo campionamento, che si effettua a partire dalle frequenze geniche
realizzatesi nella generazione precedente: la dispersione delle frequenze geniche aumenta ad ogni
generazione, e dopo t generazioni sarà:
²q
t
= p0 q0 [1-(1-1/2N) ]
Si può facilmente controllare che, se t=1, la formula relativa a più generazioni si semplifica e diviene
uguale alla precedente, valida per 1 generazione.
Il valore calcolato in base alle due precedenti formule rappresenta sia il valore di ²p (che è per
definizione uguale a quello di ²q) che il valore di ²p (uguale al valore di ²q): infatti il  si riferisce
ad uno scostamento dalla media.
Utilizzando i dati degli esempi precedenti e ponderando le frequenze geniche alle varie generazioni per
le relative probabilità, si può controllare l'esattezza delle formule riportate:
Primo esempio:
N=2
p0 = 0,5
q0 = 0,5
dopo una generazione si ha:
²p = ²q = ²p = ²q = 0,52x0,0625 + 0,252x0,25 + 0x0,375 + (-0,25)2x0,25 + (-0,5)2x0,0625 = 0,0625
ed infatti
p0 q0 / 2N = 0,5 x 0,5 / 4 = 0,0625
dopo una seconda generazione si ha:
²p = ²q = ²p = ²q =
= 2x0,16602 + 0,252x0,21094 + 0x0,24611 + (-0,25)2x0,21094 + (-0,5)2x0,16602 = 0,109375
ed infatti
t
2
p0 q0 [1-(1-1/2N) ] = 0,5 x 0,5 [1-(1-0,25) ] = 0,109375
Secondo esempio:
N=4
p0 = 0,5
q0 = 0,5
88
dopo una generazione si ha:
²p = ²q = ²p = ²q =
= 0,52x0,00391 + 0,3752x0,03125 + 0,252x0,10937 + 0,1252x0,21875 + 0x0,27343 + (0,125)2x0,21875 +
+ (-0,25)2x0,10937 + (-0,375)2x0,03125 + (-0,5)2x0,00391 = 0,03125
ed infatti
p0 q0 / 2N = 0,5 x 0,5 / 8 = 0,03125
Osservando la formula
t
²p = p0 q0 [1-(1-1/2N) ]
si può comprendere che la variabilità è massima quando i due alleli hanno uguale frequenza,
diminuisce al crescere del numero di animali ed aumenta di generazione in generazione.
Se l'azione della deriva genetica viene osservata sperimentalmente su più popolazioni che hanno le
stesse frequenze geniche iniziali, ad esempio utilizzando delle linee di animali da esperimento, si
possono schematicamente osservare tre fasi successive: inizialmente, a partire dai valori iniziali, le
frequenze geniche delle varie linee si distribuiscono con diversa probabilità fra 0 ed 1;
successivamente le frequenze tendono ad avere le stesse probabilità ma con il tempo, di generazione in
generazione, le probabilità di fissarsi aumentano.
La probabilità che un allele ha di fissarsi è pari alla sua frequenza iniziale; questa affermazione può
essere facilmente compresa se si considerano contemporaneamente due affermazioni già fatte: primo,
che l'evento più probabile è che una generazione abbia le frequenze geniche della generazione
precedente e, secondo, che dopo un numero infinito di generazioni la deriva genetica provoca la
fissazione di un allele; ad esempio, si considerino una serie di linee sperimentali di animali da
laboratorio, aventi le stesse frequenze geniche iniziali, e si lasci agire la deriva genetica fino a quando
in tutte le linee non si è verificata la fissazione di uno degli alleli considerati: a quel punto,
considerando le linee nel loro insieme, l'evento più probabile è che la media delle frequenze sia la
frequenza iniziale, il che è possibile (dato che le frequenze geniche dei vari alleli possono essere solo 0
oppure 1) solo se i diversi alleli si sono fissati nelle varie linee con probabilità pari alla frequenza
genica iniziale.
In una piccola popolazione non si è tanto interessati all'evoluzione delle frequenze geniche, ma alla
distribuzione delle possibili frequenze geniche. In una popolazione di N individui, se il locus è
polimorfo, le frequenze geniche variano fra 1/2N e (2N-1)/2N: sono quindi maggiori di 0 e minori di 1.
La deriva genetica può essere causa di differenziazione geografica: i suoi effetti sono più rilevanti in
aree a bassa densità di popolazione e con bassi tassi di immigrazione.
Alla deriva genetica consegue un effetto "a collo di bottiglia" sulla taglia della popolazione: si verifica
cioè una improvvisa, marcata e progressiva diminuzione del numero di individui (caratteristica anche
della consanguineità), legata all'omozigosi. La deriva genetica è uno stato preagonico di una
popolazione.
89
L'effetto dei fondatori è stato studiato addirittura come un meccanismo di speciazione. Lo si potrebbe
definire come una brusca accelerazione dei processi dinamici di cambiamento delle frequenze geniche
in popolazioni fondate da pochi individui (Mayr, 1954). Esistono quattro differenti teorie:
1-
teoria di Mayr (1954);
2-
teoria di Carson (1967): flush-crash theory (teoria dei cicli di espansione-catastrofe);
3-
teoria di Carson e Templeton
fondazione-espansione);
4-
teoria di Templeton (1980): genetic transilience theory (teoria del "radicale cambiamento di
stato" genetico).
(1984)
founder-flush
theory
(teoria
dei
cicli
di
Tutte le teorie comprendono tre momenti:
1-
isolamento spaziale e/o temporale di alcuni individui;
2-
rivoluzione genetica che rimette in causa l'insieme funzionale formato dai genotipi della
popolazione fondatrice;
3-
creazione di un isolamento riproduttivo fra la popolazione fondata e quella di partenza.
A titolo di esempio si riassume la teoria di Mayr. Dalla popolazione parentale, la cui coesione è
garantita dall'effetto stabilizzatore del flusso genico, si distacca, in seguito a rottura del flusso genico
causata dall'isolamento geografico, la popolazione fondatrice: a seconda della numerosità, la
popolazione fondatrice potrà o meno sopravvivere. Nel caso riesca a sopravvivere, le frequenze
geniche della popolazione fondatrice si discostano da quelle della popolazione parentale: si ha infatti
una perdita elevata della variabilità della popolazione parentale dovuta alla taglia ridotta, un aumento
della consanguineità nelle prime generazioni, una "rivoluzione genetica" intesa come radicale
cambiamento dei valori selettivi dovuto all'habitat differente ed al cambio delle frequenze geniche.
Successivamente, rimanendo la nuova popolazione isolata, la variabilità riaumenta fino al livello della
popolazione parentale, ma le frequenze geniche si attestano su valori differenti.
90