Università degli Studi di Camerino Dipartimento di Scienze ambientali APPUNTI DI GENETICA AGRARIA PROFESSOR CARLO RENIERI Anno Accademico 2007-'08 1. LA GENETICA. La genetica è la scienza dell‟eredità e delle variazioni; essa cerca di spiegare, attraverso delle leggi, la rassomiglianza e le differenti esistenti tra individui. L‟eredità è la trasmissione dei caratteri, e quindi dei geni, dai genitori ai loro discendenti. Le variazioni sono le differenze che esistono tra gli individui di una popolazione per un determinato carattere. 2. IL DNA. Oggi si dà per scontato che il materiale genetico è il DNA. Già nel 1928 lo statunitense Griffith dimostrò che una sostanza iniettata al Diplococcus pneumoniae lo trasformava da avirulento in virulento. Nel 1944 Avery identificò il DNA e dal 1952 tutta la comunità scientifica lo accettò come il materiale genetico alla base dell'eredità. L'acido desossiribonucleico è costituito da una sequenza di quattro molecole fondamentali denominate nucleotidi, che differiscono solamente per il fatto di contenere ciascuno una differente base azotata; ogni nucleotide risulta composto da uno zucchero a cinque atomi di carbonio (desossiribosio), da un gruppo fosfato e da una delle quattro basi azotate; da un punto di vista strutturale, le basi sono a due a due simili: da una parte adenina e guanina (purine, con un doppio anello) e dall'altra citosina e timina (pirimidine, ad anello singolo). La struttura di un nucleotide è quindi composta dall'anello del desossiribosio che lega il gruppo fosfato al suo carbonio 5' ed una delle quattro basi al carbonio 1'. Nel 1953, James Watson e Francis Crick proposero il primo modello della molecola del DNA che conteneva in sé l'indicazione di come il DNA potesse svolgere le sue funzioni di conservazione e trasmissione dell'informazione genetica. La struttura proposta da questi autori è quella di una doppia elica avvolta a spirale con avvitamento destrorso (cioè in senso orario). Ciascuna elica è formata da una catena di nucleotidi tenuti insieme da legami covalenti; più precisamente si tratta di legami fosfodiesterici nei quali un gruppo fosfato forma un ponte tra la posizione 3' di un pentoso e la posizione 5' del pentoso successivo. Ciascuna catena avrà ad una sua estremità un gruppo 5' libero ed all'estremità opposta un gruppo 3' libero; le due eliche sono tenute insieme dai legami idrogeno che si stabiliscono tra le basi complementari (A-T e C-G) per la presenza di due atomi elettronegativi che condividono un protone. I legami ad idrogeno che uniscono le due catene sono molto più deboli di quelli covalenti che uniscono due nucleotidi contigui nella stessa catena; per motivi sterici i legami ad idrogeno possono formarsi solo fra adenina e timina (2 legami) e fra citosina e guanina (3 legami): il differente numero di legami ad idrogeno che lega le coppie di basi azotate complementari spiega la diversa densità che il DNA può avere (è più denso se più ricco in citosina e guanina). Il modello richiede che le due catene siano anti-parallele, decorrano cioè in senso 5'-3' l'una e in senso 3'-5' l'altra: in altri termini l'estremità 5' di un filamento si trova di fronte all'estremità 3' dell'altro. Il modello proposto da Watson e Crick nel 1953 è ancora sostanzialmente valido: è il ß-DNA, dove l'andamento della spirale e dei filamenti è regolare e si può distinguere un solco minore (fra le due catene) ed un solco maggiore (quello dovuto alla spiralizzazione vera e propria). E' importante sottolineare che, in periodi successivi, sono state descritte altre conformazioni della molecola dell'acido desossiribonucleico. Queste differenti conformazioni strutturali del DNA sono state messe in rapporto a specifiche sequenze nucleotidiche della molecola stessa. Ad esempio, alcune sequenze caratterizzate da un regolare alternarsi di basi pirimidiniche e puriniche sono in grado di indurre la conversione da una normale doppia elica destrorsa ad una forma Z sinistrorsa, caratterizzata da uno scheletro portante di DNA molto più irregolare, seghettato, e dalla presenza di un unico solco minore che sostituisce i due solchi maggiore e minore della classica struttura ß. Altro caso simile è quello per cui le cosiddette ripetizioni invertite (cioè una sequenza seguita sullo stesso filamento dalla sua sequenza complementare disposta in ordine inverso) inducono nella molecola la comparsa di una struttura caratteristica "a croce": ciò è dovuto alla tendenza delle basi ad appaiarsi nell'ambito dello stesso filamento, con il conseguente ripiegarsi del filamento stesso. Il DNA è dunque una molecola estremamente flessibile e reattiva, in grado di interagire con tutta una serie di molecole cellulari grazie anche ad una continua modificazione conformazionale. 2 LA DUPLICAZIONE DEL DNA. Il meccanismo di replicazione del DNA è semiconservativo: la doppia elica madre darà due doppie eliche figlie, formate ciascuna da un filamento parentale e da un filamento neoformato; erano stati in precedenza proposti anche altri modelli che però non hanno trovato conferma (ad esempio, il modello conservativo, il modello dispersivo). La doppia elica si srotola e forma una doppia Y (la "forcina di replicazione"): la base della Y si srotola progressivamente mentre le due braccia fungono da stampo (template) per il nuovo filamento. L'intero meccanismo di replicazione è basato sulla complementarietà delle basi azotate. Lo srotolamento necessita di 3 proteine specifiche: la replicasi srotola il tratto da replicare, la proteina SSB si lega al filamento srotolato ed impedisce la sua degradazione e riunione, la proteina ligasi controlla la zona non despiralizzata proteggendola da trazioni ed altri traumi. La DNApolimerasi aggiunge un nucleotide ad un tratto preesistente: non è in grado di iniziare ex novo, ma necessita di un primer (può aggiungere nucleotidi solo all'estremità 3': il verso di formazione della catena è pertanto 5'-3'); l'energia della scissione del gruppo energetico fosfato è utilizzata per legare il nucleotide. La DNApolimerasi ha anche il compito di scindere eventuali legami erronei fra le basi. Il primer è dato dalla RNApolimerasi. Il filamento 3'-5' viene sintetizzato a tratti, sempre nel verso 5'-3', con un numero elevato di primer di RNA; i tratti sono detti frammenti di Okazaki. Quando la DNApolimerasi trova al termine di un tratto il primer di un tratto vicino lo scinde e lo risintetizza come DNA (sostituisce RNA con DNA). I vari frammenti di Okazaki sono uniti dalla DNAligasi. Negli eucarioti la replicazione del DNA non comincia in un solo punto ma contemporaneamente ed indipendentemente in più "forcine di replicazione": questi punti, detti "bolle di replicazione", confluiscono e sono infine uniti dalla DNAligasi; per dimostrare la molteplicità dei siti di replicazione si è ricorsi a timidina triziata, cioè marcata con trizio, e si è seguita la distribuzione della radioattività dopo la replicazione. LA DIVISIONE FUNZIONALE DEL DNA. Le dimensioni del genoma vengono espresse in numero di paia di basi (1 Kb = 1.000 paia di basi). Salendo nella scala evolutiva si nota una certa tendenza all'aumento delle dimensioni del genoma, ma non vi è una esatta corrispondenza fra la complessità fenotipica o il livello evolutivo di un organismo e la grandezza del suo genoma: ad esempio, il genoma di una salamandra e quello del grano tenero hanno entrambi dimensioni superiori al genoma dell'uomo. Bisogna tenere conto non solo del numero 6 di paia di basi ma anche del numero di geni. Il genoma di Eschirichia coli è composto da 4x10 paia di basi e considerando un gene in media codificato in 2-3 Kb si può sostenere che il genoma di questo batterio contiene poche migliaia di geni, come si è potuto anche controllare fenotipicamente; il genoma 8 di Drosophyla melanogaster ha circa 2x10 paia di basi, ma è stato dimostrato contenere solo 5.000 9 geni circa; il genoma dell'uomo (Homo sapiens) ha circa 3x10 paia di basi, e contiene circa 50.000100.000 geni. In realtà, mentre nei batteri le dimensioni del genoma sono proporzionali al numero dei geni, negli eucarioti ciò non si verifica. Come mai aumenta molto il DNA ma proporzionalmente non i geni? Esiste del DNA eucariotico che non funziona? In effetti negli eucarioti c'è molto DNA ripetuto: alcune centinaia di basi vengono ripetute più volte. Per studiare questo fenomeno si utilizza la cinetica della denaturazione; il DNA viene frammentato e poi denaturato (cioè trasformato da un doppio filamento in due filamenti singoli, in genere aumentando la temperatura); quando si riabbassa la temperatura il DNA si rinatura, cioè si ritrasforma in doppio filamento mediante l'appaiamento delle basi complementari: più esistono sequenze ripetute e più rapida è la rinaturazione (ci sono più probabilità di appaiamento fra frammenti complementari). 3 In base alla quantità di ripetizioni vengono distinte negli eucarioti 3 classi di DNA: 5 - DNA altamente ripetuto, che rappresenta da 0 al 50% del DNA, nel quale esistono oltre 10 copie delle stesse sequenze, come ad esempio nel caso del DNA satellite; - DNA mediamente ripetuto, che rappresenta dal 10 al 40% del DNA e con sequenze ripetute fra 10 e 5 10 volte, come nel caso dei geni per rRNA, tRNA istoni; - DNA a sequenza unica, che non è cioè ripetuto, e rappresenta il 40-80% del DNA (ad esempio, i geni dell'emoglobina, dell'ovoalbumina). Il DNA satellite è costituito da sequenze altamente ripetute: ultracentrifugando in gradiente di cloruro di cesio, all'interno della provetta il DNA si stratifica in una banda corrispondente alla propria "densità di galleggiamento"; nei procarioti si ha una sola banda, mentre negli eucarioti in prossimità della banda principale si hanno altre bande, da cui il nome di DNA satellite; il fenomeno è legato al diverso contenuto in coppie di basi guanina-citosina, che provoca una densità diversa da quella della banda principale. Da un punto di vista funzionale il DNA può essere distinto in codificante e non codificante, a seconda che dia o meno esito alla sintesi di una proteina. Il genoma è composto da parti funzionalmente discontinue: la parte non codificante (introne) viene trascritta ma non dà alcuna proteina, mentre la parte codificante darà gli esoni e quindi le proteine. Per quale motivo nel DNA si ripetono più volte le stesse sequenze? Un'ipotesi era che più erano le sequenze e più poteva essere quantitativamente la sintesi della proteina, ma si è visto che più che dalla trascrizione la sintesi proteica è limitata da altre fasi. Si tratta di una specie di copie di riserva, in caso di mutazioni? Il DNA ripetuto modifica la probabilità che le mutazioni, che sono casuali, riguardino delle sequenze funzionalmente importanti? Si tratta di famiglie multigeniche, cioè di geni molto simili sia nelle sequenze nucleotidiche che nella proteina prodotta (ad esempio, le globine dell'emoglobina, oppure le cheratine della lana), con una qualche testimonianza evolutiva? Se il DNA ripetuto non è codificante, a che cosa può servire? E' forse la forma più semplice di parassitismo? IL CODICE GENETICO. In che modo la sequenza nucleotidica del DNA determina la sequenza aminoacidica delle proteine? E' il concetto di codice genetico. Il primo problema era di stabilire se nel codice c'erano o no delle sovrapposizioni, cioè di stabilire se un nucleotide poteva essere "letto" più di una volta, in diverse posizioni del codice: ad esempio, nel caso di una sequenza ATTGCTCAG, se il codice è senza sovrapposizione, i primi tre aminoacidi sono codificati dalle triplette ATT, GCT, CAG, mentre se il codice è con sovrapposizioni, i primi tre aminoacidi sono codificati dalle triplette ATT, TTG, TGC. Nel 1961 venne accertato che non ci sono sovrapposizioni: infatti, se muta una sola base muta nella corrispondente proteina un solo aminoacido; il codice con sovrapposizione farebbe invece prevedere che al cambiamento di un solo nucleotide corrisponda il cambiamento di più aminoacidi contigui (fino a tre). In realtà ci può essere una specie di sovrapposizione perché il DNA può essere letto con differente "frame" (lettura spostata di una o due basi) e quindi dare differenti proteine: si dicono proteine modificate per scivolamento ("shifting"); si tratta però non di una sovrapposizione nella lettura del codice genetico per una proteina ma di differenti fasi di lettura dello stesso tratto di DNA che codifica per proteine differenti. Le lettere a disposizione del codice genetico sono le 4 basi azotate. Con due basi azotate si potrebbero 2 specificare 4 possibilità, cioè 16 differenti aminoacidi, mentre con tre si possono teoricamente 3 specificare 64 differenti aminoacidi (4 ); essendo 20 gli aminoacidi c'è un problema di eccesso di possibilità. Ai 20 aminoacidi bisogna aggiungere un codon per il segnale di inizio della trascrizione ed uno per il segnale di fine della trascrizione, ma ne esistono anche che non specificano nulla (e quindi fanno immediatamente interrompere la trascrizione); si tratta inoltre di un codice degenerato, perché un aminoacido può essere indicato da più di un codon. Esperimenti condotti da Brenner (con mutanti del locus rII del fago T4) hanno dimostrato che un codon è effettivamente di tre lettere (e non più di tre). Il meccanismo di duplicazione del DNA è molto efficiente: in E. coli, in un minuto vengono replicate 4 50.000 basi e in una generazione c'è solo un errore su un milione di replicazioni del DNA. LE MUTAZIONI. Occasionalmente, durante la replicazione del DNA, possono verificarsi degli errori che vengono trasmessi alla generazione successiva. Potrebbe avvenire ad esempio che venga sostituito per errore un nucleotide: è una mutazione puntiforme; l'RNA-polimerasi non è in grado di individuare l'errore, per cui l'informazione errata viene trascritta con conseguenze più o meno gravi; il cambio di una base azotata può dare un differente aminoacido o un codice non-senso, che interrompe la sintesi proteica, ma anche non provocare nulla se il nuovo codice è per lo stesso aminoacido (il codice genetico è un codice degenerato). Se un aminoacido diverso viene introdotto in una proteina l'attività della stessa potrà essere più o meno modificata (negativamente la maggior parte delle volte, positivamente qualche rara volta, ed in quest'ultimo caso il mutante potrà risultare favorito nella selezione). Se il nuovo codon derivante dalla sostituzione di un singolo nucleotide non codifica per alcun aminoacido, una volta giunto a questo livello, il processo di trascrizione si arresta: se ciò avviene subito dopo l'inizio del gene, l'assenza pressoché totale della proteina ha generalmente gravi conseguenze nell'organismo mutante. Altro tipo di mutazione puntiforme è la perdita di un nucleotide (delezione); in questo caso l'RNApolimerasi non ha più la corretta chiave di lettura (reading frame) e tutti i codon a valle della mutazione (e quindi i corrispondenti aminoacidi) assumono significati diversi. Questo tipo di mutazione viene definita frameshift. Le stesse conseguenze si hanno per l'inserzione di un nucleotide. In certi casi possono andare perduti o essere inseriti interi tratti di DNA. Si indicano con il termine di introsoni o trasposoni dei tratti di DNA più o meno lunghi, con sequenze terminali costanti, in grado di spostarsi da un punto ad un altro del genoma: la loro inserzione generalmente abolisce l'attività del gene. E' stato osservato che le coppie di nucleotidi non mutano tutte con la stessa frequenza: in certi siti la probabilità di mutazione è fino a 100 volte più elevata che in altri ("hot spots", cioè "punti caldi"). Un esempio di hot spot è il gene lact di E. coli: c'è un punto, a 200 basi dall'inizio del gene, dove la citosina è metilata in posizione 5'; normalmente la citosina è trasformata dalla desaminazione ossidativa in uracile, che viene riconosciuto come estraneo al DNA, allontanato e risostituito da citosina: la 5-metil-citosina è però trasformata dalla desaminazione ossidativa in timina, che è una normale base del DNA: ne consegue che un filamento resta normale mentre quello mutato, nella replicazione, avrà un appaiamento timina-adenina invece che citosina-guanina. L'RNA. L'informazione genetica contenuta nel DNA controlla la sintesi delle proteine: tale informazione viene trascritta in mRNA e trasferita dal nucleo ai ribosomi, dove l'mRNA fornisce il messaggio per la sintesi della proteina; l'RNA è quindi il tramite tra il DNA e le proteine: senza di esso l'informazione genetica rimarrebbe inerte e non potrebbe essere espressa. A differenza di quanto visto nel DNA, nell'RNA il filamento è singolo invece che doppio, nei nucleotidi è presente l'uracile al posto della timina, lo zucchero è il ribosio invece che il desossiribosio; nel desossiribosio il gruppo chimico legato al carbonio in posizione 2 è un atomo di idrogeno, mentre nel ribosio nella stessa posizione è presente un ossidrile. La scelta evolutiva del DNA come molecola deputata alla conservazione dell'informazione genetica è legata alle differenze chimiche esistenti fra DNA ed RNA; infatti, quando i ribonucleotidi sono uniti a formare l'RNA, l'ossidrile in posizione 2 del ribosio rimane libero, e ciò rende l'RNA meno stabile del DNA dal punto di vista chimico: in soluzione acquosa l'RNA va incontro a rapida idrolisi. Negli esperimenti che tendono a ricostruire in laboratorio il "brodo primordiale" da cui si ritiene abbia avuto origine la vita, si ha prima la polimerizzazione dell'RNA: ciò fa ritenere che l'RNA abbia evolutivamente preceduto il DNA, il quale sarebbe originato da una trascriptasi inversa (DNApolimerasi-RNAdipendente) ed avrebbe in seguito soppiantato il DNA grazie alla sua maggiore 5 stabilità, che lo rende intrinsecamente più adatto per conservare l'informazione per lunghi periodi di tempo. LA TRASCRIZIONE. La trascrizione avviene ad opera della RNApolimerasi; la RNApolimerasi si lega al DNA in corrispondenza di un promotore, il quale è differente per i vari geni ma è sempre caratterizzato da una sequenza costante di 6 basi azotate (TATAAT). La formazione dell'RNA è analoga a quella del DNA, ma non c'è bisogno di un primer; il verso della sintesi è sempre lo stesso (sul filamento 5'-3'). La sintesi dell'mRNA inizia quando l'RNA polimerasi comincia a trascrivere il DNA 10-20 nucleotidi a valle della sequenza TATAAT. L'RNA polimerasi srotola per un breve tratto la doppia elica di DNA ed inizia la trascrizione: l'enzima si muove lungo il DNA aggiungendo i ribonucleotidi (complementari ai desossiribonucleotidi del DNA) al 3' del nucleotide terminale del filamento nascente di RNA. Prima che la lunghezza del trascritto abbia superato i 30 nucleotidi, l'estremità 5' libera del filamento di RNA neosintetizzato viene ricoperta da una specie di struttura protettiva di guanosina metilata, legata per mezzo di un gruppo trifosfato. La trascrizione continua finché l'enzima non oltrepassa una sequenza del DNA che rappresenta il segnale di termine della trascrizione stessa (in genere AAUAAA): circa 20 nucleotidi più a valle il trascritto viene scisso ed un enzima aggiunge una coda di 150-200 adenin-nucleotidi all'estremità 3' del trascritto (poli-A). Nei procarioti si ha una sola RNA-polimerasi, mentre negli eucarioti si hanno tre diversi enzimi: uno per la produzione di mRNA, uno per la produzione di rRNA ed uno per la produzione di tRNA. LA TRADUZIONE. Il trascritto primario passa dal nucleo al citoplasma e viene tradotto a livello di ribosomi; intervengono a questo punto l'RNA transfer (tRNA) e l'RNA ribosomiale (rRNA). Il tRNA è un filamento corto, di 70-80 nucleotidi; esso ha una caratteristica struttura ripiegata, e lega ad una estremità un determinato aminoacido ed alla estremità opposta presenta un'ansa con l'anticodon per quell'aminoacido, ovvero il codon complementare; l'estremità a cui si lega l'aminoacido è sempre la stessa per tutti gli aminoacidi, in quanto è lo stesso enzima che lega l'aminoacido al tRNA a farsi carico del riconoscimento dell'anticodon. L'rRNA si trova legato ad alcune proteine insieme alle quali costituisce le due subunità ribonucleoproteiche (una maggiore ed una minore) che formano il ribosoma; nei procarioti il ribosoma ha un coefficiente di sedimentazione (misurato in Svedberg) di 70 S e le due subunità hanno rispettivamente 50 S e 30 S; negli eucarioti il coefficiente di sedimentazione del ribosoma è di 80 S e quello delle due subunità di 60 S e di 40 S: nella subunità grande ci sono 3 molecole di RNA, (una grande, di circa 4500 nucleotidi, due piccole di circa 160 e 120 nucleotidi), mentre nella piccola c'è una sola molecola di RNA (di circa 1800 nucleotidi). L'RNA messaggero (mRNA) "scivola" sull'rRNA un codon alla volta e ad uno ad uno si uniscono alla catena proteica nascente i vari aminoacidi portati dall'tRNA che ha l'anticodon corrispondente; in genere nei procarioti c'è all'inizio della sintesi sempre lo stesso aminoacido, che successivamente viene allontanato. La sequenza dei codon sull'mRNA, dipendente dall'informazione contenuta nel DNA, determina a sua volta l'ordine degli aminoacidi nella proteina. LA MATURAZIONE DELL'RNA. Sin dal 1960 esperimenti effettuati marcando con isotopi radioattivi l'mRNA hanno dimostrato che alcune molecole di mRNA isolate a livello nucleare hanno dimensioni superiori (ad esempio, 5.000bs) a quelle dei medesimi mRNA isolati dopo il trasferimento nel citoplasma (ad esempio, 1.000bs): infatti l'mRNA marcato non si riibridizza completamente con il DNA denaturato, perché delle parti di DNA non si ritrovano nell'mRNA citoplasmatico. I precursori nucleari vengono tagliati e riuniti per dare origine agli RNA maturi, senza alterazioni all'estremità protettiva di guanosina metilata ed alla coda di 6 poli-A, che si ritrovano anche nell'mRNA maturo. Questo processo di maturazione dell'mRNA è indicato con il termine di splicing. I geni degli organismi eucarioti sono discontinui, costituiti cioè da tratti effettivamente codificanti (indicati con il termine di esoni) inframmezzati da sequenze che non hanno alcuna funzione codificante (introni). Sia gli esoni che gli introni vengono trascritti dall'RNA-polimerasi in un trascritto primario: tale trascritto subisce una maturazione a livello nucleare che comporta l'allontanamento delle porzioni introniche; l'mRNA maturo che arriva ai ribosomi contiene pertanto solamente la porzione esonica, l'unica ad essere effettivamente espressa. Lo splicing dell'mRNA non avviene invece nei batteri dove i geni sono continui. Durante il processo di maturazione, un ruolo fondamentale nell'allontanamento degli introni è svolto dalle snRNP, costituite da un gruppo di molecole proteiche legate ad un'unica molecola di RNA: si tratta di un RNA particolare, ricco di uracile (RNA U). Nel trascritto primario, nel punto di passaggio tra esoni ed introni, esistono delle sequenze caratteristiche ricche di guanina ed uracile: le snRNP si legano a tali sequenze G-U e tagliano la catena RNA in quel punto. Gli introni vengono così allontanati mentre gli esoni vengono saldati tra loro dando origine all'RNA messaggero maturo. Agli scienziati che hanno scoperto la discontinuità dei geni è stato assegnato nel 1993 il premio Nobel. L'ESPRESSIONE DEI GENI. Le scoperte sulla discontinuità funzionale dei geni sono state fatte nel corso delle ricerche sull'espressione dei geni: le diverse cellule di un organismo hanno tutte lo stesso DNA, per cui come si spiegano le differenze? Un problema di fondamentale importanza nello studio del genoma è rappresentato dalla regolazione dell'espressione genica: è chiaro che una cellula, in un determinato istante, non contiene tutti gli mRNA codificati dal suo DNA, ma trascrive alcuni geni e produce le proteine corrispondenti solo quando ne ha la necessità. Nei procarioti non ci sono introni (quelli identificati sono trascurabili), mentre negli eucarioti si è posto immediatamente il problema di stabilire quale importanza può avere la maturazione dell'RNA nella regolazione dell'espressione genica. Secondo una teoria si ipotizzava che la scelta di quale proteina produrre, in quale cellula ed in quale momento, fosse legata alla maturazione differenziale di un'unica molecola di mRNA trascritta in maniera totale ed indifferenziata in tutte le cellule: ad esempio, un trascritto contenente più esoni avrebbe potuto essere tagliato e poi nuovamente saldato in modo da includere nell'mRNA maturo tutti o solo alcuni degli esoni, purché fossero conservati gli esoni alle estremità del gene (contenenti il "cappuccio" protettivo di guanosina metilata in posizione 5' e la coda di poli-A in posizione 3'), e che gli esoni fossero rimasti nello stesso ordine. Sono stati effettivamente scoperti diversi geni che si comportano in questo modo: si tratta di "unità di trascrizioni complesse", che codificano per più mRNA (ottenuti mediante splicing differenziale). Un esempio di unità di trascrizioni complesse è rappresentato dal segmento di DNA che codifica per la calcitonina, ormone prodotto a livello della tiroide: è stato osservato che tale sequenza si ibridizza anche con un mRNA prodotto nell'ipofisi. Il trascritto primario che si trova nelle cellule tiroidee si ritrova anche a livello dell'ipofisi e contiene due siti poli-A; nella tiroide viene accettato come segnale terminale il primo sito poli-A: i primi quattro esoni vengono saldati e danno origine ad un mRNA che codifica per la calcitonina; nell'ipofisi invece lo stesso trascritto primario termina in corrispondenza del secondo sito poli-A: al momento della saldatura il quarto esone viene allontanato insieme agli introni, mentre vengono uniti il quinto ed il sesto esone, dando così origine all'mRNA per una proteina, completamente diversa dalla calcitonina, nota come CGRP. Con la scoperta delle più recenti tecniche di biologia molecolare si è accertato che l'importanza dello splicing nella regolazione dell'espressione genica è relativa; la regolazione è effettuata essenzialmente attraverso un controllo della trascrizione primaria, quando alcuni geni vengono trascritti ed altri no: non si ha tanto una trascrizione indifferenziata seguita da una maturazione differenziale dell'mRNA, ma direttamente una trascrizione differenziale del DNA. L'importanza della trascrizione differenziale è stata dimostrata isolando e clonando dei geni; vennero isolate e clonate delle sequenze nucleotidiche per proteine specifiche del fegato e per delle proteine non-specifiche; questi geni sono stati posti su un filtro di nitrocellulosa e messi a contatto con il trascritto primario, marcato con isotopi radioattivi, di 7 cellule epatiche, renali e cerebrali: il trascritto delle cellule epatiche si ibridizzava sia con i geni per le proteine del fegato che con i geni delle proteine non specifiche, mentre il trascritto primario delle cellule renali e quello delle cellule cerebrali si ibridizzava solo con le sequenze nucleotidiche per le proteine non-specifiche. Come è controllata l'attivazione e la disattivazione del gene? E' questo un problema particolarmente sentito da chi si occupa di ingegneria genetica, perché inserire un gene estraneo in un genoma (animali transgenici) è relativamente semplice, ma controllare l'espressione di questo gene è un problema ancora non risolto. Le conoscenze disponibili riguardano soprattutto i procarioti. Esperimenti condotti principalmente sul fago lambda hanno evidenziato come l'espressione genica può essere controllata da proteine regolatrici che si legano a siti specifici del segmento di DNA: tali proteine vengono indicate con il termine di repressori. Il repressore si lega ad una specifica sequenza di DNA denominata operatore, situata immediatamente accanto al promotore, cioè accanto a quella breve sequenza di DNA che rappresenta il punto di attacco dell'RNA polimerasi e quindi di inizio della trascrizione: la presenza del repressore sul sito operatore impedisce il legame della RNA polimerasi al promotore e di conseguenza la trascrizione del gene. Nel fago lambda è stato anche evidenziato un meccanismo di autoamplificazione: l'RNA polimerasi non si lega al promotore del gene ma al promotore del gene per la proteina che funge da repressore. Molto spesso un solo repressore controlla l'espressione coordinata di più geni: tale sistema nel suo complesso viene definito operone. Un esempio è l'operone lact di E. coli, che comprende tre geni (Z, Y, ed A) responsabili del catabolismo del lattosio attraverso la sintesi di tre enzimi (ß-galattosidasi, permeasi, transacetilasi). Il gene lact di E. coli è un sistema inducibile: se non c'è lattosio nel mezzo, il repressore si lega all'operatore ed inibisce la trascrizione dei geni per le tre proteine enzimatiche che dovrebbero catabolizzare il lattosio; se invece nel mezzo c'è lattosio, questo si lega al repressore che, così modificato nella forma, non è più in grado di inattivare l'operatore: l'RNA polimerasi trascrive l'informazione per i tre geni Z, Y ed A in un'unica molecola di RNA policistronico. L'operone lact è un esempio di sistema inducibile nel senso che la sintesi di un enzima è indotta dalla presenza del suo substrato. Esistono anche dei sistemi reprimibili, nei quali il prodotto finale determina il blocco della trascrizione dei geni per gli enzimi responsabili della sintesi del prodotto stesso: un esempio è l'operone trp, responsabile della sintesi del triptofano. Il meccanismo di controllo dell'espressione genica di un sistema reprimibile comporta la presenza sul DNA di un'altra regione specifica denominata attenuatore, responsabile di una riduzione della velocità di trascrizione dell'mRNA in presenza del prodotto finale (triptofano): l'assenza di questa regione in alcuni mutanti è associata ad una produzione continua e massiccia di triptofano. GLI INTRONI, GLI ESONI E L'EVOLUZIONE. Fino agli anni '60 la maggior parte degli studiosi riteneva che i batteri, per la loro semplicità, dovessero essere simili alle prime cellule ancestrali e che gli eucarioti si fossero evoluti da procarioti primordiali. Lo splicing del trascritto primario, costantemente presente negli eucarioti, avviene molto raramente nei procarioti che non contengono, se non in quantità trascurabile, introni: di conseguenza gli esoni venivano considerati come delle complessità introdotte relativamente tardi nel corso dell'evoluzione. La prima cosa ad essere messa in dubbio fu che i batteri fossero effettivamente gli organismi più antichi. Woese e collaboratori tracciarono una mappa delle genealogie cellulari confrontando le sequenze nucleotidiche degli rRNA di differenti organismi; si utilizzava una particolare subunità 16 S dell'rRNA perché è una struttura precedente la stessa cellula ed è una molecola che non ha mai mutato la sua attività funzionale; si digeriva l'rRNA con ribonucleasi che spezzavano la catena in corrispondenza della guanina e si confrontavano i frammenti di almeno 6 basi azotate (una ventina di frammenti circa): più le sequenze sono conservate, maggiore è la probabilità che gli organismi discendano da un antenato comune. Ci si rese conto che gli archibatteri, un piccolo gruppo di metanobatteri, non rientravano nell'albero filogenetico dei batteri classici: essi non erano più vicini dal punto di vista filogenetico agli eubatteri di quanto lo fossero agli eucarioti. Si è quindi ipotizzata l'esistenza di tre linee evolutive separate, discendenti da un unico progenitore comune definito 8 "progenote": eubatteri ed archibatteri sarebbero evoluti direttamente dal progenote, mentre gli eucarioti deriverebbero dalla fusione di un eucariote ancestrale con due tipi di eubatteri; l'eucariote ancestrale avrebbe dato origine al nucleo della cellula, mentre mitocondri e cloroplasti sarebbero derivati rispettivamente dai solfobatteri purpurei e dai cianobatteri (determinando le sequenze dell'rRNA contenuto nei mitocondri si è dimostrato che sono analoghe a quelle dei solfobatteri purpurei, mentre le sequenze dell'rRNA dei cloroplasti sono analoghe a quelle dei cianobatteri). L'origine di eucarioti e procarioti è quindi da considerare indipendente e contemporanea; essendo il nucleo degli eucarioti antico quanto i batteri, ed essendo il nucleo la sede dove avviene la maturazione dell'mRNA, non vi è alcuna ragione per ritenere che tale processo abbia avuto inizio solo più tardi. Addirittura la maturazione dell'RNA potrebbe essere iniziata ancora prima della comparsa del progenote: probabilmente sin dall'inizio la molecola era caratterizzata dalla presenza di esoni ed introni e ciò sembrerebbe confermato anche dalla posizione che introni ed esoni occupano in molti geni moderni; ad esempio, nei geni che codificano per le emoglobine, per le immunoglobuline e per altri enzimi, ogni esone codifica per un dominio della molecola proteica riconoscibile come unità funzionale: è poco plausibile ritenere che l'introduzione degli introni avvenuta casualmente possa aver determinato questa precisa suddivisione e molto più probabile invece uno sviluppo graduale dello splicing che avrebbe portato alla sintesi di proteine più grandi e più utili. E' molto probabile che i geni dei primi archibatteri ed eubatteri fossero discontinui e che, attraverso un'evoluzione durata innumerevoli generazioni, i batteri oggi esistenti abbiano eliminato quasi totalmente le sequenze non codificanti dal loro genoma; il DNA degli eucarioti, uomo compreso, si è invece evoluto più lentamente (maggior intervallo di generazione): i geni degli eucarioti presentano quindi "inutili" introni ed il sistema di traduzione è rimasto ancorato ad un complesso procedimento di maturazione, evolutivamente già superato dalle cellule procariote. Non tutti gli studiosi condividono però queste ipotesi: alcuni ritengono che l'organizzazione del genoma in esoni ed introni sia evolutivamente più recente. 3. LA GENETICA FATTORIALE Tra le varie specializzazioni della genetica, quella detta fattoriale o formale (o, più imprecisamente, Mendeliana) studia l‟eredità e le variazioni dei caratteri “qualitativi”, per cui si parla di eredità qualitativa o semplice e di variazione di tipo qualitativo. La definizione di un carattere qualitativo non è sempre facile e molto spesso essa risponde più a criteri soggettivi creati dagli studiosi che non alla realtà biologica del carattere stesso. Per poter dare le basi di studio della genetica fattoriale bisogna cercare di definire nel modo più rigoroso possibile che cosa si debba intendere per carattere qualitativo. Alla trattazione dell‟argomento si fa procedere una serie di definizioni necessarie per affinare la terminologia che sarà utilizzata. ALCUNE DEFINIZIONI Prima di continuare riteniamo opportuno dare alcune informazioni che ci saranno utili nel prosieguo. Il gene rappresenta l‟unità funzionale dell‟eredità; ciascun gene è formato da una sequenza di DNA che porta l‟informazione per la costituzione di un particolare polipeptide. Per locus si intende la localizzazione fisica di un gene su di un cromosoma: in un locus un individuo ha due geni omologhi provenienti ciascuno da uno dei due genitori. Un locus si dice polimorfo quando è rappresentato da due o più geni alleli. Tali alleli derivano da cambiamenti occasionali di un presunto gene normale (o non alterato), detti mutazioni. L‟organismo che porta il gene alterato è chiamato mutante; l‟organismo che porta il gene normale, tipo selvaggio. Due geni sono alleli quando sono situati nello stesso locus ed hanno un‟azione differente su di uno stesso carattere (ad es. in caso di locus biallelico saranno all‟eliche le coppie Aa e aA). 9 Un locus è monomorfo quando è rappresentato solo da uguali; due geni uguali si dicono identici quando hanno la stessa origine genealogica, cioè derivano da un gene presente in un antenato comune ai due individui portatori o trasmettitori dei due geni. Il fenotipo è l‟espressione fisica di un carattere in un individuo in un ambiente dato; può essere osservato e misurato. Il genotipo di un individuo per un determinato carattere è dato dall‟insieme dei geni che contribuiscono all‟espressione di questo carattere. Un individuo è omozigote in un locus se i due geni che esso possiede sono uguali (AA, aa); è eterozigoti se i due geni che esso possiede sono alleli (A e a). Nella genetica fattoriale, per incrocio si intende la riproduzione tra varietà diverse di individui; si parlerà successivamente di incrocio monoibrido per gli incroci implicanti una sola coppia di alleli, di incrocio di ibrido quando le coppie di alleli sono due, di incrocio poliibrido quando l‟incrocio interessa più coppie di alleli. La generazione parentale (P), rappresenta la generazione di partenza nell‟incrocio: ad essa seguono la prima generazione filiale o F1, la seconda o F2 ecc. Per back-cross si intende l‟accoppiamento tra un individuo F1 con uno dei suoi genitori o con un individuo dello stesso genotipo del genitore: il back-cross può essere perciò “paterno” o “materno” a seconda del genitore interessato. I CARATTERI QUALITATIVI Perché si possa definire qualitativo un carattere devono sussistere due condizioni, relative la prima al sistema ereditario che ne è alla base, la seconda all‟espressione della variabilità dello stesso. Un carattere qualitativo è determinato da un sistema ereditario semplice, cioè costituito da uno o pochi loci che interagiscono tra loro. I geni appartenenti al(ai) locus (i) hanno un‟azione importante, sempre identificabile e definibile. Per tale proprietà tali geni sono detti maggiori in confronto ad altri, detti minori perché la loro azione è scarsamente rilevante e di difficile valutazione; questi ultimi intervengono nell‟eredità dei caratteri qualitativi. Quando esiste variazione del carattere nella popolazione, questa si presenta sempre in maniera discontinua. Le varie espressioni del carattere possono cioè essere raggruppate in classi ben separabili le une dalle altre e sempre facilmente identificabili. È sempre possibile perciò ottenere una classificazione del carattere in fenotipo ben separabili. All‟opposto, una gran numero di caratteri presenta una variabilità che non può essere suddivisa in fenotipi ben definiti perché essa è costituita da una gamma continua di fenotipi con tutti i possibili intermediari da un tipo all‟altro; tali caratteri sono detti a variazione continua o quantitativi. Nei caratteri qualitativi, lo studio del meccanismo ereditario si basa sull‟analisi della discendenza in incroci individuali conosciuti e determinati; essi prendono il nome di segregazioni. La variabilità del carattere della popolazione si basa sull‟analisi per enumerazione dei soggetti di ciascuna classe e su calcoli di proporzioni. La definizione di carattere qualitativo necessita perciò della contemporanea presenza delle condizioni di eredità semplice e di variazione discontinua. Se prese individualmente, infatti, esse non sono in grado di definire con sicurezza un carattere qualitativo per l‟esistenza di due situazioni particolari e cioè eredità semplici che si presentano a variazione continua e, all‟inverso, caratteri pologenici (e quindi ad eredità complessa) che presentano un‟espressione fenotipica tipicamente discontinua i cosiddetti caratteri a soglia. Gli esempi del primo tipo sono stati descritti soprattutto nella genetica vegetale ed un autore, Weber (1959-1960 a,b) ha anche messo a punto un sistema di analisi statistica capace di evidenziare tale situazione sia nelle segregazioni monoibride che di ibride. Un esempio di tale situazione è rappresentata dalla distribuzione dell‟attività della fosfatasi acida del globulo rosso. L‟analisi elettroforetica dell‟enzima eritrocitari fosfatasi acida mostra che si possono chiaramente distinguere sei genotipi determinati da tre alleli. Gli alleli danno luogo ad enzimi che possiedono qualche differenza nella loro attività enzimatica: A è il meno attivo, B ha un‟attività intermedia. C‟è il più attivo. Gli individui eterozigoti mostrano attività che sono quasi esattamente intermedie fra quelle dei rispettivi 10 omozigoti. Ciascuno di tali genotipi presenta perciò un‟attività enzimatica che si distribuisce in maniera continua; i fenotipi però non possono venire distinti sulla base della sola attività enzimatica perché le distribuzioni tendono a sovrapporsi. Se si considera l‟attività edematica della popolazione generale senza distinguere i diversi genotipi, si ottiene una distribuzione perfettamente continua che maschererebbe completamente l‟eredità semplice che ne è alla base. Di maggiore interesse è l‟altra eccezione rappresentata dai caratteri a soglia. Sono infatti di questo tipo alcuni caratteri di grande interesse zootecnico, quali la predisposizione individuale a varie malattie, la prolificità che compare in specie tendenzialmente unipare e la mortalità perinatale e neonatale intesa nel suo insieme. Fanno parte di tale gruppo anche alcuni caratteri anatomici quali il numero di vertebre nel topo e, forse, nel suino domestico e il numero di data soprannumerarie del topo. Si definiscono a soglia quei carattere che non mostrano una variazione continua, ma che in un individuo sono presenti o assenti. Al di sotto di tale discontinuità fenotipica, però, esiste una variazione continua nella disposizione a manifestare questi caratteri; vi è inoltre ciascuna combinazione genotipica è soggetta all‟influenza dell‟ambiente, per cui la distribuzione della disposizione stessa è il frutto dell‟interazione tra i genotipi e l‟ambiente. La soglia è perciò un punto lungo la distribuzione della disposizione che separa le classi fenotipiche; quando cioè la disposizione si trova al di sotto della soglia l‟individuo presenta una certa espressione fenotipica; quando invece è al di sopra, l‟individuo presenta l‟altra espressione. Esistono caratteri che presentano più di due classi fenotipiche per cui esistono lungo la curva di distribuzione due o più soglie. Ritornando perciò alle definizioni di partenza, per poter parlare di carattere qualitativo bisogna dimostrare che la variazione discontinua sia legata ad un determinismo ereditario semplice. Tale dimostrazione può essere ottenuta attraverso studi di segregazione dei caratteri (nel caso in cui si dimostri che essi producano proporzioni fenotipiche particolari, ripetibili e quindi prevedibili), sia nel caso di rapporti allelici all‟interno di un locus sia nel caso di analisi dell‟azione di più loci contemporaneamente, cioè della segregazione di più caratteri diversi gli uni dagli altri. Le proporzioni a cui fare riferimento sono parecchie; le prime furono introdotte all‟inizio del „900 da un gruppo di genetisti europei e statunitensi che riscoprirono i lavori realizzati a metà del secolo precedente da un monaco boeme, Gregorio Mendel, dal quale la branca della genetica dei caratteri semplici ha preso nome genetica mendeliana. L‟originalità degli studi di Mendel riposa essenzialmente sul metodo utilizzato per gli studi, e cioè sull‟utilizzo di segregazioni e sulla valutazione statistica degli stessi. A partire dai suoi studi si è poi creato un vero e proprio “corpus” dottrinale, che ha progressivamente rivisto, alla luce delle sempre maggiori conoscenze, le basi teoriche dei caratteri e, soprattutto, è riuscito ad associare l‟analisi del comportamento ereditario dei caratteri alla realtà genetica dei individui. Solo per memoria storica si deve ricordare che la teorizzazione mendeliana era basata su tre postulati: - Il principio del carattere unità, secondo il quale ciascun carattere è determinato dall‟azione di un solo fattore ereditario che viene trasmesso alla discendenza per mezzo della riproduzione sessuale. - Il principio della purezza dei gameti, secondo il quale i gameti maschili e femminili prodotti dai individui ibridi sono puri, cioè contengono uno e uno solo dei geni determinanti i due caratteri di una coppia allelomorfa. - Il principio della indipendenza dei caratteri, per il quale ogni carattere è indipendente rispetto agli altri. Dei tre postulati rimane valido solo il secondo: gli altri due sono stati negati dai genetisti attraverso gli studi successivi. LE LEGGI DELLA TRASMISSIONE EREDITARIA a) LA TEORIA CROMOSOMICA DELL’EREDITÀ E LE CONSEGUENZE A LIVELLO GENETICO DELLA MEIOSI Tutte le leggi della trasmissione ereditaria dei caratteri trovano la loro giustificazione in due situazioni particolari: a) la ripartizione dei cromosomi negli individui disploidi; 11 b) le conseguenze della meiosi a livello genico. Il corredo cromosomico di un individuo diploide è costituito da coppie di cromosimini omologhi, di derivazione uno paterna e l‟altro materna. Ciò fa sì che ogni individuo possieda per un locus qualsiasi sempre due geni, uno portato dal cromosoma paterno e l‟altro da quello materno. Le situazioni che si possono presentare sono diverse a seconda dei geni che si incontrano. Innanzi tutto i due geni possono essere uguali, cioè avere stessa sequenza nucleotidica e stessa funzione sintetica, per cui l‟individuo sarà genotipicamente omozigote. Oppure l‟individuo può portare due geni diversi, cioè due geni alleli (o semplicemente due alleli), quindi esso sarà eterozigote. Le possibilità di omozigosi ed eterozigosi saranno in relazioni al polimorfismo esistente all‟interno del locus nella popolazione. Ciò non toglie che ogni singolo individuo potrà avere due e solo due geni contemporaneamente. Fa eccezione alla regola dell‟omologia cromosomica la coppia eterocromosomica, che nei mammiferi è presente nei maschi ed è costituita da un cromosoma X e da uno Y, completamente diversi tra loro. Nei volatili la coppia eterocromosomica è invece femmine. Una coppia di cromosomi porta generalmente un numero piuttosto elevato di loci, che rappresentano un gruppo di associazione, i gruppi saranno perciò tanti quante sono le coppie cromosomiche, cioè n, ad eccezione del maschio nei mammiferi e delle femmine nei volatili, dove saranno n-1. Poiché il cromosoma si trasmette interno dai genitori ai figli, è evidente che i loci appartenenti allo stesso gruppo di associazione saranno trasmessi insieme. È ampiamente risaputo che per meiosi si intende un processo di divisione cellulare che interessa le cellule germinale, cioè le ovocellule e gli spermatozoi. Il significato cromosomico di tale divisione riposa nella possibilità di produrre gamete dotati di un corredo ridotto della metà rispetto a quello delle cellule germinale indifferenziate; solo un dei due cromosomi omologhi di ciascuna coppia, cioè entra nella costituzione dei gamete. L‟unione di due gamete “aploidi” (cioè a numero n di cromosomi) permette la ricostruzione di uno zigote a corredo “diploide”. Il passaggio casuale dei cromosomi di ciascuna coppia nei gameti ha conseguenze importantissime nella distribuzione dei geni. Se un individuo è eterozigote, infatti, produrrà due tipi di cromosomi e quindi due tipi di gameti, uno portatore solo del primo allele e l‟altro solo del secondo. Se esistono nello stesso gruppo di associazione altri loci polimorfi, ciascun allele di ogni locus si combinerà con gli alleli degli altri nel cromosoma in maniera del tutto casuale, ciascun cromosoma cioè è portatore di una combinazione all‟elica del tutto originale rispetto a ciascun altro cromosoma della sua coppia; i gameti prodotti non sono perciò equivalente da un punto di vista genetico, ma sono portatori di forme geniche differenti. In un individuo il cui numero di cromosomi è uguale a X, il numero Y totale di combinazioni cromosomiche possibili è pari a: Y = 2x. La meiosi è importante anche per il fenomeno del crossing-over cioè dello scambio di frazioni di DNA tra cromosomi omologhi. Tale fenomeno permette infatti di creare nuove combinazioni gametiche rispetto a quelle che si avrebbero normalmente e quindi rappresenta un importante fattore di variabilità nelle popolazioni. B) MECCANISMI DI CREAZIONE DELLE SERIE POLIALLELICHE Una buona parte dei loci che costituiscono il menoma degli individui eucaristici e procariatici presentano più forme geniche, per cui parleremo di serie poliallelica quando in uno stesso locus sono identificabili uno o più alleli. Bisogna ricordare naturalmente che un individuo normale non può portare, nelle specie diploidi, più di due alleli differenti per ogni locus, posti ciascuno su uno dei due cromosomi omologhi. I meccanismi attraverso i quali si creano serie polialleliche sono attualmente abbastanza conosciuti. Qui di seguito verranno rapidamente ricordati. Le mutazioni geniche o mutazioni puntiformi rappresentano modificazioni chimiche nucleotidiche dovute a sottrazione addizione o altre modifiche riguardanti singoli geni o piccoli gruppi di geni. 12 L‟alterazioni di almeno un gene di un cromosoma si può definire mutazione quanto è stabile, compatibile con la vita e trasmissione alle cellule figlie. Questa proprietà fanno sì che la mutazione rappresenti un fonte importante di variabilità genetica tra gli individui di una popolazione. Esistono mutazioni somatiche e mutazioni germinali: le prime avvengono in cellule somatiche del corpo e non sono trasmesse alla discendenza, le seconde si verificano in cellule germinali del testicolo o dell‟ovario e si possono trasmettere alla discendenza. Gli individui nei quali avviene una mutazione somatica vengono definiti mosaici genetici perché hanno due cloni cellulari geneticamente distinti. Le mutazioni geniche riconoscono tre meccanismi: a) La sostituzione di basi – una coppia di basi viene sostituita da una coppia differente. La sostituzione provoca una sostituzione aminoacidica. b) La delezione di basi – la lettura scala di una base azotata. c) L‟inserzione di basi – si ha uno spostamento della lettura del codice. La delezione e l‟inserzione cambiano il gene per cui si ha la sintesi di una proteina diversa; in certi casi, la delezione blocca la normale sintesi proteica. La sostituzione è invece abbastanza conservativa ed è la causa, insieme la crossing-over, della variabilità genetica all‟interno di una popolazione. Gli effetti della sostituzione aminoacidica dipendono dalla regione polipeptidica ove essi avvengono. Tali cambiamenti possono essere drastici, lievi o addirittura nulli. Quest‟ultimo evento si può verificare quando: - la sostituzione avviene in una regione che può tollerarla senza subire cambiamenti; - la sostituzione avviene tra aminoacidi simili (ad esempio, leucina con isoleucina); - la sostituzione avviene tra codoni che codificano tutti per lo stesso aminoacido. In tutti questi casi il fenotipo risulterà normale la mutazione verrà svelata mediante elettroforesi. Altre situazioni portano, invece a risultati più evidenti. Una mutazione si dice non senso (nonsense) quando crea, in una regione codificante, un codono di terminazione; il gene perde perciò la capacità codificante. La mutazione frame-shift provoca lo slittamento del codice di lettura. Infine, la mutazione di senso (missense), può esistere in due situazioni differenti, la trasversione e la transizione. La prima consiste in una sostituzione di basi puriniche con basi pirimidiniche, e viceversa; la seconda nella sostituzione di purine epirimidine tra loro. In entrambi i casi, la mutazione di senso produce un nuovo gene. È soprattutto attraverso questo meccanismo che la mutazione genica diviene la principale causa della formazione delle serie polialleliche: all‟interno di una popolazione, cioè uno stesso locus non contiene sempre lo stesso gene selvaggio, ma si arricchisce di una serie più o meno numerosa di alleli, con conseguente aumento della variabilità della popolazione stessa. Generalmente l‟allele selvaggio rimane però il più frequente. Le mutazioni possono essere classificate in varie maniere; accenneremo alle principali. Un primo sistema può essere rappresentato dall‟età d’insorgenza, nella quale il criterio è rappresentato dall‟in cui compare il fenotipo associato alla mutazione. In funzione degli effetti letali che una mutazione può provocare possiamo avere: - mutazioni letali, cioè incompatibili con la vita del soggetto o capaci di provocare sterilità maschile o femminile (letalità di tipo evoluzionistico); - mutazioni condizionali, cioè mutanti letali che si esprimono solo in determinati ambienti (sono infatti temperatura-sensibili, per cui in certi casi la temperatura crea una “condizione restrittiva”, in altri crea una “condizione permissiva”). In relazione alla capacità di influenzare altre mutazioni si distinguono: - mutazioni Enhancer, le quali intensificano gli effetti fenotipici di altre mutazioni; - mutazioni soppressive, che riducono, invece, questi stessi effetti. In entrambi i casi si parla di mutazioni modificatrici. Le mutazioni instabili costituiscono una categoria di mutazioni individuata da pochissimi anni; esse sono responsabili di alcune malattie ereditarie dell‟uomo, tra cui il ritardo mentale conseguente alla fragilità del cromosoma X e la distrofia miotonia. Nel primo caso il meccanismo della mutazione 13 consiste in due fasi successive: la prima, chiamata “permutazione”, interessa solo i soggetti che trasmettono la malattia senza esserne colpiti (i maschi normali portatori e la maggior parte delle femmine portatrici); la seconda, detta “mutazione completa” interessa tutti i soggetti colpiti. Le permutazioni si manifestano con un moderato aumento della lunghezza di un piccolo frammento di DNA mentre le mutazioni complete consistono in un aumento significativo della grandezza del frammento precedentemente aumentato durante la maturazione delle cellule sessuali femminili, in conseguenza all‟instabilità della regione del DNA che porta il gene in questione. La mutazione completa si associa a mutilazione; del DNA limitrofo. Ciò che appare infine è una espansione progressiva di una parte di un gene, composta dalla ripetizione di tre nucleotidi (CGG). Gli uomini portatori di una permutazione la trasmettono a tutte le figlie senza eccezione; esse sono perciò tutte portatrici sane. Allorché una donna trasmette la permutazione, questa diviene spesso una mutazione completa, associata ad un ritardo mentale nel 100% dei figli maschi e nel 50% delle femmine. La mutazione instabile spiega nel caso del ritardo mentale associato a fragilità della X il particolare andamento di tale patologia che interessa circa un terzo delle femmine portatrici e, soprattutto, può essere trasmessa anche da maschi che non presentano né ritardo mentale né siti fragili. Nella distrofia miotinica il meccanismo è diverso; si tratta della ripetizione di trinucleotidi CTG nel gene che codifica per una proteina regolatrice, la proteina chinasi… in questo caso però non si osserva un fenomeno tutto o niente (permutazione/mutazione), ma piuttosto un aumento della gravità della malattia con l‟aumentare della espansione. Inoltre, in questa mutazione manca la mutilazione del DNA. L‟instabilità di sequenze di DNA nella sindrome dello X fragile e nella distrofia mioclonica sembra legata alla lunghezza delle sequenze ripetute, ma al momento non è chiaro se essa interessa ogni sequenza lunga composta da motivi semplici o solamente certi motivi specifici, creando una conformazione anormale del DNA e, conseguentemente, delle difficoltà alla replicazione. I recenti progressi della genetica molecolare hanno dimostrato che la mutazione genica non è l‟unico meccanismo capace di provocare variazione genetica del DNA; per questo si parla di nuove fonti di variazioni genetiche. I principali fenomeni chiamati in causa sono: - la ricombinazione per omologia, nei due meccanismi del crossino-over illegittimo e della conversione genica; - i vari riarrangiamenti cromosomici; - la mobilizzazione di transposon (elementi genetici mobili); - la mobilizzazione di retrovirus; - la retrotrasposizione; - il trasferimento naturale dei geni tra specie diverse; - le cosiddette variazioni somaclonali. La ricombinazione per omologia rappresenta uno scambio di DNA tra sequenze all‟eliche portate ciascuna da due cromosomi omologhi. Si differenzia ulteriormente in crossing over ineguale e conversione gemica. Il crossing-over ineguale (ricombinazione ineguale) crea una situazione di asimmetria fra due cromosomi. Due sequenze di DNA, A e B, omologhe e ripetute in tandem si ricombinano in modo ineguale con conseguente asimmetria tra i due cromosomi: uno dei due, infatti, porta tre sequenze mentre l‟altro avendo subito una delezione ne avrà una sola. La ricombimnazione produce dei geni ibridi e si traduce in una ripartizione ineguale dei geni sui due cromosomi omologhi per amplificazioni e contrazioni di intere zone del menoma. Un esempio di crossing-over ineguale è l‟emoglobina detta “lepore”, che nell‟uomo provoca una anemia molto grave: essa è il risultato di una ricombinazione ineguale della famiglia multigenica dell‟emoglobina umana data da un appaiamento difettoso di due cromosomi omologhi durante la divisione meiotica di due geni al cromosoma numero 11. La conversione genica consiste in un trasferimento di una parte di un gene in un altro, con formazione di un gene chimerico. Poiché il gene donatore resta inalterato, si può supporre che tale trasferimento di DNA avvenga durante la sintesi del DNA nel corso della meiosi. Al termine del fenomeno della conversione genica, si avrà la presenza di geni normali su uno dei due cromosomi omologhi e la presenza, sull’altro di un gene normale e di un gene chimerico. 14 La conversione genica è, probabilmente, un meccanismo relativamente generico che può realizzarsi sia tra due alleli sia tra sequenze ripetute codificanti e non. Essa provoca due effetti: introduce una grande variabilità ma nel contempo omogeinizza le sequenze in modo tale da provocare notevole vicinanza tra i membri di una famiglia multigenica. All‟opposto della ricombinazione per omologia, esiste anche una ricombinazione illegittima; essa riguarda segmenti di DNA che non hanno omologia di sequenze ed è frequente soprattutto nelle sequenze ridondanti. Il meccanismo d‟azione di una ricombinazione per omologia è abbastanza ben conosciuto. Una endonucleasi provoca una rottura cromosomica (Nick); partendo da tale punto i filamenti possono srotolarsi per un breve tratto per appaiarsi poi al filamento complementare dell‟altro duplex. Le regioni dove un filamento integro di uno dei due duplex si appaia con il filamento che ha subito la rottura dell‟altro duplex vengono definite eteroduplex; dopo la formazione degli eteroduplex gli scheletri di zucchero e fosfato dei filamenti sono saldati dalla DNA-LIGASI. Il cambiamento di struttura spaziale comporta la formazione di una struttura a forma della lettera greca chi. Si può comunque giungere alla riconversione della struttura a chi in due duplex separati per azione di nick di un‟altra endonucleasi in due dei filamenti, scambio fra questi e definitiva saldatura da parte della DNA-LIGASI. Il verificarsi della ricombinazione dipende dal modo in cui si risolve la struttura a chi: esistono all‟uopo due possibilità: a) la formazione di duplex non ricombinanti; b) la formazione di duplex ricombinanti. In entrambi i casi permangono aree di DNA aventi eteroduplex. Gli errori di appaiamento possono essere riparati: a) attraverso la correzione automatica nella successiva replicazione; b) attraverso il meccanismo del mismatch repair che consiste nell‟asportazione, dal filamento di DNA, del nucleotide erroneamente appaiato e nella sua sostituzione con quello giusto. Il tutto avviene per l‟azione di due enzimi; una endonucleasi che rompe lo scheletro di zucchero e fosfato nei pressi dei nucleotidi appaiati male e una esonucleasi che asporta un tratto di questo filamento; producendo un‟interruzione che comprende le coppie appaiate male. Se il mismatch repair si applica al fenomeno della conversione genica, il risultato sarà un allele convertito nell‟altro. Alcune aberrazioni cromosomiche (duplicazioni, delezioni, inversioni) possono essere responsabili di variazioni geniche attraverso vari meccanismi quali la delezione e la duplicazione di parti o di tutto un gene, l‟inattivazione conseguente a rottura, l‟avvicinamento del gene a nuovi promotori o a sequenze enhancers o soppressive, la creazione di trascritti antisenso o capaci di inibire dei promotori. I transposons sono elementi genetici dotati di capacità traspositiva, replicativi e di escissione autonome; essi possono perciò alterare la struttura di un gene attraverso vari meccanismi quali l‟inserimento all‟interno di un gene con conseguente in attivazione dello stesso, l‟alterazione della trascrizione di geni contigui, l‟escissione reciproca ecc. i trasposons degli eucarioti sono classificati in 4 classi, e mostrano polimorfismo sia nella localizzazione che nel numero di copie presenti, generalmente molto alto. La prima famiglia comprende i cosiddetti retrotrasposons, elementi simili ai retrovirus. I retrasposons, elementi simili ai retrovirus. I retrotrasposons presentano ripetizioni dirette di ciascuna estremità (LTRs) essenziali per l‟inserzione nel DNA ospite. Si traspongono al DNA eucaristico tramite un RNA intermedio. Presentano nella loro struttura fino a tre geni: il primo è simile al gene gag del retrovirus, dove ha funzione di codificazione di proteine interne strutturali; il secondo è simile al gene pol del retrovirus e codifica per una trascrittasi inversa; il terzo non è sempre presente e non ha similitudini con geni retrovirali. La seconda classe è costituita dai retrotrasposons non virali, i quali si traspongono al DNA eucaristico per mezzo di un RNA intermedio. Presentano nella loro struttura due geni, uno simile al gene gag l‟altro al gene pol dei retrovirus. Quest‟ultimo codifica per una trascrittasi inversa. La terza classe è costituita da elementi con piccole ripetizioni terminali invertite, tra i quali alcuni contengono un gene che codifica per una traspostasi la quale permette la loro trasposizione diretta nel dna eucaristico. L‟ultima classe, la meno conosciuta è rappresentata infine da elementi con lunghe ripetizioni terminali. 15 Un meccanismo d‟azione identico ai trasposons hanno i retrovirus, virus a RNA capaci di sintetizzare a scopo replicativi un DNA intermedio il quale può così inserirsi nel dna di cellule ospiti e di provocare variazioni. La retrotrasposizione consiste nella formazione di pseudogeni come conseguenza di una trascrizione inversa dell‟mRNA e conseguente inserzione degli stessi nei cromosomi. Il trasferimento di geni tra specie diverse è stato osservato naturalmente e dimostrato sperimentalmente. Il trasferimento naturale chiama in causa sia i retrovirus che i plasmidi; quello artificiale consiste nella creazione di animali transgenici. Infine, le variazioni somaclonali sono state dimostrate in culture cellulare vegetali, le quali acquisiscono, con un meccanismo ancora sconosciuto, un elevato tasso di mutazioni. Sebbene mai dimostrate negli animali, esse potrebbero essere responsabili delle variazioni che si producono tra animali geneticamente identici prodotti attraverso manipolazioni in vitro quali l‟embryo splitting e la traspiantazione nucleare. c) ESPRESSIONE FENOTIPICA DEI GENI CODIFICANTI In un individuo diploide i cromosomi vanno sempre in coppia (con l‟eccezione degli eterocromosomi nei maschi) per cui in uno stesso locus si avranno sempre due geni. Nel caso dell‟esistenza di due o più alleli l‟individuo potrà essere omozigote per uno degli alleli o eterozigote. Gli omozigoti manifestano il carattere derivante dall‟azione biosintetica dei due geni uguali, i quali si esprimono entrambi. Fanno eccezione a tale regola i cosiddetti alleli nudi e i geni portati da uno dei due cromosomi X nella femmina (inattivazione funzionale di uno dei cromosomi X nella femmina o fenomeno di Lyon). L‟espressione fenotipica dell‟eterozigote, invece, dipende non solo dalle capacità biosintetiche dei due geni, ma anche delle interazioni che i loro trascritti intratterranno tra loro una volta sintetizzati. Infine, esistono alcune situazioni particolari nelle quali l‟attività biosintetica dei geni è più complicata di quella che normalmente si esplica. d) ECCEZIONI ALL’ESPRESSIONE FENOTIPICA DEGLI OMOZIGOTI GLI ALLELI NULLI Si definiscono alleli nulli o silenziosi geni che in condizioni di omozigosi presentano una attività biosintetico che non può essere messa in evidenza con le tecniche analitiche anche più sofisticate o, addirittura, non hanno più alcuna attività biosintetica. L‟azione di tali alleli è evidente soprattutto a livello enzimatico, dove di solito rappresentano il livello più basso della variazione quantitativa dell‟attività enzimatica stessa. Per la loro caratteristica sono geni difficilissimi da essere individuati; anche in eterozigoti, infatti, essi passano solitamente inosservati, a meno che non si ricorra all‟analisi genealogica delle loro segregazioni. Un esempio interessantissimo di allele nullo è rappresentato da una variante genetica alle αs1 Caseine nella capra, presente negli animali che dimostrano assenza di tale proteina nel latte. Un altro esempio interessante è rappresentato dall‟allele recessivo al locus Agouti (chiamato “non agouti”). Tale locus è responsabile della sintesi delle feomelanine; l‟allele recessivo inibisce completamente dalle attività biosintetica, permettendo all‟animale di apparire completamente nero. L’INATTIVAZIONE FUNZIONALE DELLA X Benché gli individui di sesso maschile siano emizogoti per il cromosoma X (essi ne hanno una solo copia), la quantità minima dei prodotti di espressione dei geni localizzati sul cromosoma X, quale l‟attività della glucosio-6-fosfato deidrogenasi (G6PD) nei globuli rossi, è identica a quella osservata negli individui di sesso femminile che hanno due cromosomi X. Quindi, deve esistere un meccanismo di compensazione di queste attività enzimatiche. Gli studi indipendenti di 4 specialisti in genetica, ARY LYON, LIANNE RUSSEL, ERNEST BEUTLER E SUSUMO OHNO , hanno 16 permesso la comprensione di questo meccanismo attualmente conosciuto sotto il nome di “ipotesi di Lyon” (figura 8). Secondo questa ipotesi: a) nelle cellule somatiche, l‟inattivazione di un cromosoma X avviene precocemente nella vita embrionale; b) l‟inattivazione è aleatoria, vale a dire che può essere inattivato il cromosoma X paterno o quello materno; c) l‟inattivazione è completa, sarebbe a dire la quasi totalità del cromosoma X è inattivato; d) l‟inattivazione del cromosoma X è permanente e trasmessa in modo clonale; se il cromosoma X di origine paterna è inattivo in una data cellula, tutte le cellule provenienti da questa cellula madre esprimeranno un cromosoma X attivo di origine materna, invece il cromosoma X di origine paterna rimarrà inattivo. Il risultato della “Lyonizzazione” è che l‟individuo di sesso femminile è un mosaico di cellule, ognuna essendo fondamentalmente emizigote per l‟uno o l‟altro dei cromosomi X. Esistono delle eccezioni alle regole enunciate riguardanti l‟inattivazione dell‟X. Questa inattivazione è certo aleatoria, ma un X di struttura anormale, sarebbe a dire portatore di una delezione, è preferibilmente inattivato. D‟altra parte, negli individui portatori di una traslocazione su un cromosoma X, è il cromosoma X che è generalmente inattivato. Benché l‟inattività del cromosoma X sia estesa alla sua quasi totalità, non è mai completa. Almeno due geni all‟estremità del braccio corto della X, quelli codificanti per l‟antigene Xg e l‟enzima steroide sulfatasi sfuggono all‟inattivazione. Inoltre certi geni sui bracci lunghi della X (Xq26) sfuggono alla inattivazione per mantenere la funzione ovarica fino all‟età normale della menopausa. Infine, è evidente che mentre l‟inattivazione della X è permanente nella maggior parte delle cellule somatiche, essa deve essere reversibile nello sviluppo delle cellule germinali. L’ESPRESSIONE FENOTIPICA DEGLI ETEROZIGOTI a) DOMINANZA SEMPLICE O MENDELIANA Si parla di dominanza totale quando tutti gli eterozigoti presentano il fenotipo corrispondente a uno dei genotipi omozigoti, che assumerà perciò il nome di dominante. Il fenotipo corrispondente all‟altro genotipo omozigote è chiamato invece recessivo. La dominanza e la recessività associate ad un solo locus biallelico dovrebbero essere più propriamente chiamate dominanza semplice o recessività semplice per evitare confusioni con altri significati che nella genetica delle popolazioni ed in quella quantitativa vengono attribuiti al termine. La dominanza si esplica con diversi meccanismi. Il più semplice consiste nell‟inattività dell‟attività funzionale dell‟allele recessivo: più spesso, soprattutto a livello enzimatico, l‟enzima prodotto dal gene dominante presenta una maggiore velocità di azione o una maggiore affinità con il substrato o ancora una maggiore resistenza all‟attività catalitica di quello prodotto dal recessivo; altre volte, la proteina prodotta dal gene dominante ha un‟azione soppressiva su quella prodotta dal recessivo. La dominanza e la recessività in un locus producono delle proporzioni caratteristiche, sia a livello fenotipico che genotipico. Due di tali proporzioni derivano dalle prime due leggi di Mendel. La prima, detta della dominanza dei caratteri recita “se si accoppiano tra loro soggetti che presentano due forme diverse dallo stesso carattere (ad esempio, due diversi colori), i soggetti che nascono porteranno tutti una delle due forme, che sarà perciò definita dominante, rispetto all‟altra, detta recessiva”. La seconda, o legge della segregazione dei caratteri; “riaccoppiando tra loro i soggetti nati dagli accoppiamenti di cui alla prima legge, ¾ dei nuovi nati avrà fenotipo dominante e ⅓ fenotipo recessivo”; ricompare cioè in questa generazione il carattere che era scomparso nella precedente. Esse fanno riferimento infatti a due dei sei possibili sistemi di segregazioni per un locus biallelico. Il primo consiste nella segregazione tra omozigoti dominanti e omozigoti recessivi; tutti gli F1 che da essi 17 derivano sono eterozigoti e presentano tutti fenotipo dominante. Il secondo consiste nella segregazione di soggetti eterozigoti; in questo caso si avranno due fenotipi, uno dominante ed uno recessivo, e tre genotipi, i due omozigoti e l‟eterozigote; quest‟ultimo sarà fenotipicamente identico a uno degli omozigoti che prende così il nome di dominante, in opposizione all‟altro che sarà invece recessivo. Il rapporto fenotipico di segregazione sarà di tre feonotipi dominato ogni uno recessivo; ad esso corrisponde un rapporto di ¼ di omozigoti dominanti, 2/4 di eterozigoti e ¼ di omozigoti recessivi. La tabella 1 e 2 riportano tutti e 6 i sistemi di segregazione possibili. L‟implicazione pratica più importante della dominanza semplice è che i soggetti omozigoti dominante e quelli eterozigoti non sono fenotipicamente distinguibili. b) DOMINANZA INTERMEDIA E CODOMINANZA Pur se spesso considerati sinonimi, i termini di dominanza intermedia e di codominanza fanno riferimento in realtà a due situazioni differenti. Nel primo caso, l‟espressione fenotipica dell‟eterozigote è intermedia rispetto a quella dei due omozigoti. Espressione intermedia non vuol dire necessariamente che l‟eterozigote è perfettamente intermedio, ma che si trova tra l‟espressione fenotipica dei due omozigoti. La dominanza intermedia è molto spesso presente nel comportamento di alcuni enzimi responsabili di malattie metaboliche, e ciò permette di ottenere una rapida diagnosi della condizione di portatore (cioè di individuo a genotipo eterozigote). Nella codominanza, invece, l‟eterozigote mostra le proprietà di entrambi gli alleli. Gli esempi di quest‟ultima situazioni sono numerosi. Le due situazioni possono essere trattate insieme perché in entrambe è possibile distinguere gli eterozigoti dai due omozigoti dominanti. Nelle segregazioni corrispondenti ai vari tipi di accoppiamento per un locus biallelico, perciò esiste sempre perfetta corrispondenza tra i rapporti fenotipici e quelli genotipici. c) I PARAMETRI DI PENETRANZA ED ESPRESSIVITÀ La penetranza è un parametro che caratterizza l‟azione di ogni genotipo. Essa può essere quantificata come proporzione di individui che mostrano l’effetto fenotipico usuale del genotipo in esame. Se un dato genotipo occasionalmente non è in grado di produrre il suo fenotipo usuale, esso mostra solo una manifestazione parziale per cui si dice che tale genotipo è incompletamente penetrante. Per i caratteri dominanti, la penetranza incompleta interessa solitamente gli eterozigoti, che appaiono come fenotipi recessivi (Aa, aa); più raramente possono essere interessati gli omozigoti recessivi, che appariranno come eterozigoti dominanti (aa, Aa). È anche possibile che l‟omozigote dominante appaia come il recessivo (AA, aa). La scelta dei fenotipi interessati è del tutto occasionale. Una parziale spiegazione a tale occasionalità può derivare dall‟azione di condizionamento sull‟espressione fenotipica di un genotipo operata da altri geni non alleli e da condizioni ambientali (modificazione della dominanza) e certe combinazioni geniche rappresentino situazioni genetiche non bilanciate; nella vita prenatale esse possono perciò essere influenzate da differenti fattori fisiologici per cui, interagendo con piccole cause esterne, possono perdere la capacità di produrre un certo fenotipo; in tal caso, essendo l‟influenza fisiologica e quella ambientale del tutto casuali, solo una certa parte dei genotipi sarà interessato; l‟altra parte rimarrà perfettamente penetrante. La penetranza è un parametro esclusivamente genotipico: esso non può essere in alcun caso attribuito ad un singolo gene, inoltre, la penetranza non deve essere confusa con l‟azione di geni soppressori o inibitori, come in alcuni casi di epistasi. La stima del parametro di penetranza richiede: - la conoscenza del tipo di eredità del carattere considerato; - la frequenza relativa dei casi in cui il genotipo manca nell‟esprimere il carattere appropriato. 18 Quando è penetrante, uno stesso genotipo può presentare una serie di manifestazioni fenotipiche. Questa situazione prende il nome di espressività di un genotipo. Generalmente i caratteri qualitativi a penetranza totale si presentano fenotipicamente uniformi; sono i caratteri a penetranza ridotta che possono presentarsi non uniformi da un punto di vista fenotipico. L‟espressività variabile si associa sempre perciò alla penetranza ridotta. Essa può essere spiegata chiamando in causa diverse situazioni: - possono esistere geni particolari, detti modificatori che cambiano solo leggermente l‟effetto fenotipico di geni maggiori. Il ruolo di tali geni non è ben conosciuto ed è difficile stabilire i loro rapporti di segregazione; - le condizioni ambientali, combinate con la base genetica, possono cambiare entro certi limiti la manifestazione fenotipica di un genotipo; - infine, alcuni caratteri possono essere controllati non da un singolo gene maggiore, ma da più geni e vari loci con effetto cumulativo. d) LA PLEIOTROPIA La pleiotropia rappresenta una proprietà di un gene e consiste nella sua capacità di sintetizzare più caratteri contemporaneamente. In tutti gli organismi viventi, molte vie biosintetiche sono spesso interconnesse e interdipendenti. È possibile perciò che i prodotti di una catena metabolica possano essere utilizzati da altre e viceversa. Un gene può perciò manifestarsi con più di una espressione fenotipica. Nella maggior parte dei casi, un carattere sarà molto ben evidente, mentre gli altri appariranno più come effetti secondari, spesso anche mal collegabili al principale; molte malattie monogenetiche presentano tale meccanismo di manifestazione fenotipica. Più raramente, le manifestazioni importanti sono varie, ma sempre piuttosto simili tra loro. L‟insieme delle espressioni fenotipiche di un gene fa parlare di effetti pleiotropici. La pleiotria può essere confusa con l‟associazione, soprattutto se questa è completa o manifesta bassa frequenza di crossing-over. L‟associazione va considerata possibile rispetto alla pleiotropia quando: - i due caratteri, ciascuno conosciuto come entità genetica specifica, sono presenti solo in uno scarso numero di famiglie; - anche un solo individuo presenta uno solo dei due caratteri; - entrambi i caratteri presentano espressività totale; - nessun legame biochimico o fisiologico è conosciuto o è plausibile tra i due caratteri. Un esempio classico di falsa pleiotropia è rappresentato dai caratteri dell‟ipertermia maligna conseguente ad anestesia con alitano e ipertrofia muscolare nel suino. Facciamo degli esempi: e) LA LETALITÀ Certi alleli si manifestano con la morte dell‟individuo prima della maturità, nel periodo pre o post-natale; vengono definiti perciò letali. Un gene si definisce letale quando in doppia dose porta a morte l‟individuo portatore. Il fenomeno si realizza cioè allo stadio diploide, allo stadio omozigote. Inoltre la mortalità si può avere anche allo stadio di gamete: i gameti portatori del gene sono non viabili. In generale: gli omozigoti muoiono, mentre gli eterozigoti sopravvivono, ma risultano spesso poco fecondi, poco resistenti e più predisposti alle malattie. La letalità fu scoperta da Cuenot nei suoi studi sui topi di laboratorio “yellow”. Accoppiando topi gialli tra di loro, Cuenot constatò che non era mai possibile ottenere linee gialle pure; all‟interno di una popolazione si ottenevano sempre degli individui che per ⅔ erano gialli e per il restante terzo erano neri. Ciò è spiegato dal fatto che i topi gialli sono tutti eterozigoti poiché gli omozigoti non nascono, il gene responsabile del colore giallo è dunque letale. I geni letali possono essere: 19 dominanti: portano a morte sia l‟omozigote dominante che l‟eterozigote; di solito possono sopraggiungere per mutazione di un allele recessivo: b) recessivi: portano a morte solo l‟omozigote recessivo; l‟eterozigote è perfettamente normale o presenta qualche piccola deficienza. Ancora possono essere: - autosomici; - legati al sesso. Quelli di tipo autosomico hanno spesso penetranza incompleta, o sono pleiotropici. A volte, infine, la loro espressione può essere limitata dal sesso. Certi geni letali sono situati sui cromosomi sessuali: il cromosoma X è dunque il solo a poter portare questi geni, in quanto nel maschio la presenza di un solo gene letale recessivo sul cromosoma X porta a morte. La trasmissione avverrà invece per mezzo di eterozigoti femmine. Queste danno: - nella progenitura maschile o letalità o normalità perché l‟unico X del maschio viene dalla madre; - nella progenitura femminile metà omozigote normale, metà omozigote portatrice poiché il maschio porta solo l‟allele normale. a) MASCHIO L X FEMMINA LI se M ½ [L] normale ½ [l] muore se F ½ LL normale ½ LI normale portatrice Nascono perciò ⅔ di femmine ed ⅓ di maschi. L‟accoppiamento di maschi con femmine letali eterozigoti da un rapporto di 2 a 1 in favore delle femmine. f) L‟ETEROGENEITÀ GENETICA Quando una o più mutazioni o variazioni genetiche producono lo stesso carattere, si parla di eterogeneità genetica. Essa può conseguire sia all‟azione di mutanti differenti ad un singolo locus, ed allora si parla di eterogeneità all’elica sia all‟azione di geni mutati appartenenti a loci diversi, eterogeneità non allelica. Entrambe le forme sono state ampiamento dimostrate sia nell‟uomo che in vari animali domestici. Molto frequentemente essa compare in malattie monogenetiche quali l‟albinismo, l‟emofilia ecc. Molto spesso l‟eterogeneità può essere svelata attraverso delle differenze che comunque esistono tra i caratteri eterogenei a livello fenotipico, fisiologico o biochimico. A volte invece, l‟unica possibilità di distinzione deriva da appropriate indagini genetiche. Tre in particolare vanno considerati: - metodi genetici veri e propri, che analizzino cioè comportamento ereditario dei geni in esame; - studi su cellule somatiche in coltura; - analisi di genetica molecolare. I metodi genetici sono: - l‟individuazione di un meccanismo ereditario differente; alcuni caratteri si presentano identici fenotipicamente, ma presentano modelli ereditari diversi (dominanti o recessivi, autosomici o legati al sesso ecc.). - il non allelismo dei recessivi, dimostrabile attraverso il test di complementazione. Esso consiste nell‟accoppiare tra loro soggetti a fenotipo recessivi provenienti da famiglie, popolazioni o razze diverse. Se il carattere recessivo è dovuto allo stesso gene, tutti i soggetti nati saranno a loro volta 20 recessivi. Se c‟è invece eterogeneità non all‟elica, tutti i soggetti che nasceranno non presenteranno il fenotipo recessivo, perché i due geni recessivi appartengono a loci diversi e quindi si incontreranno con i rispettivi alleli dominanti. Essi saranno cioè tutti doppi eterozigoti a fenotipo dominante. Un esempio di applicazione del test di complementazione ad un carattere che dimostra eterogeneità non all‟elica è l‟albinismo delle razze Bruna Alpina e Simmhental. - le relazioni di associazione. Come spiegato in seguito, i loci etrogenei possono essere posti in cromosomi diversi e non omologhi e quindi appartenere a gruppi di associazione diversi. g) L‟IMPRINTING PARENTALE DEI GENI Uno dei principi basilari della genetica è quello dell’equivalenza degli incroci reciproci: un gene, indipendentemente dal genitore che lo trasmette, si comporta sempre allo stesso modo. Tale regola gode di due eccezioni ben conosciute: - i caratteri legati a geni posti su cromosomi sessuali X e Y; - quelli portati dal DNA mitocondriale. Di entrambe queste situazioni tratteremo nelle parti successive. Un terzo tipo di eccezione è rappresentato dal cosiddetto imprinting parentale dei geni. Si tratta di un processo che, in maniera temporale e reversibile lascia un‟impronta di tipo diverso nei geni trasmessi dal genitore di sesso maschile e in quelli trasmessi dal genitore di sesso femminile. La prole che riceve geni marcati dalla madre sarà diversa da quella che riceve i geni marcati dal padre. È perciò importante il fatto che un gene venga trasmesso da un genitore piuttosto che dall’altro. Scoperto da pochi anni, ancora adesso poco si sa sulla natura molecolare del fenomeno e sul meccanismo attraverso il quale si instaura. Esso comunque dipende dalla non espressione di alcuni geni posti o sul cromosoma di origine materna o su quello di origine paterna. In questo caso, quindi, la codificazione sarebbe sempre emizigote perrhe uno dei due geni risulta inattivato. L‟imprinting parentale dei geni è stato individuato grazie al diverso comportamento degli individui affetti dalla stessa delezione del cromosoma 15 nell‟uomo. Pur essendo coinvolto lo stesso frammento cromosomico, se ad essere coinvolto è il 15 di origine paterna, si avrà la sindrome di Prader-Willi, se il 15 di origine materna la sindrome di Angelman. Le due sindromi sono clinicamente molto diverse, perché diversi sono i geni attivi coinvolti dalla delezione. h) L‟EFFETTO DI POSIZIONE Un gene mutato non viene espresso allo stesso modo in relazione al tipo di cellula in cui viene a trovarsi. Nella drosofila sono stati individuati dei caratteri i quali, diversamente dalla maggior parte degli altri caratteri mutanti, nei tessuti colpiti non vengono espressi da tutte le cellule. Questi tessuti diventano, al contrario, mosaici costituiti da alcune cellule mutate e da altre che appaiono perfettamente normali. L‟aliquota delle cellule che esprimono la mutazione è regolata da geni modificatori che possono far spostare l‟equilibrio da una condizione di tessuto completamente mutante. Alcuni Autori sostengono che gli effetti di posizione spiegherebbero anche il comportamento di alcune patologie umane, quali la corea di Huntington. Un gene modificatore che spingesse l‟equilibrio del mosaicismo verso una condizione di tessuto prevalentemente mutante provocherebbe la comparsa della corea in un‟età più precoce, mentre un gene modificatore che spingesse l‟equilibrio del mosaico verso una condizione di tessuto normale porterebbe alla comparsa della malattia in età più avanzata. 21 Tabelle riassuntive sugli incroci biallelici. GENERAZIONE PARENTALE GENERAZIONE FILIALE POSSIBILITÀ CORRISPONDENZA RISULTATO RAPPORTI FENOTIPICHE GENOTIPICA FENOTIPICO GENOTIPICI DOMINANTE Omozigote Dominante AA per x DOMINANT E 100% OMOZIGOTI 100% DOMINANTI Omozigote Dominante AA Omozigote Dominante AA x 50% OMOZ. DOM. AA 100% DOMINANTI Eterozigote Aa Eterozigote Aa 50% ETEROZ. Aa 75% DOMINANTI 25% OMOZ.DOM. e 50% ETEROZ. Aa 25% RECESSIVI 25% OMOZ. REC. Aa 100% DOMINANTI 100% ETEROZIGOTI 50% DOMINANTI TUTTI ETEROZIGOTI 50% RECESSIVI TUTTI OMOZ. REC. 100% RECESSIVI 100% OMOZIGOTI RECESSIVI aa x Eterozigote Aa DOMINANTE Omozigote Dominante AA per x RECESSIVO DOMINANTI AA Omozigote recessivo aa Eterozigote x Omozigote recessivo aa RECESSIVI Omozigote recessivo aa X x RECESSIVO Omozigote recessivo aa 22 Lo stesso quadro può essere osservato in un altro modo: INCROCIO DI PARTENZA SEGREGAZIONE FENOT IPICA OTTENUTA INTERPRETAZIONE GENOTIPO PARENTALE 1a interpretazione: entrambi omozigoti dominanti: AA x AA INTERPRET. GENOTIPO 100% 100% DOMINANTI 2a interpretazione omoz. dom. x eteroz. AA x Aa DOMINANTE 50% 50% PER 75% DOMINANTI DOMINANTE 25% RECESSIVI 100% DOMINANTI DOMINANTE Eterozigote x Eterozigote 25% AA x Aa 25% Omozigote dominante x Omozigote recessivo AA x aa 50% 100% PER RECESSIVO 50% DOMINANTI 50% RECESSIVI RECESSIVO PER RECESSIVO 100% RECESSIVI Eterozigote x Omozigote recessivo Aa x aa Omozigote recessivo x Omozigote recessivo aa x aa 50% 50% 100% 23 GENERAZIONE PARENTALE POSSIBILITA‟ FENOTIP. CORRISPONDENZA GENOTIP. OMOZIGOTE [A] OMOZIGOTE AA x x OMOZIGOTE [A] GENERAZIONE FENOTIPICA RISULTATO FENOTIPICO RAPPORTO 100% OMOZIGOTE AA 100% OMOZIGOTE [A] OMOZIGOTE [A] OMOZIGOTE AA 50% OMOZIGOTI [A] 50% x x INTERMEDIO [Aa] ETEROZIGOTE Aa 50% INTERMEDI [Aa] 50% INTERMEDIO [Aa] ETEROZIGOTE Aa 25% OMOZIGOTI [A] 25% x x 50% INTERMEDI [Aa] 50% INTERMEDIO [Aa] ETEROZIGOTE Aa 25% OMOZIGOTI [a] 25% OMOZIGOTE [A] OMOZIGOTE AA x x 100% OMOZIGOTE [a] OMOZIGOTE aa 100% INTERMEDI [Aa] INTERMEDIO [Aa] ETEROZIGOTE Aa 50% INTERMEDI [Aa] 50% x x OMOZIGOTE [a] OMOZIGOTE aa 50% OMOZIGOTI [a] 50% OMOZIGOTE [a] OMOZIGOTE aa x x 100% OMOZIGOTI [a] 100% OMOZIGOTE [a] OMOZIGOTE aa 24 RAPPORTI FENOTIPICI E GENOTIPICI PRODOTTI DALLA SEGREGAZIONE CONTEMPORANEA DI PIÙ LOCI POLIMORFI (POLIIBRIDISMO) In questo capitolo verranno analizzate due diverse situazioni collegate tra loro dal fatto che l‟osservazione non interessa più solo alleli ad un locus ma geni posti su più loci. Il primo problema consiste nel valutare se esistono, nella segregazione contemporanea di più caratteri differenti e quindi di più loci, modelli ripetibili e prevedibili. Ci occuperemo cioè delle conseguenze della collocazione cromosomica dei loci. Le situazioni che analizzeremo sono quelle dell‟indipendenza, dell‟associazione e del crossing-over. Nella seconda parte analizzeremo invece come e con quali modelli i loci possono interagire funzionalmente tra loro; affronteremo cioè il capitolo delle diverse forme di interazione tra loci. a) INDIPENDENZA ED ASSOCIAZIONE La collocazione dei geni appartenenti a loci diversi sui cromosomi produce due modelli di segregazione distinti; quello relativo all‟indipendenza e quello relativo all‟associazione. Il primo fa riferimento a loci posti su coppie di cromosomi non omologhi, l‟altro a loci posti sulla stessa coppia. Due o più caratteri sono indipendenti quando i loci responsabili sono posti su coppie diverse di cromosomi. I geni segregano in maniera indipendente e si ricombinano a caso. Per comprendere la terza legge e dettare la regola generale attraverso semplici formule matematiche, ci serviremo della descrizione dell‟esperimento compiuto dallo stesso Mendel: si tratta dell‟arcinoto accoppiamento di varietà di piselli dei quali s voglia studiare il colore e l‟aspetto della superficie. È noto che Mendel osservò che i colori possibili erano due: giallo e verde, e due erano anche i possibili aspetti della superficie: liscia e rugosa. I due caratteri risultano essere indipendenti; inoltre per il carattere “colore” il giallo è dominante sul verde e per il carattere “aspetto della superficie” il liscio è dominante sul rugoso. Indichiamo il carattere “colore” Y se giallo (yellow) e y se verde, evidenziamo invece il carattere “aspetto della superficie” S se liscio (smooth), s se rugoso. Per prima cosa si compie la fecondazione tra individui dominanti per entrambi i caratteri ed individui recessivi per entrambi i caratteri: gli F1 che si ottengono sono fenotipicamente come gli individui dominanti mentre nel genotipo, sono tutti degli eterozigoti: CARATTERE COLORE: GIALLO YY VERDE yy P F1 SSYY CARATTERE SUPERFICIE: LISCIO RUGOSO ss x SS ssyy SsYy Ovviamente dalla generazione parentale P si ottengono i seguenti gameti: SY per gli individui dominanti e sy per gli individui recessivi. Se ora accoppiamo fra loro gli individui della F1, avremo quattro tipi di gameti diversi: SY, Sy, sY, sy ed in F2 avremo così le seguenti combinazioni: F2 25 m SY Sy sY Sy SY SSYY SSYy SsYy SsYy Sy SSyY SSyy SsYy Ssyy sY sSYY sSYy ssYY SsYy sy sSyY sSyy ssyY Ssyy f Questo schema è noto come Quadrato di Paneth. Nel genotipo avremo cioè: 1/16 2/16 1/16 2/16 4/16 2/16 1/16 2/16 1/16 DOPPIO OMOZIGOTE DOMINANTE OMOZIGOTE DOMINANTE + ETEROZIGOTE OMOZIGOTE DOMINANTE + RECESSIVO ETEROZIGOTE + OMOZIGOTE DOMINANTE DOPPIO ETEROZIGOTE ETEROZIGOTE + RECESSIVO RECESSIVO + OMOZIGOTE DOMINANTE RECESSIVO + ETEROZIGOTE DOPPIO OMOZIGOTE RECESSIVO SSYY SSyY SSyy SsYY SsYy Ssyy ssYY ssyY ssyy Per due coppie di geni abbiamo cioè 9 genotipi diversi e 16 combinazioni variate di coppie di gameti. La regola generale si deduce da queste ultime affermazioni: detto n il numero di coppie di geni che si sta studiando, avremo: 3n genotipi e 4n combinazioni. Nel caso specifico infatti avremo 32=9 genotipi e 42=16 combinazioni. Anche per i fenotipi si possono dettare delle regole generali. La prima riguarda il numero di fenotipi diversi che si ottengono al momento dell’incrocio; la formula è: 2n avendo n. lo stesso significato che abbiamo visto per il genotipo; in effetti nell‟esempio dei piselli si ottengono 22=4 fenotipi diversi e per la precisione: doppi dominanti, doppi recessivi, dominante per il primo-recessivo per il secondo, recessivo per il primo-dominante per il secondo. Ma, sempre attraverso una semplice formula, è possibile conoscere anche quanti individui, nella totalità dei soggetti ottenuti, mostreranno ciascuno dei 2n fenotipi: (3 + 1)n Nel nostro caso n è 2 e quindi avremo: (3 + 1)2 = 9:3:3:1 e cioè: 9 DOPPI DOMINANTI 26 3 DOMINANTI PER IL PRIMO-RECESSIVI PER IL SECONDO 3 RECESSIVI PER IL PRIMO-DOMINANTI PER IL SECONDO 1 DOPPI RECESSIVI Per dimostrare la veridicità del concetto d‟indipendenza dei caratteri, è possibile separare i risultati ed analizzarli individualmente rispetto ad ogni singolo locus. Quindi si moltiplica la probabilità che un individuo abbia certe caratteristiche oppure abbia le caratteristiche differenti. Ancora nel nostro esempio: 3/4 * 3/4 = 9/16 3/4 * 1/4 = 3/16 1/4 * 3/4 = 3/16 1/4 * 1/4 = 1/16 Per un dato numero totale di individui prodotti, il numero atteso di ciascun fenotipo si ottiene moltiplicando il numero totale per la frazione attesa. Riteniamo necessario, a questo punto, riassumere le regole che abbiamo enunciato, anche perché con le stesse formule si possono conoscere altre proprietà; ripetendo che n è il numero delle coppie di geni (all‟eliche o eterozigoti), abbiamo: a) il numero dei fenotipi forniti dalla F1; b) il numero dei fenotipi differenti per “test-cross” di un poliibrido della F1, se c‟è dominanza completa di un allele sull‟altro in ciascun locus; c) il numero dei fenotipi differenti ottenuti in F2 (F1 x F1) se c‟è dominanza completa di un allele sull‟altro in ciascun locus. 3n a) il numero dei genotipi differenti in F2; b) il numero di fenotipi differenti in F2 se c‟è codominanza in ciascun locus. 4n a) il numero di combinazioni gametiche differenti che si ottengono a partire dalla F1; b) la taglia minima che deve avere la popolazione per ottenere una ricombinazione completa di tutti i gameti ottenuti in F1. A queste formule aggiungiamo: y=2x che corrisponde al numero totale di combinazioni cromosomiche prodotte in ogni meiosi (y), dove “x” corrisponde al numero apolide di cromosomi della specie, e M = ½ (g2 + g) dove M è il numero di incroci differenti possibili, mentre “g” rappresenta il numero dei genotipi differenti possibili con un numero n di coppie di alleli. Nella descrizione della legge dell‟indipendenza, Mendel tenne fermo il principio della dominanza completa; tale presupposto risulta essere più l‟eccezione che la regola: osserviamo quindi cosa accade nella realtà quando si osservi l‟attività di due o più coppie di loci. EFFETTO DELLA SEGREGAZIONE INDIPENDENTE DEI GENI A B C D E F G N 2n 4n 3n 2n 3n-2n 2n 1 2 4 3 2 1 2 2 4 16 9 4 5 4 27 3 8 64 27 8 19 8 4 16 256 81 16 65 16 1024 1084576 59049 1024 58025 1024 10 Legenda: A: Numero B: Differ eter. C: Numero “dim.” D: Differ E: Differ. F: Differ G: Differ. Caso RAPPORTI FENOTIPICI IN F2 NEL DI IBRIDISMO IN LOCI NON ASSOCIATI RELAZIONE FRA GLI ALLELI DEI GENITORI DI IBRIDI PROPORZIONE FENOTIPICHE ATTESE NEGLI ADULTI NELLA GENERAZIONE F2 PRIMO LOCUS SECONDO LOCUS Dominante-Recessivo Dominante-Recessivo 9:3:3:1 Dominante-Recessivo Codominante 3:6:3:1:2:1 Codominante Dominante-Recessivo 1:2:1:2:4:2:1:2:1 Dominante-Recessivo Recessivo letale (1) 3:1:6:2 Codominante Recessivo letale (1) 1:2:1:2:4:2 Recessivo letale (1) Recessivo letale (1) 4:2:2:1 Dominante-Recessivo Recessivo letale (2) 9:3 Codominante Recessivo letale (2) 3:6:3 Recessivo letale Recessivo letale (2) 9: (1): Gli eterozigoti sono riconoscibili dagli omozigoti dominanti. (2): Gli eterozigoti non sono riconoscibili dagli omozigoti dominanti. 4.4.1.2 L‟ASSOCIAZIONE ED IL CROSSING- OVER LEGITTIMO Due o più geni non alleli sono detti associati quando sono situati sullo stesso cromosoma, che può essere sia un‟autonoma, che un eterocromosoma. Avranno quindi tendenza a rimanere insieme nel corso della formazione dei gameti. L’associazione può considerarsi stabilita quando, nei risultati d un reincrocio, le rispettive proporzioni delle 4 categorie fenotipiche sono significativamente differenti dalle proporzioni 1:1:1:1; oppure se in una generazione F2 classica (F1 x F1), le proporzioni rispettive delle differenti categorie sono significativamente differenti dalle proporzioni 9:3:3:1 caratteristiche dell‟indipendenza dei due geni. L‟associazione può essere: 28 - Completa, quando non è seguita da crossing-over. In questo caso i geni sono sempre trasmessi assieme quando derivano dallo stesso genitore. La segregazione indipendente dei caratteri manca completamente e la situazione può essere confusa con la pleiotropia. - Incompleta, quando presenta crossing-over e perciò ricombinazione. Le diverse paia di alleli vengono perciò ripartite, almeno parzialmente, in modo indipendente. Nell‟associazione incompleta, cioè, avviene uno scambio tra paia di alleli di cromosomi omologhi: è questo il fondamentale processo del crossing-over. La comparsa di nuove ricombinazioni ha dimostrato che il crossing-over è quindi lo scambio di frammenti cromosomici tra cromatidi di cromosomi omologhi alla meiosi. Per le quattro possibilità fenotipiche che derivano da due coppie di geni allelici avremo: - due combinazioni con i geni associati allo stesso modo dei cromosomi parentali: vengono dette “combinazioni parentali”; - due combinazioni con i geni che derivano dal crossing-over e sono dette “fenotipi ricombinati o ricombinanti”. La pratica dimostrazione di quanto detto ci viene dalla descrizione degli esperimenti compiuti da T.H. Morgan sul moscerino della frutta, la Drosophila melanogaster. Questo piccolo insetto ha un patrimonio genetico pari a 8 cromosomi dei quali due sessuali. Fra i molti caratteri che Morgan studiò, prederemo in considerazione la forma delle ali ed il loro colore. Per la forma delle ali il locus AA riconosce in A (dominante) la forma di ali “normali”, mentre in a (recessivo) la forma di ali “vestigiali”. Per il colore delle ali il locus BB riconosce in B (dominante) il colore “normale”, mentre in b (recessivo) il colore “sicuro”. Morgan incrociò individui doppi dominanti ma eterozigoti nel genotipo con individui doppi recessivi: rispettando la legge di Mendel ci si sarebbe dovuto attendere 4 fenotipi (AaBb, Aabb, aaBb, aabb) con frequenza 1:1:1:1 ovvero con percentuale di comparsa del 25%. Invece si ottennero due combinazioni con percentuale totale dell‟83% e le restanti due con il restante 17%; e cioè: Doppio recessivo aabb Doppio dominante AABB FENOTIPI PARENTALI 83% 1° locus dom., 2° locus rec. RICOMBINANTI 17% 1° locus rec., 2° locus dom. Il fenomeno dipendeva proprio dal fatto che c‟è associazione fra A e B da un lato e fra a e b dall‟altro: A e B si trovano sullo stesso paio di cromosomi omologhi. L‟associazione diminuisce sempre il numero di possibilità gametiche e nel caso degli eterozigoti la diminuzione è sempre della metà; inoltre mentre le condizioni fenotipiche rimangono le stesse, muta la frequenza di manifestazione. Nella fattispecie la frequenza dei ricombinati è sempre minore rispetto a quella dei parentali e comunque mai superiore al 50% in particolare, se i fenotipi ricombinanti non compaiono per niente si può parlare di associazione completa. Un doppio eterozigote per due geni associati può avere due costituzioni possibili: - CIS (= coupling) quando due alleli dominanti sono sullo stesso cromosoma mentre i due recessivi sono sull‟omologo; 29 TRANS (= repulsion) quando i due alleli dominanti si trovano su cromosomi diversi e l‟allele dominante di una coppia ed il recessivo dell‟altra coppia, mentre il recessivo della prima coppia ed il dominante della seconda sono sull‟omologo. Per accertarci dell‟eventuale presenza dei fenomeni di crossing-over e all‟interno di questi della presenza di costituzioni “cis” o “trans” dobbiamo sempre partire dagli eterozigoti perché l‟accoppiamento degli omozigoti non ci mostra nulla di significativamente diverso. Nel caso più semplice dell‟associazione tra due loci biallelici, modificazioni significative in F2 dei rapporti fenotipici 9:3:3:1 o 1:1:1:1 possono far sospettare l‟esistenza di associazione e crossing-over. Sperimentalmente sono stati messi a punto tre metodi di segregazione atti a svelare l‟esistenza di associazione e crossing-over, essi sono: - il metodo del reincrocio o di Hutt; - il metodo degli eterozigoti o di Fisher; - il metodo per i geni legati al sesso. Il metodo del reincrocio o metodo di Hutt è noto anche come “metodo della radice quadrata”; consiste nell‟accoppiare individui eterozigoti F1 con individui doppi omozigoti recessivi. La frequenza attesa mendeliana è 1:1:1:1: si valuta se la frequenza osservata risulta significativamente diversa da quella attesa; il calcolo avviene mediante l‟applicazione del chi quadrato. Con il metodo di Hutt possiamo poi osservare se l‟associazione ha costituzione “cis” o “trans”; infatti, nel caso di due loci biallelici A a, B b, se le percentuali maggiori saranno a favore dei fenotipi AaBb e aabb l‟associazione avrà costituzione “cis”, mentre se le percentuali saranno maggiori per Aabb e aaBb la costituzione prevalente sarà “trans”. Infatti mentre per il doppio omozigote recessivo l‟unico gamete è ab per l‟eterozigote i gameti possono essere: AB, Ab, aB, ab; qualora la costituzione sia “cis” avremo prevalenza dei gameti prevalete la costituzione in “trans” i gameti più frequenti saranno Ab e ab con discendenza Aabb e aaBb. In altri termini, la frequenza del fenotipo doppio recessivo in F2 può servire a stimare: - la frequenza de gameti parentale se in F1 gli alleli recessivi sono in posizione “cis”; - la frequenza dei gameti ricombinati se in F1 essi sono in “trans”. Facciamo un esempio: le galline di razza Leghorn presentano associazione tra il locus I ed il locus F; il locus I ha I dominante con il carattere “colore bianco” e il recessivo con il carattere “colorato”, il locus F ha F dominante con il carattere “piumaggio increspato” e f recessivo con il carattere “piumaggio normale”. Partendo da soggetti eterozigoti IiFf (repulsion) ottenuti da genitori bianchi normali Iiff e genitori pigmentati increspati iiFF; tali eterozigoti F1 appaiono bianchi increspati; accoppiamoli con soggetti iiff pigmentati normali, otterremo le seguenti percentuali: 40,15 % colorati increspati iiFf 40,15 % bianchi normali Iiff 11,40 % bianchi increspati IiFf 8,30 % normali iiff Tra le possibili ipotesi che permettono di spiegare tale segregazione, quella mendeliana di indipendenza è da rifiutare data la differenza significativa fra le frequenze attese e quelle osservate rispetto ad un accoppiamento fra un eterozigote ed un doppio recessivo. Lo stesso dicasi per l‟ipotesi del Linkage completo in quanto di dovrebbero avere solo due combinazioni; infatti il gene dominante di un carattere è legato al gene recessivo dell‟altro carattere: I è associato a f, mentre i è associato a F; esiste la repulsione a realizzare l‟associazione si di uno stesso cromosoma fra geni dominanti e fra geni recessivi; le due combinazioni dovrebbero essere perciò: - bianchi normali Iiff colorati increspati iiFf entrambi nella frequenza del 50%. Resta perciò da considerare l‟ipotesi del Linkage con crossing-over. È infatti necessario ammettere l‟esistenza di un Linkage, poiché una proporzione molto elevata di animali di fenotipo [if] e 30 [If] presenta repulsione dei geni dominanti e recessivi fra di loro; ma la presenza dei due altri fenotipi [if] e [IF] riunenti i geni dominanti fra di loro ed i recessivi fra di loro in debole frequenza (19,7%) e per conseguenza lontana dalla proporzione mendeliana (50% ovvero 25% + 25%), suppone un crossing-over che condiziona parzialmente il linkage. Partendo sempre da soggetti eterozigoti IiFf bianchi increspati ottenuti però da genitori bianchi increspati IIFF e colorati normali iiff è possibile analizzare la fase di coupling. In F2 abbiamo: 45,5 % 36,3 % 12,0 % 6,2 % bianchi increspati colorati normali bianchi normali colorati increspati IIFF iiff Iiff iiFF Le ipotesi mendeliana e l‟ipotesi del Linkage completo non sono ammissibili per gli stessi motivi indotti poco sopra; valida risulta invece la terza ipotesi ovvero quella del Linkage con crossingover: infatti c‟è una netta tendenza dei geni dominanti I e F ad associarsi fra loro e la stessa tendenza mostrano i geni recessivi. La presenza dei fenotipi [If] e [iF] in debole proporzione suppone la realizzazione del 18,2% di ricombinazione fra I ed f da una parte, i ed F dall‟altra. Il metodo di Hutt è il sistema più rapido per mettere in evidenza i linkage in zootecnia: esso permette infatti l‟utilizzo di un numero piuttosto limitato di soggetti. Il metodo di Fischer o degli eterozigoti è molto più complesso e si applica quando si è impossibilitati ad utilizzare il metodo di Hutt. Consiste nell‟accoppiare due eterozigoti e nell‟osservare se la frequenza ottenuta è significativamente diversa da quella attesa e che è pari, per due loci biallelici a 9:3:3:1. Vediamo per questo secondo metodo un esempio di Linkage in fase di repulsion: P IIff F1 x iiFF IiFf Ora accoppiamo individui eterozigoti e chiamiamo p = la probabilità di ricombinazione [IF + if] 1-p = la probabilità di linkage [If + iF] La probabilità di apparizione di ciascun gamete sarà la seguente: gameti probabilità IF if iF If p/2 p/2 1-p/2 1-p/2 Attraverso una tabella a doppia entrata sarà possibile calcolare la frequenza teorica dei quattro possibili fenotipi in una generazione F2: IF p/2 if p/2 If 1-p/2 iF 1-p/2 31 IF p/2 [IF]p2/4 [if]p2/4 If p/2 [If] (1-p2/4) If 1-p/2 [iF] (1-p2/4) iF 1-p/2 La soma di queste frequenze è pari a uno. Di regola se r è la frequenza di crossing-over o frequenza di ricombinazione tra due geni associati Aa e Bb, i gameti formati dagli eterozigoti per entrambe le paia di alleli avranno frequenze dipendenti dalla combinazione genica originale. Quindi quando i geni sono in condizione di coupling (AB o ab) si forma un totale di r gameti ricombinanti, dei quali ½ r sono Ab ed ½ sono aB. La frequenza totale dei gameti parentali, che prima era 1, verrà quindi ridotta di r; cioè ciascuno dei due tipi parentali (AB, ab) verrà formato con una frequenza ½ - ½r. Analogamente, geni eterozigoti in condizione repulsion (Ab o aB) formeranno r gameti ricombinanti (AB, ab) e perderanno la frequenza di r gameti parentali (Ab, aB). La conoscenza delle frequenze di ricombinazione e la conoscenza della condizione di coupling e di repulsion dei geni implicati nell‟incrocio rendono possibile la previsione delle frequenze genotipiche della discendenza di eterozigoti per geni associati. Ad esempio se la ricombinazione tra due geni associati Aa e Bb è del 10% e l‟eterozigote porta questi geni in condizione di coupling, le frequenze dei gameti AB, Ab, aB e ab sono rispettivamente, 0,45, 0,05, 0,05, 0,45. Una semplice scacchiera 4x4 potrà fornire poi le frequenze di ciascuna delle 16 possibili combinazioni; ad esempio la frequenza del doppio recessivo aabb sarà 0,45x0,45=0,2025. Il metodo di Fisher può essere applicato anche in altra maniera. In questo caso si segnalano i fenotipi in F2 nel modo seguente: AB con a1; Ab con a2; aB con a3; ab con a4; se gli eterozigoti della F1 sono in cis (AB/abxAB/ab), allora calcoliamo il rapporto: a3 x a3 -------------------------- = z a1 x a4 se gli eterozigoti della F1 sono in trans (Ab/aBxAb/aB), il rapporto sarà: a1 x a4 ------------------------- = z a2 x a3 Il valore di z si desume da apposite tabelle. Il metodo per i geni legati al cromosoma x è molto semplificato, dato che nella discendenza di un incrocio i maschi ereditano i loro cromosomi x solo dalla madre; ogni evento di ricombinazione verificatosi nella gametogenesi femminile si nota immediatamente nei figli maschi, i quali, già in possesso di un solo cromosoma x mostrano sempre gli effetti dei geni legati al sesso, siano essi dominanti recessivi. 32 La natura parentale o ricombinata dei gameti formati dalla femmina è osservabile direttamente nella discendenza F2 maschile senza che il genotipo dei maschi F1 intervenga. Studiando i fenomeni di crossing-over, si è scoperto che i cromatidi di un cromosoma possono subire più di un crossing-over. Il processo influenza i tipi di gameti che si formano. Il più frequente è il crossing-over doppio, detto anche crossing-over a due filamenti: sono interessati a questo fenomeno gli stessi due cromatidi in entrambi i chiasmi: si formano perciò due cromosomi doppi. È importante notare che in tali condizioni i due geni estremi presi in esame possono non manifestare ricombinazione; infatti, nei cromosomi rimaneggiati varia soltanto la posizione del gene centrale rispetto ai due geni laterali; i crossing-over doppi derivano cioè da chiasmi doppi: in essi si muove soltanto il gene centrale, mentre nei crossing-over semplici si sposta uno solo dei geni terminali. Sono stati individuati anche doppi crossing-over simultanei. L‟interferenza è un fenomeno per il quale la formazione di un chiasma riduce la probabilità d‟apparizione di un secondo chiasma nella regione vicina. In tal caso il numero osservato di cromatidi doppiamente rimaneggiati risulta essere inferiore a quello deducibile dalla distanza. L‟interferenza si calcola attraverso la seguente formula: interferenza = 1 – coincidenza % cromatidi rimaneggiati osservati dove coincidenza = -----------------------------------------% cromatidi rimaneggiati calcolati Una applicazione interessante del Linkage seguito da crossing-over è rappresentato dalla costituzione delle cosiddette carte cromosomiche, ovvero la disposizione dei geni nel cromosoma d‟appartenenza. Lo studio delle carte cromosomiche ha due scopi ben precisi: a) localizzare i geni uno in rapporto all’altro. b) Calcolare le distanze che li separano. L‟unità di misura per calcolare la distanza fra un gene e l‟altro è il centimorgan, detta anche unità d ricombinazione, che corrisponde alla probabilità di apparizione di un crossing-over tra due punti di un cromosoma. Si può anche dire che 1 centimorgan è quella parte di cromatide con probabilità 1% di subire un crossing-over e avere da esso forme ricombinate; per questo si può definire la probabilità dell‟1% come frequenza di ricombinazione. Perciò, conoscendo il numero medio di crossing-over su un paio di cromosomi, si può risalire con forte probabilità all‟esatta lunghezza della carta di questo gruppo di associazione (ricordiamo che per gruppo di associazione intendiamo tutti i geni situati su di un determinato cromosoma). Questa lunghezza si ottiene moltiplicando il numero medio di chiasmi per 50. Comunque, affinché un crossing-over sia svelabile, esso deve avvenire fra due punti conosciuti: se i punti sono sconosciuti le ricombinazioni non saranno riconoscibili. Il crossing-over non sarà svelabile nemmeno nel caso in cui esso avvenga all‟interno di una zona delimitata da due geni conosciuti, senza interessare direttamente questi due geni. In entrambi questi casi, i prodotti derivati da tali meiosi ci appariranno identici ai parentali di partenza. Nel secondo caso si potrà ricorrere ad un terzo gene situato fra i due estremi. Naturalmente possono esistere anche crossing-over multipli. Quando tra i due geni estremi si presentano più di 15 unità di ricombinazione, è possibile avere crossing-over doppi: aumentando tale distanza, aumenterà anche la frequenza dei doppi crossing-over e siccome questi non danno luogo a ricombinazione genetica tra i geni terminali, si ottengono distanze viziate per difetto. La difficoltà si supera mediante il test dei tre punti. 33 Prima di studiare il modo per stabilire la frequenza dei chiasmi, elenchiamo alcune regole propedeutiche: 1) ogni punto di un cromosoma ha una probabilità non nulla di essere punto di rottura o chiasma; ogni punto ha la stessa probabilità di esserlo; 2) in media, un bivalente (due cromosomi omologhi) subisce un chiasma; 3) il numero di chiasmi è proporzionale alla lunghezza del cromosoma, precisando che: - la proporzionalità non è diretta, o meglio è diretta fino ad una certa lunghezza del cromosoma poi il numero rimane costante nonostante l‟allungarsi dello stesso; - ciascun tipo di cromosoma si caratterizza per un numero medio di chiasmi; 4) si può caratterizzare lo spazio situato fra due punti di un cromosoma, cioè fra due loci, in base ala frequenza dei chiasmi che esso produce. Tale frequenza permette di predire le rispettive proporzioni di gameti parentali e ricombinati; all‟inverso, la percentuale di gameti ricombinati, ottenuti a partire da un genotipo dato, è il riflesso diretto della percentuale di chiasmi che si sono avuti fra i due geni in studio. Secondo la regola di Morgan “la percentuale di ricombinazione tra due geni non alleli è una misura possibile della loro distanza”; maggiore risulta tale distanza, maggiore è la probabilità che un chiasma abbia luogo tra i due punti considerati La distanza in parole viene definita distanza genetica. La distanza genetica ha delle proprietà: - additività: prendendo in considerazioni più coppie di geni, la distanza tra la prima coppia e l‟ultima è data dalla somma delle percentuali di ricombinazione di tutti questi geni, presi a due a due. L‟additività non ha valore quando intervengono fenomeni di doppio crossing-over La frequenza dei chiasmi è dunque uguale al doppio della frequenza dei prodotti ricombinati (cromatidi rimaneggiati), quindi: A questo punto possiamo elencare i fattori che condizionano la correttezza delle carte genetiche. Essi sono: a) la distanza fra geni: l‟addittività della distanza genetica porta ad avere lunghezze superiori a 100 unità poiché la percentuale massima di ricombinazione fra due loci è 50%, i due geni sono situati molto lontano l’uno dall’altro sullo stesso cromosoma; possono segregare indipendentemente e sembrare localizzati su cromosomi non omologhi; b) la numerosità del campione; maggiore è il numero di individui analizzati, più precisa risulterà la stima della distanza; c) le distanze medie; per ottenere una distanza media a partire da diverse prove, è necessario ponderare ciascuna distanza calcolata in ciascun esperimento in funzione della taglia del campione; per cui se definiamo “n” la taglia di ciascuno dei campioni e “d” la distanza genetica che gli è propria, avremo: đ = Σ nd essendo N il numero totale dei N soggetti esaminati La percentuale di ricombinazione è il riflesso diretto della percentuale di chiasmi che si sono verificati fra due geni e che, viceversa, la frequenza di chiasmi permette di predire la proporzione rispettiva di gameti parentali e ricombinati. In nessun caso, sono possibili più del 50% dei gameti ricombinati (che è come dire che corrisponde a 100 la probabilità che un chiasma abbia luogo). Non ci si può aspettare infatti più del 50% di ricombinazioni tra due loci, poiché soltanto due dei quattro cromatidi in una tetrade alla meiosi sono coinvolti in un particolare punto del crossing-over. Però, se sullo stesso cromosoma 2 geni sono sufficientemente lontani fra di loro affinché la probabilità che un chiasma abbia luogo sia del 100% ci saranno allora il 50% di gameti parentali ed il 50% di gameti ricombinati. Veniamo ora alle tecniche di studio della distanza fra geni: innanzitutto dobbiamo precisare che la distanza genetica ha un significato diverso dalla distanza fisica che separa due geni nello stesso cromosoma. I metodi principali sono due ed entrambi sfruttano la tecnica del DNA ricombinante che riesce a mettere in evidenza i gameti ricombinanti e la loro frequenza di espressione, essi sono: 34 Il primo è applicabile nel caso in cui non ci siano doppi crossing-over, i quali non si osservano per distanze inferiori a 5 unità e consiste nel reincrocio di un doppio eterozigote. Il test dei tre punti, invece, vale per distanze maggiori di 5 unità, in cui potrebbero manifestarsi fenomeni di doppio crossing-over. Consiste nell‟utilizzare un terzo gene tra i due considerati al fine di svelare un eventuale doppio crossing-over, e si serve anch‟esso del reincrocio ma con un triplo eterozigote. In generale, se si considerano 3 geni associati, separati da distanze conosciute, la percentuale di ricombinanti svelabili tra i due geni esterni A e C, senza utilizzare il gene centrale B, è pari alla percentuale di ricombinazione tra A e B, alla quale si somma la percentuale di ricombinazione tra B e C meno due volte la percentuale dei doppi ricombinanti, cioè: % ric. A-B + % ric. B-C | - 2% doppi ric. Il calcolo delle distanze genetiche ci permette di ottenere, per ogni cromosoma di un individuo, l‟esatto ordine dei geni ovvero la loro giusta posizione all‟interno del cromosoma. Il processo è reso difficoltoso dai doppi crossing-over, anche perché, in assenza di geni supplementari maggiore sarà la probabilità di avere doppi crossing-over. Perciò le stime di distanza più sicure si hanno a partire da geni molto legati. Le distanza genetiche al di sotto delle quali si ha la certezza dell‟assenza di doppi crossing-over variano da specie a specie. Ogni percentuale inferiore a questo valore tipico di ogni specie risulta equivalente alla distanza stessa mentre al di là di questo valore la relazione fra percentuale di ricombinazione e distanza genetica non è più lineare; la percentuale diviene una sottostima della distanza in parola. Terminiamo dicendo che, sebbene la distanza fisica e quella genetica non siano in relazione diretta esse hanno però lo stesso ordine. b) L‟INTERAZIONE In questo capitolo tratteremo del concetto di interazione. Si tratta di una situazione prettamente funzionale, consistente nel rapporto che i prodotti biosintetici dei geni possono intrattenere tra loro. Allo stato attuale delle conoscenze, possiamo considerare tre tipi di interazione: - l‟interazione vera e propria o interazione semplice; - l‟interazione epistatica o epistasi; - l‟interazione non epistatica. L‟INTERAZIONE SEMPLICE Gli enzimi hanno un ruolo attivo in tutto il metabolismo intermedio degli organismi. Le reazioni del metabolismo intermedio realizzano, tappa per tappa, la trasformazione di una sostanza in un‟altra e ciascuna tappa è catalizzata da un enzima specifico. L‟insieme delle reazioni che trasformano un precursore in un prodotto terminale costituisce una via biosintetica. Tutte le vie biosintetiche, anche le più semplici, implicano vari enzimi codificati da più geni; per ottenere ciascun metabolita è necessaria l‟azione catalitica di vari enzimi, ciascuno dei quali è codificato da un gene differente. Siamo in presenza di una interazione genetica semplice in tutti i casi nei quali due o più geni determinano enzimi che catalizzano differenti tappe di una stessa via biosintetica. L‟EPISTASI L‟epistasi è una interazione nella quale geni e loci mascherano o sopprimono l‟azione di geni situati in altri loci. Si tratta sempre, inoltre di una interazione intergenica, cioè tra geni situati su coppie di cromosomi non omologhi. È detta anche “soppressione intergenica”. I geni che nascono vengono detti depistatici, i geni inibiti, nascosti vengono definiti ipostatici. 35 In altri termini i geni che combinano la loro azione producono un effetto che non è il risultato cumulativo o additivo dei geni stessi. A livello di segregazione, in un incrocio bifattoriale si ottiene, in F2, un numero di fenotipi minore di quattro. Infatti l‟epistasi è responsabile della formazione di sei tipi diversi di proporzioni F2, sempre che ci sia dominanza completa nel singolo locus: - per tre di queste si avranno 3 fenotipi; - per tre solamente 2 fenotipi. Chiamando per nostra comodità il primo locus AA e il secondo BB, si avranno i seguenti casi: Epistasi dominante Il singolo gene è dominante anche in singola dose, ovvero sia in omozigosi (AA) che in eterozigoti (Aa o aA) sull‟altro locus sia che esso sia in omozigosi (BB o bb) sia che sia in eterozigoti (bB o Bb). Il rapporto fenotipico sarà 12:3:1; l‟epistasi si esplica ne 12 perché è in quelli che A si presenta anche in singola dose: nei restanti quattro casi il primo locus ha sempre l‟omozigosi recessiva e quindi l‟epistasi non si presenta. Un esempio può essere dato dal colore del frutto della zucca; infatti quando si ha il paio di alleli AA il bianco è dominante sulla condizione colorata, quando si ha il paio di alleli BB il giallo è dominante sul verde, quando si è in epistasi il dominante bianco nasconde l‟effetto di giallo e di verde. Quindi: AaBb 12/16 BIANCHI 3/16 GIALLI x AaBb 1/16 VERDI Doppia epistasi dominante Si definisce anche “Epistasi con azione dei due geni dominanti senza effetto cumulativo”. In questo caso l‟uno o l‟altro dei geni, se dominante, risulta essere epistatico sull‟altro: quindi o il singolo gene A è epistativo su tutte le manifestazioni del singolo gene B o il singolo gene B è epistatico su tutte le manifestazioni del singolo gene A. Il rapporto dei fenotipi sarà 15:1, avremo cioè solo due fenotipi; l‟epistasi si mostra nei 15 dove A o B è epistatico anche su bb e su aa rispettivamente: solo il doppio recessivo non subirà il processo di epistasi. Come esempio abbiamo la capsula dei semi nella specie botanica Capsella bursa-pastoris. Infatti: * * * con il paio di alleli AA abbiamo una forma triangolare dominante su quella ovoidale; con il paio di alleli BB abbiamo una forma triangolare dominante su quella ovoidale; in epistasi l‟allele dominante in uno o nell‟altro dei due loci nasconde l‟effetto della condizione ovoidale. Quindi: AaBb x AaBb 15/16 FORMA TRIANGOLARE 1/16 FORMA OVOIDALE 36 Siamo in grado di scoprire la doppia epistasi dominante osservando l‟estrinsecazione del fenotipo dove solo il doppio recessivo si mostra nell‟aspetto che ci si attende. Per questa forma è stata prospettata la teoria della duplicazione di un gene: in altri termini A e B sarebbero due geni indipendenti, ma uguali dal punto di vista funzionale poiché agiscono sullo stesso carattere. Epistasi recessiva In questo caso la coppia epistatica è la coppia aa; per agire deve essere in omozigosi e sempre in doppia dose perché in singola dose non agisce. Perciò aa risulta epistatico su BB, Bb, Bb e bb. Il rapporto fenotipico sarà 9:3:4 e l‟epistasi si mostrerà proprio negli ultimi quattro, laddove cioè troveremo l‟omozigosi recessiva nel primo locus. Doppia epistasi recessiva Entrambi gli omozigoti recessivi risultano essere epistatici rispetto agli effetti dell‟altro gene. Quindi aa mostra epistasi su tutte le manifestazioni di B (BB, Bd, bB e bb) mentre bb mostra epistasi su tutte le manifestazioni di A (AA, Aa, aA e aa). Il rapporto fenotipico sarà 9:7 e l‟epistasi si mostrerà sui 7. In certi casi il rapporto fenotipico potrà essere anche 9:6:1 e cioè quando il doppio recessivo avrà un carattere diverso dai 6. In altri termini l‟omozigote recessivo dell‟altra coppia. L‟esempio ci viene ancora dal mondo vegetale ed il colore del fiore nei piselli. Qui abbiamo che il paio di alleli A da colore rosso scuro dominante sul bianco mentre il paio di alleli B da condizione colorata dominante su condizione incolore (bianco); in epistasi gli omozigoti recessivi producono fiori bianchi per entrambi i geni A e B. Allora: AaBb x 9/16 ROSSI SCURI AaBb 7/16 BIANCHI Epistasi dominante e recessiva Si definisce anche “Epistasi con dominante e recessivo che si esprimono allo stesso fenotipo”. Un gene, se dominante anche in singola dose, è epistatico rispetto all‟altro gene, se omozigote recessivo e mai in singola dose, è epistatico rispetto al primo. Cioè: A è epistatico su BB, Bb, bB e bb. Il genotipo bb è epistatico su AA, Aa, aA e aa. Il rapporto fenotipico sarà 13:3 e l‟epistasi si mostrerà sui 13 in quanto 9 doppi dominanti, 3 recessivi per il secondo locus e dominanti per il primo tranne aa) ed infine uno doppio recessivo. L‟esempio proviene dal mondo animale ed è il piumaggio nel pollame nel quale il paio di alleli A provoca l‟inibizione della condizione colorata carattere dominante sulla comparsa del colore mentre il paio di alleli B per il quale risulta dominante il colore sulla condizione bianco. In epistasi l‟inibizione del colore (dominante) impedisce che si manifesti il carattere “colore del piumaggio” anche quando questa condizione risulta essere geneticamente determinata; il gene per il colore, se omozigote recessivo, impedisce la comparsa del colore anche quando sia assente l‟inibitore dominante. Quindi: AaBb x AaBb 37 13/16 BIANCHI 3/16 COLORATI (aaBB, aaBb e aabB) L‟INTERAZIONE NON EPISTATICA In questo caso geni non alleli, combinando la loro azione, danno origine ad un fenotipo differente da quello che essi indurrebbero separatamente. Mentre nella epistasi cambiano le frequenze fenotipiche qui tali frequenze rimangono identiche rispetto alla legge di Mendel; si ha però un nuovo fenotipo, diverso nella sostanza e non nel numero, determinato da diversi prodotti finali derivati da vie biosintetiche differenti che contribuiscono insieme a determinare un carattere comune. L‟esempio classico è dato dalla forma delle creste dei polli; in tale situazione si ha: - Il paio di alleli A dà cresta a rosa dominante sulla cresta non a rosa. - Il paio di alleli B da cresta a pisello dominante su cresta non a pisello. - Con l‟interazione i due dominanti dei rispettivi locus producono cresta a noce; gli omozigoti recessivi per cresta a rosa e cresta a pisello producono cresta semplice. Quindi: P Cresta a rosa x RR pp Cresta a pisello rr PP Gameti Rp rP x F1 Creste a noce Rr Pp RP Rp rP rp RRPP noce RRPp noce RrPP noce RrPP noce Rp RRPp noce RRpP noce RrpP noce Rrpp Rosa rP rRPP noce rRPp noce rrPP pisello rrPp pisello rP rRpP noce rRpp rosa rrpP pisello rrpp semplice RP 38 MODELLI EREDITARI In questo capitolo affronteremo la classificazione di tutti i possibili modelli ereditari per caratteri qualitativi finora definiti, in funzione di parametri diversi. a) IN FUNZIONE DELLA LOCALIZZAZIONE DEL DNA Poiché negli animali il dna è localizzato sia nel nucleo che nei mitocondri, esistono due modelli ereditari diversi, che chiameremo nucleare e mitocondriale. Quest‟ultimo è detto anche citoplasmatico, in considerazione della localizzazione dell‟organello. Il modello nucleare è classificabile in diverse maniere a seconda della localizzazione cromosomica, del numero degli alleli per locus, del numero di fenotipi allelomorfi, del sesso degli individui. La particolarità del meccanismo ereditario dello mtDNA è data dal fatto che la stragrande maggioranza dei mitocondri presenti nell‟embrione sono di origine ovocitaria e non spermatozoaria, come dimostrato oramai ampiamente da numerose sperimentazioni. In particolare, nell‟ibridazione interspecifica tra asino e cavallo, il mulo (asino stallone per cavalla) presenta un mtDNA che assomiglia a quello della cavalla mentre quello del bardotto (cavallo stallone per asina) è identica a quello dell‟asina. A ciò consegue che l‟eredità mitocondriale portata dai figli è sempre e solo di origine materna. Un meccanismo ereditario di tal genere può essere mimato da almeno tre situazioni diverse: - l‟infezione di agenti che possono essere trasmessi dalla madre al feto; - un‟eredità autosomica dominante che sia letale per lo spermatozoo; - una trasmissione mediata da plasmidi citoplasmatici non mitocondriali. Recenti studi hanno dimostrato che tra DNA nucleare e DNA mitocondriale esistono interazioni vicendevoli, come dimostrato da alcune patologie di cui informazione è contenuta in uno dei due DNA, ma la cui espressione è mediata dall‟altro. b) IN FUNZIONE DELLA LOCALIZZAZIONE DEI GENI SUI CROMOSOMI La localizzazione dei geni sui cromosomi lascia a considerare modelli ereditari differenti: il modello autosomico e quelli per i geni legati ai cromosomi sessuali (eterocromosomi). Nel modello autosomici i geni sono portati dai cromosomi autosomici, che sono pari a 2n – 2. L‟implicazione essenziale di tale modello è che i maschi e le femmine possono essere interessati in uguale misura. I modelli che conseguono alla localizzazione dei geni nei cromosomi sessuali sono diversi. Il più conosciuto è quello detto associato al cromosoma X o X-Linked. I geni che ne sono responsabili sono localizzati nei cromosomi X che notoriamente, nei mammiferi, sono 2 nella femmina e uno, sempre di origine materna, nel maschio. La femmina possiede due cromosomi X e questi si comportano come una normale coppia autosomica, che potrà essere in condizione sia di eterozigoti che di omozigosi. Il maschio, invece, ha un solo cromosoma X per cui presenterà il carattere definito dal gene presente; per questo si parla di emizogosi. Il modello ereditario associato alla X è detto incrociato o criss-cross. Infatti, la femmina riceve un X dal padre e uno dalla madre e può trasmettere le sue X sia alle figlie che ai figli. Il maschio riceve la X dalla madre e la trasmette sempre e solo alle figlie femmine. I figli maschi ereditano perciò il carattere dalla loro madre e il cromosoma X può saltare alternativamente da un sesso all’altro in generazioni successive. Ciò spiega perché, mentre gli incroci reciproci per caratteri autosomici danno risultati identici, ciò non avviene per i carattere legati alla X. Un aspetto importate di tutta l‟eredità legata al cromosoma X è che manca la trasmissione maschiomaschio (padre-figlio), in quanto il padre trasmette al figlio il cromosoma Y; le figlie ricevono invece il cromosoma X e quindi porteranno sempre il gene posseduto dal padre. Da un punto di vista funzionale è importante ricordare che anche la femmina si comporta da emizogote grazie al cosiddetto 39 fenomeno di Lyon o compensazione del dosaggio genico o principio del singolo X attivo, che consiste nella disattivazione congenita di uno dei due cromosomi X in tutte le cellule somatiche, cosicché in una femmina solo un cromosoma X è geneticamente attivo e solo i geni situati su di esso sono operanti. Un caso esemplare di emizigosi nella specie umana è l‟emofilia. Il gene che ne è responsabile si trova nel cromosoma X; in presenza di emofilia la madre è sempre, al minimo portatrice; indicando con Xe il gene normale e con Xe il gene recessivo, avremo: M 2A + XE Xe x F 2A + XE Y con quattro possibilità gametiche, dal quale deriveranno quattro possibilità zigotiche: XE XE F normale Xe XE F portatrice XE Y M normale Xe Y M emofilico Per cui il maschio soffrirà di emofilia se ha il gene sul cromosoma X; la femmina soffrirà di emofilia solo se la madre sarà portatrice ed il padre emofilico; solo in questo caso avremo infatti un genotipo XeXe. Molto più complesso il meccanismo ereditario legato ai geni portatori dal cromosoma Y. Un tempo tale eredità veniva definita olandrica perché si pensava che tale cromosoma non avesse alcuna omologia con altri. Attualmente invece il cromosoma Y viene distinto in tre sottoregioni: - una sottoregione che occupa gran parte del braccio corto del cromosoma (Yp), che risulta omologa ad una parte del cromosoma X alla quale si appaia durante la meiosi (regione pseudo autosomale); - una regione pericentrica; - una terza regione costituita dal braccio lungo del cromosoma probabilmente inerte. Recentemente studi di genetica molecolare indicano che il braccio Yp contiene varie sequenze che non sono omologhe con Xp, ma che lo sono con Yq, Xq o, addirittura, un autosoma. Tra i geni portati dal cromosoma Y possiamo ricordare SRY (Testis determination factor), fattore che determina la differenziazione delle gonadi indifferenziate in testicoli; è localizzato probabilmente in Yp11.2; le sue sequenze sono altamente conservate sia nei mammiferi che negli uccelli. c) IN RAPPORTO AL SESSO L‟eredità portata dai cromosomi X e Y viene anche definita eredità legata al sesso. Mentre nei mammiferi i due sistemi sono separati, nella drosofila è stata scoperta una parziale omologia tra cromosoma X e Y nel maschio, con conseguente parziale appaiamento alla meiosi. L‟eredità legata al sesso può perciò essere ulteriormente suddivisa in: - eredità completamente legata al sesso; - eredità incompletamente legata al sesso; - eredità olandrica vera e propria. 40 I geni completamente legati al sesso sono situati sui segmenti non omologhi del cromosoma X. Quelli incompletamente legati al sesso sono portati dalla frazioni omologhe di X e di Y, possono ricombinarsi come i geni autosomici mediante il fenomeno del crossing-over. Infine, i geni olandrici sono situati sulla porzione non omologa del cromosoma Y. Negli avicoli è ben definito un gruppo di caratteri legati al sesso che permettono il messaggio precocissimo dei pulcini. Gli animali vengono definiti autosexing. Nelle principali specie avicole domestiche la determinazione del sesso è cromosomica secondo il modello “abraxas”, gl eterocromosomi vengono disegnati con i simboli ZZ e ZW; nel maschio il corredo corrisponde a 2A + ZZ, mentre nella femmina corrisponde a 2A + ZW. È il maschio cioè ad essere eterogamico. In casi più rari il meccanismo è di tipo “protenor” inverso, perché gli eterocromosomi del maschio vengono designati con ZZ e quelli della femmina con ZO. Tra i principali caratteri autosessanti possiamo ricordare: Nel piumaggio golden-silver, il silver, detto anche bianco, è dominante (S) e lo è anche in singola dose, il golden, detto anche giallo, è recessivo (s): 1) M ss x F So (golden) (silver) --------- M Ss (silver) x F So (golden) 2) M SS x F So (golden) (silver) --------- M Ss (silver) x F So (silver) nel caso 1) la discendenza è sessabile; non lo è nel caso 2). La barratura delle penne risulta dominante anche in singola dose (B), la sua assenza, detta anche piumaggio uniforme, risulta essere recessiva (b): 1) M bb (uniforme) 2) M BB (barrato) x F Bo (barrato) ---------- M Bb (barrato) x F bo ---------- M Bb (uniforme) (barrato) x F bo (uniforme) x F Bo (barrato) la discendenza è sessabile solo nel caso 1). Riguardo alla velocità di impiumamento, il carattere “impiumamento lento” è dominante anche in singola dose (K), il carattere “impiumamento rapido” è recessivo (k): 1) M KK (rapido) x F Ko --------- M Kk (lento) (lento) x F ko (rapido) 2) M KK (lento) x F ko --------- M Kk (rapido) (lento) x F Ko (lento) la discendenza è sessabile sono nel caso 1). 41 Si definisce associata al sesso quell‟eredità portata da cromosomi autosomici la cui espressione è però più o meno condizionata dal sesso dell‟individuo in cui i cromosomi si trovano. Essa può essere ulteriormente distinta in: - eredità limitata dal sesso; - eredità influenzata dal sesso. Si definiscono limitati dal sesso quei caratteri la cui informazione genetica esiste in entrambi i sessi, ma che si possono esprimere solo in uno dei due: l‟esempio più interessante è dato da tutti i caratteri che intervengono nella definizione della produzione del latte o delle uova. Sono invece influenzati da sesso quei caratteri che esistono in entrambi i sessi, si esteriorizzano in entrambi, ma la loro espressione è più netta in un sesso rispetto all‟altro. L‟espressione di questi geni è cioè influenzata dagli ormoni sessuali, anche se, a quanto sembra, solo lo stato eterozigote è influenzato dagli ormoni sessuali. Infatti, mentre l’omozigote dominante o recessivo hanno lo stesso fenotipo, qualunque sia il sesso, l’eterozigote avrà differente fenotipo nei due sessi. Il fenomeno è conosciuto come inversione della dominanza. Un esempio è dato dall‟influenza degli ormoni sessuali sul carattere assenza o presenza di corna nella specie ovina; il carattere è legato all‟azione di un locus in cui è dominante l‟assenza di corna sia in omozigosi dominante (PP) sia in eterozigoti (Pp), mentre è recessiva la presenza di corna. Nell‟incrocio fra arieti privi di corna della razza Suffolk (S) e pecore della razza Dorset (D) dotate di corna (+ per la presenza e - per l‟assenza) avremo: P (-) S M PP x (+) D F pp F1 tutti eterozigoti Pp, però: M (+) F (-) L‟interpretazione è che gli ormoni androgeni influenzano l‟estrinsecarsi del carattere e così le normali proporzioni mendeliane per un locus biallelico a dominanza completa vengono rispettate solo nel sesso femminile; accoppiando gli F1 tra loro avremo: F2 MP p F P PP Pp p pP pp nei M : 3 (+) e 1 (-) nelle F: 3 (-) e 1 (+) Nei maschi si ha l‟inversione della dominanza, mentre nelle femmine vengono rispettate le segregazioni normalmente attese. Alcuni autori pensano che non ci sia solo un‟influenza ormonale, bensì che il locus vada incontro ad un vero e proprio cambiamento intrinseco: infatti il maschio castrato presenta ugualmente le corna e perciò si può prospettare la neutralizzazione di P da parte di p. 42 LA G E N E T I C A D I P O P O L A Z I O N E Mendel morì nel 1884: le leggi che oggi portano il suo nome, e che egli aveva scoperto nel 1866, erano dimenticate. La "riscoperta" delle leggi di Mendel avvenne nel 1900 ad opera di tre botanici che lavoravano indipendentemente: H. De Vries (olandese), C. Correns (tedesco) ed E. Tschermak (ungherese). Nacque negli stessi anni la genetica delle popolazioni; la legge fondamentale venne individuata dal matematico inglese G. H. Hardy e dal medico tedesco W. Weinberg (legge di Hardy-Weinberg, 1908). Genetica delle popolazioni: per genetica si intende "struttura genetica", e dunque è la struttura genetica delle popolazioni. Ma perché popolazioni e non specie, o razze? La popolazione è in genere aggettivata: popolazione "mendeliana", che può essere una specie oppure una sub-unità della specie. Una popolazione mendeliana è una popolazione in cui gli individui sono sottoposti ad un flusso genico (gene flow), cioè possono "scambiarsi" geni grazie alla riproduzione. Fino a quando degli individui sono sottoposti al flusso genico? Due sono i meccanismi che possono interrompere il flusso genico: la speciazione e la creazione di barriere riproduttive. La speciazione è il meccanismo più importante e comporta l'incapacità riproduttiva per le differenze biologiche esistenti fra gli animali; la barriera riproduttiva non richiede invece la perdita di capacità riproduttiva, ma l'impossibilità di riprodursi per motivi spazio-temporali (ad esempio, l'isolamento geografico, come nel caso degli animali selvatici australiani oppure degli animali che gli Europei hanno portato con loro nelle colonie). Speciazione e barriere riproduttive possono anche coesistere e variamente intrecciarsi. La definizione di popolazione mendeliana può adattarsi a specie (come nel caso in cui una specie è una popolazione molto ristretta), oppure adattarsi a suddivisioni della specie (come nel caso degli animali domestici, ma a volte anche nel caso di selvatici diffusi in aree molto vaste e con differenti habitat). Nell'animale domestico le barriere riproduttive principali le crea l'uomo, addirittura all'interno della popolazione (ad esempio, quando sceglie i riproduttori). Il soggetto della trattazione teorica può essere un gene qualsiasi facente parte di un locus polimorfo. La grandezza fondamentale da misurare è la frequenza genica, cioè la frequenza del gene nella popolazione mendeliana. La frequenza si ha solo se il gene è un allele di un locus polimorfo: cioè nella popolazione è presente, oltre al gene, il suo o i suoi alleli. Si parla di frequenze, cioè di grandezze relative (fra 0 ed 1), e che come tali si possono confrontare fra popolazioni mendeliane. Gli scopi della genetica delle popolazioni sono due: - definire la struttura genetica della popolazione; - individuare e studiare le forze che possono provocare delle variazioni all'interno delle popolazioni (cioè variazioni delle frequenze geniche). Se si parla di variazione, si tratta di un concetto dinamico; se si cambia, si cambia nel tempo, cioè nel susseguirsi delle generazioni. Applicheremo dei modelli teorici, che non si differenziano nelle specie (si applicano alla riproduzione sessuata dei mammiferi, e non si tiene conto di individui che non si riproducono). Il nostro pool genetico deriva da animali che effettivamente si riproducono. La struttura di una popolazione è definita da tre grandezze: - le frequenze fenotipiche; - le frequenze genotipiche; - le frequenze geniche. Biologicamente è la frequenza genica che determina le altre due, ma il nostro cammino pratico è inizialmente l'opposto, dal fenotipo al genotipo al gene, in quanto non vediamo direttamente il gene ma solo i suoi effetti. Nella trattazione teorica si può supporre di conoscere la frequenza genica e da questa arrivare a genotipi e fenotipi: questa potrà essere la via reale in futuro, grazie allo studio diretto del DNA. La genetica di popolazione è basata sulla legge di Hardy-Weinberg, o legge dell'equilibrio genetico. L'equilibrio genetico è il non variare da una generazione alla successiva delle frequenze geniche, e quindi di quelle genotipiche e fenotipiche. Esiste innanzitutto un equilibrio intra-locus e poi un equilibrio di tutti i loci (equilibrio effettivo della popolazione). Bisogna prima di tutto accertare alcune condizioni relative al campione; la popolazione reale in genere non rispetta le condizioni della popolazione ideale, ma nonostante ciò la legge è nella sostanza valida 43 anche per le popolazioni reali. Fenomeno di Walhund: nel campione non deve esistere accavallamento di generazioni e la popolazione non deve tendere a distribuirsi per sottopopolazioni. Nell'uomo in genere le generazioni non si sovrappongono, ma l'accavallamento delle generazioni è la regola negli animali domestici, dove l'intervallo di generazione è più breve. Walhund dimostrò che in certe situazioni si può avere l'equilibrio nella popolazione generale e non nelle sottopopolazioni o viceversa. Per essere in equilibrio ci deve essere una corretta ripartizione dei sessi, la popolazione deve essere di effettivo illimitato (cioè la più grande possibile), il sistema riproduttivo deve essere panmittico (popolazione in panmissia), nella popolazione non devono esistere mutazioni, migrazioni, selezione e deriva genetica (queste ultime quattro sono proprio le forze che fanno variare l'equilibrio genetico). La panmissia è la situazione genetica che consegue ad una riproduzione panmittica, cioè ad una riproduzione realmente e totalmente casuale, in cui tutti gli individui hanno la stessa possibilità di riprodursi dando una prole fertile che è a sua volta in panmissia. In realtà la riproduzione sessuata non è mai casuale. Più la popolazione è grande e più tutti i geni hanno la possibilità di esprimere il corrispondente fenotipo. I presupposti della legge di Hardy-Weinberg non esistono nelle popolazioni reali: è sufficiente avvicinarcisi il più possibile (ad esempio, nell'uomo ci sono circa 8 mutazioni per ogni generazione). Rispetto alla panmissia, il sistema omeogamico tende a far riprodurre fra di loro gli individui più simili, mentre il sistema eterogamico tende a far riprodurre fra loro individui dissimili; il sistema omeogamico è tipicamente rappresentato dall'accoppiamento fra parenti, ma nell'uomo anche da criteri di scelta basati sul colore della pelle, su criteri estetici, su criteri culturali, su criteri intellettivi; il sistema eterogamico è quello che in genere lega fra loro diverse popolazioni mendeliane: zootecnicamente è l'incrocio. La formula matematica della legge di Hardy-Weinberg è rappresentata dal quadrato di un binomio o di un polinomio: Due alleli: A a Frequenze geniche: f(A) = p f(a) = q Frequenze genotipiche: [AA] [Aa] [aa] Frequenze fenotipiche: [A] [a] [AB] (nella codominanza non c'è differenza fra frequenze genotipiche e fenotipiche) Fare attenzione al fatto che, in loci codominanti, in genere la notazione Aa è sostituita dalla notazione AB, dove A e B sono due alleli codominanti dello stesso locus. Utilizzando il quadrato di Punnet nel caso di un locus biallelico: ¦ p q -----------------------------p ¦ pp qp ¦ q ¦ pq qq 44 ed essendo: p+q = 1 e (p+q)² = p²+2pq+q² = 1 si hanno nella generazione filiale le stesse frequenze geniche della generazione parentale: f(A) = (2p² + pq + pq) / (2p² + 2pq + 2pq + 2q²) = = (p² + pq) / (p² + 2pq + q²) = p² + pq = p (p+q) = p f(a) = (pq + pq + 2q²) / (2p² + 2pq + 2pq + 2q²) = = (pq + q²) / (p² + 2pq + q²) = pq + q² = q (p+q) = q Anche nel caso di un locus triallelico con: f(A) = p f(B) = q f(C) = r calcolando la composizione della generazione filiale con il quadrato di Punnet si ha: ¦ p q r --------------------------------------p ¦ p² pq pr ¦ q ¦ qp q² qr ¦ r ¦ rp rq r² poiché p+q+r = 1 e (p+q+r)² = p²+q²+r²+2pq+2pr+2qr = 1 si ottengono nuovamente le frequenze geniche della generazione parentale: f(A) = (2p²+pq+pq+pr+pr) / (2p²+2pq+2pr+2pq+2q²+2qr+2pr+2qr+2r²) = = (p²+pq+pr) / (p²+q²+r²+2pq+2pr+2qr) = p²+pq+pr = p(p+q+r) = p f(B) = (2q²+pq+pq+qr+qr) / (2p²+2pq+2pr+2pq+2q²+2qr+2pr+2qr+2r²) = = (q²+pq+qr) / (p²+q²+r²+2pq+2pr+2qr) = q²+pq+qr = q(p+q+r) = q f(C) = (2r²+pr+pr+qr+qr) / (2p²+2pq+2pr+2pq+2q²+2qr+2pr+2qr+2r²) = = (r²+pr+qr) / (p²+q²+r²+2pq+2pr+2qr) = r²+pr+qr = r(p+q+r) = r Anche partendo dalle frequenze genotipiche si può dimostrare la validità della legge di Hardy-Weinberg: 45 ¦ AA Aa aa ¦ p² 2pq q² --------------------------------------------------------------------4 3 2 2 AA p² ¦ p 2p q pq ¦ 3 2 2 3 Aa 2pq ¦ 2p q 4p q 2pq ¦ 2 2 3 4 aa q² ¦ pq 2pq q da cui riassumendo si ha: 4 AA x AA = p (tutti AA) AA x Aa = 4p q (metà AA e metà Aa) AA x aa = 2p q (tutti Aa) Aa x Aa = 4p q (1/4 AA, 1/2 Aa, 1/4 aa) Aa x aa = 4pq (metà Aa e metà aa) aa x aa = q (tutti aa) 3 2 2 2 2 3 4 e sommando i genotipi simili si ha: 4 3 2 2 AA = p +2p q+p q = p²(p²+2pq+q²) = p² 3 2 2 2 2 3 Aa = 2p q+2p q +2p q +2pq = 2pq(p²+2pq+q²) = 2pq 2 2 3 4 aa = p q +2pq +q = q²(p²+2pq+q²) = q² Se partiamo da una popolazione che non è in equilibrio, in quanto tempo si raggiunge l'equilibrio genetico? Generalmente basta una sola generazione di accoppiamento casuale per ottenere l'equilibrio: dopo una generazione le frequenze geniche non mutano più; ciò è valido indipendentemente dall'entità del polimorfismo, ovvero non dipende dal numero di alleli presenti al locus considerato. Un'eccezione è per i loci del cromosoma sessuale X (geni X-linked); ricordiamo che non basta dire genericamente "legati al sesso" perché esistono anche geni Y-linked, i quali danno l'eredità olandrica, cioè solo maschile, come nel caso dell'antigene HY, collegato alla repressione e derepressione dello sviluppo sessuale dell'embrione. Nel caso di un allele X-linked, se le frequenze sono diverse nei due sessi, esse tendono all'uguaglianza solo all'infinito; nei mammiferi non è mai stata dimostrata complementarietà totale fra X ed Y, come accade in alcuni esseri inferiori; il maschio non è omozigote o eterozigote, bensì emizigote, ed il carattere si manifesta comunque, indipendentemente dal fatto che sia dominante oppure recessivo. f(XA) = 2/3 f(XAf) + 1/3 f(XAm) L'eredità si manifesta "criss-cross", o incrociata; i maschi ricevono il cromosoma X dalla madre, mentre le femmine ricevono un cromosoma X dal padre ed un cromosoma X dalla madre: pertanto la generazione filiale maschile riceve le frequenze geniche delle femmine della generazione parentale, mentre la generazione filiale femminile riceve le frequenze geniche medie dei due sessi nella generazione parentale. Nel tempo, l'andamento delle frequenze nei due sessi ha l'aspetto di una linea "a dente di sega", con differenze che ad ogni generazione si dimezzano e cambiano di segno. Per gli alleli legati al cromosoma X, nelle femmine c'è differenza fra frequenze geniche e frequenze genotipiche, mentre nei maschi (emizigoti) le due frequenze sono uguali. E' molto importante 46 comprendere questi meccanismi per studiare le patologie recessive legate alla X (ad esempio, l'emofilia).(1) --------------------------------------------------------------------(1) Non confondere l‟eredità “legata al sesso” con quella “limitata dal sesso” e con quella “influenzata dal sesso”. L‟eredità legata al sesso riguarda caratteri portati dall‟eterocromosoma X, ma che possono manifestarsi in entrambi i sessi. L‟eredità limitata dal sesso riguarda caratteri che sono normalmente ereditati da entrambi i sessi, ma che si manifestano solo il un sesso (ad esempio la produzione lattea). L‟eredità influenzata dal sesso è quella in cui il carattere si eredità normalmente in entrambi i sessi, ma si manifesta differentemente nei due sessi (magari per influenza degli ormoni sessuali): ad esempio, il carattere corna si manifesta nei maschi in maniera più evidente. ESEMPIO Locus biallelico X-linked f(XAm) = pm = 0,2 f(XAf) = pf = 0,5 (la differenza fra le frequenze di maschi e femmine è -0,3) Generazione successiva: pm = 0,5 pf = (0,2+0,5)/2 = 0,35 (la differenza fra le frequenze è adesso +0,15) Generazione successiva: pm = 0,35 pf = (0,5+0,35)/2 = 0,425 (la differenza è adesso -0,075) Notare che in ogni generazione la frequenza genica nella popolazione è 0,4 esima [f(XA) = 2/3f(XAf) + 1/3f(XAm)]: alla n generazione la frequenza genica sarà 0,4 anche in entrambi i sessi. GENI X-LINKED Andamento delle frequenze geniche 1,0 F r e q u e n z a ,8 ,6 ,4 ,2 0,0 1 2 3 4 5 6 7 8 9 10 Generazione maschi femmine 47 GENI X-LINKED Andamento delle frequenze geniche 1,0 F r e q u e n z a ,8 ,6 ,4 ,2 0,0 1 2 3 4 5 6 7 8 9 10 Generazione maschi femmine 48 ESEMPIO In una popolazione con un locus autosomico biallelico Tt: TT Tt tt = 0,4 = 0,4 = 0,2 ¦ TT Tt tt ¦ 0,4 0,4 0,2 ---------------------------------------------------TT 0,4 ¦ 0,16 0,16 0,08 Tt 0,4 ¦ 0,16 0,16 0,08 tt 0,2 ¦ 0,08 0,08 0,04 (notare che le combinazioni fuori della diagonale sono simmetriche e possono quindi essere facilmente sommate) TT TT TT Tt Tt tt x x x x x x TT Tt tt Tt tt tt = = = = = = 0,16 (tutti TT) 0,32 (metà TT e metà Tt) 0,16 (tutti Tt) 0,16 (1/4 TT, metà Tt, 1/4 tt) 0,16 (metà Tt e metà tt) 0,04 (tutti tt) per cui, sommando i genotipi simili, otteniamo: TT Tt tt = = = 0,36 0,48 0,16 Le frequenze ottenute sono diverse da quelle di partenza, ma possiamo dimostrare che l'equilibrio è stato raggiunto in una sola generazione, in quanto: ¦ TT Tt tt ¦ 0,36 0,48 0,16 ------------------------------------------------------------------------TT 0,36 ¦ 0,1296 0,1728 0,0576 Tt 0,48 ¦ 0,1728 0,2304 0,0768 tt 0,16 ¦ 0,0576 0,0768 0,0256 TT TT TT Tt Tt tt x x x x x x TT Tt tt Tt tt tt = = = = = = 0,1296 (tutti TT) 0,3456 (metà TT e metà Tt) 0,1152 (tutti Tt) 0,2304 (1/4 TT, metà Tt, 1/4 tt) 0,1536 (metà Tt e metà tt) 0,0256 (tutti tt) da cui nuovamente otteniamo: TT Tt tt = = = 0,36 0,48 0,16 49 ESEMPIO Una popolazione con un locus autosomico biallelico Aa, ma frequenze diverse nei due sessi: ad esempio, i maschi provengono da una razza con frequenze geniche p e q rispettivamente pari a 0,6 e 0,4, mentre le femmine da un'altra razza con frequenze geniche 0,8 e 0,2 (entrambe le razze erano comunque, al loro interno, in equilibrio). Maschi AA Aa aa = p² p = 0,8 q = 0,2 = 0,64 Aa = 2pq aa q = 0,4 = p² = 0,36 = 2pq = 0,48 = q² = 0,16 Femmine AA p = 0,6 = q² = 0,32 = 0,04 ¦ AA Aa aa ¦ 0,36 0,48 0,16 ------------------------------------------------------------------------AA 0,64 ¦ 0,2304 0,3072 0,1024 Aa 0,32 ¦ 0,1152 0,1536 0,0512 aa 0,04 ¦ 0,0144 0,0192 0,0064 AA AA AA Aa Aa aa x x x x x x AA Aa aa Aa aa aa = = = = = = 0,2304 (tutti AA) 0,4224 (0,1152+0,3072: metà AA e metà Aa) 0,1168 (0,1024+0,0144: tutti Aa) 0,1536 (1/4 AA, metà Aa, 1/4 aa) 0,0704 (0,0192+0,0512: metà Aa e metà aa) 0,0064 (tutti aa) per cui, sommando i genotipi simili, otteniamo: AA = 0,2304 + 0,2112 + 0,0384 = 0,48 Aa = 0,2112 + 0,1168 + 0,0768 + 0,0352 = 0,44 aa = 0,0384 + 0,0352 + 0,0064 = 0,08 Le frequenze geniche sono la media di quelle delle due razze di origine: p = 0,48 + 1/2 (0,44) = 0,7 [cioè (0,6+0,8)/2] q = 0,08 + 1/2 (0,44) = 0,3 [cioè (0,4+0,2)/2] Si può dimostrare che le frequenze geniche sono già in equilibrio, mentre le frequenze genotipiche ancora non lo sono: infatti dovrebbe essere p² 2pq q² = 0,7² = 0,49 = 2 (0,7) (0,3) = 0,42 = 0,3² = 0,09 50 L'equilibrio delle frequenze genotipiche si raggiunge nella generazione seguente: ¦ AA Aa aa ¦ 0,48 0,44 0,08 ------------------------------------------------------------------------AA 0,48 ¦ 0,2304 0,2112 0,0384 Aa 0,44 ¦ 0,2112 0,1936 0,0352 aa 0,08 ¦ 0,0384 0,0352 0,0064 AA AA AA Aa Aa aa x x x x x x AA Aa aa Aa aa aa = = = = = = 0,2304 (tutti AA) 0,4224 (metà AA e metà Aa) 0,0768 (tutti Aa) 0,1936 (1/4 AA, metà Aa, 1/4 aa) 0,0704 (metà Aa e metà aa) 0,0064 (tutti aa) da cui otteniamo, sommando i genotipi simili: AA = 0,2304 + 0,2112 + 0,0484 AA = 0,2112 + 0,0768 + 0,0968 + 0,0352 = 0,42 AA = 0,0484 + 0,0352 + 0,0064 = 0,09 = 0,49 e le frequenze geniche: p = 0,49 + 1/2 0,42 = 0,7 q = 0,09 + 1/2 0,21 = 0,3 IL CONTROLLO DELL'EQUILIBRIO GENETICO. In pratica è sempre necessario partire da frequenze fenotipiche per arrivare alle frequenze geniche e stabilire se, in quel determinato locus, esiste una condizione di equilibrio, cioè se quelle frequenze geniche si trasmetteranno immutate nelle successive generazioni. In un locus polimorfo (biallelico), se i fenotipi evidenziabili sono solamente due significa che fra i due alleli i rapporti sono di dominanzarecessività, mentre se i fenotipi presenti sono tre i rapporti fra i due alleli sono di codominanza. Nel locus codominante, esistendo un'assoluta uguaglianza fra frequenza genotipica e frequenza fenotipica, l'eventuale equilibrio può essere valutato direttamente dalle frequenze fenotipiche: ciò non può essere fatto per alleli con rapporti di dominanza-recessività. La valutazione della condizione di equilibrio in un locus consiste nel confrontare le frequenze genotipiche osservate con le frequenze teoriche, attese secondo la legge di Hardy-Weinberg. Se la differenza fra frequenze attese ed osservate non è significativa, allora le frequenze genotipiche possono dirsi "in equilibrio"; il confronto fra frequenze attese ed osservate è fatto mediante il test ² (leggi "chi quadrato"). 51 I dati di partenza per i calcoli sono i valori di p e di q, ovvero le frequenze dei due alleli nella popolazione; il metodo è differente, a seconda del tipo di rapporto esistente fra i due alleli: nel caso di codominanza si utilizza il metodo della conta diretta, mentre nel caso di dominanza-recessività il metodo della radice quadrata del fenotipo recessivo. Ad esempio, nel caso di codominanza (cioè A=B), abbiamo: p = f(A) = ([2A + ½[AB] + ½[AB]) / 2n = ([A + ½[AB]) / n dove n rappresenta il numero degli individui; è stato in pratica sufficiente contare i differenti fenotipi. Supponiamo si tratti di bovini Shorthorn, che possono essere di mantello bianco, rosso o roano (eterozigoti); per calcolare la frequenza dell'allele per il rosso si contano i bovini rossi, si sommano a questi la metà degli individui roani e si divide il tutto per il numero totale di bovini (rossi+bianchi+roani); per ottenere q si potrebbe utilizzare lo stesso tipo di calcolo, ma è più semplice q=1-p (poiché p+q=1). Nel caso di dominanza-recessività fra alleli (cioè A>a), sappiamo che il fenotipo [a] corrisponde al genotipo [aa], mentre il fenotipo [A] è dato da due genotipi, [AA] e [Aa]: non è possibile cioè stabilire se un fenotipo dominante è dato da un genotipo omozigote dominante o eterozigote. Le frequenze geniche possono essere calcolate solo presupponendo che la popolazione sia in equilibrio: ½ q = f(a) = ([a]/n) , (dove n rappresenta il numero degli individui) e quindi p = f(A) = 1 -q. E' importante sottolineare che, poiché nel caso di dominanza-recessività le frequenze sono state ricavate presupponendo che la popolazione sia in equilibrio, non si potrà poi controllare se l'equilibrio è effettivamente esistente: in altre parole, a partire dalle frequenze geniche calcolate con questo metodo si otterrebbero come frequenze fenotipiche attese quelle stesse frequenze fenotipiche che erano state realmente osservate. Un esempio più complesso è il locus triallelico AB0, quello dei gruppi sanguigni dell'uomo, dove sono presenti contemporaneamente rapporti di dominanza e codominanza: A=B A>0 B>0 f(A) = p f(B) = q f(0) = r [A] = [AA] + [A0] [B] = [BB] + [B0] [AB] = [AB] [0] = [00] p+q+r = 1 (p+q+r)² = p²+q²+r²+2pq+2pr+2q r= 1 [A] = p²+2pr [B] = q²+2qr [AB] = 2pq [0] = r² Per meglio comprendere i rapporti di dominanza e codominanza del locus AB0, ricordiamo che l'allele A fa produrre la proteina omonima (agglutinogeno A), l'allele B fa produrre l'agglutinogeno B, mentre l'allele 0 ("zero") non fa produrre alcun agglutinogeno. Si presuppone che la popolazione sia in equilibrio e si comincia quindi il calcolo estraendo la radice quadrata della frequenza dell'omozigote recessivo [00]=[0]; il valore di r così ottenuto viene poi utilizzato per calcolare p e q. 52 Ad esempio, avendo osservato in 190.177 avieri britannici la seguente distribuzione dei gruppi sanguigni: [A] = 79.334 [B] = 16.279 [AB] = 5.782 [0] = 88.782 si calcola dapprima la frequenza r: ½ r² = 88.782/190.177 r = (0,46684) = 0,6833; ed utilizzando il valore di r trovato si calcola p e q: q²+2qr+r² = (q+r)² = (1-p)² da cui: ½ q+r = ([B]+[0]) = 1-p ½ ½ p = 1-([B]+[0]) = 1-(0,5524) = 1-0,7432 = 0,2568 ed analogamente: p²+2pr+r² = (p+r)² = (1-q)² da cui: ½ p+r = ([A]+[0]) = 1-q ½ ½ q = 1-([A]+[0]) = 1-(0,8840) = 1-0,9402 = 0,0598 Notare che, una volta calcolato p (oppure q), anche la frequenza dell'ultimo allele è stata calcolata mediante una formula che fa riferimento ad un presunto equilibrio secondo Hardy-Weinberg, e non per differenza rispetto ad 1 (cioè grazie a p+q+r = 1) oppure utilizzando il genotipo AB (cioè 2pq = 5.782/190.177 = 0,0304). La somma delle frequenze geniche è nel caso esposto 0,9999, cioè inferiore ad 1: la differenza non è dovuta solamente all'arrotondamento, ma anche al fatto che le frequenze geniche non sono perfettamente in equilibrio e non tutta l'informazione è utilizzabile (nel nostro caso, non si è fatto uso dell'informazione data dalla frequenza del genotipo AB). Se si fosse utilizzato il genotipo AB oppure la somma delle tre frequenze, si sarebbero ottenuti risultati leggermente diversi (ma probabilmente meno esatti, perché ricavati da una quantità inferiore di informazioni); infatti: se r = 0,6833 e p = 0,2568, si ha: q = 1-p-r = 0,0599 oppure 2pq = 5.782/190.177 = 0,0304 e q = 0,0304/0,5136 = 0,0592 mentre se r = 0,6833 e q = 0,0598, si ha: p = 1-q-r = 0,2569 oppure 2pq = 5.782/190.177 = 0,0304 e p = 0,0304/0,1196 = 0,2542 Ricordiamo ancora una volta che il procedimento illustrato PRESUPPONE che le frequenze siano in equilibrio, ed una buona corrispondenza dei valori di p e q calcolati con i due procedimenti può confortare l'ipotesi di equilibrio genetico, la quale NON PUO' PERO' ESSERE DIMOSTRATA. 53 Ad un risultato simile si perviene anche, dopo aver calcolato r, risolvendo due equazioni di secondo grado, e scegliendo ovviamente la soluzione positiva: p²+2pr = 79.334/190.177 q²+2qr = 16.279/190.177 p²+1,3666p-0,4172 = 0 q²+1,3666q-0,0856 = 0 p = 0,2570 q = 0,06 Anche in questo caso la somma delle tre frequenze risulta diversa da 1 (p+q+r = 1,0003), e ciò non solo per l'arrotondamento utilizzato, ma anche per il non perfetto equilibrio secondo Hardy-Weinberg. Inoltre, se la popolazione fosse perfettamente in equilibrio, si dovrebbero ottenere, utilizzando la frequenza dell'eterozigote AB oppure la somma totale delle frequenze, gli stessi risultati: dato r = 0,6833 e p = 0,2570: q = 1-0,6833-0,2570 = 0,0597 oppure 2pq = 0,0304 e q = 0,0304/0,514 = 0,0591 dato r = 0,6833 e q = 0,06: p = 1-0,6833-0,06 = 0,2567 oppure 2pq = 0,0304 e p = 0,0304/0,12 = 0,2533 Solo il metodo della conta diretta permette effettivamente di valutare se l'equilibrio genetico è presente o meno in una popolazione: quando si fa uso, anche parzialmente (come nel caso del locus AB0), della radice quadrata di un fenotipo recessivo non si può verificare se l'equilibrio è presente o meno, in quanto l'equilibrio è indispensabile premessa al calcolo di una frequenza genica mediante la radice quadrata di un fenotipo recessivo. Come si fa a stabilire se le frequenze geniche sono in equilibrio secondo Hardy-Weinberg? Bisogna confrontare le frequenze osservate con le frequenze attese. Dalla popolazione mendeliana si estrae un campione, e già questa operazione può essere una fonte di errore se non effettuata correttamente; parleremo inoltre di significatività delle differenze, in quanto le differenze stesse potrebbero essere dovute al caso: la popolazione potrebbe cioè essere in equilibrio, ma presentare, per il semplice fatto della casualità delle segregazioni, delle distribuzioni di frequenze leggermente diverse da quelle teoricamente attese secondo la legge di Hardy-Weinberg (è solo questa l'origine delle differenze in una popolazione mendeliana in equilibrio che sia stata interamente campionata). Un locus è in equilibrio quando le differenze fra frequenze osservate ed attese non sono significative. Bisogna evitare gli errori di campionamento, quali ad esempio: - che la popolazione mendeliana sia suddivisa in sottopopolazioni; - che le eventuali differenze di generazione non siano considerate; - che il campione non sia casuale (random). Si utilizza il test ² (leggi "chi quadrato"): ² = [(O-E)²/E] cioè la sommatoria dei quadrati degli scarti fra frequenze osservate (Observed) e frequenze attese (Expected) divisi per le corrispondenti frequenze attese non deve superare dei valori tabulari, determinati in base ad un livello di significatività prescelto, generalmente il 5% (P 0,05), ed ai gradi di libertà su cui si basa il confronto. Generalmente parlando, affinché da una popolazione (cioè da un insieme costituito da tutte le possibili osservazioni) si possa ricavare un campione (le osservazioni effettivamente utilizzate per la descrizione della popolazione o per un confronto fra popolazioni) adatto a fini statistici bisogna soddisfare i criteri di randomizzazione e rappresentatività del campione: ovvero, il campione deve essere random, cioè casuale nella composizione, e rappresentativo della popolazione da cui è stato estratto, cioè racchiudere in sé le caratteristiche della popolazione di cui fa parte. Solo se i criteri di rappresentatività e casualità del campione sono soddisfatti, le conclusioni si possono statisticamente ritenere valide non solo per il campione, ma anche per la popolazione. 54 Una volta stabilita la frazione di campionamento, cioè la quantità o percentuale di dati da campionare, il campionamento vero e proprio può essere effettuato con varie modalità, da scegliere a seconda delle circostanze. Il campionamento può essere: - casuale semplice (con o senza ripetizione); - sistematico; - a grappolo; - stratificato; - a stadi. Se, ad esempio, si dovesse campionare la popolazione frisona italiana, un campionamento casuale semplice significherebbe estrarre a sorte dall'elenco degli animali da campionare (per semplificare questa operazione sono disponibili delle tabelle di numeri casuali oppure delle funzioni che generano una serie di numeri pseudo-casuali): nel caso di campionamento senza ripetizione, un animale già estratto non verrebbe incluso nella popolazione per successive estrazioni, mentre nel caso di un campionamento con ripetizione un animale parteciperebbe alle successive estrazioni, per cui potrebbe entrare nel campione due o più volte (è un caso abbastanza raro in zootecnia: ad esempio, si pescano in una vasca dei pesci e si rileva su di loro ciò che interessa, quindi li si rigetta nella stessa vasca e si procede ad una nuova pesca; lo stesso potrebbe verificarsi separando momentaneamente delle pecore da un gregge: in questo caso però la ripetizione può essere evitata identificando gli animali con una matricola o semplicemente marcandoli). Un campionamento sistematico potrebbe essere effettuato, ad esempio, entrando nelle varie stalle e scegliendo in ogni stalla il primo animale che si ha modo di osservare (il campionamento sistematico può essere soggetto ad un errore sistematico, quando il criterio seguito introduce una fonte di errore: ad esempio, gli animali potrebbero essere disposti nella stalla per sesso o per età, per cui si sceglierebbe, senza saperlo, sempre un maschio oppure sempre l'animale più giovane); con un campionamento a grappolo, si metterebbero nel campione tutti gli animali di alcune stalle; con un campionamento stratificato si sceglierebbero gli animali nelle diverse stalle in proporzione, ad esempio, al sesso ed alla consistenza nelle varie stalle: per poter effettuare un campionamento stratificato è dunque necessario conoscere alcune caratteristiche della popolazione; con un campionamento a stadi, verrebbero scelti ad esempio solo gli animali di alcune regioni e, con più stadi, gli animali di alcune province nelle regioni già scelte e, con un ulteriore stadio, gli animali di alcuni comuni di alcune province delle regioni scelte. Il ² è un indice di dispersione ideato da Pearson, utilizzato per calcolare la probabilità di osservare una determinata ripartizione di frequenze rispetto a quelle attese in base ad una ipotesi. (O - E)² ² = -------------------E dove: O è la frequenza osservata; E è la frequenza attesa. Notare che il valore di ² dipende dal numero dei termini della sommatoria (o meglio dal numero dei termini della sommatoria stessa che sono realmente "liberi", cioè dal numero dei gradi di libertà). Si utilizzano le frequenze assolute, e non le frequenze relative, perché alle frequenze viene attribuito un valore differente a secondo del numero di osservazioni da cui le frequenze stesse sono state ricavate. Il valore di ² è tanto più elevato quanto più è elevata la differenza fra la frequenza osservata e la frequenza attesa, ed aumenta in ragione del quadrato di questa differenza: un differenza di 3, rispetto ad una di 1, provocherà un aumento del numeratore di 9 volte (man mano che ci si allontana dalla frequenza attesa, è sempre assai meno probabile che un ulteriore scostamento unitario della frequenza osservata dalla attesa si possa verificare casualmente); il valore è tanto più basso quanto più elevata è la frequenza attesa: su un numero più elevato di osservazioni è più probabile uno scostamento casuale. 55 Questo test non può essere utilizzato nel caso una qualsiasi delle frequenze presenti nel calcolo sia inferiore a 5: in tale circostanza si ricorre ad un test analogo, il "test esatto di Fisher", oppure, se possibile, si riuniscono le classi di frequenza meno rappresentate in classi più ampie. Nel caso di piccoli campioni, con classi superiori a 5 ma inferiori a 100, può essere utilizzata nel calcolo la correzione di Yates (o correzione di continuità), che consiste nel sottrarre e sommare 0,5, prima dell'elevazione al quadrato, rispettivamente al più elevato scostamento positivo ed al più elevato scostamento negativo. La funzione di distribuzione del ² è data da: ½n-1 f(²) = ½(²) (²) e -----------------½n 2 (n/2) dove: ² è il valore trovato di ²; n sono i gradi di libertà. La funzione (leggi "gamma") è, per un numero positivo, pari al fattoriale del numero stesso al quale sia stato sottratto 1 (ovvero n=(n-1)!). Dato un numero di gradi di libertà, ogni valore di ² ha quindi una propria possibilità di essere osservato, calcolabile in base alla funzione di frequenza riportata. Generalmente, se non si fa uso di programmi statistici su elaboratori elettronici, i quali forniscono il valore esatto delle probabilità del ² calcolato per gli opportuni gradi di libertà, si utilizza un'apposita tabella: nelle diverse colonne sono riportati i valori di ² per dei livelli standard di probabilità, mentre le righe rappresentano i diversi gradi di libertà. G.d.L. 1 2 .... 10 20 .... 100 .... ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ Probabilità di valori superiori 0,500 0,45 1,39 .... 9,34 19,34 .... 99,33 .... .... .... .... .... .... .... .... .... .... 0,050 3,84 5,99 .... 18,31 31,41 .... 124,34 .... 0,010 6,63 9,21 .... 23,21 37,57 .... 135,81 .... 0,001 10,83 13,82 .... 29,59 45,32 .... 149,45 .... La probabilità con cui accettare o rifiutare un'ipotesi corrisponde al livello di sicurezza con cui si vuole ritenere valide le proprie conclusioni: viene pertanto fissata dallo sperimentatore a seconda del caso; in genere, in zootecnia vengono considerate significative le differenze per cui P 0,05. Il concetto di gradi di libertà è un concetto assimilabile solo con un po' di esperienza: si tratta del numero di osservazioni realmente indipendenti: ad esempio, per un locus poliallelico, nella verifica dell'equilibrio genetico i gradi di libertà sono pari al numero degli alleli meno 1 (ma è possibile trovare testi in cui i gradi di libertà sono pari al numero dei fenotipi meno uno, oppure al numero dei fenotipi meno il numero degli alleli), mentre nel caso del controllo di una segregazione i gradi di libertà sono pari al numero dei fenotipi osservati meno 1. 56 IPOTESI: dominanza completa. Aa x Aa Frequenze osservate (totale 4889): AA + 2Aa = 3655 aa = 1234 Frequenze attese: AA + 2Aa = 3/4 (4889) = 3666,75 aa = 1/4 (4889) = 1222,25 ²1gdl = (3655-3.66675)²/3666,75 + (1234-1222,25)²/1222,25 = 0,1507 Il valore di ² è inferiore a quello tabulare per P0,05 ed 1 g.d.l., per cui la segregazione osservata è in accordo con l'ipotesi. IPOTESI: codominanza. Aa x Aa Frequenze osservate (totale 3536): AA = 868 Aa = 1782 aa = 886 Frequenze attese: AA = 1/4 (3536) = 884 2Aa = 1/2 (3536) = 1768 aa = 1/4 (3536) = 884 ²2gdl = (868-884)²/884 + (1782-1768)²/1768 + (886-884)²/884 = 0,405 Il valore di ² è inferiore a quello tabulare per P0,05 e 2 g.d.l., per cui la segregazione osservata è in accordo con l'ipotesi. IPOTESI: letalità omozigote recessivo. Aa x Aa Frequenze osservate (totale 1282): AA = 414 2Aa = 868 57 Frequenze attese: AA = 1/3 (1282) = 427,3 2Aa = 2/3 (1282) = 854,7 X²1gdl = (414-427,3)²/427,3 + (868-854,7)²/854,7 = 0,621 Il valore di ² è inferiore a quello tabulare per P0,05 ed 1 g.d.l., per cui la segregazione osservata è in accordo con l'ipotesi. IPOTESI: segregazione diibrido AaBb. In F2 sono stati osservati su un totale di 4082 fenotipi: [AB] = 2458 [Ab] = 603 [aB] = 598 [ab] = 423 Frequenze attese (9:3:3:1): [AB] = 9/16 (4082) = 2296,125 [Ab] = 3/16 (4082) = 765,375 [aB] = 3/16 (4082) = 765,375 [ab] = 1/16 (4082) = 255,125 ²3gdl = (2458 - 2296,125)²/2296,125 + (603 - 765,375)²/765,375 + (598 - 765,375)²/765,375 + (423 - 255,125)²/255,125 = 192,926 Poiché il valore di ² osservato è superiore a quello tabulato per 3 g.d.l. e P0,001, dobbiamo escludere l'ipotesi di segregazione indipendente del diibrido AaBb. Controlliamo allora se, separatamente, le coppie alleliche Aa e Bb segregano nel rapporto 3 ad 1: [A] = 3061 [a] = 1021 attese = 3/4 (4082) = 3061,5 attese = 1/4 (4082) = 1020,5 ²1gdl = (3061-3061,5)²/3061,5 + (1021-1020,5)²/1020,5 = 0,0003 [B] = 3056 [b] = 1026 attese = 3/4 (4082) = 3061,5 attese = 1/4 (4082) = 1020,5 ²1gdl = (3056-3061,5)²/3061,5 + (1026-1020,5)²/1020,5 = 0,0395 In entrambi i casi il valore di ² è inferiore a quello per 1 g.d.l e P0,05, per cui le due coppie alleliche segregano, ciascuna per suo conto, nel rapporto atteso di 3 ad 1, ma complessivamente non nelle classiche frequenze 9:3:3:1. Per dimostrare che si tratta di una segregazione non indipendente, come nel caso di due loci posti sullo stesso cromosoma, verifichiamo per differenza l'interazione dei due loci nella segregazione: 58 Segregazione g.d.l. X² significatività ----------------------------------------------------------------------------------------------------------------AaBb 3 192,93 P0,001 Aa 1 0,0003 non significativo Bb 1 0,040 non significativo ----------------------------------------------------------------------------------------------------------------"interazione" 1 192,89 P0,001 Si può dunque concludere che si tratta effettivamente di un diibrido, in cui la segregazione delle due coppie alleliche non è però indipendente. CONTROLLO EQUILIBRIO GENETICO: A=a (2595 osservazioni). [AA] = 1760 [Aa] = 620 [aa] = 215 p = (1760 + ½ 620)/2595 = 0,798 q = (215 + ½ 620)/2595 = 0,202 Frequenze attese in base alla legge di Hardy-Weinberg: [AA] = p² (2595) = 1652,5 [Aa] = 2pq (2595) = 836,6 [aa] = q² (2595) = 105,9 ²1gdl = (1760-1652,5)²/1652,5 + (620-836,6)²/836,6 + (215-105,9)²/105,9 = 175,47 Il valore di ² osservato è superiore a quello tabulare per 1 g.d.l. e P0,001, per cui la popolazione non è da considerare in equilibrio secondo Hardy-Weinberg. CONTROLLO EQUILIBRIO GENETICO: Z=z (in un gruppo sanguigno di 2047 bovini Jersey). [ZZ] = 542 [Zz] = 1043 [zz] = 462 p = (542 + ½ 1043)/2047 = 0,5195 q = (462 + ½ 1043)/2047 = 0,4805 Frequenze attese in base alla legge di Hardy-Weinberg: [ZZ] = p² (2047) = 552.44 [Zz] = 2pq (2047) = 1021,94 [zz] = q² (2047) = 472,61 ²1gdl = (542-552,44)²/552,44 + (1.043-1.021,94)²/1.021,94 + (462-472,61)²/472,61 = 0,8695 Il valore di ² osservato è inferiore a quello tabulare per 1 g.d.l. e P0,05, per cui la popolazione è da considerare in equilibrio secondo Hardy-Weinberg, e le differenze fra le frequenze osservate ed attese sono da attribuire al caso. 59 IPOTESI: appartenenza di un campione ad una popolazione (locus AB0, 1000 osservazioni). Frequenze ipotizzate nella popolazione: p = 0,35, q = 0,25, r = 0,4. Campione osservato: [A] = 400 [B] = 260 [AB] =175 [0] = 165 Frequenze attese: (p²+2pr) 1000 = 402,5 (q²+2qr) 1000 = 262,5 (2pq) 1000 = 175 (r²) 1000 = 160 ²2gdl = (400-402,5)²/402,5 + (260-262,5)²/262,5 + (175-175)²/175 + (165-160)²/160 = 0,1956 Poiché il ² è inferiore a quello tabulato per P0,05 e 2 g.d.l., la distribuzione osservata è compatibile con quella attesa: il campione può effettivamente appartenere ad una popolazione con le frequenze alleliche indicate. TABELLE DI CONTINGENZA: servono a verificare se due o più caratteri sono indipendenti (ancor prima di aver chiarito il determinismo genetico dei caratteri stessi). Mantello: fenotipo chiaro o scuro. Occhi: fenotipo chiaro o scuro. Mantello Occhi OSSERVAZIONI ----------------------------------------------------------------------Scuro scuri 1605 Scuro chiari 95 Chiaro scuri 395 Chiaro chiari 405 In totale, su 2500 animali, 1700 hanno mantello scuro ed 800 lo hanno chiaro, mentre, per quanto riguarda il colore degli occhi, 2000 li hanno chiari e 500 scuri; la probabilità di avere mantello scuro è dunque 0,68 (cioè 1700/2500) e quella di averlo chiaro 0,32 (cioè 800/2500, o anche 1-0,68); la probabilità di avere occhi scuri è 0,8 (cioè 2000/2500), quella di avere occhi chiari 0,2 (cioè 500/2500, o anche 1-0,8). Se i due caratteri fossero indipendenti, in base al principio della probabilità composta, gli animali con mantello ed occhi scuri dovrebbero essere 1360 (cioè 0,68 x 0,8 x 2500), quelli con mantello scuro ed occhi chiari 340 (cioè 0,68 x 0,2 x 2500), quelli con mantello chiaro ed occhi scuri 640 (cioè 0,32 x 0,8 x 2500), ed infine quelli con mantello ed occhi chiari 160 (cioè 0,32 x 0,2 x 2500). In altre parole, dei 1700 animali con mantello scuro, 1360 (80%) dovrebbe avere occhi scuri e 340 (20%) occhi chiari, mentre gli 800 animali con mantello chiaro dovrebbero avere, in base alle stesse percentuali, 640 occhi scuri e 160 occhi chiari. Il tutto può essere riassunto nella seguente tabella di contingenza: M A N T E L L O S c u r o C h ia r o O C C H I O s s e r v a t i A t t e s i O s s e r v a t i A t t e s i T O T A L E S c u r i 1 6 0 5 1 3 6 0 3 9 5 6 4 0 2 0 0 0 C h ia r i 9 5 3 4 0 4 0 5 1 6 0 5 0 0 T O T A L E 1 7 0 0 8 0 0 2 5 0 0 60 In una tabella di contingenza, il numero dei gradi di libertà si calcola con la formula gdl = (r-1) x (c-1) dove r è il numero delle righe e c il numero delle colonne della tabella; nel nostro caso, (2-1) x (2-1) = 1 g.d.l. (tabella 2 x 2). ²1gdl = (1605-1360)²/1360 + (395-640)²/640 + (95-340)²/340 + (405-160)²/160 = 689,625 Poiché il valore di ² trovato supera il valore tabulare per P0,001 ed 1 g.d.l., dobbiamo concludere che i due caratteri non sono indipendenti, e cioè gli animali con mantello scuro hanno più frequentemente occhi scuri, mentre quelli con mantello chiaro hanno più frequentemente occhi chiari (potrebbe ad esempio trattarsi di loci associati). STIMA DELLA FREQUENZA DEI PORTATORI. Supponiamo che in un locus biallelico l'allele recessivo a sia responsabile di una grave malattia: in altre parole, che gli omozigoti recessivi aa siano soggetti ad una selezione naturale o artificiale che li porta a non riprodursi. I genotipi possibili alla nascita sono tre (AA, Aa ed aa), ma gli accoppiamenti possibili, dato che aa non è in grado di riprodursi, si riducono da 6 a 3: ACCOPPIAMENTO RISULTATO ---------------------------------------------------------------------AA x AA tutti AA AA x Aa ½ AA + ½ Aa AA x aa accoppiamento impossibile Aa x Aa ¼ AA + ½Aa + ¼ aa Aa x aa accoppiamento impossibile aa x aa accoppiamento impossibile Vediamo dunque che la nascita degli omozigoti recessivi aa è determinata dalla frequenza degli eterozigoti (portatori, fenotipicamente sani, del gene per la malattia): esprimiamo allora le frequenze in termini di q. La frequenza degli eterozigoti, nell'intera popolazione (compresi gli omozigoti recessivi) è data da 2pq = 2q(1-q); la frequenza degli eterozigoti nella popolazione di individui normali è data da 2pq / (p²+2pq) = 2q(1-q) / [(1-q)²+2q(1-q)] = 2q / (1-q+2q) = 2q/(1+q). ESEMPIO: su 55715 bambini nati in 3 anni a Birmingham (G.B.), 5 erano affetti da fenilchetonuria. Stimare la frequenza dei portatori nella popolazione totale e fra gli individui sani. ½ f(a) = q = (5/55715) = 0,0095 frequenza dei portatori sui bambini nati = 2q(1-q) = 0,019 x 0,9905 = 0,0188 frequenza dei portatori nella popolazione sana = 2q/(1+q) = 0,019/1,0095 = 0,0188 Poco meno del 2% della popolazione è costituita da portatori sani: a causa della bassa frequenza di soggetti affetti dalla malattia le due frequenze sono praticamente uguali. 61 GENOTIPI INUNLOCUS BIALLELICO 1,0 F r e q u e n z e ,8 ,6 ,4 ,2 0,0 0 0,25 0,5 0,75 1 Frequenza di a AA Aa aa ALLELE RECESSIVOLETALE a ,070000 P O R T A T O R I ,060000 ,050000 ,040000 ,030000 / S A N I ,020000 ,010000 0,000000 0,00001 0,0001 0,001 AFFETTI / NATI Se le frequenze geniche non variassero da una generazione alla successiva le popolazioni avrebbero scarsa possibilità di modificarsi; in realtà le popolazioni sono in un continuo divenire, e le nuove generazioni sono sempre diverse dalle precedenti. Occorre, come già ripetuto più volte, superare il concetto statico di razza; all'inizio vennero definiti degli standard, ed alcuni standard di razza sono rimasti invariati per almeno 150 anni; ancora oggi è difficile far capire agli stessi tecnici la necessità di aggiornare frequentemente gli standard di razza. Quali sono le forze che fanno variare le popolazioni? Sono quelle forze che fanno variare le frequenze geniche da una generazione all'altra, e che fanno in tal modo variare in misura maggiore o minore l'equilibrio genetico (lo possono far perdere e far attestare su equilibri diversi). La perdita dell'equilibrio genetico può essere molto pericolosa per una popolazione, soprattutto se riguarda più loci. Le forze in grado di far variare l'equilibrio genetico sono 4: - mutazione; - migrazione (o flusso genico); - selezione (riproduzione differenziale dei genotipi); - deriva genetica. Mutazione, migrazione e selezione provocano delle pressioni sistematiche: conoscendole, si può 62 prevedere quali saranno le frequenze geniche nelle generazioni successive; in altre parole, i cambiamenti prodotti da mutazioni, migrazioni e selezione sono prevedibili sia in intensità che in direzione. q (leggi "delta q") è la misura dello spostamento della frequenza genica q da una generazione a quella successiva all'azione della forza stessa. La deriva genetica agisce attraverso una pressione dispersiva: pur conoscendo le frequenze geniche, non si è in grado di prevedere le frequenze della generazione successiva; è una situazione che bisogna cercare di evitare. Nelle popolazioni che vanno scomparendo lo stato "preagonico" della popolazione stessa è rappresentato dalla deriva genetica. Si può solo ipotizzare il grado delle modificazioni dovute alla deriva genetica, ma non la direzione. Mutazioni, migrazioni e deriva genetica provocano delle variazioni fortuite, solo la selezione sembra avere un aspetto "finalistico" di adattamento del fenotipo degli animali; inoltre mutazioni, migrazioni e deriva genetica agiscono su tutti i loci, mentre la selezione interessa esclusivamente i loci non neutri; con la selezione i loci neutri possono variare per il cosiddetto "effetto autostop", cioè "trascinati" dai loci non neutri soggetti a selezione con i quali i loci neutri in oggetto sono associati. Le mutazioni, anche quelle ricorrenti, hanno praticamente nessuna forza nel far variare le frequenze geniche: richiederebbero un numero elevatissimo di generazioni. Ugualmente pochissima forza hanno le migrazioni, per le quali occorre però fare una distinzione fra popolazioni omogenee e popolazioni non omogenee (erosione genetica). Nel far variare le frequenze la forza più importante è la selezione. La deriva genetica esiste sempre, ma è importante solo se la popolazione è piccola. LA SELEZIONE. La selezione fu definita come termine da Charles Darwin (1809-1882); è il metodo con cui l'uomo "migliora" le popolazioni per i suoi fini. Bisogna distinguere una selezione gametica da una selezione zigotica; la selezione gametica è anche detta genica, quella zigotica è anche definita genotipica. La selezione gametica o genica è la riproduzione differenziale dei geni: dato un locus biallelico, un allele ha una capacità riproduttiva superiore all'altro allele perché il gamete con il primo allele si riproduce meglio del gamete con il secondo allele; è un modello teorico, difficile da comprendere (il gamete è espressione del genotipo dell'animale che si riproduce, non dei geni che il gamete stesso porta), ricavato da animali inferiori: non ha significato zootecnico, ed è stato ipotizzato ad esempio come una possibile ipotesi circa le frequenze geniche dei gatti senza coda dell'isola di Man. Nella selezione zigotica la selezione non si verifica sul gene ma sulla combinazione degli alleli di un locus polimorfo (è molto più semplice da capire, giacché il genotipo selezionato si è espresso nel fenotipo). La selezione naturale è in realtà una selezione del fenotipo. Nella selezione zigotica o genotipica la selezione agisce nella riproduzione differenziale dei genotipi all'interno di un locus polimorfo. Non esiste un solo tipo di selezione: tratteremo la selezione con coefficienti selettivi costanti, ma ne esistono altri tipi. TIPI DI SELEZIONE 1234567- selezione a coefficienti costanti selezione dipendente dalla frequenza selezione dipendente dalla densità valore selettivo ineguale nei due sessi selezione ciclica selezione disruptiva interazione fra tipi di selezione diversa Nella selezione a coefficienti costanti, i valori selettivi sono costanti e non variano al variare delle frequenze alleliche. Nella selezione dipendente dalla frequenza i valori selettivi variano al variare delle frequenze alleliche; la correlazione fra il valore selettivo di un genotipo e la sua frequenza è negativa: un genotipo sarà cioè avvantaggiato dal diminuire della sua frequenza. Nella selezione dipendente dalla densità c'è un variare della fitness dipendente dalla densità della popolazione in un habitat ben definito. Nella selezione con valore selettivo ineguale nei due sessi lo stesso allele è soggetto a 63 pressioni selettive differenti a seconda del sesso. Nella selezione ciclica la fitness cambia ciclicamente, con il variare ciclico dell'ambiente (ad esempio, con le stagioni). Nella selezione disruptiva, due sottopopolazioni separate da una diversa nicchia ecologica, possono riprodursi ed entrare in un nuovo equilibrio. I tipi di selezione citati possono inoltre avvenire anche contemporaneamente. La selezione può anche essere distinta in stabilizzatrice, direzionale, ciclica e diversificante. Nella selezione stabilizzatrice viene selezionato il fenotipo medio (se pensiamo ad una curva normale, si riproducono gli individui prossimi alla media); nella selezione direzionale viene selezionato uno dei due fenotipi estremi (cioè gli individui vicini ad una estremità della curva normale): è il caso tipico degli animali in produzione zootecnica, in cui l'uomo seleziona i migliori; nella selezione ciclica dei fattori ciclici, come ad esempio l'alternarsi delle stagioni, favoriscono in un certo periodo gli individui vicini ad un estremo della curva normale ed in un periodo successivo quelli prossimi all'altro estremo (ad esempio, un mantello bianco quando c'è la neve invernale ed un mantello selvaggio in estate); nella selezione diversificante i due estremi fenotipici vengono selezionati contemporaneamente (si riproducono cioè solo i fenotipi alle due estremità della curva normale, mentre gli intermedi vengono eliminati). Una distinzione molto semplice è quella fra selezione naturale e selezione artificiale: nella selezione naturale è l'ambiente che condiziona la riproduzione dei genotipi, nella selezione artificiale è l'uomo. La selezione artificiale è principalmente effettuata su popolazioni domestiche estremamente migliorate, sulle quali la selezione naturale non è praticamente più attiva; la selezione naturale è attiva soprattutto sulle razze primarie. Lo stesso Darwin ipotizzò la presenza di un altro tipo di selezione, la selezione sessuale, sulla cui esistenza ed eventualmente importanza si hanno ancora oggi pareri controversi; la selezione sessuale è basata sulla preferenza di un sesso ad accoppiarsi con particolari fenotipi dell'altro sesso: è probabilmente alla base dei dimorfismi sessuali più esasperati, che probabilmente non sopravviverebbero alla selezione naturale (ad esempio, la coda di alcuni uccelli maschi, come il pavone, è indispensabile per il corteggiamento ma è sicuramente svantaggiosa perché rende l'animale stesso più vulnerabile ai predatori). Studieremo la selezione a coefficienti selettivi costanti, con particolare riferimento a quella direzionale, cioè alle selezione dei genotipi "estremi". La selezione è la riproduzione differenziale dei genotipi polimorfi. Ogni genotipo ha una sua misura del valore riproduttivo, la fitness, termine già introdotto da Darwin; la definizione di fitness è molto complessa, e noi cercheremo di semplificarla utilizzandola in termini relativi, cioè di rapporti fra le efficienze riproduttive dei diversi genotipi. La fitness è dapprima un fenomeno relativo ad un locus, poi relativo all'insieme di loci di un individuo, infine della popolazione di individui con quei loci. La fitness è definibile solo per i loci non neutri, che complessivamente non sono molti. Per la fitness si valutano due elementi: la fertilità e la "viabilità" (un francesismo che potremmo tradurre in compatibilità con la vita). 1)- selezione dovuta ad una differente viabilità (=compatibilità con la vita) nelle varie fasi di sviluppo - selezione gametica - selezione zigotica (prenatale e postnatale) 2)- selezione dovuta ad una differente fertilità - alcuni genotipi sono meno fertili di altri - alcuni tipi di accoppiamento sono incompatibili e la fertilizzazione non avviene 3)- selezione familiare (Haldane, 1924) [di scarsa importanza in zootecnia]: i discendenti di un certo accoppiamento possono avere nel complesso una diversa viabilità in relazione al genotipo di ciascun componente della famiglia. Che cosa è la fitness? Abbiamo visto che si compone di fertilità e viabilità. Possiamo tentare di definirla in maniera assoluta o in maniera relativa. In termini assoluti, la fitness di un genotipo potrebbe essere definita come il numero medio di figli nati vivi e vitali nella carriera riproduttiva di un individuo caratterizzato da quel genotipo: ad esempio, se 64 in una popolazione da 100 omozigoti recessivi ad un locus biallelico nascono 200 individui, la fitness è 200/100=2. Esistono però alcuni problemi nel definire la fitness in questi termini: ad esempio, l'allele recessivo potrebbe essere "dannoso" rispetto al dominante, ma dall'esempio illustrato ciò non si capisce; inoltre se il carattere è raro è difficile avere un campione sufficientemente ampio; la fitness dipenderebbe non solo dal genotipo esaminato ma anche dai possibili accoppiamenti (ad esempio, per + il fattore Rh ed Rh nell'uomo): in tal caso la fitness varierebbe anche al variare delle frequenze geniche; alcuni caratteri potrebbero essere evidenti solo nella vita adulta. Una migliore definizione, sempre in termini assoluti, di fitness di un genotipo è dato dal numero medio di figli per gli individui con quel determinato genotipo, prendendo in considerazione la generazione parentale e quella filiale nella stessa fase di sviluppo. Con questa definizione si tiene conto sia della fertilità che della viabilità del genotipo. La fitness relativa di un genotipo in una popolazione è una grandezza proporzionale al numero medio di figli che tale genotipo produce e che contribuiscono alla generazione successiva: per rendere proporzionale la fitness si confrontano le differenti fitness dei genotipi presenti nella popolazione. Ad esempio: GENOTIPO AA Aa aa -----------------------------------------------------------fitness assoluta 5 3 2 fitness relativa 2,5 1,5 1 (dando valore unitario alla fitness più bassa) fitness relativa 0,5 0,3 0,2 (la somma totale delle fitness è 1) fitness relativa 1 0,6 0,4 (dando valore unitario alla fitness più elevata) Per esprimere la fitness relativa si utilizza in genere l'ultimo metodo, si dà cioè valore 1 alla fitness più elevata: ciò non deve però essere inteso come assenza di selezione per tale genotipo (nel nostro caso AA), ma indica solamente che quello è il genotipo con la massima capacità riproduttiva. I genotipi con fitness inferiore ad 1 hanno un coefficiente di selezione (anch'esso relativo), pari ad 1-fitness. La fitness viene generalmente indicata con w, il coefficiente di selezione con s. Nell'esempio, i coefficienti di selezione per l'eterozigote e l'omozigote recessivo sono: sAa = 1-0,6 = 0,4 saa = 1-0,4 = 0,6 E' ovvio che potremmo anche esprimere la fitness come 1-s, cioè nel nostro caso: wAA = 1-sAA = 1-0 = 1 wAa = 1-sAa = 1-0,4 = 0,6 waa = 1-saa = 1-0,6 = 0,4 Nel caso in cui l'eterozigote ha una fitness minore di entrambi gli omozigoti, la popolazione tende a diventare omozigote per il gene con la maggior frequenza iniziale: teoricamente, nel caso le frequenze di partenza siano uguali, la situazione è in equilibrio (con gli eterozigoti si elimina uno stesso numero di alleli A ed a, per cui se gli alleli hanno uguale frequenza si elimina anche un'identica frazione di geni A ed a, lasciando così invariate le frequenze), ma ovviamente anche un minimo effetto delle deriva genetica porta ad uno squilibrio che, per quanto piccolo, è l'inizio della tendenza alla fissazione del gene più frequente. Se un allele è incondizionatamente vantaggioso (cioè l'animale omozigote per questo gene ha una maggiore fitness dell'animale omozigote per l'altro allele, indipendentemente dal fatto che la fitness dell'eterozigote sia come quella dell'uno o dell'altro omozigote) tende a fissarsi nella popolazione; viceversa, se un allele è incondizionatamente svantaggioso (cioè l'animale omozigote per questo gene ha una minore fitness dell'animale omozigote per l'altro allele, indipendentemente dal fatto che la fitness dell'eterozigote sia come quella dell'uno o dell'altro omozigote) tende a scomparire dalla popolazione (ovvero è l'altro allele che tende a fissarsi). Un caso più complesso è il polimorfismo bilanciato o vantaggio dell'eterozigote; un famoso esempio è quello dell'anemia falciforme: un modello di equilibrio simile a questo è chiamato in causa anche in 65 numerose situazioni zootecniche (ad esempio, nascita di ovini a vello colorato). L'anemia falciforme è dovuta ad un gene mutato S, codominante con il gene non mutato A, il quale codifica per una particolare emoglobina in cui un aminoacido è sostituito da un altro: tale sostituzione provoca, a basse tensioni di ossigeno, una particolare disposizione spaziale delle molecole di emoglobina all'interno dell'eritrocita, il quale assume conseguentemente la caratteristica forma a falce che dà il nome alla malattia. L'omozigote SS è affetto da una gravissima forma di anemia; l'eterozigote AS (o SA) ha una forma subclinica di anemia, ed è riconoscibile per la presenza nello striscio di sangue di un certo numero di forme eritrocitarie a falce; l'omozigote AA è l'individuo normale. Date queste premesse, ci si dovrebbe aspettare che la selezione naturale abbia nel tempo abbassato la frequenza q dell'allele S: gli individui SS infatti di regola non si riproducono; in alcune popolazioni umane la frequenza dell'allele S risulta invece elevata. Una prima ipotesi potrebbe essere che la frequenza dell'allele S, nonostante la selezione naturale, non diminuisce perché c'è una mutazione ricorrente dell'allele A in S: tale ipotesi è però da scartare, sia perché la frequenza q è troppo elevata per essere mantenuta da una mutazione, sia perché la mutazione stessa non è stata mai riscontrata in analisi di gruppi familiari. L'osservazione che la frequenza dell'allele S nelle popolazioni umani è proporzionale all'incidenza della malaria, nonché la maggior resistenza degli eterozigoti alla malaria sia in infezioni sperimentali che naturali hanno portato all'ipotesi di una maggior fitness dell'eterozigote rispetto al normale genotipo AA negli habitat dove la malaria è endemica: a favore di tale ipotesi potrebbero esserci diverse basi fisiologiche, ad esempio l'eritrocita con emoglobina SA potrebbe non essere un ambiente di vita adatto per il parassita, oppure l'organismo potrebbe meglio individuare e neutralizzare il parassita con le proprie difese macrofagiche quando, alle basse tensioni di ossigeno (come nei capillari), il globulo rosso tende a modificare la propria forma. Nel modello esposto entrambi i genotipi omozigoti hanno una fitness inferiore a quella dell'eterozigote; indichiamo con s1 il coefficiente selettivo dell'omozigote AA e con s2 il coefficiente selettivo contro l'omozigote SS. Se q è la frequenza dell'allele S in una generazione, quale sarà la frequenza q1 dello stesso allele nella generazione successiva? GENOTIPO ¦ AA AS SS ---------------------------------------------------------------------fitness ¦ 1-s1 1 1-s2 q1= q²(1-s2)+pq --------------1-s1p²-s2q² e poiché p=1-q si ha q1= q²(1-s2)+q(1-q) ------------------1-s1p²-s2q² = q²-q²s2+q-q² ----------------1-s1p²-s2q² = q-q²s2 ------------1-s1p²-s2q² Avendo calcolato la frequenza dell'allele S nella nuova generazione, è anche possibile calcolare la differenza di frequenza dell'allele stesso fra le due generazioni: q = q1-q = q-s2q² -------------- - q 1-s1p²-s2q² = q-s2q²-q(1-s1p²-s2q²) -------------------------- = 1-s1p²-s2q² 66 3 = q-s2q²-q+s1p²q+s2q ------------------------ = 1-s1p²-s2q² q(-s2q+s1p²+s2q²) ----------------------1-s1p²-s2q² = q[s1p²+s2q(-1+q)] --------------------1-s1p²-s2q² poiché è q=1-p si ha q = q[s1p²+s2q(-1+1-p)] ------------------------1-s1p²-s2q² = q(s1p²-s2qp) -----------------1-s1p²-s2q² pq(s1p-s2q) = -------------1-s1p²-s2q² E' possibile anche calcolare delle frequenze di equilibrio, ovvero delle frequenze in cui q=0: pq(s1p-s2q) --------------- = 0 1-s1p²-s2q² Una prima soluzione si ha quando pq=0, il che è possibile, essendo p+q=1, solo quando p=1 e q=0 oppure p=0 e q=1: in altri termini, quando il locus è fisso. Una seconda soluzione si ha quando s1p-s2q=0, ovvero quando s1p=s2q, da cui si può ricavare s1p=s2(1-p) ¦ ¦ ¦ ¦ ¦ s1p+s2p=s2 p=s2/(s1+s2) s2q=s1(1-q) s2q+s1q=s1 q=s1/(s1+s2) Esistono dunque delle frequenze di equilibrio, ma vengono sempre raggiunte in un simile modello? Sì, perché se la frequenza q è minore di quella di equilibrio, e conseguentemente p è maggiore, s 1p-s2q è positivo, e quindi q è positivo, per cui la frequenza q aumenta e p diminuisce; se, al contrario, la frequenza q è superiore a quella teorica all'equilibrio, e di conseguenza p è inferiore, s 1p-s2q è negativo, e quindi q è negativo, per cui q diminuisce e p aumenta. ESEMPIO fitness AA = AS = SS = 1-1/9 = 1-0 = 1-1 = 8/9 1 0 frequenze all'equilibrio p = 1/(1+1/9) = q = (1/9)/(1+1/9) = 0,9 0,1 67 genotipi alla nascita con frequenze all'equilibrio (totale 100) AA = 100 p² = 100(0,9)² = 81 AS = 100 2pq = 200(0,9)(0,1) = 18 SS = 100 q² = 100(0,1)² = 1 genotipi dopo la selezione AA = 81(8/9) = 72 AS = 18(1) = 18 SS = 1(0) = 0 -------------------------------------------------totale 90 Si può controllare che le frequenze geniche dopo la selezione sono rimaste uguali: p = (72+18/2)/90 = 0,9 q = (18/2)/90 = 0,1 Invece, partendo da una frequenza dell'allele S inferiore a quella di equilibrio, la frequenza stessa aumenta: p q = = 0,99 0,01 genotipi alla nascita (totale 10000) AA = 10000 p² = 10000(0,99)² AS = 10000 2pq = 20000(0,99)(0,01) SS = 10000 q² = 10000(0,01)² = = = 9801 198 1 genotipi dopo la selezione AA = 9801(8/9) = 8712 AS = 198(1) = 198 SS = 1(0) = 0 ----------------------------------------------------totale 8910 frequenze geniche dopo la selezione p = (8712+198/2)/8910 = q = (198/2)/8910 = 0,989 0,011 Al contrario, partendo da una frequenza dell'allele S superiore a quella di equilibrio, la frequenza si riduce: p q = = 0,8 0,2 68 genotipi alla nascita (totale 100) AA = 100 p² = AS = 100 2pq = SS = 100 q² = 100(0,8)² 200(0,8)(0,2) 100(0,2)² = = = 64 32 4 genotipi dopo la selezione AA = 64(8/9) = 56,889 AS = 32(1) = 32 SS = 4(0) = 0 ------------------------------------------------------totale 88,889 frequenze geniche dopo la selezione p = (56,889+32/2)/88,889 = q = (32/2)/88,889 = 0,82 0,18 L'andamento delle frequenze geniche è dunque prevedibile; si può anche, al contrario, risalire al numero di generazioni trascorse dalla comparsa della mutazione. POLIMORFISMOBILANCIATO FREQUENZA DI EQUILIBRIODELL'ALLELEA 1,0 F R E Q U E N Z A ,8 ,6 ,4 ,2 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 FITNESSAA fitness BB=0,2 fitness BB=0,6 fitness BB=0,4 fitness BB=0,8 Supponiamo ora di avere un campione di individui adulti, ricavato da una popolazione che si presuppone aver ormai raggiunto l'equilibrio: come si calcolano i valori di fitness? Essendo la popolazione in equilibrio, le frequenze alla nascita dovrebbero essere come quelle negli adulti: possiamo allora calcolare le frequenze geniche e da queste le frequenze genotipiche attese secondo la legge di Hardy-Weinberg; la fitness relativa viene calcolata in base ai rapporti fra frequenze osservate ed attese, espressi in proporzione al valore più elevato. ESEMPIO Frequenze genotipiche negli adulti (totale 12387) AA = 9365 AS = 2993 SS = 29 Frequenze geniche di equilibrio p = (9365+2993/2)/12387 q = (29+2993/2)/12387 = = 0,877 0,123 69 Frequenze attese secondo Hardy-Weinberg AA = 12387 p² = 9527,2 AS = 12387 2pq = 2672,4 SS = 12387 q² = 187,4 Rapporti fra frequenze osservate ed attese AA = 9365/9527,2 = 0,983 AS = 2993/2672,4 = 1,12 SS = 29/187,4 = 0,155 Fitness AA = AS = SS = 0,983/1,12 1,12/1,12 0,155/1,12 = = = 0,878 1 0,138 Se le frequenze non sono in equilibrio per il calcolo della fitness occorrono due campioni, uno relativo alla popolazione prima della selezione ed uno relativo alla popolazione dopo l'azione della forza selettiva: la fitness relativa può essere espressa dal rapporto fra la frequenza genotipica nella popolazione dopo la selezione e la frequenza genotipica nella popolazione non ancora selezionata, sempre in proporzione al genotipo che ha la fitness più elevata. ESEMPIO Campione prima della selezione, ovvero nati (totale 287) AA = 189 AS = 89 SS = 9 Campione dopo la selezione, ovvero adulti (totale 654) AA = 400 AS = 249 SS = 5 Frequenze genotipiche dei neonati AA = 189/287 = AS = 89/287 = SS 0,6585 0,3101 = 9/287 = 0,0314 Frequenze genotipiche degli adulti AA = 400/654 = 0,6116 AS = 249/654 = 0,3807 SS = 5/654 = 0,0076 Rapporti fra le frequenze genotipiche AA = 0,6116/0,6585 = 0,9288 AS = 0,3807/0,3101 = 1,2277 SS = 0,0076/0,0314 = 0,2420 70 Fitness AA = AS = SS = 0,9288/1,2277 = 1,2277/1,2277 = 0,2420/1,2277 = 0,7565 1 0,1971 E' possibile notare che la frequenza dell'allele S nei due campioni è diversa, a conferma del probabile non equilibrio: q(neonati) q(adulti) = = (9+89/2)/287 = (5+249/2)/654 = 0,1864 0,1980 La frequenza di equilibrio è (1-0,7565)/[(1-0,7565)+(1-0,1971)]=0,2327 Più semplice nel calcolo è: Rapporti fra le osservazioni AA = 400/189 = AS = 249/89 = SS = 5/9 = 2,1164 2,7978 0,5556 Fitness AA = AS = SS = 0,7565 1 0,1986 2,1164/2,7978 = 2,7978/2,7978 = 0,5556/2,7978 = Le differenze rispetto ai valori calcolati in precedenza sono dovute agli arrotondamenti, in quanto i due metodi sono matematicamente equivalenti: Fitness AA = AS = SS = [(400/654)/(189/287)] / [(249/654)/(89/287)] = (400/189) / (249/89) [(249/654)/(89/287)] / [(249/654)/(89/287)] = 1 [(5/654)/(9/287)] / [(249/654)/(89/287)] = (5/9) / (249/89) Se non si fossero campionati i neonati e si fosse utilizzato il metodo precedentemente applicato per una popolazione in equilibrio si sarebbe giunti a conclusioni errate, come dimostrano i calcoli seguenti: Frequenze osservate negli adulti (totale 654) AA AS = 249 SS = 5 Frequenze attese AA = 654 p² AS = 654 2pq SS = 654 q² = = = = 400 654 (0,80199)² 1308 (0,80199)(0,19801) 654 (0,19801)² = = 420,64 207,71 = 25,64 71 Rapporto fra frequenze osservate ed attese AA = 400/420,64 = 0,95093 AS = 249/207,71 = 1,19879 SS = 5/25,64 = 0,19501 Fitness AA = AS = SS = 0,95093/1,19879 1,19879/1,19879 0,19501/1,19879 = = = 0,79324 1 0,16267 Il modello con vantaggio selettivo dell'eterozigote viene anche indicato come superdominanza: si intende in tal modo dire che l'eterozigote domina, relativamente alla fitness, su entrambi gli omozigoti; attenzione a non confondere fitness e carattere: è ovvio che, riguardando la fitness il fenotipo, essa è influenzata dal tipo di eredità, cioè da come il genotipo si esprime nel fenotipo (cioè dal fatto che i due alleli abbiano rapporti di dominanza e recessività completa, A>a, oppure di codominanza, A=B, e dalla penetranza nell'eterozigote). Non confondere, ad esempio, un eterozigote con superdominanza intesa in senso mendeliano, come una maggior quantità del carattere (che, se svantaggioso, potrebbe dare minor fitness), con la superdominanza intesa come maggior fitness dell'eterozigote: fare quindi attenzione, nelle successive figure, alla differente simbologia Aa e AB. Il vantaggio selettivo dell'eterozigote è un modello frequentemente utilizzato in zootecnia per spiegare alcune situazioni particolari (nascita di agnelli a vello colorato, insorgenza della resistenza a rodenticidi o insetticidi). Relativamente alla fitness dell'eterozigote possiamo ipotizzare, oltre alla superdominanza in cui l'eterozigote ha fitness relativa 1 ed i due omozigoti sono soggetti a due coefficienti selettivi s1 e s2, altre quattro possibilità: la dominanza completa, l'assenza di dominanza, la dominanza parziale e la sottodominanza. Nella dominanza completa l'eterozigote ha la stessa fitness di un omozigote: la selezione si ha solo contro un omozigote oppure nella stessa misura contro un omozigote e l'eterozigote; nell'assenza di dominanza la fitness dell'eterozigote è la media delle fitness dei due omozigoti (ovvero il coefficiente selettivo dell'eterozigote è la metà di quello dell'omozigote sfavorito); nella dominanza parziale la fitness dell'eterozigote è intermedia fra quella dei due omozigoti (ma non è la media delle due fitness): è in genere più vicina alla fitness dell'omozigote "dominante", ovvero di quello che ha fitness 1, (la cui fitness penetra appunto parzialmente nell'eterozigote); nella sottodominanza la fitness dell'eterozigote è inferiore alla fitness di entrambi gli omozigoti (che hanno in genere entrambi fitness 1). SUPERDOMINANZA 0 fitness 1 |-------------------------------------------------------------------------------------------------------| BB AA AB 0 fitness 1 |-------------------------------------------------------------------------------------------------------| AA AB BB 72 DOMINANZA COMPLETA 0 fitness 1 |-------------------------------------------------------------------------------------------------------| aa AA Aa 0 fitness 1 |-------------------------------------------------------------------------------------------------------| AA aa Aa ASSENZA DI DOMINANZA 0 fitness 1 |-------------------------------------------------------------------------------------------------------| BB AB AA AB ha carattere intermedio oppure A>B con penetranza 50% DOMINANZA PARZIALE 0 fitness 1 |-------------------------------------------------------------------------------------------------------| BB AB AA I caso: AB ha carattere più simile ad AA che a BB II caso: A>B ma con penetranza parziale Solo nel secondo caso è possibile avere: 0 fitness 1 |-------------------------------------------------------------------------------------------------------| BB AB AA SOTTODOMINANZA 0 fitness 1 |-------------------------------------------------------------------------------------------------------| AB BB AA 0 fitness 1 |-------------------------------------------------------------------------------------------------------| AB AA BB Come già illustrato per la superdominanza (vantaggio selettivo per l'eterozigote), anche per la dominanza completa, la assenza di dominanza, la dominanza parziale e la sottodominanza si potrebbero calcolare le frequenze geniche nelle successive generazioni: si tratta comunque di tutte situazioni che portano, a differenza del vantaggio selettivo per l'eterozigote, alla fissazione di un allele (l'allele favorito nei casi di dominanza completa, dominanza parziale ed assenza di dominanza, oppure l'allele più frequente nel caso di sottodominanza con omozigoti di fitness 1). 73 Poiché con la sola eccezione della superdominanza l'esito finale della selezione è la fissazione del locus, l'interesse non è tanto nel calcolo delle frequenze di equilibrio e del tempo necessario per raggiungere l'equilibrio, come appunto nel caso della superdominanza, bensì nel calcolo del tempo necessario per raggiungere la fissazione. Ad esempio, supponiamo di selezionare contro un omozigote recessivo: genotipo frequenza iniziale coefficiente selettivo fitness contributo gametico AA p² 0 1 p² Aa 2pq 0 1 2pq aa q² s 1-s q²(1-s) (totale = 1) (totale = 1-sq²) Le frequenze genica dell'allele recessivo nella successiva è pertanto: q1 = q²(1-s) + pq ---------------1-sq² da cui, poiché p=1-q, si ricava: q - q²s q1 = ----------1-sq² La differenza nelle frequenze geniche fra due generazioni successive è: q = q1 - q = -sq²(1-q)/(1-sq²) Supponiamo che degli omozigoti recessivi aa siano stati favoriti dalla selezione naturale perché meglio mimetizzati, e che l'allele a abbia raggiunto una frequenza di 0,8; con il cambio di stagione, le modifiche del paesaggio rendono però gli animali aa sfavoriti, perché più visibili ai predatori, e lo svantaggio è pari ad una fitness 0,5: come si modificheranno le frequenze nelle due generazioni successive? q1 = q - q²s 0,8 - 0,8² (0,5) 0,48 ------------ = ------------------------- = ------1-sq² 1 - 0,8² (0,5) 0,68 q2 = q1 - q1²s ------------1-sq1² = 0,70588 0,70588 - 0,70588² (0,5) = ------------------------------- = 0,60829 1 - 0,70588² (0,5) Infatti: AA Aa aa = p² = (1-0,8)² = 2pq = 2 (1-0,8) (0,8) = q² = 0,8² = 0,04 = 0,32 = 0,64 74 ¦ AA Aa aa ¦ 0,04 0,32 0,64 ------------------------------------------------------------------------AA 0,04 ¦ 0,0016 0,0128 0,0256 Aa 0,32 ¦ 0,0128 0,1024 0,2048 aa 0,64 ¦ 0,0256 0,2048 0,4096 AA Aa aa = 0,0016 + 0,0064 + 0,0064 + 0,0256 = 0,0064 + 0,0256 + 0,0064 + 0,0512 + 0,1024 + 0,0256 + 0,1024 = 0,0256 + 0,1024 + 0,1024 + 0,4096 = 0,04 = 0,32 = 0,64 Azione della selezione: AA = 0,04 Aa = 0,32 aa = 0,64 (0,5) = 0,32 --------------------------------TOTALE 0,68 f(A) = [0,04 + ½ (0,32)] / 0,68 = 0,29412 f(a) = [0,32 + ½ (0,32)] / 0,68 = 0,70588 Trasformiamo le frequenze e calcoliamo la generazione successiva: AA = 0,04 / 0,68 = 0,05882 Aa = 0,32 / 0,68 = 0,47059 aa = 0,32 / 0,68 = 0,47059 ¦ AA Aa aa ¦ 0,05882 0,47059 0,47059 -----------------------------------------------------------------------------------------------------AA 0,05882 ¦ 0,00346 0,02768 0,02768 Aa 0,47059 ¦ 0,02768 0,22145 0,22145 aa 0,47059 ¦ 0,02768 0,22145 0,22145 AA = 0,00346 + 0,01384 + 0,01384 + 0,05536 = 0,0865 Aa = 0,01384 + 0,02768 + 0,01384 + 0,11073 + 0,11073 + 0,02768 + 0,11073 = 0,41523 aa = 0,05536 + 0,11073 + 0,11073 + 0,22145 = 0,49827 Le frequenze sono ancora: f(A) = 0,0865 + ½ 0,41523 = 0,29412 f(a) = 0,49827 + ½ 0,41523 = 0,70589 Ma dopo l'azione della selezione: AA = 0,0865 Aa = 0,41523 aa = 0,49827 (0,5) = 0,24914 -------------------------------------TOTALE 0,75087 f(A) = [0,0865 + ½ (0,41523)] / 0,75087 = 0,39170 f(a) = [0,24914 + ½ (0,41523)] / 0,75087 = 0,60830 (le leggere differenze sono dovute agli arrotondamenti) 75 Controlliamo le differenze delle frequenze fra una generazione e la successiva: q = q1 - q = -sq²(1-q)/(1-sq²) = -0,8² (0,5) (1 - 0,8) / (1 - 0,8² x 0,5) = 0,09412 q = q2-q1 = -sq1²(1-q1)/(1-sq1²) = -0,70588²(0,5)(1-0,70588)/(1-0,70588² x 0,5) = 0,09759 ed infatti 0,70588-0,8 = -0,09412 ed ancora 0,60829-0,70588= -0,09759. Nel caso la selezione artificiale contro l'omozigote recessivo sia totale (o sia totale la selezione naturale contro questo genotipo, come nel caso di un gene recessivo letale), si ha s=1, per cui nella prima generazione: q1 = q - q² ---------- = 1-q² q ------1+q nella seconda generazione: q1 q2 = -----1+q1 e sostituendo nella formula di q2 il valore già trovato per q1 si ha: q q2 = -----1+2q La frequenza alla generazione t è analogamente: qt = q -----1+tq da cui si ricava: q-qt t = ------- = (1/qt) - (1/q) q qt Ad esempio, quante generazioni di selezione totale contro l'omozigote recessivo occorrono per dimezzare la frequenza 1/20000 di un genotipo omozigote recessivo? ½ ½ q = (1/20000) = (0,00005) = 0,00707 ½ ½ qt = (1/40000) = (0,000025) = 0,005 t = 1/0,005 - 1/0,00707 = 200 - 141 = 59 In generale, poiché i cambiamenti delle frequenze geniche dipendono non solo dall'intensità di selezione, ma anche dalle frequenze geniche iniziali, la selezione è efficace soprattutto quando q ha frequenze "medie", mentre frequenze di q molto elevate o molto basse riducono l'effetto della selezione. Nel caso della selezione contro un omozigote recessivo, quando questo è poco frequente la selezione è particolarmente inefficace, perché il gene è presente principalmente negli eterozigoti. 76 EFFETTODELLASELEZIONE SELEZIONECONTROL'OMOZIGOTERECESSIVO 1,0 F R E Q U E N Z A D I a ,9 ,8 ,7 ,6 ,5 ,4 ,3 ,2 ,1 0,0 100 GENERAZIONI DI SELEZIONE fitness aa=0 fitness aa=0,6 fitness aa=0,2 fitness aa=0,8 fitness aa=0,4 Come si può spiegare biologicamente il vantaggio selettivo dell'eterozigote? Potrebbe trattarsi di pleiotropia (cioè il gene influisce su due aspetti, come dimostrato nell'uomo per un allele S che in doppia dose causa l'anemia falciforme ma in eterozigosi conferisce resistenza alla malaria), oppure di una stretta associazione fra due geni (che noi confondiamo in uno solo), oppure avere una spiegazione molecolare, cioè da due codici genetici diversi derivano due proteine che, nel caso di isoenzimi, potrebbero avere complessivamente una adattabilità superiore. L'assenza di dominanza è una situazione rara. La dominanza completa è una situazione molto frequente, caratteristica ad esempio di molte malattie metaboliche: il problema è proprio nella difficoltà ad individuare gli eterozigoti (portatori di malattie neonatali monofattoriali); nella dominanza completa è difficile selezionare per il dominante se l'eterozigote ha la stessa fitness del dominante (ci si trascina dietro l'eterozigote, proprio perché non c'è selezione contro di esso), mentre selezionare per il dominante è facile se l'eterozigote ha la stessa fitness dell'omozigote recessivo (la selezione è infatti di pari intensità contro l'omozigote recessivo e l'eterozigote): nella selezione artificiale il problema si potrebbe risolvere se il gene fosse codominante (si potrebbero identificare gli eterozigoti e decidere se sottoporli o meno a selezione). Ad esempio, nei caprini l'assenza di corna è un carattere dominante, pleiotropico con aspetti dell'apparato genitale sia maschile che femminile in grado di causare ipofertilità o addirittura sterilità, dovuti ad alterazioni dell'epididimo nei maschi e pseudoermafroditismo nelle femmine. Il carico genetico è una misura che fa riferimento non al singolo genotipo ma a tutti i possibili genotipi ad un determinato locus e definisce il valore ottimale di riproduzione del locus stesso. Il carico genetico è la diminuzione relativa della fitness media di una popolazione rispetto alla fitness che si avrebbe qualora tutti gli individui della popolazione stessa avessero il genotipo con la massima fitness; per diminuzione relativa si intende che la diminuzione è rapportata alla fitness massima. wmassima - wmedia carico genetico = ------------------------wmassima Se per convenzione diamo valore 1 alla fitness massima, il carico genetico è pari a 1-wmedia: tale formula rappresenta chiaramente la misura in cui una popolazione si discosta da una costituzione genetica "perfetta". Il carico genetico misura quanti individui in una popolazione sono destinati ad una "morte genetica". Il carico genetico può essere, anche in una popolazione in equilibrio, mantenuto da diverse situazioni, fra 77 le quali le più semplici sono il carico genetico da mutazione ed il carico genetico da segregazione (o bilanciato). Nel carico genetico da mutazione l'equilibrio è mantenuto da una mutazione ricorrente sfavorevole, la quale comporta la "morte genetica" di un certo numero di individui; anche una mutazione favorevole è però in grado di generare una carico genetico "di transizione", perché la mutazione favorevole va a sostituire degli alleli, un tempo vantaggiosi, divenuti svantaggiosi proprio per la comparsa della mutazione più favorita (il carico è detto "di transizione" perché esiste solo fino a quando l'allele favorevole non si fissa). Il carico genetico da segregazione è anche detto carico bilanciato, e riguarda quei loci in cui l'equilibrio è mantenuto dal vantaggio selettivo dell'eterozigote; in questo caso è pari a (s1 s2)/(s1+s2), in quanto: frequenza iniziale fitness frequenza dopo la selezione AA p² 1-s1 p² (1-s1) Aa 2pq 1 2pq aa q² 1-s2 q² (1-s2) Il carico genetico è: p²s1 + q²s2 e sostituendo a p e q le rispettive frequenze all'equilibrio si ha: [s2/(s1+s2)]²s1 + [s1/(s1+s2)]² s2 = (s2²s1+s1²s2)/(s1+s2)² = = s2s1(s2+s1)/(s1+s2)² = s2s1/(s1+s2) Nella popolazione utilizzata come esempio per mostrare l'equilibrio genetico nel caso dell'anemia falciforme era: genotipo AA AS SS fitness 0,878 1 0,138 coefficiente selettivo 0,122 0 0,862 In base a questi dati è possibile calcolare il carico genetico: carico genetico = (0,122)(0,862)/(0,122+0,862) = 0,107 Se ne deduce che il 10,7% degli individui è destinato ad una "morte genetica"; infatti a partire dalle frequenze di equilibrio: p = 0,877 q = 0,123 frequenze genotipiche alla nascita (su 100 nati): AA = 100 p² = 76,9 AS = 200 pq = 21,6 SS = 100 q² = 1,5 78 frequenze genotipiche alla riproduzione (ovvero nati x fitness): AA = 76,9 (0,878) = 67,5 AS = 21,6 (1) = 21,6 SS = 1,5 (0,138) = 0,2 --------Totale 89,3 Carico genetico = 100-89,3 = 10,7% Le altre tre forze che, oltre alla selezione, concorrono a far variare le frequenze geniche, e cioè mutazioni, migrazioni e deriva genetica, non possiedono la stessa potenza della selezione. LE MUTAZIONI. Le mutazioni, pur essendo fortuite, possono sotto certi aspetti agire sistematicamente, e quindi essere prevedibili in forza e direzione. Tutti i loci possono teoricamente mutare: piccole variazioni delle frequenze geniche richiedono però moltissime generazioni. La mutazione è una variazione, spesso puntiforme, della sequenza del DNA: è una variazione strutturale a cui può, a volte, conseguire la variazione funzionale del gene. Le mutazioni possono essere distinte in ricorrenti e non ricorrenti. Le mutazioni ricorrenti (ad esempio l'albinismo) sono quelle che interessano un determinato locus ad ogni generazione e con un -5 tasso di mutazione fisso (in genere nell'ordine di 10 ). Le mutazioni non ricorrenti sono quelle che compaiono fortuitamente senza essere associate ad un tasso di mutazione determinato, per cui la possibilità di ritrovare l'allele mutato nella generazione successiva dipende praticamente solo dall'eventuale riproduzione di individui mutati (ad esempio, una razza statunitense di pecore senza coda, l'acondroplasia Ancon delle pecore, molte malattie monofattoriali); una mutazione non ricorrente ha elevatissima probabilità di essere persa nel corso delle generazioni, e quindi di non riuscire a modificare le frequenze geniche. Calcolare un tasso di mutazione, proprio a causa della bassa frequenza dell'evento, è molto difficile. Nell'uomo si stima che ad ogni generazione si verifichino circa 8 mutazioni. Le mutazioni ricorrenti possono essere ulteriormente distinte in mutazioni dirette e mutazioni inverse: u = tasso di mutazione diretto (A1 diventa A2) v = tasso di mutazione inverso (A2 diventa A1) In presenza della sola mutazione diretta, partendo da una frequenza p la frequenza nella generazione n successiva è p(1-u) e, dopo n generazioni, p(1-u) . Se esiste anche la mutazione inversa, partendo dalla frequenza p nella generazione successiva si avrà: p1 = p - up + vq da cui si ricava: p = p1 - p = p - up + vq -p = vq -up All'equilibrio non si ha variazione di frequenze geniche, per cui da vq - up = 0 si possono ricavare le frequenze all'equilibrio: p= v/(u+v) q= u/(u+v) Ad esempio, con i seguenti tassi di mutazione: -5 -6 u = 10 v = 10 le frequenze di equilibrio sono: -5 10 1 qe = ---------------------------- = ------------- = 10/11 = 0,9091 79 -5 -6 10 + 10 1 + 1/10 -6 10 1/10 pe = ---------------------------- = ------------- = 1/11 = 0,0909 -5 -6 10 + 10 1 + 1/10 Infatti: -5 -6 -5 -5 p0 = 1/11 p1 = 1/11 - 10 1/11 + 10 10/11 = 1/11 - 10 /11 + 10 /11 = 1/11 q0 = 10/11 q1 = 10/11 + 10 1/11 - 10 10/11 = 10/11 + 10 /11 - 10 /11 = 10/11 -5 -6 -5 -5 In maniera analoga a quanto fatto per l'equilibrio da vantaggio selettivo per l'eterozigote, anche nel caso di mutazione diretta ed inversa si può dimostrare che l'equilibrio non solo esiste, ma viene effettivamente raggiunto indipendentemente dalle frequenze iniziali: inoltre, a differenza di quanto accade per la superdominanza, se anche il locus fosse inizialmente monomorfo, la possibilità di mutazioni in entrambi i versi porterebbe comunque alla presenza di due alleli, che raggiungerebbero poi nel tempo l'equilibrio. Se q0 < qe, e quindi p0 > pe, allora: q1 = q0 + up0 - vq0 e p1 = p0 - up0 + vq0 e p1 < p0 da cui, poiché up0 > vq0, si ricava: q1 > q0 Utilizzando per un nuovo esempio gli stessi tassi di mutazione dell'esempio precedente e le frequenze iniziali: q0 = 0,8 p0 = 0,2 si ha: q1 = q0 + up0 - vq0 = 0,8 + 0,00001 x 0,2 - 0,000001 x 0,8 = 0,8000012 p1 = p0 - up0 + vq0 = 0,2 - 0,00001 x 0,2 + 0,000001 x 0,8 = 0,1999988 Invece, se q0 > qe, e quindi p0 < pe, si ha: q1 = q0 + up0 - vq0 e p1 = p0 - up0 + vq0 e p1 > p0 da cui, poiché up0 < vq0, si ricava: q1 < q0 Ad esempio, utilizzando ancora una volta i tassi di mutazione -5 u = 10 -6 v = 10 80 e le seguenti frequenze iniziali: q0 = 0,05 p0 = 0,95 si ha: q1 = q0 + up0 - vq0 = 0,05 + 0,00001 x 0,95 - 0,000001 x 0,05 = 0,05000945 p1 = p0 - up0 + vq0 = 0,95 - 0,00001 x 0,95 + 0,000001 x 0,05 = 0,94999055 Ricordiamo ancora che gli spostamenti nelle frequenze geniche dovuti alle mutazioni sono generalmente molto più lenti di quelli dovuti alla selezione. LE MIGRAZIONI. La migrazione è una forza sistematica; per migrazione si intende, in senso pratico, lo spostamento di riproduttori da una popolazione ad un'altra (dalla popolazione che immigra alla popolazione ricevente); in senso teorico per migrazione si intende un flusso genico da una popolazione ad un'altra: per avere il flusso genico occorre che gli individui si riproducano, e pertanto la definizione teorica e quella pratica vengono a coincidere. Le frequenze geniche che mutano sono essenzialmente quelle della popolazione ricevente. Per la migrazione bisogna considerare due aspetti: 1 - numerosità e struttura genetica della sottopopolazione immigrante; 2 - la differenza di frequenze geniche fra sottopopolazione immigrante e popolazione ricevente. Se non ci sono differenze nelle frequenze geniche fra la sottopopolazione che immigra e la popolazione ricevente le frequenze geniche non cambiano. Se in una popolazione non arrivano nuovi riproduttori per migrazione è più probabile che l'effetto della deriva genetica sia importante. Per spiegare la migrazione si farà uso del modello più semplice possibile, in cui: 1 - all'immigrazione consegue la possibilità riproduttiva fra immigrati e popolazione ricevente; 2 - emigrano in uguale misura maschi e femmine; 3 - emigra un campione casuale, rappresentativo della popolazione. E' comunque difficile che queste tre condizioni siano contemporaneamente rispettate: ad esempio, alle migrazioni umane seguono spesso barriere culturali che ostacolano la riproduzione fra immigrati e popolazione ricevente. POPOLAZIONE I f(A)=pI POPOLAZIONE R f(A)=p0 sia m il tasso di migrazione nei due sessi; nella popolazione R, dopo la migrazione, a determinare p1. cioè la frequenza dell'allele A saranno due componenti: la frazione m di animali immigrati e la frazione 1-m della popolazione ricevente, con le rispettive frequenze dell'allele, e cioè pI e p0. p1 = m pI + (1-m) p0 = p0 + m (pI-p0) La frequenza di A dopo la migrazione è dunque la media delle frequenze di A nella popolazione immigrata ed in quella ricevente, ponderate per la relativa numerosità [mp I+(1-m)p0]: dipende dalla frequenza della popolazione ricevente, dal tasso di migrazione e dalla differenza nelle frequenze geniche fra sottopopolazione immigrata e popolazione ricevente [p0 + m (pI-p0)]. 81 La differenza tra le frequenze geniche prima e dopo la migrazione dipende solo dal tasso di migrazione e dalla differenza di frequenze geniche fra sottopopolazione immigrata e popolazione ricevente (non dipende cioè dalla frequenza né della sottopopolazione immigrata né della popolazione ricevente); infatti: p = p1 - p0 = m (pI-p0) Perché ci sia una variazione delle frequenze geniche la sottopopolazione immigrata e la popolazione ricevente debbono avere frequenze diverse. Se la migrazione interessa solo animali di un sesso (ad esempio solo i maschi), il tasso di migrazione globale per i due sessi è m/2, per cui: p1 = p0 + m/2 (pI-p0) Invece che rispetto alla popolazione ricevente, la differenza di frequenze geniche può essere indicata rispetto alla popolazione immigrante: pi = p1 - pi = pr + m (pi - pr) - pi = pr(1-m) - pi(1-m) = (1-m)(pr-pi) Si può dimostrare che, dopo n generazioni, la differenza di frequenze geniche fra la popolazione immigrata e la popolazione immigrante è: n pi = pn - pi = (1-m) (pr-pi) da cui si ricava la frequenza genica della popolazione immigrata dopo n generazioni: n pn = (1-m) (pr-pi) + pi Ad esempio, in una popolazione la frequenza di un allele è 0,1: se, con un tasso di migrazione del 10%, immigra un'altra popolazione, nella quale lo stesso allele ha frequenza 1, quale sarà la frequenza della popolazione immigrata dopo 4 generazioni di immigrazione? m = 0,1 n=4 pr = 0,1 pi = 1 n pn = (1-m) (pr-pi) + pi 4 p4 = (1-0,1) (0,1-1) + 1 = 0,6561 (-0,9) + 1 = 0,40951 In genere, se il tasso di migrazione è basso, la migrazione non ha un evidente impatto genetico nella popolazione ricevente (a meno che non sia accompagnata da un'appropriata selezione): il ripetersi di successive migrazioni può comunque portare a cambiamenti rapidi, come dimostra la tabella seguente. 82 f(A) NELLA POPOLAZIONE R TASSO DI MIGRAZIONE (m) 0,5 0,1 0,01 frequenza iniziale gen. 1 gen. 2 gen. 3 ... gen. 5 ... gen. 10 gen. 20 gen. 50 gen. 100 0 0 0 0,50 0,75 0,87 ... 0,97 ... 1,00 1,00 1,00 1,00 0,10 0,19 0,27 ... 0,41 ... 0,65 0,88 1,00 1,00 0,01 0,02 0,03 ... 0,05 ... 0,10 0,18 0,40 0,63 La migrazione di animali di un solo sesso è molto frequente: quasi sempre si fanno immigrare dei maschi; è un modello di incrocio, in cui alla immigrazione dei nuovi maschi consegue però la mancata riproduzione di maschi della popolazione ricevente. Incrociando tori di razze da carne con bovine frisone si pratica una migrazione di soli maschi su sole femmine, senza un successivo atto riproduttivo della generazione dei prodotti. Il caso più semplice è quello dell'incrocio di sostituzione, come nel caso della sostituzione della razza bovina sarda con la bruna alpina: in 5-7 generazioni la sostituzione è da ritenersi completata. E' addirittura possibile che una specie migri su un'altra specie (ibridazione interspecifica): ad esempio, bovino con zebù, maiale con cinghiale; asino e cavalla producono il mulo, ma il prodotto non è fertile, per cui non si può considerare questo incrocio un modello migratorio. Nel modello migratorio la conoscenza delle frequenze di partenza è molto importante, ma in alcuni casi non è possibile: ad esempio, ci si può trovare di fronte ad una popolazione in cui il mescolamento è già avvenuto, senza che siano disponibili dati precedenti alla immigrazione; è possibile, conoscendo le caratteristiche della popolazione immigrata, ricostruire la struttura genetica della popolazione ricevente: si tratta di un modello zootecnico di erosione genetica; uno studio classico è quello delle frequenze geniche nelle razze caprine giapponesi, erose dalla Saanen. L'erosione genetica sta attualmente interessando le nostre popolazioni ovine (Gentile di Puglia e Sopravissana soprattutto). Ad esempio, si è interessati a conoscere le frequenze geniche originarie di una popolazione che ha subito un'immigrazione. Supponiamo che la popolazione immigrata presenti per un determinato allele frequenza 0,4 e che la popolazione immigrante presenti invece per lo stesso allele frequenza 1; le ricerche permettono di stimare il tasso di migrazione in 1% e, in base al rapporto fra il tempo trascorso da quando è incominciata l'introduzione di animali della razza immigrante e l'intervallo di generazione caratteristico della specie, in 20 il numero di generazioni per cui è avvenuta l'immigrazione. In base alla formula n pn = (1-m) (pr-pi) + pi ed essendo n = 20 m = 0,01 pn = 0,4 pi = 1 si ha: 20 0,4 = (1 - 0,01) (pr - 1) + 1 83 0,4 = 0,81791 (pr - 1) + 1 da cui si ricava pr = (0,4 - 1 +0,81791) / 0,81791 = 0,267 In altri casi è possibile stabilire le frequenze alleliche, oltre che della popolazione immigrante e della popolazione immigrata, anche della originaria popolazione ricevente (o perché tali frequenze sono state calcolate in precedenti studi o perché la popolazione si è conservata in purezza in alcune zone): si può in questi casi, stimando come nell'esempio precedente il numero di generazioni in base al rapporto fra tempo trascorso ed intervallo di generazione, calcolare il tasso di migrazione. Ad esempio: n = 10 pr = 0,65 pi = 1 pn = 0,88 Sostituendo i valori nella formula n pn - pi = (1-m) (pr-pi) si ricava: 10 0,88 - 1 = (1-m) (0,65-1) 10 (1-m) = (0,88-1)/(0,65-1) = 0,34286 1/10 1-m = (0,34286) 1/10 m = 1 - (0,34286) = 1 - 0,898 = 0,102 LA DERIVA GENETICA. La deriva genetica (o drift o effetto Sewall Wright, dal nome dello scienziato che ne delineò l'importanza) non è una forza sistematica, bensì è dispersiva; la deriva genetica casuale è un processo per cui le frequenze geniche sono soggette a fluttuazioni dovute al caso: è strettamente legata alla numerosità della popolazione. La deriva genetica si accompagna spesso ad altri tre processi dispersivi: la suddivisione delle popolazioni naturali in sottopopolazioni molto differenziate, la diminuzione della variabilità genetica delle piccole popolazioni, l'aumento della frequenza degli omozigoti a discapito degli eterozigoti (in maniera particolare quando si tratta di consanguineità). La conoscenza della deriva genetica è essenziale per lo studio delle piccole popolazioni, il cui comportamento è diverso da quello delle popolazioni mendeliane, che sono teoricamente infinite. L'evento più frequente alla nascita è che la generazione filiale abbia le stesse frequenze geniche dei genitori, ovvero la frequenza attesa della generazione filiale è la frequenza della generazione parentale: possono però verificarsi scostamenti dalle frequenze geniche attese, in entrambe le direzioni, con probabilità ben precise; tali scostamenti sono in genere maggiori nelle popolazioni di minori dimensioni; se infatti la popolazione è piccola, anche il numero dei gameti è piccolo e, ad ogni generazione, il campione casuale che passa alla generazione successiva è affetto da fluttuazioni aleatorie, il cui risultato è la impossibilità di prevedere la struttura genica della popolazione nel passaggio da una generazione alla successiva. La deriva genetica è un cambiamento di frequenze geniche casuale che tutte le popolazioni possono 84 seguire, indipendentemente dalla numerosità. Kidd e Cavalli Sforza studiarono i bovini norvegesi, rimasti totalmente isolati da altre razze, ed i bovini islandesi, portati sull'isola dai Vichinghi norvegesi, ed in seguito mai erosi da altre razze; utilizzando alcuni geni neutri (gruppi sanguigni ed altri polimorfismi ematici), per i quali le variazioni di frequenza non possono essere imputate a fenomeni selettivi, i due autori stabilirono la distanza genetica fra le due popolazioni, determinata dalla deriva genetica: riuscirono anche a dimostrare che l'effetto dei fondatori era limitato. E' però difficile distinguere con certezza, anche per geni neutri, che cosa è dovuto alla deriva genetica e che cosa è dovuto alla selezione: secondo una teoria, nessun gene è neutro; i geni potrebbero essere distinti in geni selettivamente attivi e geni selettivamente non attivi, i quali verrebbero selezionati passivamente per associazione (linkage) con geni attivi: il fenomeno è detto "effetto autostop". Nelle piccole popolazioni l'imparentamento fra gli animali porta alla consanguineità ed all'aumento dell'omozigosi: alla fissazione porta anche la deriva genetica. ESEMPIO DI EFFETTO DELLA DERIVA GENETICA 2 individui, un maschio ed una femmina, entrambi eterozigoti Aa n=2 p = 0,5 differenti gameti prodotti: 2n = 4 q = 0,5 2n promemoria: (p+q) differenti combinazioni possibili: 2n+1 = 5 possibili combinazioni di r alleli A: (2n)! / [r! (2n-r)!] r 2n-r probabilità di ogni combinazione con r alleli A: p q r 2n-r probabilità di una frequenza allelica: {(2n)! / [r! (2n-r)!]} p q (distribuzione binomiale) A 4 3 2 1 0 --- GENERAZIONE SUCCESSIVA --a probabilità 4 0 p = 0,0625 3 1 4p q = 0,25 2 2 2 6p q = 0,375 3 3 4pq = 0,25 4 4 q = 0,0625 p 1 0,75 0,5 0,25 0 q 0 0,25 0,5 0,75 1 In un questo esempio la probabilità che, in una sola generazione, uno o l'altro dei due alleli si fissi è complessivamente il 12,5%. L'ipotesi più probabile è il mantenimento delle stesse frequenze (37,5%). In due casi le frequenze geniche sono diventate 0,75 e 0,25 (oppure 0,25 e 0,75, cosa che non farà differenze ai fini dell'esempio). Che cosa succederà nella successiva generazione, ammettendo che la numerosità sia invariata e che sia ancora possibile accoppiare gli animali? Si tratterebbe di una popolazione composta sempre da un maschio ed una femmina, o identica a quella iniziale, o con il locus ormai fissato, o infine formata da un animale omozigote per uno qualsiasi dei due alleli e un altro animale eterozigote. In quest'ultimo caso: n=2 p = 0,75 differenti gameti prodotti: 2n = 4 q = 0,25 2n promemoria: (p+q) differenti combinazioni possibili: 2n+1 = 5 possibili combinazioni di r alleli A: (2n)! / [r! (2n-r)!] r 2n-r probabilità di ogni combinazione con r alleli A: p q r 2n-r probabilità di una frequenza allelica: {(2n)! / [r! (2n-r)!]} p q (distribuzione binomiale) 85 --- GENERAZIONE SUCCESSIVA --a probabilità 4 0 p = 0,31641 3 1 4p q = 0,42188 2 2 2 6p q = 0,21094 3 3 4pq = 0,04687 4 4 q = 0,00391 A 4 3 2 1 0 p 1 0,75 0,5 0,25 0 q 0 0,25 0,5 0,75 1 Anche in questo caso la probabilità maggiore è il mantenimento delle stesse frequenze geniche (42,188%), ma le probabilità di fissazione del locus sono complessivamente aumentate (32,032%), con aumento della probabilità di fissare l'allele più frequente. Si noti che la probabilità di un aumento della frequenza dell'allele più frequente è superiore alla probabilità di una diminuzione della frequenza dell'allele stesso. Con la probabilità composta si possono calcolare, a partire dalla generazione iniziale, la probabilità delle frequenze geniche dopo due generazioni: Generazione iniziale P totale p q 0,5 0,5 Prima generazione P1 0,0625 0,25 0,375 0,25 0,0625 p q 1 0 0,75 0,5 0,25 0 0,25 0,5 0,75 1 Seconda generazione P2 p q P1 x P2 1 0 0,0625 0,31641 1 0 0,07910 0,42188 0,75 0,25 0,10547 0,21094 0,5 0,5 0,05274 0,04687 0,25 0,75 0,01172 0,00391 0 1 0,00098 0,0625 1 0 0,02344 0,25 0,75 0,25 0,09375 0,375 0,5 0,5 0,14063 0,25 0,25 0,75 0,09375 0,0625 0 1 0,02344 0,00391 1 0 0,00098 0,04687 0,75 0,25 0,01172 0,21094 0,5 0,5 0,05274 0,42188 0,25 0,75 0,10547 0,31641 0 1 0,07910 1 1 0,0625 1 0 86 p q 1 0,75 0,5 0,25 0 0 0,25 0,5 0,75 1 --- probabilità totali dopo due generazioni --0,0625 + 0,07910 + 0,02344 + 0,00098 0,10547 + 0,09375 + 0,01172 0,05274 + 0,14063 + 0,05274 0,01172 + 0,09375 + 0,10547 0,00098 + 0,02344 + 0,07910 + 0,0625 = 0,16602 = 0,21094 = 0,24611 = 0,21094 = 0,16602 TOTALE 1,00003 Se la taglia della popolazione iniziale fosse stata più ampia, le probabilità di fissazione alla prima generazione sarebbero state inferiori: 4 individui, 2 maschi e 2 femmine, tutti eterozigoti Aa n=4 p = 0,5 differenti gameti prodotti: 2n = 8 q = 0,5 2n promemoria: (p+q) differenti combinazioni possibili: 2n+1 = 9 possibili combinazioni di r alleli A: (2n)! / [r! (2n-r)!] r 2n-r probabilità di ogni combinazione con r alleli A: p q r 2n-r probabilità di una frequenza allelica: {(2n)! / [r! (2n-r)!]} p q (distribuzione binomiale) A 8 7 6 5 4 3 2 1 0 a 0 1 2 3 4 5 6 7 8 GENERAZIONE SUCCESSIVA ----------- probabilità ----------8 p = 0,00391 7 8p q = 0,03125 6 2 28 p q = 0,10937 5 3 56 p q = 0,21875 4 4 70 p q = 0,27343 3 5 56 p q = 0,21875 2 6 28 p q = 0,10937 7 8 pq = 0,03125 8 q = 0,00391 p 1 0,875 0,75 0,625 0,5 0,375 0,25 0,125 0 q 0 0,125 0,25 0,375 0,5 0,635 0,75 0,875 1 Nella deriva genetica una generazione non ha "memoria storica" di cosa è successo nelle generazioni precedenti. Con il tempo, l'accumulo di eventi casuali porta sempre alla fissazione di un allele ed alla perdita (estinzione) di tutti gli altri; la probabilità che un allele si fissi dipende dalla sua frequenza iniziale; il tempo (misurabile come numero di generazioni) necessario per la fissazione di un allele varia da caso a caso, ma è in rapporto con la dimensione della popolazione: più la popolazione è estesa, maggiore è il numero di generazioni necessario per raggiungere la fissazione. 87 La variazione casuale delle frequenze geniche è dispersiva, comporta cioè l'impossibilità di prevedere il verso della variazione: l'intensità della variazione può invece essere predetta; la varianza della variazione di frequenza (²p) dipende dalle frequenze geniche iniziali e dalla numerosità della popolazione: ²p p0 q0 = -------2N dove: N = numero di individui che compongono la popolazione p0 e q0 = frequenze dei due alleli di un locus biallelico. La formula soprariportata è quella che, in una distribuzione binomiale, rappresenta la varianza di un campione di dimensione 2N ricavato da una popolazione con frequenze p0 e q0. Ad ogni generazione c'è un nuovo campionamento, che si effettua a partire dalle frequenze geniche realizzatesi nella generazione precedente: la dispersione delle frequenze geniche aumenta ad ogni generazione, e dopo t generazioni sarà: ²q t = p0 q0 [1-(1-1/2N) ] Si può facilmente controllare che, se t=1, la formula relativa a più generazioni si semplifica e diviene uguale alla precedente, valida per 1 generazione. Il valore calcolato in base alle due precedenti formule rappresenta sia il valore di ²p (che è per definizione uguale a quello di ²q) che il valore di ²p (uguale al valore di ²q): infatti il si riferisce ad uno scostamento dalla media. Utilizzando i dati degli esempi precedenti e ponderando le frequenze geniche alle varie generazioni per le relative probabilità, si può controllare l'esattezza delle formule riportate: Primo esempio: N=2 p0 = 0,5 q0 = 0,5 dopo una generazione si ha: ²p = ²q = ²p = ²q = 0,52x0,0625 + 0,252x0,25 + 0x0,375 + (-0,25)2x0,25 + (-0,5)2x0,0625 = 0,0625 ed infatti p0 q0 / 2N = 0,5 x 0,5 / 4 = 0,0625 dopo una seconda generazione si ha: ²p = ²q = ²p = ²q = = 2x0,16602 + 0,252x0,21094 + 0x0,24611 + (-0,25)2x0,21094 + (-0,5)2x0,16602 = 0,109375 ed infatti t 2 p0 q0 [1-(1-1/2N) ] = 0,5 x 0,5 [1-(1-0,25) ] = 0,109375 Secondo esempio: N=4 p0 = 0,5 q0 = 0,5 88 dopo una generazione si ha: ²p = ²q = ²p = ²q = = 0,52x0,00391 + 0,3752x0,03125 + 0,252x0,10937 + 0,1252x0,21875 + 0x0,27343 + (0,125)2x0,21875 + + (-0,25)2x0,10937 + (-0,375)2x0,03125 + (-0,5)2x0,00391 = 0,03125 ed infatti p0 q0 / 2N = 0,5 x 0,5 / 8 = 0,03125 Osservando la formula t ²p = p0 q0 [1-(1-1/2N) ] si può comprendere che la variabilità è massima quando i due alleli hanno uguale frequenza, diminuisce al crescere del numero di animali ed aumenta di generazione in generazione. Se l'azione della deriva genetica viene osservata sperimentalmente su più popolazioni che hanno le stesse frequenze geniche iniziali, ad esempio utilizzando delle linee di animali da esperimento, si possono schematicamente osservare tre fasi successive: inizialmente, a partire dai valori iniziali, le frequenze geniche delle varie linee si distribuiscono con diversa probabilità fra 0 ed 1; successivamente le frequenze tendono ad avere le stesse probabilità ma con il tempo, di generazione in generazione, le probabilità di fissarsi aumentano. La probabilità che un allele ha di fissarsi è pari alla sua frequenza iniziale; questa affermazione può essere facilmente compresa se si considerano contemporaneamente due affermazioni già fatte: primo, che l'evento più probabile è che una generazione abbia le frequenze geniche della generazione precedente e, secondo, che dopo un numero infinito di generazioni la deriva genetica provoca la fissazione di un allele; ad esempio, si considerino una serie di linee sperimentali di animali da laboratorio, aventi le stesse frequenze geniche iniziali, e si lasci agire la deriva genetica fino a quando in tutte le linee non si è verificata la fissazione di uno degli alleli considerati: a quel punto, considerando le linee nel loro insieme, l'evento più probabile è che la media delle frequenze sia la frequenza iniziale, il che è possibile (dato che le frequenze geniche dei vari alleli possono essere solo 0 oppure 1) solo se i diversi alleli si sono fissati nelle varie linee con probabilità pari alla frequenza genica iniziale. In una piccola popolazione non si è tanto interessati all'evoluzione delle frequenze geniche, ma alla distribuzione delle possibili frequenze geniche. In una popolazione di N individui, se il locus è polimorfo, le frequenze geniche variano fra 1/2N e (2N-1)/2N: sono quindi maggiori di 0 e minori di 1. La deriva genetica può essere causa di differenziazione geografica: i suoi effetti sono più rilevanti in aree a bassa densità di popolazione e con bassi tassi di immigrazione. Alla deriva genetica consegue un effetto "a collo di bottiglia" sulla taglia della popolazione: si verifica cioè una improvvisa, marcata e progressiva diminuzione del numero di individui (caratteristica anche della consanguineità), legata all'omozigosi. La deriva genetica è uno stato preagonico di una popolazione. 89 L'effetto dei fondatori è stato studiato addirittura come un meccanismo di speciazione. Lo si potrebbe definire come una brusca accelerazione dei processi dinamici di cambiamento delle frequenze geniche in popolazioni fondate da pochi individui (Mayr, 1954). Esistono quattro differenti teorie: 1- teoria di Mayr (1954); 2- teoria di Carson (1967): flush-crash theory (teoria dei cicli di espansione-catastrofe); 3- teoria di Carson e Templeton fondazione-espansione); 4- teoria di Templeton (1980): genetic transilience theory (teoria del "radicale cambiamento di stato" genetico). (1984) founder-flush theory (teoria dei cicli di Tutte le teorie comprendono tre momenti: 1- isolamento spaziale e/o temporale di alcuni individui; 2- rivoluzione genetica che rimette in causa l'insieme funzionale formato dai genotipi della popolazione fondatrice; 3- creazione di un isolamento riproduttivo fra la popolazione fondata e quella di partenza. A titolo di esempio si riassume la teoria di Mayr. Dalla popolazione parentale, la cui coesione è garantita dall'effetto stabilizzatore del flusso genico, si distacca, in seguito a rottura del flusso genico causata dall'isolamento geografico, la popolazione fondatrice: a seconda della numerosità, la popolazione fondatrice potrà o meno sopravvivere. Nel caso riesca a sopravvivere, le frequenze geniche della popolazione fondatrice si discostano da quelle della popolazione parentale: si ha infatti una perdita elevata della variabilità della popolazione parentale dovuta alla taglia ridotta, un aumento della consanguineità nelle prime generazioni, una "rivoluzione genetica" intesa come radicale cambiamento dei valori selettivi dovuto all'habitat differente ed al cambio delle frequenze geniche. Successivamente, rimanendo la nuova popolazione isolata, la variabilità riaumenta fino al livello della popolazione parentale, ma le frequenze geniche si attestano su valori differenti. 90