GENETIC LAB LABORATORIO DIDATTICO DI GENETICA MOLECOLARE TITOLO: La Lattasi e il carattere “Persistenza della Lattasi” in eta’ adulta associato al polimorfismo rs 4988235 QUADRO GENERALE DELL’ATTIVITA’ MODULO DI GENETICA MOLECOLARE: - Laboratorio di bioinformatica MATERIALE: Copie del testo - Laboratorio di Genetica molecolare - Testi TECNICHE UTILIZZATE IN LABORATORIO - Estrazione di DNA dalle cellule della mucosa boccale - PCR - Digestione enzimatica - Elettroforesi ADATTA PER : Triennio della scuola superiore TEMPO DI REALIZZAZIONE - 2 ore Biolab - 2 moduli di 4 ore hands-on Lab PREREQUISITI 1. CHE COS’E’ IL DNA 2. LA STRUTTURA DEL DNA 3. DAL DNA AL CROMOSOMA 4. APLOIDIA E DIPLOIDIA 5. GENE/LOCUS/ALLELE 6. GENOTIPO/FENOTIPO 7. DUPLICAZIONE DEL DNA 8. TRASCRIZIONE IN mRNA CONCETTI CHIAVE - STRUTTURA DEL DNA GENE/LOCUS/ALLELI ENZIMI DI RESTRIZIONE POLIMORFISMO ALLELICO APLOTIPO LINKAGE DISEQUILIBRIUM 9. SPLICING 10. SINTESI PROTEICA 11. REGOLAZIONE DELL’ESPRESSIONE GENICA 12. PROMOTORE 13. ENZIMI DI RESTRIZIONE 14. POLIMORFISMI 15. POLIMORFISMO ALLELICO 16. POLIMORFISMI DI SEQUENZA ATTIVITA’ WEBSITE http://learn.genetics.utah.edu/ Virtual lab INDICE GUIDA PER IL DOCENTE A. Obiettivi B. Background di conoscenze da fornire allo studente C. Argomenti correlati all’attività di Laboratorio: 1. Trascrizione e maturazione dell’RNA 2. Struttura ed espressione dei geni. Il promotore 3. Polimorfismi di sequenza del DNA 4. Enzimi di restrizione 5. SNPs 6. Aplotipi 7. Analisi di Linkage D. Strategia d’insegnamento: 1. Attività di Bioinformatica Abstract . Prerequisiti. Concetti chiave 2. Attività hands-on in laboratorio Abstract. Prerequisiti Tecniche utilizzate in laboratorio per l’ Analisi molecolare del DNA: PCR Termociclatori Taq polimerasi Scelta dei primer Digestione con gli enzimi di restrizione Elettroforesi su gel di agarosio Strumentazione e materiale a disposizione Principali prefissi e unità di misura usate in biologia molecolare e cellulare Pag. 3 Pag. 4 Pag.5 Pag. 8 Pag. 9 Pag. 10 Pag. 12 Pag. 14 Pag. 16 Testo: Bioinformatica Il Lattosio Che cos’è l’intolleranza al Lattosio Genetica Laboratorio Evoluzione Pag.19 Pag. 25 Pag. 26 Pag. 27 Pag. 28 Pag. 29 Letteratura scientifica sulla Lattasi Pag. 30 Glossario Pag. 31 Pagine per lo studente - Background di conoscenze Istruzioni per l’attività Questionario: PRE-Test POST-Test Pag.32 2 Guida per il docente A. Obiettivi: In questa attività si studia la condizione nota come “Intolleranza al Lattosio” correlata con l’assenza dell’enzima Lattasi. In alcune popolazioni (es. nord-europee) si osserva il carattere “Persistenza della Lattasi”, carattere mendeliano dominante che è stato correlato con uno polimorfismo a singolo nucleotide (SNP) nel gene che codifica per la Lattasi. B. Background di conoscenze da fornire allo studente 1.Leggi di Mendel e terminologia della Genetica mendeliana 2.Struttura chimica del DNA e livelli di organizzazione molecolare. 3.Duplicazione, trascrizione, traduzione 4.Meccanismi di regolazione C. Argomenti correlati all’attività di laboratorio 1.Meccanismi di regolazione 2.I polimorfismi di sequenza del DNA: Enzimi di restrizione I RFLP e gli SNP Frequenza degli SNP e individuazione degli SNP 3.Aplotipi 4.Sudi di Linkage D. Strategia d’insegnamento: 1. Attività di Bioinformatica: Abstract: Gli studenti navigano nel Modulo ”Percorso di Bioinformatica” per compiere una ricerca web e per: imparare l’approccio metodologico di un lavoro di ricerca Materiale: Computers con accesso a Internet Durata: Due ore Prerequisiti : Nessuno Concetti chiave: Geni, alleli, SNP, 2. Laboratorio di Genetica Molecolare Abstract: Il DNA genomico viene estratto dalle cellule della mucosa buccale. Il polimorfismo C/T-13910 è identificato mediante PCR. I prodotti della PCR vengono quindi digeriti con l’enzima di restrizione HinfI. La succesiva corsa elettroforetica evidenza il genotipo relativo al polimorfismo: CC, TT, o CT. Età: 16-18 anni Prerequisiti: DNA, cromosomi, proteine, ereditarietà mendeliana Concetti chiave: Il meccanismo e il significato evolutivo di questa variazione definita come “Persistenza della Lattasi” introduce alla comprensione delle interazioni geneambiente. 3 Argomenti correlati all’attività di laboratorio 1. I meccanismi di regolazione della trascrizione L’informazione genetica contenuta nelle sequenze del DNA viene trasferita all’RNA e dall’RNA al polipeptide corrispondente. Durante la trascrizione, un complesso proteico, comprendente l’enzima RNA polimerasi, sintetizza le molecole di RNA sullo stampo delle sequenze di DNA che costituiscono le unità di trascrizione. La RNA polimerasi si lega al sito d’inizio della trascrizione insieme ad altre proteine, dette fattori di trascrizione. Questi fattori, mediante l’interazione con brevi sequenze di DNA presenti nella regione a monte dell’inizio della trascrizione (promotore), servono a posizionare la RNA polimerasi nel sito giusto e a separare i due filamenti di DNA per formare la bolla di trascrizione. L’enzima usa come stampo uno dei due filamenti di DNA in direzione 5’->3’, catalizzando il legame fosfodiestere tra il gruppo ossidrilico legato al C3’ del ribonucleotide precedente e il fosfato del nuovo ribonucleotide. Il processo continua fino a che la polimerasi incontra una sequenza di arresto. A questo punto si stacca e libera la catena di RNA, mentre la bolla di trascrizione si richiude e il DNA riassume la conformazione a doppia elica. L’RNA neosintetizzato ha la sequenza di basi identica a quella di uno dei due filamenti di DNA (il filamento senso), anche se la Timina è sostituita dall’Uracile. Da uno stesso gene possono essere trascritte consecutivamente numerose copie di RNA e il livello di trascrizione dipende da complessi meccanismi (vedi la regolazione della trascrizione). E’ importante ricordare che le cellule eucariotiche possiedono tre tipi di RNA polimerasi: - RNA polimerasi I trascrive i geni degli RNA ribosomiali - RNA polimerasi II trascrive i geni che codificano proteine sintetizzando i precursori degli RNA messaggeri e anche alcuni piccoli RNA - RNA polimerasi III trascrive i geni di tutti gli RNA transfer, un RNA ribosomiale e altri piccoli RNA. I precursori degli mRNA neosintetizzati (trascritti primari) devono subire una serie di modificazioni prima di essere trasferiti nel citoplasma per venire tradotti sui ribosomi. Questo processo di maturazione degli mRNA include le seguenti modificazioni. • Aggiunta all’estremità 5’ di un cappuccio (cap). Al primo nucleotide all’estremità 5’ della molecola di RNA nascente viene rimosso il fosfato terminale e viene aggiunta una molecola di Guanosina monofosfato (GMP) metilata in posizione 7’. Il capping serve per proteggere il trascritto dall’attacco delle esonucleasi che lo degraderebbero, e per facilitare il trasporto dal nucleo al citoplasma. • Rimozione di alcune sequenze che non vengono tradotte (processo di splicing). Quasi tutti i geni eucariotici sono divisi in sequenze codificanti, chiamate esoni, e sequenze non tradotte, dette introni. Questi ultimi vengono rimossi dai trascritti primari mediante il processo di splicing. Gli introni sono quindi sequenze di DNA, situate tra due esoni, le quali sono trascritte ma non tradotte. Salvo rare eccezioni, gli introni iniziano sempre con i nucleotidi GT e terminano con i nucleotidi AG (regola GT-AG). Nel processo di splicing si verifica prima la scissione all’inizio dell’introne (5’), poi l’estremità libera dell’introne si ripiega su se stessa formando una struttura simile ad un laccio e infine avviene il taglio a livello della giunzione 3’ dell’introne. Quindi i due esoni si uniscono mentre l’introne va perso. Una struttura macromolecolare (costituita da varie subunità di molecole di piccoli RNA nucleari, gli snRNP, e da una serie di proteine specifiche) promuove e controlla le reazioni dello splicing. • Aggiunta all’estremità 3’ di una coda poli-A. La maggior parte delle unità di trascrizione hanno una breve sequenza (AATAAA) che specifica il sito di termine della trascrizione. Circa 15-30 nucleotidi a valle di questo sito, l’RNA neosintetizzato viene scisso da un enzima, una endonucleasi, e alla molecola di RNA vengono aggiunti circa 200 residui di Adenosina monofosfato (AMP). Questa coda di poli-A ha lo scopo di stabilizzare le molecole degli mRNA maturi e di facilitare il loro trasporto dal nucleo al citoplasma. 4 2. STRUTTURA ED ESPRESSIONE DEI GENI Dal punto di vista della genetica molecolare per gene s’intende una sequenza di DNA potenzialmente trascrivibile in RNA funzionalmente attivo. Tale RNA può svolgere direttamente una funzione strutturale e/o catalitica (rRNA, tRNA) oppure trasportare l’informazione per la sintesi di una proteina (mRNA). Nel genoma umano si stima che siano presenti circa 23.000 geni codificanti proteine e 1000-2000 geni codificanti RNA strutturali. Da recenti studi emergerebbe però l’esistenza di diverse migliaia (o decine di migliaia) di trascritti non codificanti che potrebbero non avere alcuna funzione o, viceversa, svolgere un ruolo fondamentale nella regolazione della conformazione della cromatina e della trascrizione di geni codificanti proteine. IL PROMOTORE La regione a monte del sito d’inizio della trascrizione è detta promotore. La numerazione dei nucleotidi inizia da -1, che corrisponde al nucleotide che precede il sito d’inizio della trascrizione (indicato con +1). In questa regione, di lunghezza variabile, si trova una serie di brevi sequenze che vengono riconosciute e legate da fattori di trascrizione. I fattori di trascrizione favoriscono il legame dell’RNA polimerasi al sito giusto per iniziare la sintesi di RNA. I geni che presentano elevati livelli di trascrizione, presentano nel promotore delle sequenze specifiche ( i TATA box a circa -25 bp dal sito d’inizio della trascrizione; il CAAT box, a -80 bp dal sito d’inizio della trascrizione, i GC box). Accanto a sequenze comuni a molti promotori vi sono elementi che sono riconosciuti da fattori di trascrizione tessuto-specifici. Anche i geni che mostrano un’espressione tessuto-specifica vengono spesso trascritti a livelli molto bassi in tutte le cellule. Vi sono altre sequenze che vengono riconosciute da fattori di trascrizione quali gli elementi di risposta, localizzati nel promotore o nella regione 5’ del gene, e gli elementi indicati come enhancer (intensificatori), che servono per aumentare i livelli basali della trascrizione e sono localizzati a distanza variabile dal gene, talvolta anche a valle del sito d’inizio della trascrizione, vale a dire all’interno della regione trascritta. Sito d’inizio della trascrizione +1 segnale di poliA promotore CG box CG Box CAAT box ATG sito poliA codone di stop TATA box GT esone 1 AG introne 1 GT esone 2 AG introne 2 esone 3 5’UTR 3’UTR >>>>>>>>>>>>> direzione di lettura del gene TRASCRIZIONE precursore dell’mRNA GT CAP AG GT AG AAA SPLICING mRNA MATURO CAP AAAAA 5 3. REGOLAZIONE DELLA TRASCRIZIONE Due sono le condizioni perché si abbia una efficace trascrizione: 1. La presenza nella cellula di specifici fattori di trascrizione che interagiscono con brevi sequenze nel promotore del gene e con sequenze enhancer e consentono l’assemblaggio del complesso di trascrizione 2. Una conformazione della cromatina del gene “aperta”,ovvero i nucleosomi non compattati e, possibilmente, il DNA non associato agli istoni nel promotore. Il controllo dell’espressione genica mediante il legame di fattori proteici con le sequenze di regolazione è estremamente complesso e coinvolge numerosi fattori che possono essere grossolanamente distinti in fattori ubiquitari e tessuto-specifici. L’interazione di fattori specifici con gli elementi enhancer è importante per l’espressione genica tessuto-specifica. Elementi regolatori della trascrizione 1.fattori di trascrizione 2.elementi cis-acting 3.elementi di regolazione distanti anche 1 Mb 4.Promotori alternativi/multipli 5.Modificazioni in DNA e istoni(acetilazioni o mutilazione)/accessibilità alla cromatina 6.piccoli RNAs di tanti tipi. Enhancers Gli enhancers sono sequenze nucleotidiche cis-agenti che esplicano la loro funzione aumentando notevolmente (fino a 200 volte) la frequenza di trascrizione del gene che controllano. Dal punto di vista strutturale, un enhancer non differisce molto da un promotore.Gli enhancers non devono necessariamente essere vicini ai promotori: è possibile infatti trovare degli enhancer a parecchie centinaia di migliaia di paia di basi di distanza a valle o a monte del sito d'inizio della trascrizione. Elementi cis-acting “Cis-acting” generalmente significa “che agisce sulla stessa molecola”. Nel contesto della regolazione della trascrizione, sono generalmente considerati “elementi cisacting” delle sequenze di DNA, che attraverso i fattori di trascrizione,regolano l’espressione dei geni sullo stesso cromosoma. Un esempio di sequenza regolatoria cis-acting è l’”operatore” dell’operone lac. 6 Questa sequenza di DNA è legata dal repressore lac che impedisce la trascrizione dei geni adiacenti sulla stessa molecola di DNA. Possiamo dire quindi che l’operatore lac “agisce in cis” nella regolazione dei geni vicini. L’operatore non codifica per alcuna proteina o RNA. Vi sono inoltre numerosi altri meccanismi da cui dipende il meccanismo dell’espressione genica, come l’attivazione dei fattori di trascrizione in seguito al legame di un ligando, per esempio un ormone, ad uno specifico recettore sulla superficie cellulare. Infatti l’espressione di molti geni è controllata da un ormone, da un fattore di crescita o da una molecola di segnale intracellulare (es. cAMP) i quali legandosi a recettori specifici determinano l’attivazione o inattivazione di determinati fattori di trascrizione (es. mediante la loro fosforilazione o defosforilazione). I fattori attivati interagiscono quindi con gli elementi di risposta presenti nel promotore e inducono l’espressione del gene corrispondente. Notevoli progressi sono stati fatti recentemente nell’identificazione di modificazioni della cromatina associate a una conformazione aperta (attiva) o compatta (inattiva). Tali modificazioni sono dette epigenetiche, perché non modificano la sequenza primaria del DNA. Generalmente la cromatina attiva è caratterizzata da un alto livello di acetilazione degli istoni H3 e H4. Al contrario, gli istoni associati alla cromatina inattiva, non trascritta, sono tutti deacetilati. Un’altra modifica degli istoni è la metilazione. La metilazione epigenetica più studiata riguarda però lo stesso DNA e consiste nella metilazione delle citosine, tipica delle regioni non trascritte e dei promotori di geni trascrizionalmente inattivi. Le citosine metilate vengono riconosciute da proteine determinando il reclutamento di altre proteine che modificano la cromatina e la compattano, facilitando l’inattivazione trascrizionale del gene stesso. STRUTTURA ESONI-INTRONI Il primo esone comincia al sito d’inizio della trascrizione, ma il primo tratto (fatto di 200-300 bp) non è codificante; questo segmento pertanto è trascritto, ma non tradotto e viene indicato come regione 5’UTR ( UnTraslated Region). La regione 5’UTR è importante per l’efficienza della traduzione in quanto facilita il legame dell’mRNA ai ribosomi. La regione tradotta inizia generalmente con ATG, nel 1° esone. Il numero degli esoni presenti nei geni umani è altamente variabile. Vi sono geni piccoli costituiti da un singolo esone e altri che possiedono più di 100 esoni. Il numero medio è di 9-10 esoni per gene. I singoli esoni sono generalmente piuttosto piccoli con dimensioni medie di circa 200bp, ma esistono alcuni esoni eccezionalmente lunghi che possono superare anche le 5 kb. Al contrario degli esoni, la dimensione degli introni è molto variabile. Generalmente i geni piccoli hanno introni piccoli, mentre in quelli più grandi gli introni possono avere anche una lunghezza di 10-20 kb. Quasi tutti gli introni cominciano con GT (sito donatore di splicing) e terminano con AG (sito accettore di splicing). Questi dinucleotidi sono circondati da sequenze consenso, altamente conservate nel corso dell’evoluzione e molto simili tra loro. Il processo di splicing deve essere molto preciso dato che lo spostamento anche di un singolo nucleotide determinerebbe lo slittamento del modulo di lettura e quindi la sintesi di una proteina alterata. L’ultimo esone, così come il primo, contiene una sequenza trascritta, ma non tradotta, detta regione 3’UTR. TRASCRITTI ALTERNATIVI E ISOFORME PROTEICHE Un tempo si riteneva che ogni gene codificasse per un unico prodotto polipeptidico o molecola di RNA, mentre oggi si sa che la maggioranza di geni umani specifica due o più forme alternative di proteine (isoforme). I meccanismi con i quali vengono generate queste diverse isoforme sono: - l’uso di promotori alternativi 7 - lo splicing alternativo la poliadenilazione alternativa Si conoscono diversi geni umani che hanno due o più promotori che sono attivi specificamente in determinati tessuti e dirigono la sintesi di isoforme tessutospecifiche oppure vengono attivati durante un particolare stadio dello sviluppo. Il meccanismo più frequente con il quale si generano delle isoforme diverse è lo splicing alternativo, che consiste nell’assemblaggio diffrenziale di esoni durante la maturazione dell’RNA. Si stima che oltre il 60% dei geni umani produca due o più proteine mediante questo meccanismo. Molti esoni specificano domini proteici strutturali distinti che possono essere combinati in modo diverso nelle cellule dei diversi tessuti nei quali il gene è espresso. Pertanto a partire da un singolo gene possono venire generate proteine simili, ma non identiche che possono avere funzioni diverse nei vari tessuti. 4. POLIMORFISMI DI SEQUENZA DEL DNA Il termine polimorfismo significa “esistenza di forme diverse”. In genetica, il polimorfismo può essere analizzato sia a livello proteico che di materiale genetico. In questo secondo caso, le forme diverse, ossia le varianti genetiche possono riguardare un gene, vale a dire un tratto di DNA codificante una proteina (polimorfismo allelico), oppure un tratto di DNA non codificante (polimorfismo di sequenza). Queste diversità di sequenza si definiscono polimorfismi e dato che più del 98% del DNA umano è DNA non codificante, e che quindi la maggior parte di queste differenze è localizzata in sequenze non codificanti, il fenotipo di un polimorfismo di sequenza del DNA non è riconoscibile dall’esterno (ex. nei gruppi sanguigni). Dato l’elevato numero di loci polimorfici, i polimorfismi di sequenza sono molto più frequenti dei polimorfismi allelici tradizionali (gruppi sanguigni, albinismo, colore degli occhi, ecc..) e conseguentemente più utili nella ricerca biologica e medica. E’ stato osservato che il DNA di due individui differisce per circa un nucleotide ogni 500/1000. Quando un polimorfismo interessa una sequenza riconosciuta da un Enzima di Restrizione, la variazione, creando o distruggendo il sito di restrizione, darà luogo a differenze nei siti di taglio di quel dato enzima all’interno della popolazione. Digerendo con quell’enzima il DNA di individui diversi, si osserva quindi un polimorfismo di lunghezza dei frammenti di restrizione – RFLP - e cioè dal DNA di individui diversi si generano frammenti di restrizione diversi. Come tutti i polimorfismi, i RFLP possono essere equiparati ad alleli codominanti di un locus mendeliano: la presenza o assenza di uno o dell’altro allele può essere riconosciuta in ogni individuo, consentendo la distinzione in omozigoti ed eterozigoti. Il fenotipo di un RFLP è evidenziabile in termini di differenze di numero e/o dimensione dei frammenti di DNA ottenuti con la digestione con un certo enzima di restrizione. I frammenti sono visibili dopo migrazione elettroforetica su un gel. L’avvento della genetica molecolare ha permesso di identificare i polimorfismi del DNA, che sono diventati i marcatori genetici più comunemente usati. Attualmente si utilizzano tre tipi di polimorfismi del DNA: i Polimorfismi di Lunghezza dei Frammenti di Restrizione, o RFLP i Polimorfismi del Singolo Nucleotide, o SNP i Polimorfismi di Lunghezza di Sequenze Semplici, o SSLP che vengono poi distinti in VNTR (Variable Number of Tandem Repeats) o minisatelliti, e i STR (Simple Tandem Repeats ) o microsatelliti. 8 5. GLI ENZIMI DI RESTRIZIONE Un sito di restrizione o sequenza consenso viene definito come una particolare sequenza di DNA riconosciuta da un enzima di restrizione o endonucleasi come il punto in cui tagliare la molecola di DNA. Questi siti sono generalmente palindromici (cioè possono essere letti in entrambe le direzioni) la cui successione di basi è identica su entrambi i filamenti quando ciascuno di essi venga letto in direzione 5’ -> 3’. La sequenza riconosciuta non è unica e varia da enzima ad enzima, anche se con la stessa specificità di sequenza. Infatti, sebbene gli enzimi di restrizione isolati siano oltre 3500, le sequenze bersaglio che possono essere tagliate sono molto meno numerose (poco più di 200 ). I siti di restrizione sono delle normali sequenze di basi, lunghi dai 4 fino a diverse decine di paia di basi, per cui si possono trovare più o meno facilmente nel genoma. Un enzima di restrizione può tagliare all’interno di una sequenza o nelle sue vicinanze, oppure la sequenza consenso può anche essere distante diverse centinaia di basi. Il taglio prodotto dagli enzimi può generare frammenti di DNA con estremità piatte (blunt), o sporgenti ( 5’-protruding e 3’-protruding). Le estremità prodotte sono “appiccicose”, cioè possono formare ponti Idrogeno tra le due code a filamento singolo complementari. Le estremità coesive facilitano inoltre la reazione della DNA ligasi. L’enzima EcoRI produce un taglio sfalsato creando due estremità coesive a singolo filamento al 5’ (5’-protruding): 5’...G/ AATTC.. 3’ 3’...CTTAA /G...5’ L’enzima HhaI opera un taglio sfalsato creando due estremità coesive a singolo filamento al 3’ (3’-protruding ) : 5’… G C G /C… 3’ 3’… C/G C G… 5’ Nome enzima Organismo di provenienza Sequenza d riconoscimento e posizione di taglio Pronuncia EcoRI E.Coli RY13 G/A A T T C C T T A A/G Eco-ri-uno HindIII Haemophilus influenzae Rd A/A G C T T T T C G A /A Acca-ind-tre BamHI Bacillus amyloliquefaciens G/G A T C C C C T A G/G Bam-acca-uno ENZIMI DI RESTRIZIONE. Sono prodotti dai batteri che li utilizzano per difendersi da un DNA estraneo, esempio un virus Altri enzimi (le metilasi ) proteggono il DNA batterico grazie all’azione delle proprie endonucleasi di restrizione. Gli ER si indicano con un sistema di lettere e numeri che si riferisce al ceppo batterico da cui sono stati isolati. 9 6. Polimorfismo a singolo nucleotide o SNPs (Single nucleotide polymorphism / Polimorfismo di sequenza di un singolo nucleotide) Un polimorfismo a singolo nucleotide (in inglese Single Nucleotide Polymorphism o SNP, pronunciato snip) è un polimorfismo (cioè una variazione a livello di una sequenza di acidi nucleici) che si presenta tra individui della stessa specie, caratterizzata da una differenza a carico di un unico nucleotide C T A A/G G T A SNP Gli SNPs sono sostituzioni di un singolo nucleotide di una base con un’altra. Naturalmente, possiamo avere 4 versioni per ogni SNP, una per ogni nucleotide,A,C,G e T e la distribuzione nella popolazione potrebbe risultare in una delle seguenti combinazioni. Gli SNP si verificano nella popolazione con una frequenza maggiore all’1%. Sono stati individuati molti SNPs nella sequenza del DNA e la sfida per la ricerca è identificare gli SNPs correlati con un particolare effetto nel fenotipo. Nel genoma umano si verificano SNPs all’incirca uno ogni 300 paia di basi. Questo significa che – su 3 miliardi di nucleotidi presenti nel genoma umano - avremo circa 10 milioni di SNPs. Gli SNPs costituiscono il 90% di tutte le variazioni genetiche umane. Un polimorfismo noto è quello dei gruppi sanguigni, ~20 loci Non bisogna confondere una mutazione puntiforme con uno SNP! Anche se si assomigliano, non sono la stessa cosa. - sono entrambe differenze di singoli nucleotidi, ma per parlare di SNP bisogna che questo sia presente in almeno l’1% della popolazione. - molte mutazioni correlate a malattie si trovano all’interno delle regioni codificanti del gene o in quelle regolatorie e interessano la proteina corrispondente a quel gene. Viceversa, gli SNPs non sono necessariamente localizzati nei geni, e non sempre alterano la funzione di una proteina. Gli SNPs sono divisi in due principali categorie: Linked SNPs (detti anche indicative SNPs) non si trovano all’interno dei geni e non alterano la funzione della proteina. Tuttavia sono correlati con una particolare risposta ai farmaci o al rischio di ammalarsi di una certa malattia prodotta. Causative SNPs alterano il funzionamento di una proteina, correlando con una malattia o influenzando la risposta individuale ad una terapia (farmaco).Si distinguono 2 tipi di Causative SNPs: - Coding SNPs,localizzati nella regione codificante del gene, cambiano la sequenza di aminoacidi nella proteina 10 - Non-coding SNPs, localizzati nelle sequenze regolatorie del gene, modificano il livello di espressione del gene e quindi la quantitò di RNA e di proteina prodotta. I POLIMORFISMI DEL DNA sono utili come: IDENTIFICATORI INDIVIDUALITA’ : o controllo relazioni parentali in famiglie con malattie mendeliane o Genetica di popolazione o Indagini di paternità o Indagini di medicina legale MARCATORI GENETICI o per identificare geni-malattia o ANALISI DI LINKAGE (diagnosi portatore) mappaggio sia genetico (ordinamento dei geni sui cromosomi) che fisico (distanza fisica tra i geni) Come si individuano i Polimorfismi? Per analisi diretta della sequenza del DNA : PCR + elettroforesi ( agarosio+ et.br./acrilamide+ et.br./acrilamide+fluoresc.) microchip Un metodo utile per individuare gli SNPs è la valutazione dei cosiddetti polimorfismi di lunghezza dei frammenti di restrizione (Restriction fragment length polymorphisms) o RFLP. Se un allele contiene un sito di riconoscimento per un enzima di restrizione ed un altro no, la digestione dei due alleli genererà due frammenti di dimensione differente. In realtà oggi gli SNPs sono studiati principalmente attraverso i microarrays, che permettono l’analisi simultanea di centinaia di migliaia di diversi SNPs ed una veloce analisi elaborata da un computer. 11 7. APLOTIPO Al fine di trovare una associazione tra SNPs e la risposta a un farmaco, gli scienziati hanno considerato una serie di SNPs su un segmento più lungo di DNA. C T/C G A C T A A/G G A C C G/T A SNP SNP SNP Questi tre SNPs possono combinarsi in 23 ( ognuno dei tre SNPs con i due possibili nucleotidi), cioè otto differenti combinazioni. C C C C C C C C T T T T C C C C G G G G G G G G A A A A A A A A C C C C C C C C T T T T T T T T A A A A A A A A A A G G A A G G G G G G G G G G T T T T T T T T A A A A A A A A C C C C C C C C C G C T C G C T C G CT C G C T A A A A A A A A POSSIBILI COMBINAZIONI DI SNPs Ogni combinazione di SNPs è chiamata APLOTIPO. Quindi, possiamo dire che in questa regione di DNA ci sono 8 possibili aplotipi. C C C C C C C C T T T T C C C C G G G G G G G G A A A A A A A A C C C C C C C C T T T T T T T T A A A A A A A A A A G G A A G G G G G G G G G G T T T T T T T T A A A A A A A A C C C C C C C C C G C T C G C T C G CT C G C T A A A A A A A A APLOTIPO APLOTIPO APLOTIPO APLOTIPO APLOTIPO APLOTIPO APLOTIPO APLOTIPO 1 2 3 4 5 6 7 8 Quando studiamo i campioni di DNA di un vasto gruppo di popolazione,possiamo notare che solo quattro di queste combinazioni sono presenti. Infatti, anche nella realtà, spesso noi possiamo vedere solo alcuni dei possibili aplotipi C C C C T T C C G G G G A A A A C C C C T T T T A A A A A G A G G G G G T A C C G T A C C G T A C CT T A C C T A A A A APLOTIPO APLOTIPO APLOTIPO APLOTIPO 1 3 6 8 12 aplotipo 6 aplotipo 8 aplotipo 1 RICORDA ! Nel mondo della Genetica, ogni cosa è “in paia”: noi riceviamo un aplotipo dalla madre e uno dal padre. aplotipo 3 Questo significa che abbiamo due aplotipi ( o un paio di aplotipi). CCGACTAAGTAC CT A aplotipo della mamma mamma papa’ CTGACTAAGTACCGA aplotipo del padre I due aplotipi ereditati dal figlio sono differenti I due aplotipi ereditati dal figlio sono identici CTGACTAAGTACCGA aplotipo della madre f figlio CTGACTAAGTACCGA aplotipo del padre SNP PROFILE………….. che cos’è ? LA COPPIA DI APLOTIPI è lo “SNP PROFILE” CCGACTAAGTAC CT A aplotipo della mamma CTGACTAAGTACCGA aplotipo del padre SNP PROFILE CTGACTAAGTACCGA aplotipo del padre Quando i ricercatori studiano la risposta di un individuo ad un farmaco, essi devono considerare quello SNP profile, unico della persona CTGACTAAGTACCGA aplotipo della madre CTGACTAAGTACCGA aplotipo del padre CTGACTAAGTACCGA aplotipo del padre 8. ANALISI DI LINKAGE (o di Associazione o di Concatenazione) 13 Permette di determinare la posizione cromosomica del locus responsabile di un carattere genetico o di una determinata malattia rispetto a ”marcatori genetici” di cui è nota la posizione. Un marcatore genetico è un qualunque carattere che risponde alle seguenti caratteristiche: - è polimorfico - è facile da identificare e stabile nelle generazioni - segrega in modo mendeliano Quali sono ? RFLP,VNTR, STR, SNP. Ogni individuo possiede due copie di ciascun allele, uno ereditato dal padre e uno dalla madre. Durante la meiosi i cromosomi omologhi segregano separatamente. Quindi, se consideriamo due loci polimorfici situati su cromosomi diversi, un particolare allele del primo locus avrà il 50% di probabilità di segregare insieme ad un particolare allele del secondo locus. Se consideriamo invece due loci situati sullo stesso cromosoma, ci aspettiamo che i loro alleli vengano ereditati insieme ( cioè co-segregano) in base alla distanza che intercorre tra loro sul cromosoma. Più grande è la loro distanza, più è facile che un evento di crossing over separi i due alleli. L’evento di crossing over dà luogo alla formazione di gameti ricombinanti La probabilità che avvenga questa ricombinazione, espressa in percentuale, è nota come frequenza di ricombinazione. La frequenza di ricombinazione ci dice quindi la distanza genetica tra loci diversi. L’analisi di concatenazione nell’uomo si basa sullo studio degli alberi genealogici e sulla ricerca delle meiosi informative (cioè quelle in cui si può identificare se un gamete è o non è ricombinante). Allo stesso modo si può mappare anche un numero consistente di loci,considerandone sempre due per volta. Un altro approccio è quello di studiare gli aplotipi, ovvero l’ordine degli alleli sui rispettivi cromosomi omologhi. E’ quindi necessaria una rielaborazione statistica dei dati riguardanti l’associazione tra i marcatori e la comparsa della malattia. Quali sono i problemi di uno studio di linkage ? 1.le famiglie da analizzare solitamente contano pochi individui 2. in famiglie poco numerose vi è un basso numero di ricombinanti 3. i risultati così ottenuti hanno una bassa significatività statistica Quali sono le possibili soluzioni ? 1. Analizzare più famiglie insieme Quali popolazioni studiare ? 1.Popolazioni geneticamente isolate 2.Popolazioni giovani, con poche generazioni dal momento del fondatore, con pochi crossing over, con poche ricombinazioni 3.Popolazioni omogenee, cioè con poche famiglie fondatrici Esempi di popolazioni che presentano queste caratteristiche sono: - I Finlandesi: geneticamente e linguisticamente molto diversi dai loro vicini slavi.La popolazione è giovane in quanto fondata circa 2000 anni fa da poche famiglie fondatrici - I Sardi in Italia LINKAGE EQUILIBRIUM: indica una combinazione casuale di alleli a loci associati. Consideriamo per esempio il caso di due loci associati 1 e 2 con 2 possibili alleli ciascuno (A e a per il locus 1 e B e b per il locus 2) Gli aplotipi possibili in una determinata popolazione (AB, 14 Ab, aB, ab) si verificheranno con una frequenza che è il prodotto delle frequenze dei singoli alleli per ciascun aplotipo. Esempio: A = 0,2 B = 0,6 a = 0,8 b = 0,4 - 4 aplotipi possibili: AB Ab aB ab AB Ab aB ab 0,2 x 0,6 = 0,12 0,2 x 0,4 = 0,08 0,8 x 0,6 = 0,48 0,8 x 0,4 = 0,32 equilibrio di linkage LINKAGE DISEQUILIBRIUM: indica una combinazione non casuale di alleli a loci associati. Il linkage disequilibrium è spesso la conseguenza di un effetto "founder" (fondatore), cioè di una mutazione in un singolo individuo. Perchè l'effetto fondatore sia evidenziabile in una popolazione è necessario che i due loci siano vicini, in maniera tale che gli eventi di ricombinazione siano rari tra i due loci, e che non sia trascorso abbastanza tempo dalla comparsa del fondatore poichè la ricombinazione puo' ristabilire nel tempo l'equilibrio. Il linkage disequilibrium (LD) indica la presenza di associazione preferenziale tra specifici alleli relativi a due o più loci, presenti sullo stesso cromosoma, che costituiscono di solito un particolare aplotipo ancestrale, diffuso nella popolazione in cui è rilevato, perché trasmesso lungo la discendenza da un comune progenitore. Riprendiamo l’esempio dei 4 aplotipi AB, Ab, aB, ab. Se si trovassero questi valori AB Ab aB ab = = = = 0,04 – 0,16 + 0,56 + 0,24 - - linkage disequilibrium TECNICHE UTILIZZATE PER L’ANALISI MOLECOLARE DEL DNA 15 1. ESTRAZIONE DEL DNA. Il DNA può essere estratto da qualunque cellula nucleata. I tipi cellulari più utilizzati sono rappresentati dai leucociti di sangue periferico, colture cellulari (fibroblasti, amniociti, villi coriali). L’isolamento del DNA richiede l’utilizzo di enzimi capaci di distruggere le membrane cellulari e nucleari e di solventi organici in grado di separare le proteine dagli acidi nucleici. Nella procedura classica di estrazione del DNA genomico, le cellule vengono lisate e sottoposte a trattamento proteolitico con Proteinasi K, eliminata successivamente con estrazioni fenoliche. Il DNA purificato viene precipitato in Etanolo. La determinazione quantitativa della concentrazione del DNA estratto, calcolata in ng/µl, viene effettuata mediante lettura spettrofotometrica valutando l’assorbanza del campione a 260 nm. 2. LA TECNICA DELLA PCR PER L’ANALISI DEI RFLP L’introduzione della PCR, la tecnica che consente di amplificare selettivamente un tratto di DNA, ha rivoluzionato la genetica molecolare e le sue applicazioni sono praticamente infinite. Uno degli ambiti di utilizzo è la diagnosi di malattie genetiche mediante analisi di RFLP. L’utilizzo della PCR semplifica molte cose. Ad esempio, la PCR consente di analizzare uno specifico tratto di DNA, invece di dover lavorare su tutto il DNA nucleare di una cellula,ossia sul DNA genomico. La PCR (Polymerase Chain Reaction) è una tecnica di amplificazione in vitro di un frammento di DNA di cui si conosca la sequenza nucleotidica delle regioni terminali. Il principio è molto semplice. Data una sequenza di DNA genomico a doppio filamento e due corte sequenze oligonucleotidiche (primer), di cui una complementare ad un tratto di filamento a una estremità del DNA da amplificare (forward primer) e l’altra complementare ad un altro tratto posto all’altra estremità (reverse primer), in presenza di una DNA polimerasi termostabile e di una miscela di desossinucleotiditrifosfati(dNTPs), in appropriate condizioni di reazione, è possibile copiare numerosissime volte (30-40 volte) il tratto compreso tra i due primer, semplicemente facendo variare ciclicamente la temperatura di reazione. Infatti, raggiunta la temperatura di denaturazione (92-95°C), la doppia elica si apre (fase di denaturazione), rendendo disponibile lo stampo per la sintesi delle catene complementari. Se la temperatura si abbassa, in virtù delle loro minori dimensioni e della loro concentrazione, i primer si legheranno (fase di appaiamento o annealing) al DNA stampo prima che si rinaturi e in presenza di una DNA polimerasi con un optimum di temperatura elevato (circa 72°C), inizierà la sintesi di DNA a partire dai primer (fase di sintesi del DNA o extension), procedendo lungo i filamenti singoli. Al termine del primo ciclo di PCR da una doppia elica di DNA se ne ottengono due. Ripetendo il ciclo denaturazione – annealing – extension numerose volte (in genere da 30 a 40 volte), si ottiene una massiccia amplificazione specifica di un dato tratto di DNA, corrispondente a DNA in quantità tale da essere visualizzabile in un gel di agarosio mediante colorazione specifica. Il metodo di analisi del DNA mediante PCR presenta vantaggi molto evidenti: 1. è molto rapido (da 60 a 90 minuti), 2. la manualità è semplicissima, 3. è automatizzato, 16 4. i risultati sono visualizzabili con facilità. Il limite più grosso è rappresentato dalla necessità di conoscere le sequenze fiancheggianti il tratto di DNA che si vuole amplificare, per poter costruire i primer specifici. La PCR ha rivoluzionato la genetica molecolare. Le applicazioni della PCR sono praticamente infinite. I principali ambiti di utilizzo sono la diagnosi prenatale delle malattie genetiche e le indagini di medicina legale. I termociclatori Il successo della PCR è dovuto in gran parte alla possibilità di far avvenire l’intero processo in modo automatico all’interno di strumenti detti termociclatori (thermal cyclers) in grado di variare ciclicamente la temperatura tra le varie fasi di ogni ciclo di PCR. Un esempio di profilo di amplificazione standard impostato mediante un termociclatore è il seguente: 1. denaturazione del DNA: 30 sec. a 94°C 2. appaiamento(annealing)deiprimer: 30 sec. a 50°-60°C 35 cicli 3. sintesi (extension)di DNA: 30 sec-5 min. a 72°C Il successo della PCR è stato possibile grazie anche all’uso di una DNA polimerasi termostabile estratta da batteri termofili (che vivono ad elevate temperature). Una DNA polimerasi utilizzata nelle reazioni della PCR è la Taq polimerasi, estratta dal batterio Thermus aquaticus. L’isolamento di DNA polimerasi termostabili ha sollevato gli operatori dall’ingrato compito di aggiungere enzima fresco ad ogni ciclo di reazione! Scelta dei primer Per ogni PCR, è necessario usare due primer (forward e reverse). La scelta della coppia di primer è critica per una buona riuscita della PCR, ovvero per ottenere l’amplificazione di un tratto di DNA in modo specifico. I primer devono essere “disegnati” a monte e a valle dei siti di restrizione. Si tratta di oligonucleotidi, con dimensioni comprese tra le 15 e le 30 basi che ibridano su filamenti opposti in posizioni fiancheggianti la regione di interesse del DNA. Per minimizzare la formazione di artefatti è importante che le loro sequenze non contengano basi complementari (all’interno dello stesso primer o tra i due primer); inoltre la Temperatura di fusione dei due oligonucleotidi deve essere identica o almeno molto vicina. 3. Digestione con enzimi di restrizione (ER) Come abbiamo detto, gli ER sono endonucleasi che tagliano il legame fosfodiesterico nel DNA a doppia elica a livello di sequenze specifiche (siti di restrizione). La digestione con ER va condotta a 37°C in una soluzione tampone (fornita insieme all’enzima dal produttore) che garantisce le condizioni ottimali (di salinità e pH) per la digestione. Il tempo di incubazione varia a seconda se si digerisce DNA genomico o frammenti di DNA corti .Nel primo caso la digestione richiede almeno 8 ore (o tutta la notte). Nel secondo caso sono sufficienti da 1-4 ore. Gli ER sono reagenti costosi e delicati. Temono le contaminazioni (usare precauzioni nel prelevare l’enzima dalla soluzione stock) e l’inattivazione (si devono conservare a -20°C e, al momento dell’uso, mantenere sempre in un bagno di ghiaccio). 4.Elettroforesi su gel di agarosio E’ una tecnica che consente di separare in base alle loro dimensioni (peso molecolare) molecole dotate di carica, facendole migrare su un gel in presenza di un campo elettrico. Il gel può essere immaginato come una rete tridimensionale attraverso le cui maglie migrano le molecole sotto l’azione di un campo elettrico. Il campo elettrico è generato da un apparecchio, detto alimentatore. Per separare molecole di DNA si usano gel di agarosio. Le molecole di DNA sono cariche negativamente per la presenza di gruppi fosfato e migrano dal polo negativo (catodo) verso il polo positivo (anodo). Per un certo intervallo di pesi molecolari, la velocità di migrazione è funzione del loro peso molecolare: tanto più grande è la molecola di DNA, tanto minore è la velocità di migrazione. E, viceversa, tanto più piccola è la molecola di DNA, tanto più velocemente migra. Le molecole di DNA di diversa lunghezza vengono pertanto separate in base alla diversa velocità di migrazione. Per poter determinare la lunghezza delle molecole di DNA in esame separate mediante elettroforesi, vengono “caricati” sul gel anche i cosiddetti marcatori di peso molecolare,ossia 17 una miscela di frammenti di DNA di cui è noto il peso molecolare. Confrontando la posizione dei frammenti a peso molecolare noto con quella dei frammenti di DNA in esame, è possibile calcolarne il peso molecolare, ossia la lunghezza. Dato che il peso molecolare di un frammento di DNA è proporzionale al numero di coppie di nucleotidi (basi) che lo costituiscono, di solito esso viene espresso in paia di basi (bp). La separazione elettroforetica dura circa 45 minuti circa. Al termine, i vari frammenti di DNA, essendo incolori, possono essere visualizzati, con particolari sistemi di colorazione. Il DNA delle diverse classi di peso molecolare è visibile sotto forma di bande distinte: sono le cosiddette bande di DNA. Comunemente, per poter visualizzare il DNA, durante la preparazione del gel si aggiunge all’agarosio il bromuro di etidio, una sostanza che ha la proprietà di legarsi al DNA e di emettere fluorescenza se esposta a luce UV. Alla fine della corsa, le bande si visualizzano esponendo il gel alla luce ultravioletta. Il bromuro di etidio va maneggiato con estrema cautela in quanto è un agente intercalante del DNA e, come tale, ha proprietà mutagene. Noi utilizzeremo il GEL RED, intercalante non tossico che non richiede precauzioni particolari. ATTIVITA’ DI BIOINFORMATICA PREMESSA: 18 Principali siti di riferimento www.ncbi.nlm.nih.gov L’NCBI (National Centre for Biotecnology Information) sorto nel 1988, crea database pubblici, conduce ricerche in bioinformatica, sviluppa software per analizzare dati genomici e divulga informazioni biomediche. L’obiettivo è una migliore comprensione dei processi molecolari riguardanti la salute umana e le malattie. Sul sito si trovano banche dati relative al genoma umano e di altri organismi, a sequenze nucleotidiche e aminoacidiche, a strutture molecolari, a pubblicazioni scientifiche (come PubMed, la principale banca dati bibliografica, pubblica e gratuita, del settore biomedico). In particolare NCBI –Entrez comprende un database di strutture biomolecolari 3D determinate sperimentalmente: MMDB ossia Molecular Modeling DataBase. Tali strutture sono ottenute principalmente con cristallografia a raggi e spettroscopia di risonanza magnaticanucleare (NMR); forniscono informazioni sulla funzione biologica, la storia evolutiva e le relazioni tra le macromolecole. Il database è ovviamente più piccolo rispetto ai data base proteici o nucleotidici (solo di una frazione delle proteine si è determinata la struttura 3D), ma molte proteine possono considerarsi omologhe a quelle presenti. http://genome.ucsc.edu/ UCSC ( University of California Santa Cruz). Questo sito contiene le sequenze di riferimento e le schermate che mostrano un’ampia collezione di genomi. Fornisce inoltre un portale di accesso al Progetto Encode. www.ensembl.org ENSAMBL ( un gioco di parole tra ensamble -insieme- e EMBL, European Molecular Biology Laboratory) è un progetto sviluppato in collaborazione tra il Sanger Center di Cambridge e EMBL per sviluppare un software di annotazione automatica dei genomi animali.Con il termine “annotazione” si intende l’inserimento di tutte le informazioni riguardanti la funzione di una determinata sequenza. Ensambl aggiorna i dati almeno 10 volte l’anno. OBIETTIVO DELL’ATTIVITA’ : 1. 2. 3. 4. 6. 7. 8. Cos’è la Lattasi ? Come si fa a localizzare il gene d’interesse ? Una volta che l’ho localizzato, come trovo tutte le informazioni necessarie ? Come si caratterizza il gene ? Come riconoscere esoni ed introni ? Come trovare il polimorfismo a singolo nucleotide rs 4988235 correlato con LP ? Come interpretare i dati statistici sulle frequenze alleliche nelle popolazioni? 1°. OBIETTIVO: COS’E’ LA LATTASI ? 19 Andare su GOOGLE . digitare NCBI. Aprire la Home Page. Search “ OMIM “ for “LCT”. Go DESCRIPTION In humans, the activities of lactase and most of the other digestive hydrolases are maximal at birth. The majority of the world's human population experiences a decline in production of the digestive enzyme lactase-phlorizin hydrolase during maturation, with the age of onset ranging from the toddler years to young adulthood. Due to the reduced lactase level, lactose present in dairy products cannot be digested in the small intestine and instead is fermented by bacteria in the distal ileum and colon. The fermentative products result in symptoms of diarrhea, gas bloat, flatulence, and abdominal pain. However, in a minority of adults, high levels of lactase activity persist in adulthood. Lactase persistence is a heritable autosomal dominant condition that results in a sustained ability to digest the milk sugar lactose throughout adulthood 20 2° OBIETTIVO Come si fa a localizzare il gene LCT? Ritorna sulla pagina iniziale del sito NCBI. Search “nucleotide” for ”lep homo sapiens” . Clicca su GO. Cliccare su LCT (Homo Sapiens) Si aprirà un tipico file di GenBank. Questa pagina non è facile da leggere, ma alcune informazioni sono chiare. 3° OBIETTIVO: Come si trovano tutte le informazioni necessarie ? In questa pagina leggiamo: - le Reference. Cliccando qui troverai le citazioni alle pubblicazioni in letteratura scientifica che riguardano la nostra sequenza.Per leggere un abstract dell’articolo che descrive il gene clicca sul link PubMed . - la posizione del gene Lct. Il gene si trova sul cromosoma 2. - Il Sommario. Qui vengono descritte le principali funzioni della Proteina Il gene 2q21 si trova sul cromosoma 2 in un enhancer noto come MCM6 4° OBIETTIVO: Come si caratterizza il gene LCT ? Go to reference sequence details Cliccare su GenBank. Compare una pagina con tutte le informazioni sul gene per la Lattasi. MA NON E’ QUESTO IL GENE CHE CONTIENE LO SNP !! Torna indietro Clicca su MCM6. Che cos’è? Leggi Summary Clicca su NM 005915+4 Si apre la pagina con le informazioni sul gene MCM6, sugli esoni e introni di cui è fatto. Lo SNP che ci interessa sta sull’introne 6. 5. Individuazione del Polimorfismo SNP rs 4988235 Ritorna in cima alla pagina dell’NCBI. Su Search cerca SNP for MCM6 22 Clicca su rs 4988235 Scorrendo la pagina si ha la sequenza contenente lo SNP Sotto ancora… Cliccare su Open sequence viewer in a new window.Si apre una nuova finestra sullo SNP VAI SU GO TO POSITION/RANGE SE VADO SU SEQUENCE E SCRIVO L’INIZIO E LA FINE DELLA SEQUENZA AMPLIFICATA 26611-26811 OTTENGO……… 23 6. Genetica delle popolazioni Quali frequenze alleliche di riferimento si riscontrano nella popolazione caucasica? 24 Il Lattosio Il lattosio è uno zucchero riducente destrogiro. E’ costituito da una molecola di ß D-(+)-galattosio e da una di ß D-(+)-glucosio uniti da un legame β(1→4) glicosidico. È l'unità del D-(+)-glucosio ad avere il gruppo aldeidico "libero" responsabile delle proprietà riducenti del lattosio. Il lattosio rappresenta il 98% degli zuccheri presenti nel latte (di mucca, di capra, di asina oltre che nel latte di donna). E’ contenuto oltre che nel latte (circa il 40 % della massa secca, 3.5-4% sul tal quale), anche nei suoi derivati (formaggi e yogurt) e in prodotti a base di siero di latte Lattasi La Lattasi,nota anche come Lattasi-Florizina Idrolasi è una ß-galattosidasi responsabile dell’idrolisi del Lattosio in Glucosio e Galattosio. I due monosaccaridi vengono assorbiti dagli enterociti intestinali e passano nel circolo sanguigno; il Glucosio viene utilizzato come fonte energetica e il Galattosio diventa un componente dei Glicolipidi e delle Glicoproteine. La Lattasi ha due attività: un’attività ß-glicosidica idrolizzante il Lattosio e un’attività ß-glicosidica per l’idrolisi della Florizina,un disaccaride trovato nelle radici e nella corteccia di piante della famiglia delle Raosacee e di alcune alghe marine. La Lattasi è sintetizzata come Pro-Lattasi, un polipeptide di 220 Kda che subisce una considerevole modificazione post-trascrizionale durante il trasporto alla superficie cellulare nella forma matura di Lattasi di 150 Kda. Dimerizza sulla membrana dell’orletto a spazzola per formare l’enzima attivo. Anche fattori presenti nel lume intestinale contribuiscono alla modifica della proteina per produrre l’enzima attivo mediante separazione di due ulteriori aminoacidi da parte della Tripsina pancreatica. Il polipeptide scisso non ha apparentemente una funzione enzimatica,ma può funzionare come una molecola adiuvante (chaperone). La Lattasi ha un dominio C-terminale sulla membrana che sporge verso il lume gastrointestinale. Il sito della Florizina è utilizzato per diverse funzioni e questo spiega perché l’attività di alcuni enzimi che fa seguito alla diminuzione dell’espressione enzimatica dopo lo svezzamento con il latte materno. ( Fig.1) Fig.1 25 Che cos’è l’intolleranza al lattosio? È l’incapacità dell’intestino a scindere il lattosio (si trova nel latte di mucca, di capra, di asina oltre che nel latte di donna) nei due zuccheri semplici, il glucosio e il galattosio, che sono assorbibili dall’intestino. L’intolleranza al Lattosio è una condizione molto comune caratterizzata dalla mancanza di Lattasi,un enzima che si trova nell’orletto a spazzola della mucosa intestinale e idrolizza il Lattosio a galattosio e glucosio. Nei neonati sono presenti alte concentrazioni di questo enzima. Dopo l’allattamento si verifica una riduzione della sua attività, irreversibile e geneticamente programmata e che si manifesta come un malassorbimento primario di Lattosio,la più comune carenza enzimatica. Tale incapacità è data dalla mancanza totale o parziale dell’enzima lattasi che si trova a livello della superficie delle cellule che rivestono l’intestino. La permanenza del lattosio come tale nell'intestino ne determina l'utilizzo da parte della flora batterica intestinale responsabile della fermentazione (da questo processo si ha una grande produzione di gas e acidi organici) ed essendo il lattosio una sostanza osmoticamente attiva richiama nel colon acqua e sodio impedendo la formazione delle feci solide. I sintomi più comuni dell’intolleranza al lattosio sono: * dolori addominali di tipo crampiforme * meteorismo intestinale * diarrea * in rari casi è anche presente perdita di peso e malnutrizione La gravità della sintomatologia dipende dalla quantità di lattosio che ogni individuo riesce a tollerare. Molto spesso i sintomi, soprattutto i dolori addominali e la diarrea, compaiono poco dopo l’assunzione di alimenti contenenti lattosio. L'intolleranza al lattosio può essere congenita,primaria, secondaria e transitoria. CARENZA CONGENITA DI LATTASI è estremamente rara è dovuta a mutazioni nella regione codificante del gene per la lattasi (autosomal recessively inherited severe gastrointestinal disorder of infants). CARENZA PRIMARIA DI LATTASI è dovuta alla totale o parziale assenza di Lattosio che si sviluppa nell’infanzia a varie età in differenti gruppi razziali. E’ la più comune causa di intolleranza al Lattosio ed è anche conosciuta come IPOLATTASIA ADULT TYPE o NON PERSISTENZA DELLA LATTASI o CARENZA EREDITARIA DI LATTASI. E’ la carenza enzimatica più diffusa nel mondo.E’ una condizione autosomica recessiva derivante dalla diminuzione dell’attività dell’enzima Lattasi-Forizina nelle cellule intestinali. CARENZA SECONDARIA DI LATTASI è solitamente dovuta ad un deterioramento della mucosa intestinale secondario ad un processo infiammatorio o infettivo. Il problema in questo caso è temporaneo e dura fino a che non si sia risolta la causa primaria. Può comparire ad ogni età, ma è più comune nell’infanzia. CARENZA TRANSITORIA DI LATTASI è oggi definita come una carenza di lattosio relativa osservata tra i neonati pretermine di meno di 34 settimane di gestazione. Sebbene la Lattasi sia un enzima non inducibile, una alimentazione supplementare con Lattasi può favorire la produzione e l’espressione dell’enzima. 26 GENETICA La capacità di digerire il Lattosio diminuisce rapidamente con l’età nella popolazione umana in seguito alla diminuzione dei livelli dell’enzima Lattasi-Florizina Idrolasi; questa condizione è nota come “Non persistenza della Lattasi”(LNP). Comunque, alcuni individui,in particolare quelli discendenti da alcune popolazioni che hanno praticato la pastorizia, mantengono la capacità di digerire il latte e altri prodotti caseari anche nell’età adulta. Questi individui presentano il carattere “Persistenza della Lattasi”(LP). Il fenotipo LP/LNP è geneticamente determinato, con il carattere LP dominante sul LNP. Si pensa che l’espressione nell’adulto del gene che codifica per la Lattasi (LCT), localizzato sul cromosoma 2 (2q21) sia dovuto a un polimorfismo cis-acting della regolazione dell’espressione del gene della Lattasi. Uno studio di linkage disequilibrium (vedi pag.14)e l’analisi dell’aplotipo (ved.pag.12) nel pedigree dei Finlandesi ha identificato due singoli SNPs associati con il carattere “Persistenza della Lattasi”. Due SNPs nel gene che codifica per la Lattasi (LCT) C/T-13910 e G/A-22018 sono associati con la capacità di digerire il latte nell’età adulta (Persistenza della Lattasi) nella popolazione europea. C/T-13910 e G/A-22018, sono localizzati rispettivamente a ~14 kb e ~22 kb a monte del gene LCT, rispettivamente all’interno degli introni 9 and 13 del gene adiacente MCM6 (MiniChromosome Maintenance 6), un enhancer del gene promoter LCT. Gli alleli -13910*T e -22018*A sono associati rispettivamente al 100% e al 97% con il carattere “Persistenza della Lattasi” nello studio della popolazione Finlandese, mentre il solo allele 13910*T è associato all’ ~86%-98% con la “Persistenza della lattasi” nelle altre popolazioni Europee. La variante europea -13910*T, correlata con la persistenza della lattasi (LP), è quasi inesistente tra le popolazioni dell’Africa sub-Sahariana che mostrano tuttavia un’alta incidenza della LP. Uno studio di associazione genotipo-fenotipo condotto nella popolazione africana (proveniente da Tanzania, Kenia e Sudan) ha identificato altri 3 SNPs nel gene MCM6, associati con la persistenza della lattasi, mentre la variante europea -13910 è quasi inesistente. L’esatto meccanismo che sottosta alla ”Non persistenza della lattasi” non è ancora completamente compreso. In sintesi, il carattere “Persistenza della Lattasi” è collegato ad una trasmissione autosomica dominante, essendo dominante il polimorfismo C/T*-13910 con l’allele C ( wild type) legato alla diminuzione della espressione del mRNA della Lattasi. Gli individui eterozigoti per lo SNP (genotipo CT) hanno un’attività lattasica intermedia e sono più suscettibili all’intolleranza al Lattosio in caso di stress o di infezioni gastrointestinali. Gli omozigoti adulti (genotipo CC) con una “Non persistenza della Lattasi” hanno livelli impercettibili di Lattasi intestinale come risultato di down regulation dell’enzima sull’orletto a spazzola dopo lo svezzamento. 27 LABORATORIO 1. ESTRAZIONE DI DNA DA MUCOSA BOCCALE 2. PCR LCT -13910 Primers: 5′-GCTGGCAATACAGATAAGATAATGGA-3′ (position 26611–26636) 5′-CTGCTTTGGTTGAAGCGAAGAT-3′ (position 26790–26811) Reaction volume : 25 µL.: Genomic DNA 1 µL, 1.5 mM MgCl2, Buffer, 0.2 mM di dNTP, 10 ρmol di ogni primer , 2.0 U di Taq DNA polymerase. Amplification: Iniziale denaturazione a 95 °C per 5 min Denaturazione 35 cicli a 95 °C per 1 min Annealing a 59 °C per 1 min Extension a 72 °C per 1 min Extension finale a 72 °C per 5 min 3. DIGESTIONE Il prodotto della PCR è digerito con l’enzima HinfI (0.25 U) a 37°C overnight La sequenza genomica è …AAGATAATGGTAG C/T CCCTG…. HinfI taglia : 5'...G ANTC..3' 3'…CTNA G…..5' La digestione del prodotto della PCR può dare: - i prodotti dell’ allele T, 2 frammenti da 177 bp e 24 bp - un unico prodotto dell’ allele C di 201 bp. E’ previsto un controllo positivo ( PCR non digerita) 4. ELETTROFORESI SU GEL soluzione 3% di gel Agaroso CC GENOTYPE single band of 201 bp Ipolactasia TT GENOTYPE two bands of 177 and 24 bp CT GENOTYPE three bands of 201 bp, 177 and 24 bp normalactasia Il frammento da 24 bp è molto piccolo e non si vede ! 28 EVOLUZIONE Significato adattativo in Europa e in Africa. La tolleranza al Lattosio è un esempio di cambiamento evolutivo basato sulla selezione operata nell’uomo appartenente ad una cultura pastorizia legata al consumo del latte. (Feldman and Cavalli-Sforza, 1989). Evidenze archeologiche hanno (2003) dimostrato una correlazione tra la frequenza della persistenza del gene della Lattasi e le regioni geografiche europee abitate fin dal Neolitico ( 6400 A.C.) da allevatori di bestiame. Nel Nord Europa la persistenza della Lattasi è comune e il consumo del latte non solo è molto diffuso, ma si è sempre considerato il latte come un alimento importante dal punto di vista nutrizionale. Si sta comprendendo oggi come questo sia accaduto. Una ipotesi spiega queste differenze genetiche nella popolazione in termini di un vantaggio selettivo basato su una alimentazione arricchita di latticini. Sebbene non ancora del tutto compresi, i vantaggi biologici della persistenza della Lattasi probabilmente tengono conto della disponibilità giornaliera di una bevanda energetica e ricca di Calcio che permette alla comunità di allevatori di far fronte anche ai raccolti modesti. Questa capacità genetica di digerire il latte è stata vista come un classico esempio di coevoluzione genecultura. L’ipotesi dell’assimilazione del Calcio è stata avanzata da Flatz and Rotthauwe secondo i quali la persistenza della Lattasi è stata favorita nelle regioni a latitudine maggiore a causa dei livelli ridotti di luce solare e quindi della insufficiente sintesi di vitamina D. La vitamina D è necessaria per l’assorbimento del Calcio e il latte costituisce una buona sorgente alimentare di entrambi.Inoltre, sono da considerare altri fattori positivi quali la possibiità di disporre con regolarità di un cibo calorico e ricco di proteine e il fatto che il latte costituisce una sorgente di liquidi incontaminata. Studi epidemiologici mostrano che lo sviluppo della produzione dei latticini precede la selezione del carattere “persistenza della Lattasi”. Siccome la produzione e l’uso dei latticini si fa risalire a 10.000 anni fa,la pressione selettiva si è manifestata solo per le ultime 400 generazioni. Malgrado questo breve tempo,c’è una suggestiva evidenza della recente selezione positiva: la persistenza della Lattasi è associata ad un aplotipo che è molto comune nei nordeuropei ed è distante dall’aplotipo ancestrale. La scoperta della base molecolare di questo SNP distante circa 14 kb dal gene, ha permesso ulteriori analisi della variazione genetica associata con la persistenza/non persistenza della Lattasi. L’assenza dell’allele 13910*T nei campioni del Neolitico indica che i primi allevatori in Europa non erano ancora adatti al consumo e alla digestione del latte. E’ improbabile che il consumo di latte si sia diffuso in Europa prima della comparsa dell’allele 13910*T. Resta aperta una importante questione riguardante la localizzazione geografica delle prime popolazioni che portavano l’allele 13910*T, il modo e la direzione della diffusione dell’allele, e la precisa natura dei vantaggi selettivi conferiti dalla persistenza della Lattasi. E’ probabile che i vantaggi conferiti da questi svariati fattori differiscano in Europa e in Africa. Nelle popolazioni africane la capacità di digerire il latte nell’età adulta probabilmente è una conseguenza non solo dell’adattamento al miglioramento dei benefici nutrizionali provenienti dal latte (carboidrati,grassi,proteine e Calcio), ma anche dal fatto che il latte costituisce una importante fonte di liquidi nelle regioni aride. Dal momento che tra i sintomi dell’intolleranza al Lattosio c’è perdita di acqua in seguito a diarrea, gli individui che portavano gli alleli associati alla persistenza della Lattasi e potevano tollerare il latte, manifestavano un maggior vantaggio selettivo. 29 Diffusione La frequenza della persistenza della Lattasi è alta nelle popolazioni nord-europee: >90% negli Svedesi e nei Danesi diminuisce nell’Europa meridionale e nel Medio Oriente ~50% negli Spagnoli,, Francesi e popolazioni arabe dedite alla pastorizia è bassa negli Asiatici non allevatori di bestiame e negli Africani ~1% nei Cinesi, ~5%-20% negli Africani allevatori. In Italia, la prevalenza dell’intolleranza al Lattosio varia ampiamente nelle regioni. Nel Sud Italia e nelle isole, la frequenza è più del 70%. I Sardi, che sono una popolazione geneticamnete isolata, manifestano la stessa associazione genetica dell’ipolattasia con la variante C/T* -13910 simile ad altre popolazioni del NordEuropa. Recenti studi mostrano che non esiste in Sardegna l’allele T/T, perciò la persistenza alla Lattasi è sostenuta solo dagli allele C/T BIBLIOGRAFIA 1.Single nucleotide polymorphism C/T-13910, located upstream of the lactase gene, associated with adult-type hypolactasia: Validation for clinical practice Rejane Mattar ⁎, Maria do Socorro Monteiro, Cibele Aparecida Villares,Aníbal Ferreira dos Santos, Flair José Carrilho Department of Gastroenterology, University of São Paulo School of Medicine, São Paulo 2.Convergent adaptation of human lactase persistence in Africa and Europe. Sarah A Tishkoff,1,9 Floyd A Reed,1,9 Alessia Ranciaro,1,2 Benjamin F Voight,3 Courtney C Babbitt,4 Jesse S Silverman,4 Kweli Powell,1 Holly M Mortensen,1 Jibril B Hirbo,1 Maha Osman,5 Muntaser Ibrahim,5 Sabah A Omar,6 Godfrey Lema,7 Thomas B Nyambo,7 Jilur Ghori,8 Suzannah Bumpstead,8 Jonathan K Pritchard,3 Gregory A Wray,4 and Panos Deloukas8 3.Frequency of LCT -13910C>T single nucleotide polymorphism associated with adult-type hypolactasia/lactase persistence among Brazilians of different ethnic groups Rejane Mattar, 1 Maria S Monteiro,1 Cibele A Villares,1 Aníbal F Santos,1 Joyce MK Silva,1 and Flair J Carrilho 4.The Origins of Lactase Persistence in Europe Yuval Itan,1,4 Adam Powell,1,5 Mark A. Beaumont,2 Joachim Burger,3 and Mark G. Thomas1,5* 5.Tracing the distribution and evolution of lactase persistence in Southern Europe through the study of the T(-13910) variant. Anagnostou P, Battaggia C, Coia V, Capelli C, Fabbri C, Pettener D, Destro-Bisol G, Luiselli D. Dipartimento di Biologia Animale e dell'Uomo, Università La Sapienza, Roma, Italy. A.Perino1,S.Cabras2,D.Obinu3,L.Cavalli Sforza4 6.Lactose intolerance:a non-allergic disorder often managed by allergologists Margarida Coelho Æ Donata Luiselli Æ Giorgio Bertorelle Ana Isabel Lopes Æ Susana Seixas Giovanni Destro-Bisol Æ Jorge Rocha 7. Microsatellite variation and evolution of human lactase persistence Rejane Mattar,Maria do Socorro Monteiroa,Cibele Aparecida Villaresa,Aníbal Ferreira dos Santona and Flair José Carrilhoa Lactose digestion and the evolutionary genetics of lactase persistence Catherine J. E. Ingram · Charlotte A. Mulcare · Yuval Itan · Mark G. Thomas · Dallas M. Swallow 30 GLOSSARIO Allele: è una delle possibili forme o varianti in cui si puo' presentare un gene, con conseguenze sulle caratteristiche espresse. Per ogni gene (ad un determinato locus sul cromosoma) esistono due alleli, ereditati dal padre e della madre. Quando i due alleli sono uguali, l'individuo è definito omozigote per quel specifico tratto; se gli alleli sono diversi, l'individuo è definito eterozigote. Annealing (appaiamento) complementarietà delle basi. formazione di molecole ibride di acidi nucleici basata sulla Elettroforesi tecnica che consente di separare molecole caricate elettricamente, mediante la migrazione in un campo elettrico. Enzima proteina che catalizza (accelera) una specifica reazione chimica di una via metabolica in un sistema vivente. Ha azione specifica, in quanto riconosce il substrato su cui agire. Enzimi di restrizione chiamati anche endonucleasi di restrizione o “forbici” molecolari : sono enzimi che tagliano il DNA a doppia elica (e non quello a singolo filamento!) in corrispondenza di specifiche sequenze nucleotidiche, dette siti di restrizione Fenotipo insieme delle caratteristiche visibili di un organismo, che risultano dall’interazione tra genotipo e ambiente. Frammenti di restrizione frammenti provenienti da una molecola di DNA più lunga per digestione con enzimi di restrizione Gene unità ereditaria funzionale corrispondente generalmente al segmento di DNA che codifica una proteina. Genoma patrimonio genetico di una cellula o di un organismo. Genotipo costituzione genetica di un organismo Linkage Equilibrium indica una combinazione casuale di alleli a loci associati Linkage disequilibrium indica una combinazione non casuale di alleli a loci associati Isoforma Un tempo si riteneva che ogni gene codificasse per un unico prodotto polipeptidico o molecola di RNA, mentre oggi si sa che la maggioranza di geni umani specifica 2 o più forme alternative di proteine Locus ( plurale loci) posizione fissa su un cromosoma occupata da un dato gene. Nel liguaggio comune il termine viene spesso usato come sinonimo di gene Marcatore genetico nell’analisi genetica qualsiasi differenza fenotipica, controllata geneticamente, utilizzata Oligonucleotide corta molecola di DNA (o RNA) a singolo filamento, costituita da poche decine di basi, ottenuta artificialmente e utilizzata in esperimenti di ibridazione molecolare e nella PCR PCR (polymerase chain reaction) tecnica di biologia molecolare utilizzata per amplificare in breve tempo segmenti specifici di DNA Polimorfismo esistenza di forme diverse di: alleli (polimorfismo allelico), proteine (polimorfismo proteico), DNA (polimorfismo del DNA). ciascuno dei quali con una frequenza di almeno 1%. Polimorfismo della lunghezza dei frammenti di restrizione (RFLP) Restriction Fragment Length Polymorphism (lunghezza variabile dei frammenti di restrizione). 31 Polimorfismo del DNA, che si evidenzia trattando cromosomi Determinato da una differenza di una base tra due DNA presenza o assenza di un sito di restrizione per uno specifico quindi frammenti di diversa lunghezza dopo trattamento con omologhi con enzimi di restrizione. omologhi, differenza che causa la enzima di restrizione, e quell’enzima Primer corta catena polinucleotidica, a DNA o RNA, alla quale vengono aggiunti nuovi nucleotidi nel corso della sintesi di DNA. Noto anche con il termine di innesco. Nella PCR si utilizza una coppia di primer Promotore regione del DNA a cui si lega la RNA-polimerasi per avviare la trascrizione del gene(cioè la sintesi dell'RNA-messaggero). Funziona come un "interruttore molecolare" che "accende" o "spegne" il gene. regioni di controllo sequenze del DNA che attivano e regolano l'espressione di un gene. La loro presenza è pertanto necessaria per la corretta e efficace espressione del gene. RNA-messaggero (mRNA) copia a singolo filamento della sequenza nucleotidica di un gene, che trasporta ai ribosomi l'informazione per la sintesi (traduzione) della proteina corrispondente Splicing del RNA processo in cui le sequenze introniche sono eliminate dai trascritti primari di RNA nel nucleo durante la trascrizione, per dar luogo alla produzione di molecole di mRNAmaturo. Splicing alternativo assemblaggio differenziale di esoni durante la maturazione dell’RNA. Si stima che più del 60% dei geni umani produca 2 o più proteine mediante questo meccanismo. Molti esoni specificano domini proteici strutturali distinti che possono essere combinati in modo diverso nelle cellule dei diversi tessuti nei quali il gene è espresso..si ottengono così isoforme tessuto-specifiche Sequenze palindromiche sequenza nucleotidica che è identica al suo filamento complementare quando entrambi vengono letti nella stessa direzione chimica (es 5'-->3'). Esempio GATC Siti di restrizione sequenza di basi ben determinata riconosciuta e tagliata dagli enzimi di restrizione in modo da lasciare corte sequenze a singola elica, dette estremità coesive poiché le loro basi sono complementari. Guida per lo studente Background Conoscenze propedeutiche Le malattie ereditarie monogeniche sono determinate da mutazioni in singoli geni che si trasmettono nelle famiglie secondo leggi ben definite scoperte dall’abate Gregorio Mendel nella seconda metà dell’Ottocento. Per questo motivo le malattie monogeniche o monofattoriali vengono anche chiamate“mendeliane”. In particolare bisogna ricordare che: I geni possono avere alleli diversi (varianti alternative di uno stesso gene) ossia essere polimorfici; Gli organismi diploidi hanno due copie di ogni gene, cioè due alleli. Se i due alleli sono uguali, l’individuo è omozigote (ad es, ha genotipo AA oppure aa). Se i due alleli sono diversi, l’individuo è eterozigote (ad es, il genotipo è Aa) 32 La I legge di Mendel o legge dell’uniformità della prima generazione ibrida, afferma che l’incrocio tra individui della generazione parentale ciascuno omozigote per due alleli diversi di uno stesso gene (ad es, AA x aa) e che quindi differisce dall’altro genitore per una caratteristica (ad es, pelo nero o marrone), dà una progenie costituita da individui tutti identici tra loro (tutti eterozigoti; ad es, Aa); Durante la meiosi i due alleli di un gene segregano e si distribuiscono ciascuno in un gamete apolide (II legge di Mendel, legge della segregazione). Un individuo omozigote produce un solo tipo di gamete (A oppure a) relativamente a un dato locus (la posizione occupata da un gene in un cromosoma). Un individuo eterozigote produce due tipi di gameti (A e a) in ugual quantità, cioè in rapporto 50% ciascuno. Una buona rappresentazione grafica della segregazione si ottiene costruendo il “quadrato di Punnett”. Alleli appartenenti a geni diversi localizzati su cromosomi diversi segregano in modo indipendente (III legge di Mendel, legge della segregazione indipendente). Allele dominante: allele che si manifesta allo stato eterozigote; Allele recessivo: allele mascherato dall’allele dominante, che si manifesta solo allo stato omozigote; Allele codominante: due alleli entrambi espressi allo stato eterozigote, che agiscono sul fenotipo in modi indipendenti e distinguibili. Un esempio classico si ha nel caso degli alleli IA e IB del gruppo sanguigno ABO. L’1% circa dei neonati è affetto da una malattia genetica monogenica. La mutazione genica è presente fin dal concepimento, quindi anche alla nascita, anche se non sempre si manifesta fenotipicamente alla nascita. Alcune di queste malattie comportano conseguenze già apprezzabili nel neonato. Altre malattie monogeniche si manifestano, invece, durante le età successive della vita. La corea di Huntington, ad esempio, è una malattia genetica a insorgenza tardiva che si manifesta solo in età adulta. Si definisce malattia autosomica quella in cui l’allele malato è presente nelle coppie di cromosomi non coinvolti nella determinazione del sesso, gli autosomi; si parla invece di malattia legata all’X quella in cui l’allele si trova nel cromosoma sessuale X. In questo caso la trasmissione segue modalità particolari in quanto la maggior parte dei geni rappresentati sul cromosoma X non sono rappresentati sul cromosoma Y. Il cromosoma Y, infatti, è molto più piccolo e contiene quasi esclusivamente i geni per la determinazione del sesso. Per schematizzare: • malattie autosomiche: se l’allele normale è dominante, la malattia si rende manifesta solo nella condizione omozigote recessiva, ossia negli individui in cui entrambi gli alleli del gene sono alterati (malattia autosomica recessiva); se invece è l’allele alterato a prevalere su quello sano, la malattia si rende sempre evidente, anche nella condizione eterozigote, ossia è sufficiente che uno solo dei due alleli sia alterato per avere la malattia (malattia autosomica dominante) • malattie legate all’X: se l’allele è recessivo,come nella maggior parte dei casi, i maschi ricevono l’X difettoso dalla madre, ma non possono bilanciarlo con un allele sano nell’Y in quanto questo cromosoma non contiene l’allele corrispondente; le femmine invece manifestano la malattia solo nelle condizione omozigote. Di conseguenza, la frequenza delle malattie recessive legate al cromosoma X è maggiore nei maschi che nelle femmine. Nel caso di malattie dominanti le femmine manifestano la malattia anche nella condizione eterozigote. 33 34