Come e quanto varia il genoma umano? Quali sono le conseguenze di queste variazioni? Se si confrontano genomi di individui diversi li si trova identici per > 99.5% In che cosa consistono le differenze tra genomi? Variazioni su piccola e su larga scala I cambiamenti su piccola scala interessano un solo gene Si riteneva che le variazioni su larga scala fossero molto svantaggiose e quindi rare. Negli ultimi anni si è invece scoperto che sono piuttosto comuni Scherer et al (2007)-Nat Genet. 39: S7–15. Sequenziamento del genoma umano: 1990–2003 Studio della variabilità umana: HapMap e1000 genomi Cambiamenti di un singolo nucleotide Nel genoma umano sono presenti > 40 milioni di SNS (ca.10 milioni sono polimorfiche) 2007 – genoma di Craig Venter • 3.2 milioni di SNP • ca. 300 000 indel (da 1 a 571 bp) allo stato etrozigote • Ca. 560 000 indel (1-82 711 bp) allo stato omozigote • 90 grandi inversioni • 62 varianti di sequenza a elevato no. di copie 12 291 000 bp diverse dalla sequenza di riferimento Genoma umano 3.2 x 109 bp differenze con il genoma di riferimento: 12.3 x 106/3.2 x109 = 0.00386 La variazione più piccola interessa un singolo nucleotide (sostituzioni o inserzioni/delezioni) Quali effetti sul fenotipo? Variazioni di una o poche basi che si verificano in sequenze codificanti SNS-Samesense (SS) o sinonime (S) SNS-MisSense (MS) o non sinonime (NS) SNS-non senso Inserzioni o delezioni di poche bp (indel) Inversioni di poche bp (inv) Esempi di mutazione SS o sinonima AAA (Lys) AAG (Lys) CUA (Leu) UUA (Leu) Esempi di mutazione MS o Non Sinonima Sostituzione della 1a base del codone: AAA (Lys) CAA (Gln) Sostituzione della 2a base del codone: AAA (Lys) ACA (Thr) Sostituzione della 3a base del codone: AAA (Lys) AAC (Asn) Esempio di mutazione Non Senso Inserzioni di pochi nt Formazione di un codone di STOP subito a valle della delezione di 1 nt mRNA con codoni di STOP che cadono prima dell’ultimo esone sono instabili e vengono degradati meccanismo attraverso il quale viene impedita la produzione di ‘monconi polipeptidici’ che potrebbero essere dannosi per la cellula NMD Nonsense-Mediated Decay = degradazione mediata da codoni non-senso Quando gli mRNA arrivano nel citoplasma sono ancora legati, in corrispondenza dei punti di splicing, a complessi proteici (EJC = Exon Junction Complex) che vengono rimossi solo durante il primo round di traduzione. mRNA da cui non vengano rimossi gli EJC sono instabili e vengono degradati Strachan e Read – Genetica Molecolare Umana, Zanichelli, 2012 Frecce verdi formazione di codoni di STOP prematuri prima dell’ultimo esone, mRNA instabili > non produzione di ‘tronconi polipeptidici’ Frecce rosse formazione di codoni di STOP prematuri nell’ultimo esone, mRNA stabili > produzione di ‘tronconi polipeptidici’. In genere comportano conseguenze fenotipiche più gravi E le SNS che interessano regioni non codificanti? Le conseguenze sono più difficili da prevedere Mutazioni che alterano il processo di splicing Rimozione degli introni dal trascritto primario Strachan e Read – Genetica Molecolare Umana, Zanichelli, 2012 Sequenze introniche importanti per lo splicing Strachan e Read – Genetica Molecolare Umana, Zanichelli, 2012 Enahancer di splicing esoniche o introniche STR con effetti fenotipici: MALATTIE DA ESPANSIONE (instabile) DI BREVI TRATTI RIPETUTI La base molecolare di queste malattie consiste nella ripetizione abnorme di un microsatellite o STR (Short Tandem Repeat) Cosa sono i microsatelliti o STR ? Regioni di genoma in cui una breve sequenza di basi (da 1 a 10 bp), detta repeat, viene ripetuta un certo numero di volte Molto spesso questi loci sono Gli alleli vengono in genere indicati con un numero che corrisponde al numero di ripetizioni dell’unità di base Ad esempio, gli alleli 13 e 14 di un microsatellite del tipo CA (vedi figura A) differiscono l’uno dall’altro per due basi: l’allele 13 presenta il dinucleotide CA ripetuto 13 volte (per un totale di 26 bp), mentre nell’allele 14 esso è ripetuto 14 volte (in totale 28 bp) Ciascun sito STR è indicato con una sigla (D number) D6S282 D = DNA; 6 = l’STR considerato sta sul cromosoma 6; Probabile meccanismo di generazione di nuovi alleli STR Nelle malattie da espansione Alleli normali l’unità base è presente un numero di volte limitato (anche se variabile da allele ad allele) Alleli patologici l’unità base è presente un numero di volte molto maggiore Esempio: nella Corea di Huntington gli CAG 40-120 alleli CAG normali contengono il CAG trinucleotide CAG ripetuto 11-36 CAG gene HD CAG volte, 11-36 CAG gli alleli patologici lo presentano 40-120 volte CAG CAG In pedigree in cui segregano malattie dovute ad espansioni nucleotidiche si osservano, in generazioni successive della stessa famiglia, anticipazione dell’età di insorgenza e aumento della gravità dei sintomi clinici I 54a 1 II 56a 1 III 2 46a 41a 2 3 42a 18a 1 4 2 3 5 6 Il no. all’interno del simbolo dei soggetti affetti indica l’età di insorgenza della malattia Entrambi i fenomeni sono spiegati dalle seguenti osservazioni: l’entità dell’espansione è direttamente collegata alla gravità della malattia e alla sua età di insorgenza il tratto espanso è soggetto ad instabilità meiotica (e anche mitotica) i portatori di un allele espanso producono con frequenza elevata I II 48/28 31/30 54a 1 28/30 III 54/31 48/30 56a 1 28/32 1 2 29/27 28/30 50/31 46a 41a 2 62/30 3 4 42a 18a 2 54/30 3 5 6 I no. accanto ai soggetti affetti indicano il no. di ripetizioni dell’unità di base La prima dimostrazione che l’espansione di un microsatellite può essere causa di patologie risale all’inizio degli anni ’90 Oggi si conoscono una ventina di malattie dovute a questo meccanismo Quali le cause dell’instabilità mitotica e meiotica? Poco note (la lunghezza del tratto necessario per la formazione di hairpin coincide con la lunghezza dei frammenti di Okazaki; ruolo della regione fiancheggiante, fattori sesso-specifici, ecc.) Le malattie da espansione possono essere suddivise in 3 categorie sulla base della regione genica in cui si trova il tratto ripetuto (regioni codificanti o non codificanti) e del meccanismo molecolare alla base della patogenicità (perdita di funzione, produzione di Nat Rev Genet (2005) 6: 743-755 1. Malattie in cui il gene contiene l’espansione in una regione NON codificante (nel 5’ UTR per FRAXA e FRAXE e nel 1° introne per FRDA) e in cui il meccanismo patogenetico è la perdita di funzione l’unità ripetuta è diversa da gene a gene il range di espansione patologico è molto elevato (centinaia o addirittura migliaia di copie) 2. Malattie in cui il gene contiene l’espansione in una regione NON codificante (nel 5’ UTR o nel 1° introne) e il meccanismo patogenetico è la produzione di un mRNA con nuove caratteristiche l’unità ripetuta è diversa da gene a gene il range di espansione patologico è molto elevato (centinaia o addirittura migliaia di copie) 3. Malattie in cui il gene contiene l’espansione in una regione codificante sono malattie neurodegenerative l’unità base ripetuta è sempre CAG (codone che codifica per Glutamina malattie da poli-glutamine) sono a trasmissione Autosomica Dominante (tranne SBMA) il meccanismo patogenetico è l’acquisizione di funzione da parte della proteina mutata Variazioni su piccola e su larga scala Scherer et al (2007)-Nat Genet. 39: S7–15. A metà del primo decennio di questo secolo si è cominciata ad indagare la variabilità che coinvolge tratti di genoma di > 1 kb Risultati inattesi questo tipo di variabilità è piuttosto comune