Lezione 3 Genoma umano come esempio di genoma eucariote 3.2 x 109 bp Genoma umano 22 autosomi + xx (femmina) o xy (maschio) Primo draft di sequenza: 2001 • Genotipo: sequenza di DNA, sia nucleare che mitocondriale. (Per le piante anche il DNA del cloroplasto) • Fenotipo: l’inisieme dei tratti che si osservano, incluse proprietà macroscopiche come l’altezza, il peso, il colore di occhi e capelli; incluse proprietà microscopiche come un’eventuale anemia falciforme, la deficienza della glucoso-6-fosfato deidrogenasi, o la capacità di digerire il lattosio oltre lo svezzamento. • Storia personale: l’insieme delle esperienze e l’ambiente fisico e psicologico in cui ci si sviluppa. Fattori come la nutrizione, gli stimoli intellettuali, le esperienze nell’ambiente uterino hanno grande influenza sullo sviluppo individuale. • Fattori epigenetici: ogni tessuto differenziato ha un suo set di geni espressi o silenziati. Durante lo sviluppo, reazioni chimiche precise e interconnesse attivano o disattivano parte del genoma in momenti e posizioni strategiche. Questi controlli possono cambiare durante la vita e rispondono a stimoli esterni come dieta stress etc. http://learn.genetics.utah.edu/content/epigenetics/ Genomi eucarioti • Regioni codificanti proteine (uomo: 2-3%) • Regioni codificanti RNA strutturali (es. rRNA) • DNA moderatamente ripetitivo • • • • Famiglie geniche come actina, globine Geni per RNA ribosomali (ripetuti in centinaia di copie) tRNA (50 siti ognuno con 10/100 copie nell’uomo) Geni per istoni in molte specie • Elementi ripetuti a funzione non nota (es. SINE (tra cui le Alu nei primati) e LINE) e altamente ripetuti (es. mini e microsatelliti o STR), Telomeri (corte unità ripetitive TTAGGG nell’uomo) • Regioni intergeniche non ripetute • Regioni funzionali ancora da definire con esattezza (ENCODE http://www.nature.com/encode/#/threads) The transposable element content of the human genome About 45% of the human genome can currently be recognized as being derived from transposable elements, the vast majority of which are non-LTR retrotransposons such as L1, Alu and SVA elements. L1, LINE-1; LTR, long terminal repeat. Distribuzione nel genoma dei diversi tipi di marcatori molecolari polimorfici Tassi di mutazione I microsatelliti (short tandem repeats, STRs) Sequenze ripetitive di 2-5 paia di basi in tandem Regioni codificanti il proteoma • Genoma umano: ~ 20.000 geni codificanti proteine. Alcune regioni povere: regioni subtelomeriche, cromosoma 18 e X. Viceversa il 19 e il 22 sono relativamente ricchi. Molte bande G chiare Molte bande G scure http://www.ensembl.org/Homo_sapiens/Location/Genome Regioni codificanti il proteoma • Esoni e introni (con eccezioni): lunghezza media di un esone: 200 bp • La grande varietà di dimensione dei geni dipende soprattutto dagli introni: gene per l’insulina 1.7 kb, LDL receptor 5.45 kb, dystrophin gene 2400 kb • Esistono regioni codificanti su entrambi i filamenti http://www.ensembl.org/ Un esempio specifico: la famiglia delle globine Il lucus α-globin sul cromosoma 16 p13.3 NCBI map viewer: regione genomica p13.3 cromosoma 16 Regione 100k-200k NCBI map viewer > human > cromosome 16 The α-globin locus: Cinque geni espressi, ζ, αD, α2, α1, e θ1, e due pseudogeni, ψζ e ψa1 Il lucus β-globin sul cromosoma 11 NCBI map viewer: regione genomica p15 cromosoma 11 Regione 5M-5.5M The β-globin locus: Quattro geni espressi e uno pseudogene Numerose duplicazioni e divergenze Paraloghi: geni che si sono originati da un antenato comune in seguito a duplicazione genica. L’ordine dei geni sul cromosoma ha un significato: la trascrizione segue rigidamente lo sviluppo dell’organismo. Embrione (fino a 6 settimane dopo il concepimento): tetramero ζ2ε2. A seguire, fino a ceirca 8 settimane dopo la nascita la specie predominante diventa l’emoglobina fetale, α2γ2, segue poi l’emoglobina adulta, principalemente α2 β2. L'emoglobina nell' adulto e di tipo HbA 96% α2β2, HbA2 α2δ2 3% e HbF α2γ2 1% Controllo dell’espressione del cluster β: locus control region β-Globin region: geni codificanti e Locus Control Region, che consiste di cinque DNAse hypersensitive segments. Feto: interazione tra il locus control region e i geni Gγ and Aγ genes, mediata da proteine. Cerchi blu: complessi di rimodellamento della cromatina. Cerchio azzurro: complesso proteico PYR che lega la regione ricca di pirimidine (YR; Y = pirimidine) al 5′ del gene. Questo legame riconfigura il sistema: PYR blocca il controllo “fetale”, menter la locus control region promuove l’espressione del gene β. Proviamo a recuperare i seguenti dati da Genbank e da altre banche dati di NCBI (esercizio simile all’esame) Possiamo per esempio usare il numero di accesso GenBank: NG_000006.1 e cercare tra i geni della regione l’HBA1 • Quanto è grande la regione codificante il gene per l’emoglobina HBA1? • Risposta: la regione codificante (CDS) è composta da 429 nucleotidi incluso lo stop codon (nel dettaglio Esone 1*: 95 bp; Esone 2: 205; Esone 3*: 129) *sono incluse solo le basi che codificano, esclusi i 5’ e 3’ UTR • Quanti esoni e quanti introni? • 3 esoni e 2 introni • Qual è la sequenza della proteina? • MVLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFDLSHGSAQVKGHGKKVA DALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPAEFTPAVHASLDKFLA SVSTVLTSKYR • Ci sono malattie conosciute che siano state messe in relazione con mutazioni a questo gene? SI, vedi OMIM 141800 • Si conoscono le mutazioni specifiche? SI, vedi OMIM 141800 ALLELIC VARIANTS Proviamo a recuperare gli stessi dati da ENSEMBL • Esempio: ENST00000320868 Proviamo a cercare le informazioni su lunghezza di esoni e introni del gene CYP2D6 in genbank