Lezione 3
Genoma umano come esempio
di genoma eucariote
3.2 x 109 bp
Genoma umano
22 autosomi + xx (femmina) o xy (maschio)
Primo draft di sequenza: 2001
• Genotipo: sequenza di DNA, sia nucleare che mitocondriale. (Per le piante anche il DNA del
cloroplasto)
• Fenotipo: l’inisieme dei tratti che si osservano, incluse proprietà macroscopiche come
l’altezza, il peso, il colore di occhi e capelli; incluse proprietà microscopiche come
un’eventuale anemia falciforme, la deficienza della glucoso-6-fosfato deidrogenasi, o la
capacità di digerire il lattosio oltre lo svezzamento.
• Storia personale: l’insieme delle esperienze e l’ambiente fisico e psicologico in cui ci si
sviluppa. Fattori come la nutrizione, gli stimoli intellettuali, le esperienze nell’ambiente
uterino hanno grande influenza sullo sviluppo individuale.
• Fattori epigenetici: ogni tessuto differenziato ha un suo set di geni espressi o silenziati.
Durante lo sviluppo, reazioni chimiche precise e interconnesse attivano o disattivano parte
del genoma in momenti e posizioni strategiche. Questi controlli possono cambiare durante la
vita e rispondono a stimoli esterni come dieta stress etc.
http://learn.genetics.utah.edu/content/epigenetics/
Genomi eucarioti
• Regioni codificanti proteine (uomo: 2-3%)
• Regioni codificanti RNA strutturali (es. rRNA)
• DNA moderatamente ripetitivo
•
•
•
•
Famiglie geniche come actina, globine
Geni per RNA ribosomali (ripetuti in centinaia di copie)
tRNA (50 siti ognuno con 10/100 copie nell’uomo)
Geni per istoni in molte specie
• Elementi ripetuti a funzione non nota (es. SINE (tra cui le Alu
nei primati) e LINE) e altamente ripetuti (es. mini e
microsatelliti o STR), Telomeri (corte unità ripetitive TTAGGG
nell’uomo)
• Regioni intergeniche non ripetute
• Regioni funzionali ancora da definire con esattezza (ENCODE
http://www.nature.com/encode/#/threads)
The transposable element content of the human genome
About 45% of the human genome can currently be recognized as being derived from transposable
elements, the vast majority of which are non-LTR retrotransposons such as L1, Alu and SVA elements. L1,
LINE-1; LTR, long terminal repeat.
Distribuzione nel genoma dei diversi tipi
di marcatori molecolari polimorfici
Tassi di mutazione
I microsatelliti (short tandem repeats, STRs)
Sequenze ripetitive di 2-5 paia di basi in tandem
Regioni codificanti il proteoma
• Genoma umano: ~ 20.000 geni codificanti proteine. Alcune regioni povere:
regioni subtelomeriche, cromosoma 18 e X. Viceversa il 19 e il 22 sono
relativamente ricchi.
Molte bande G chiare
Molte bande G scure
http://www.ensembl.org/Homo_sapiens/Location/Genome
Regioni codificanti il proteoma
• Esoni e introni (con eccezioni): lunghezza media di un
esone: 200 bp
• La grande varietà di dimensione dei geni dipende
soprattutto dagli introni: gene per l’insulina 1.7 kb,
LDL receptor 5.45 kb, dystrophin gene 2400 kb
• Esistono regioni codificanti su entrambi i filamenti
http://www.ensembl.org/
Un esempio specifico: la famiglia delle globine
Il lucus α-globin sul cromosoma 16
p13.3
NCBI map viewer: regione genomica p13.3 cromosoma 16
Regione 100k-200k
NCBI map viewer > human > cromosome 16
The α-globin locus:
Cinque geni espressi, ζ, αD, α2, α1, e θ1,
e due pseudogeni, ψζ e ψa1
Il lucus β-globin sul cromosoma 11
NCBI map viewer: regione genomica p15 cromosoma 11
Regione 5M-5.5M
The β-globin locus:
Quattro geni espressi e uno pseudogene
Numerose duplicazioni e divergenze
Paraloghi: geni che si sono originati da un antenato comune in seguito a duplicazione
genica.
L’ordine dei geni sul cromosoma ha un significato: la trascrizione segue rigidamente lo
sviluppo dell’organismo.
Embrione (fino a 6 settimane dopo il concepimento): tetramero ζ2ε2. A seguire, fino a
ceirca 8 settimane dopo la nascita la specie predominante diventa l’emoglobina fetale,
α2γ2, segue poi l’emoglobina adulta, principalemente α2 β2.
L'emoglobina nell' adulto e di tipo HbA 96% α2β2, HbA2 α2δ2 3% e HbF α2γ2 1%
Controllo dell’espressione del cluster β: locus control region
β-Globin region: geni
codificanti e Locus Control
Region, che consiste di
cinque DNAse
hypersensitive
segments.
Feto: interazione tra il locus
control region e i geni Gγ
and Aγ genes, mediata da
proteine. Cerchi blu:
complessi di
rimodellamento della
cromatina.
Cerchio azzurro: complesso
proteico PYR che lega la
regione ricca di pirimidine (YR;
Y = pirimidine) al 5′ del gene.
Questo legame riconfigura il
sistema: PYR blocca il controllo
“fetale”, menter la locus
control region promuove
l’espressione del gene β.
Proviamo a recuperare i seguenti dati da
Genbank e da altre banche dati di NCBI
(esercizio simile all’esame)
Possiamo per esempio usare il numero di accesso GenBank:
NG_000006.1 e cercare tra i geni della regione l’HBA1
• Quanto è grande la regione codificante il gene per l’emoglobina HBA1?
•
Risposta: la regione codificante (CDS) è composta da 429 nucleotidi incluso lo stop
codon (nel dettaglio Esone 1*: 95 bp; Esone 2: 205; Esone 3*: 129)
*sono incluse solo le basi che codificano, esclusi i 5’ e 3’ UTR
• Quanti esoni e quanti introni?
•
3 esoni e 2 introni
• Qual è la sequenza della proteina?
•
MVLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFDLSHGSAQVKGHGKKVA
DALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPAEFTPAVHASLDKFLA
SVSTVLTSKYR
• Ci sono malattie conosciute che siano state messe in relazione con
mutazioni a questo gene? SI, vedi OMIM 141800
• Si conoscono le mutazioni specifiche? SI, vedi OMIM 141800 ALLELIC
VARIANTS
Proviamo a recuperare gli stessi
dati da ENSEMBL
• Esempio: ENST00000320868
Proviamo a cercare le informazioni
su lunghezza di esoni e introni del
gene CYP2D6 in genbank