Diapositiva 1 - Dipartimento di Farmacia

Il Genoma Umano
ca 1013 cellule/individuo.
Ciascuna con un genoma nucleare
e molti genomi mitocondriali.
Il genoma nucleare è composto
da ca 4x109 coppie di basi,
suddivise in 23 coppie di molecole
lineari: i cromosomi. Il più piccolo
contiene ca. 50.000.000 di nucleotidi,
il più grande ca. 250.000.000.
La Biologia Moderna
Progetti Genoma: Perchè?
La determinazione e la conoscenza dell’intera sequenza
genomica sembrano essere la condizione necessaria per
comprendere la completa biologia di un determinato
organismo
In che modo?
Sequenziamento del DNA significa determinazione della
sequenza lineare delle basi che lo compongono, cioè A, T,
C e G.
Il DNA umano è composto da 3.12 miliardi di paia di
basi
La Biologia Moderna: i Progetti Genoma
Un requisito essenziale alla comprensione della biologia
completa di un organismo è la determinazione della sequenza
del suo intero genoma
“A prerequisite to understanding the complete biology of an
organism is the determination of its entire genome sequence”
Fleischmann et al. 1995
2000-2001
Il Genoma Umano completamente sequenziato e assemblato
LE TAPPE DEL PROGETTO GENOMA
1953 James Watson e Francis Crick determinano la struttura del DNA (La doppia elica)
1977 Gli scienziati americani Allan Maxam and Walter Gilbert e l'inglese Frederick Sanger
mettono a punto 2 diversi metodi per sequenziare il DNA, cioè per "leggere" la successione
di basi nucleotidiche che lo compongono. Il metodo di Sanger, oggi automatizzato, è quello
tuttora utilizzato.
1985 Lo scienziato americano Kary Mullis inventa la PCR, una tecnica che permette di
moltiplicare artificialmente il DNA, anche se presente in quantità minima.
1986Il premio Nobel Renato Dulbecco e Leroy Hood lanciano l'idea di sequenziare l'intero
genoma Umano.
1990 Negli Stati Uniti nasce ufficialmente lo Human Genome Project (HGP), sotto la guida
di James Watson. Negli anni successivi Regno Unito, Giappone, Francia, Germania, Cina si
uniscono al progetto formando un consorzio pubblico internazionale. In Italia il progetto
genoma nasce nel 1987 ma si interrompe nel 1995.
1992 Craig Venter lascia l'NIH e il progetto pubblico. Fonderà una compagnia privata, la
Celera Genomics, portando avanti un progetto genoma parallelo.
1993 Francis Collins e John Sulston diventano direttori rispettivamente del National Human
Genome Research Center negli USA e del Sanger Center in Inghilterra, i 2 principali centri
coinvolti nel HGP.
1999 (Dicembre) Pubblicata su Nature la sequenza completa del cromosoma 22.
2000 (Maggio) pubblicata su Nature la sequenza completa del cromosoma 21.
2000 (Giugno) Francis Collins e Craig Venter annunciano congiuntamente di aver
completato la "bozza" del genoma Umano.
2001 La bozza completa del genoma umano (che gli inglesi chiamano working
draft) è pubblicata su Nature (quella del consorzio pubblico) e su Science (quella
della Celera).
Celera Genomics (Applera, Applied Biosystems)
Istituzioni pubbliche in:
USA,
UK,
China
Francia
Germania
Il genoma di un virus è composto da poche migliaia di bp
Dimensioni del Genoma
in Megabasi
Procarioti
Mycoplasma genitalium
Haemophilus influenzae
Escherichia coli
0.58
1.83
4.7
Eucarioti
Saccharomyces cerevisiae
Caenorabditis elegans
Drosophila melanogaster
Homo sapiens
13.5
100
165
3300
Genoma Umano
>3.000.000.000
Geni e sequenze associate
circa 900.000.000
Non codificante
810.000.000
Introni
DNA unico e a
basso numero
di copie
1.680.000.000
Codificante
90 .000.000
Pseudogeni
Regioni di
controllo
DNA extragenico
circa 2.100.000.000
Ripetuto in tandem
Minisatelliti
Microsatelliti
Satellite
DNA ripetitivo
420.000.000
Disperso
SINE
LINE
Retroposoni
Il DNA spazzatura è veramente tale?
•
•
•
•
•
1-Geni
2-pseudogeni
3-ripetizioni
4-minisatelliti
5-significato ignoto
GENI E SEQUENZE CORRELATE
-DNA codificante
-DNA non codificante
Funzione dei geni negli eucarioti
superiori
•Geni che codificano per prodotti
proteici;
•Geni che codificano per RNA non
codificanti (RNA-genes).
I geni possono essere classificati,
oltre che per la funzione, anche
per la rappresentatività e per
l’organizzazione
•Geni singoli
•Geni ripetuti
•Geni appartenenti a famiglie
•Geni in clusters
•Geni interspersi nel genoma
PSEUDOGENI: copia non funzionante di un gene
• CONVENZIONALI: gene inattivato a
causa di una o più mutazioni
• MATURATI: anomala espressione genica
DNA RIPETUTO
Il genoma nucleare contiene una grande quantità di sequenze
ripetute che sono in gran parte inattive da un punto di vista
trascrizionale
A. DNA RIPETUTO IN TANDEM
B: DNA RIPETTUTO INTERSPERSO
Classi principali del DNA ripetuto in tandem
Il DNA satellite è lungo e ripetitivo (riptetizioni di 171 nucletidi) e costitutisce
la massa principale dell’eterocromatina.
E’ il cosiddetto DNA alfoide o satellite a, 3-5%
ogni cromosoma.
Funzione poco chiara, probabilmente svolgono un ruolo strutturale.
Satellite 2 e 3 contengono schiere di sequenze che si basano sulla
ripetizione in tandem ATTCC
Il DNA minisatellite è ipervariabile ed è altamente polimorfico.
Sono più di 1000 scheramenti (100-20.000 bp) di corte unità ripetute in tandem.
La sequenza centrale è GGGCAGGAXG
Importante da punto di vista diagnostico: zona del DNA fingerprint.
Un minisatellite particolare è costituito dall’unità ripetuta TTAGGG (10-15 kb),
localizzato nei telomeri. Ha funzione protettiva dei cromosomi.
Il DNA microsatellite contine sequenze di 1-4 nucletidi ripetuti in tutto il genoma.
Le più comuni sono le dinucletidiche CA (0.5% del genoma; anche questo
è altamente polimorfico.
Organizzazione dei DNA satelliti nei centromeri
DNA RIPETUTO INTERSPERSO
Viene suddiviso in due principali famiglie:
•Short Interspersed Nucleotide Elements;
•Long Interspersed Nucleotide Elements
Classe
Famig lia
SINE
Alu
MIR
LINE
LINE-1 (Kpn)
LINE -2
Dimensioni un ità N° copie
ripetuta
0,3 kb lungh ezza 1.200.000 ca
completa
Dimensione
450.000 ca
media 0,13 kb
% Genoma
6,1 kb lungh ezza 2600.000 ca
completa, ma le
dimensioni medie
sono 0,8 kb
Dimensione
370.000
media 0,25 kb
Dimensione
240.000
media 1,3 kb
17,3%
LTR
ERV
Trasposoni a
DNA
MER-1 (Charlie) Dimensione
213.000
media 0,25 kb ca
10,7% ca
2,5% ca
3,3%
4,7%
1,4%
Il DNA mitocondriale
0.0005% del genoma umano
- doppio filamento a diversa composizione:
filamento heavy (H) e light (L)
- contiene 37 geni, 28 su filamento H e 9 su filamento L
- dei 37 geni, 24 codificano per prodotti maturi ad RNA e 13
per polipeptidi dei complessi multimerici del mitocondrio (concetto
di semiautonomia)
- i geni sono estremamente compatti:
privi di introni
sovrapposti parzialmente (subunita’ 6 e 8 dell’ATPas
trascritti privi di codoni di stop
- eredita’ matroclina
1
2
3
4
5
6
7
8
9
10
11
12
13 14
16
15
104
279
221
251
17
18
19 20
72
88
mitochondria
Y
.016
45 48
51
3.2*109 bp
Myoglobin
*5.000
b-globin
Exon 1 Exon 2
6*104 bp
*20
Exon 3
5’ flanking
DNA:
22
163
a globin
(chromosome 11)
21
86
118 107 100
148
143
142
176 163 148 140
197 198
66
X
3’ flanking
ATTGCCATGTCGATAATTGGACTATTTGGA
3*103 bp
*103
30 bp