Genomica Lez.1 - Dipartimento di Biologia

GENI GENOMI e GENOMICA
L’analisi dei complessi genomici eucariotici ha ormai
raggiunto la dignita’ di una nuova scienza, infatti si
parla di GENOMICA
La
nascita
della
genomica
e’
stata
la
diretta
conseguenza dello sviluppo e completamento dei vari
“progetto-genoma” che si sono
proposti, come
fine ultimo il completo sequenziamento del genoma
umano, oltre che di alcuni organismi di importanza
strategica
I vari progetti che sono stati varati per mappare e
sequenziare gli interi genomi dell’uomo e di altri
organismi aprono prospettive di ricerca entusiasmanti
I dati di mappatura e di sequenziamento stanno
producendo, ed in molti casi hanno prodotto, una
ricchissima messe di nuove conoscenze sui processi
biologici
Questo approccio e’ particolarmente fruttuoso quando
la comparazione di sequenze fra specie differenti
consente di individuare quelle che sono evolutivamente
conservate, e che e’ probabile codifichino proteine
funzionalmente importanti
Questa e’ una delle ragioni per cui sono oggetto di
intenso
studio
dall’uomo
anche
i
genomi
di
specie
diverse
http://www.ncbi.nlm.nih.gov/genomes/leuks.cgi
I Genomi Eucariotici
NCBI:
895
Eukaryotic
Projects:
Complete 37
Assembly 350
In Progress 508
Complete Published
1395
Archaeal: 94
Bacterial: 1168
Eukaryal: 133
Genome
Genome
Sequencing
Projects:
La scelta dei genomi da sequenziare è dettata da vari criteri:
Organismi modello
- facilità di manipolazione (lievito, Drosophila, C. elegans, Ciona, Danio)
- modelli di studio per malattie umane (scimpanzé, topo, ratto)
Specie parassite e patogene di interesse per la salute/ economia umana
- Identificazione di marcatori molecolari utili per la diagnosi della
patologia o per identificare target per la messa a punto di nuovi
farmaci (es. Plasmodium, tripanosomi, etc.)
Organismi “filogeneticamente interessanti
- Organismi chiave per comprendere la storia evolutiva di un gruppo
tassonomico (es. anfiosso, Ciona)
Proprietà intrinseche del genoma
- genoma relativamente piccolo rispetto ad altri organismi evolutivamente
vicini, come per Arabidopsis thaliana e Fugu rubripes)
I Genomi Eucariotici
Distribuzione filogenetica dei progetti genomici nei Metazoi
amphioxus
DI COSA SI OCCUPA LA GENOMICA?
In particolare si occupa della struttura,
contenuto, funzione ed evoluzione del
genoma.
È una scienza
che
si
basa sulla
bioinformatica per l'elaborazione e la
visualizzazione dell'enorme quantità di dati
che produce.
GENOMICA
La data di nascita si fa coincidere con il sequenziamento completo del
primo genoma, nel 1980: si trattava del genoma di un virus, il fago
Φ-X174.
Il primo sequenziamento del genoma di un organismo vero e proprio fu
completato nel 1995 e si trattava di un batterio, Hemophilus influenzae,
con un genoma di “notevoli” dimensioni (1,8 milioni di paia di basi.
Da allora i genomi "completati" aumentano esponenzialmente
Obiettivi della genomica
•mappe genetiche e fisiche del DNA degli organismi viventi, mediante il
suo completo sequenziamento.
•La sequenza del DNA viene poi annotata, ovvero vengono identificati e
segnalati tutti i geni e le altre porzioni di sequenza significative, insieme
a tutte le informazioni conosciute su tali geni.
• Inserimento delle informazioni in appositi database, accessibili via
Internet (gratuitamente).
•genomica comparativa, che si occupa del confronto tra i genomi di
diversi organismi, nella loro organizzazione e sequenza.
Esempio di output
La genomica è stata affiancata più recentemente da
nuove branche della biologia ad essa affini per modalità
di approccio alla ricerca:
Lista di "-oma"
Di seguito sono riportati i più importanti "-oma" proposti recentemente all'interno della comunità
scientifica
Il trascrittoma è l'insieme degli mRNA trascritti nell'intero organismo, tessuto, cellula >> trascrittomica
Il metaboloma comprende la totalità dei metaboliti presenti in un organismo >> metabolomica
Il metalloma comprende la totalità delle specie di metalli e metalloidi >> metallomica
Il lipidoma comprende la totalità dei lipidi >> lipidomica
L' interattoma comprende la totalità delle interazioni molecolari che hanno luogo in un organismo; un
nome che comunemente indica la disciplina della interattomica è quello di biologia dei sistemi (systems
biology)
Lo spliceoma (da non confondersi con lo spliceosoma, il complesso di proteine ed acidi nucleici coinvolti nello
splicing) comprende la totalità delle isoforme proteiche dovute a splicing alternativo >> spliceomica
L' ORFeoma comprende la totalità delle sequenze di DNA che iniziano con un codone ATG e terminano con
un codone di stop (sequenze note come ORF, open reading frames) >> ORFeomica
Kinoma: l'insieme delle protein chinasi (dall'inglese kinase) di una cellula >> kinomica
Glicosiloma: correlato alle reazioni di glicosilazione >> glicosilomica)
Fisioma: correlato alla fisiologia >> fisiomica)
Neuroma: l'insieme delle componenti nervose di un organismo >> neuromica)
Predittoma: l'insieme delle predizioni di struttura proteica
Reattoma: l'insieme dei processi biologici
Organizzazione del genoma umano
GENOMA UMANO
Genoma mitocondriale
16.6 kb
37 geni
Genoma nucleare
25-30000 geni
30%
Geni e sequenze
annesse
70%
DNA
Intergenico
Unico o moderatamente ripetuto
10%
90%
DNA
DNA
codificante
non codificante
Pseudogeni
frammenti
genici
due geni
per rRNA
22 geni
per tRNA
80%
Unico o basso
numero di copie
13 geni
codificanti
proteine
20%
Moderatamente
o altamente
ripetuto
Introni,
UTR
Tandem
repeats
Repeats
interspersi
Organizzazione del genoma umano
Genoma nucleare
3200Mb
Geni e sequenze
annesse 1200Mb
Geni
48Mb
Pseudogeni
DNA Intergenico
2000Mb
Sequenze correlate
1152Mb
frammenti
genici
LINE
640Mb
Ripetizioni
Intersperse
1400Mb
Introni,
UTR
Microsatelliti
90Mb
Elementi LTR
250Mb
SINE
420Mb
Trasposoni a DNA
90b
Altre regioni
intersperse
600Mb
Varie
510Mb
Cosa e’ un gene?
Che cosa è un GENE
L’avvento dell’era genomica ha messo in crisi la tradizionale definizione di
GENE, tuttora molto dibattuta.
Lewin B. Il Gene VIII
Segmento di DNA coinvolto nella produzione di una catena polipeptidica,
comprende regioni (leader e coda) che precedono e seguono la regione
codificante, oltre alle sequenze intercalate (introni) tra i singoli elementi
codificanti (esoni).
Brown T.A. Genomi 2
Un segmento di DNA contenente informazioni biologiche, che codifica per una
molecola di RNA e/o proteina.
Ovviamente, se non ci si accorda sulla definizione di gene, non è possibile
determinarne il numero, anche assumendo di disporre della annotazione
completa del genoma.
Un gene e’ una sequenza di DNA che
specifica le informazioni richieste dalla
cellula per fare uno specifico prodotto.
La sequenza di DNA di un gene specifica
inoltre quando, quanto ed in che tipo di
cellule il prodotto deve essere fatto.
intron
Exon 1
Enhancer
Promoter
intron
Exon 2
Exon 3
Transcription
termination
Promoters Elements
Core promoter
Proximal promoter
Distal promoter
(Enhancer)
CORE PROMOTER
posizionato
PROM. PROSSIMALE
 regione sufficiente a deteminare il TSS esatto;
approssimativamente a - 35 dal TTS; sito di legame dei GTF
 200-300 bp upstream al TSS; sito di legame di TF specifici;
responsabile, almeno in parte, della modulazione della espressione
PROMOTORE DISTALE 100 bp – 2 Mb; sito di legame di TF specifici
Definizione di GENE
Per giungere ad una definizione il più possibile corretta di GENE è necessario conoscerne le
caratteristiche principali.
• Un gene può utilizzare diversi promotori
• La trascrizione di un gene si può arrestare in corrispondenza di diversi terminatori
• I trascritti espressi da un gene possono subire splicing alternativo che generano trascritti che
differiscono sia nelle regioni non tradotte (5’ e 3’UTR) che nella regione codificante
I geni possono essere sovrapposti
I geni possono essere sovrapposti tra loro, nello stesso orientamento o in
orientamento opposto, o anche essere completamente contenuti in altri
geni.
L’introne 26 del gene neurofibromatosis type I (NF1) contiene 3 geni diversi
nell’orientamento opposto (OMGP, EVI2A, EVI2B).
I Genomi degli Eucarioti:Compattezza
I genomi degli eucarioti hanno una densità genica molto variabile.
Nei genomi dei procarioti unicellulari, che sono di dimensioni ridotte, la densità genica
è molto alta e ricorda quella dei genomi procariotici. In figura è rappresentato un
segmento del genoma di lievito che presenta 26 geni + 2 tRNA.
I suoi geni sono molto poveri di introni e di elementi ripetuti (3,4% del genoma)
I Genomi degli Eucarioti:Compattezza
I genomi degli eucarioti più complessi hanno genomi meno compatti.
In Drosophila, che presenta un organismo più complesso del lievito ma meno dei
mammiferi, presenta una densità genica intermedia tra queste.
Nel segmento corrispondente troviamo meno geni (11) con più introni ed elementi
ripetuti (12% del genoma).
I Genomi degli Eucarioti:Compattezza
I genomi dei mammiferi, e l’uomo ne è un tipico esempio, eucarioti hanno una
densità genica molto ridotta.
In media, i geni codificanti per proteine occupano solo il 1-3% dell’intero genoma.
La scarsa compattezza del genoma nucleare è dovuta alla struttura discontinua
dei geni, con introni che nei mammiferi possono raggiungere dimensioni intorno a
20-30 kpb (ed oltre) e alla presenza di elementi ripetuti (44% del genoma).
I geni eucariotici sono monocistronici, tuttavia strutture simili agli operoni
batterici sono state descritte in C. elegans.
I Genomi degli Eucarioti:Compattezza
Nelle piante infine troviamo delle situazioni ancora più spinte verso la diminuzione
della compattezza
Assenza di correlazione tra numero di geni e dimensione
del genoma negli eucarioti
Gene number
Genome s ize (M b)
100000
10000
1000
100
10
1
human
mous e
c hic ken
xenopus
zebrafis h
fugu
c iona
fly
worm
yeas t