GENI GENOMI e GENOMICA L’analisi dei complessi genomici eucariotici ha ormai raggiunto la dignita’ di una nuova scienza, infatti si parla di GENOMICA La nascita della genomica e’ stata la diretta conseguenza dello sviluppo e completamento dei vari “progetto-genoma” che si sono proposti, come fine ultimo il completo sequenziamento del genoma umano, oltre che di alcuni organismi di importanza strategica I vari progetti che sono stati varati per mappare e sequenziare gli interi genomi dell’uomo e di altri organismi aprono prospettive di ricerca entusiasmanti I dati di mappatura e di sequenziamento stanno producendo, ed in molti casi hanno prodotto, una ricchissima messe di nuove conoscenze sui processi biologici Questo approccio e’ particolarmente fruttuoso quando la comparazione di sequenze fra specie differenti consente di individuare quelle che sono evolutivamente conservate, e che e’ probabile codifichino proteine funzionalmente importanti Questa e’ una delle ragioni per cui sono oggetto di intenso studio dall’uomo anche i genomi di specie diverse http://www.ncbi.nlm.nih.gov/genomes/leuks.cgi I Genomi Eucariotici NCBI: 895 Eukaryotic Projects: Complete 37 Assembly 350 In Progress 508 Complete Published 1395 Archaeal: 94 Bacterial: 1168 Eukaryal: 133 Genome Genome Sequencing Projects: La scelta dei genomi da sequenziare è dettata da vari criteri: Organismi modello - facilità di manipolazione (lievito, Drosophila, C. elegans, Ciona, Danio) - modelli di studio per malattie umane (scimpanzé, topo, ratto) Specie parassite e patogene di interesse per la salute/ economia umana - Identificazione di marcatori molecolari utili per la diagnosi della patologia o per identificare target per la messa a punto di nuovi farmaci (es. Plasmodium, tripanosomi, etc.) Organismi “filogeneticamente interessanti - Organismi chiave per comprendere la storia evolutiva di un gruppo tassonomico (es. anfiosso, Ciona) Proprietà intrinseche del genoma - genoma relativamente piccolo rispetto ad altri organismi evolutivamente vicini, come per Arabidopsis thaliana e Fugu rubripes) I Genomi Eucariotici Distribuzione filogenetica dei progetti genomici nei Metazoi amphioxus DI COSA SI OCCUPA LA GENOMICA? In particolare si occupa della struttura, contenuto, funzione ed evoluzione del genoma. È una scienza che si basa sulla bioinformatica per l'elaborazione e la visualizzazione dell'enorme quantità di dati che produce. GENOMICA La data di nascita si fa coincidere con il sequenziamento completo del primo genoma, nel 1980: si trattava del genoma di un virus, il fago Φ-X174. Il primo sequenziamento del genoma di un organismo vero e proprio fu completato nel 1995 e si trattava di un batterio, Hemophilus influenzae, con un genoma di “notevoli” dimensioni (1,8 milioni di paia di basi. Da allora i genomi "completati" aumentano esponenzialmente Obiettivi della genomica •mappe genetiche e fisiche del DNA degli organismi viventi, mediante il suo completo sequenziamento. •La sequenza del DNA viene poi annotata, ovvero vengono identificati e segnalati tutti i geni e le altre porzioni di sequenza significative, insieme a tutte le informazioni conosciute su tali geni. • Inserimento delle informazioni in appositi database, accessibili via Internet (gratuitamente). •genomica comparativa, che si occupa del confronto tra i genomi di diversi organismi, nella loro organizzazione e sequenza. Esempio di output La genomica è stata affiancata più recentemente da nuove branche della biologia ad essa affini per modalità di approccio alla ricerca: Lista di "-oma" Di seguito sono riportati i più importanti "-oma" proposti recentemente all'interno della comunità scientifica Il trascrittoma è l'insieme degli mRNA trascritti nell'intero organismo, tessuto, cellula >> trascrittomica Il metaboloma comprende la totalità dei metaboliti presenti in un organismo >> metabolomica Il metalloma comprende la totalità delle specie di metalli e metalloidi >> metallomica Il lipidoma comprende la totalità dei lipidi >> lipidomica L' interattoma comprende la totalità delle interazioni molecolari che hanno luogo in un organismo; un nome che comunemente indica la disciplina della interattomica è quello di biologia dei sistemi (systems biology) Lo spliceoma (da non confondersi con lo spliceosoma, il complesso di proteine ed acidi nucleici coinvolti nello splicing) comprende la totalità delle isoforme proteiche dovute a splicing alternativo >> spliceomica L' ORFeoma comprende la totalità delle sequenze di DNA che iniziano con un codone ATG e terminano con un codone di stop (sequenze note come ORF, open reading frames) >> ORFeomica Kinoma: l'insieme delle protein chinasi (dall'inglese kinase) di una cellula >> kinomica Glicosiloma: correlato alle reazioni di glicosilazione >> glicosilomica) Fisioma: correlato alla fisiologia >> fisiomica) Neuroma: l'insieme delle componenti nervose di un organismo >> neuromica) Predittoma: l'insieme delle predizioni di struttura proteica Reattoma: l'insieme dei processi biologici Organizzazione del genoma umano GENOMA UMANO Genoma mitocondriale 16.6 kb 37 geni Genoma nucleare 25-30000 geni 30% Geni e sequenze annesse 70% DNA Intergenico Unico o moderatamente ripetuto 10% 90% DNA DNA codificante non codificante Pseudogeni frammenti genici due geni per rRNA 22 geni per tRNA 80% Unico o basso numero di copie 13 geni codificanti proteine 20% Moderatamente o altamente ripetuto Introni, UTR Tandem repeats Repeats interspersi Organizzazione del genoma umano Genoma nucleare 3200Mb Geni e sequenze annesse 1200Mb Geni 48Mb Pseudogeni DNA Intergenico 2000Mb Sequenze correlate 1152Mb frammenti genici LINE 640Mb Ripetizioni Intersperse 1400Mb Introni, UTR Microsatelliti 90Mb Elementi LTR 250Mb SINE 420Mb Trasposoni a DNA 90b Altre regioni intersperse 600Mb Varie 510Mb Cosa e’ un gene? Che cosa è un GENE L’avvento dell’era genomica ha messo in crisi la tradizionale definizione di GENE, tuttora molto dibattuta. Lewin B. Il Gene VIII Segmento di DNA coinvolto nella produzione di una catena polipeptidica, comprende regioni (leader e coda) che precedono e seguono la regione codificante, oltre alle sequenze intercalate (introni) tra i singoli elementi codificanti (esoni). Brown T.A. Genomi 2 Un segmento di DNA contenente informazioni biologiche, che codifica per una molecola di RNA e/o proteina. Ovviamente, se non ci si accorda sulla definizione di gene, non è possibile determinarne il numero, anche assumendo di disporre della annotazione completa del genoma. Un gene e’ una sequenza di DNA che specifica le informazioni richieste dalla cellula per fare uno specifico prodotto. La sequenza di DNA di un gene specifica inoltre quando, quanto ed in che tipo di cellule il prodotto deve essere fatto. intron Exon 1 Enhancer Promoter intron Exon 2 Exon 3 Transcription termination Promoters Elements Core promoter Proximal promoter Distal promoter (Enhancer) CORE PROMOTER posizionato PROM. PROSSIMALE regione sufficiente a deteminare il TSS esatto; approssimativamente a - 35 dal TTS; sito di legame dei GTF 200-300 bp upstream al TSS; sito di legame di TF specifici; responsabile, almeno in parte, della modulazione della espressione PROMOTORE DISTALE 100 bp – 2 Mb; sito di legame di TF specifici Definizione di GENE Per giungere ad una definizione il più possibile corretta di GENE è necessario conoscerne le caratteristiche principali. • Un gene può utilizzare diversi promotori • La trascrizione di un gene si può arrestare in corrispondenza di diversi terminatori • I trascritti espressi da un gene possono subire splicing alternativo che generano trascritti che differiscono sia nelle regioni non tradotte (5’ e 3’UTR) che nella regione codificante I geni possono essere sovrapposti I geni possono essere sovrapposti tra loro, nello stesso orientamento o in orientamento opposto, o anche essere completamente contenuti in altri geni. L’introne 26 del gene neurofibromatosis type I (NF1) contiene 3 geni diversi nell’orientamento opposto (OMGP, EVI2A, EVI2B). I Genomi degli Eucarioti:Compattezza I genomi degli eucarioti hanno una densità genica molto variabile. Nei genomi dei procarioti unicellulari, che sono di dimensioni ridotte, la densità genica è molto alta e ricorda quella dei genomi procariotici. In figura è rappresentato un segmento del genoma di lievito che presenta 26 geni + 2 tRNA. I suoi geni sono molto poveri di introni e di elementi ripetuti (3,4% del genoma) I Genomi degli Eucarioti:Compattezza I genomi degli eucarioti più complessi hanno genomi meno compatti. In Drosophila, che presenta un organismo più complesso del lievito ma meno dei mammiferi, presenta una densità genica intermedia tra queste. Nel segmento corrispondente troviamo meno geni (11) con più introni ed elementi ripetuti (12% del genoma). I Genomi degli Eucarioti:Compattezza I genomi dei mammiferi, e l’uomo ne è un tipico esempio, eucarioti hanno una densità genica molto ridotta. In media, i geni codificanti per proteine occupano solo il 1-3% dell’intero genoma. La scarsa compattezza del genoma nucleare è dovuta alla struttura discontinua dei geni, con introni che nei mammiferi possono raggiungere dimensioni intorno a 20-30 kpb (ed oltre) e alla presenza di elementi ripetuti (44% del genoma). I geni eucariotici sono monocistronici, tuttavia strutture simili agli operoni batterici sono state descritte in C. elegans. I Genomi degli Eucarioti:Compattezza Nelle piante infine troviamo delle situazioni ancora più spinte verso la diminuzione della compattezza Assenza di correlazione tra numero di geni e dimensione del genoma negli eucarioti Gene number Genome s ize (M b) 100000 10000 1000 100 10 1 human mous e c hic ken xenopus zebrafis h fugu c iona fly worm yeas t