Communicato stampa Avanzamento veloce per la ricerca biomedicale Una gigantesca enciclopedia del DNA decifra le sequenze non-codanti Hinxton, il 6 settembre 2012 – Oggi, un consorzio internazionale di scienzati rivela che la maggior parte di quello che viene comunemente chiamato ‘DNA spazzatura’ nell’uomo è in realtà un intricato pannello di controllo con milioni di interrutori che regolano l’attività dei nostri geni. Senza questi « switches » i geni non potrebbero funzionare, e mutazioni in queste regioni del genoma potrebbero essere responsabili di malattie umane. Questa scoperta è stata fatta da alcune centinaia di ricercatori nel progetto ENCODE e i risultati, assai ricchi e complessi, hanno portato all’introduzione di un nuovo tipo di pubblicazione scientifica in cui pubblicazioni elettroniche e dati sono interconnessi. Cosí come l’Human Genome Project ha rivoluzionato la ricerca biomedicale, cosí ENCODE porterà a una migliore comprensione, e alla nascita di nuove aree di ricerca, in campo biomedico. Coordinato dal National Genome Research Institute (NHGRI) negli Stati Uniti e dall’EMBL-European Bioinformatics Institute (EMBL-EBI) in Gran Bretagna, ENCODE presenta una mappa dettagliata delle funzionalità del genoma, identificando 4 milioni di switch che regulano l’attività genica. Questa informazione di riferimento aiuterà i scienzati a focalizzarsi su aree di ricerca molto specifiche nel campo delle malattie umane. Le scoperte sono pubblicate in 30 articoli open-access, tutti interconnessi, in 3 giornali scientifici: Nature, Genome Biology e Genome Research. “Il nostro genoma è vivo e attivo grazie a questi interrutori: milioni di regioni genomiche che determinano sè un gene è attivo o no”, dice Ewan Birney, coordinatore dell’analisi dei dati per ENCODE. “L’Human Genome Project ha dimostrato che solo il 2% del genoma contiene geni codificanti per proteine. Con ENCODE abbiamo scoperto che, in realtà, l’80% del genoma ha un ruolo attivo. Una porzione molto più ampia del genoma, una proporzione sorprendente in effetti, è coinvolta nel controllare quando e dove le proteine, i principali costituenti della cellula, vengono prodotte.” “I dati di ENCODE possono essere utilizzati da qualsiasi ricercatore, indipendentemente dalla patologia di interesse” secondo Ian Dunham dell’EMBL-EBI, che ha svolto un ruolo chiave nel coordinare l’analisi. “In molti casi sappiamo abbastanza precisamente quali geni sono coinvolti in una malattia, ma non quali interrutori li controllano. Talvolta questi interrutori ci sorprendono perchè la loro localizzazione sul genoma potrebbe associarli con una malattia completamente diversa da quella in cui sono coinvolti. ENCODE fornisce importanti indicazioni da sequire per scoprire i meccanismi chiave convolti in processi fisiologici e patologici. Queste informazioni potrebbero essere utilizzate per creare nuovi farmaci o riposizionare farmaci gia’ utilizzati.” “ENCODE fornisce una conoscenza che va al di là della semplice sequenza del genoma, dimostrando come le diverse parti del sistema sono interconnesse” commenta Dr Michael Snyder, professore alla Stanford University e uno dei principali investigatori di ENCODE. “Stiamo solo ora incominciando a capire che le informazioni generate in studi di associazione genome-wide non riguardano solo i geni ma anche i meccanismi che ne controllano l’attivazione. A causa della complessa natura tridimensionale del genoma, le regioni che controllano l’attivazione di un gene possono essere collocate molto lontano del gene stesso e richiedere curve e piegamenti per entrare in contatto. Se non fosse per ENCODE, non avremmo mai scoperto tali regioni. Questo è un passo fondamentale per capire come funziona l’essere umano. ENCODE ci aiuta a studiare in profondità i meccanismi regulatori e come le diverse componenti del sistema si collegono per formare un essere complesso." Fino ad ora, generare ed archiviare grandi quantità di dati era sempre stato un’importante problema in campo biomedico. Ma ora, con il calo dei costi e l’aumento della produzione di sequenze genomiche, la sfida si è mossa verso l’analisi dei dati, nell’interpretazione dei dati prodotti dai studi di associazione genome-wide. I collaboratori di ENCODE hanno lavorato in maniera sistematica, utilizzando gli stessi approcci sperimentali e computazionali che si ritrovano in tutti i laboratori al livello mondiale. ENCODE ha coinvolto 442 scienziati in 32 laboratori in GB, USA, Spagna, Svizzera, Singapore e Giappone. 15 terabytes (15 milliardi di bytes) di dati grezzi sono stati prodotti, ora tutti disponibili nel pubblico dominio. L’ equivalente di 300 anni di potere computazionale sono stati necessari per studiare 147 tipi di tessuti e determinare cosa potesse attivare, o disattivare, l’espressione genica, e come questi meccanismi siano diversi da un tipo cellulare all’altro. Gli articoli pubblicati oggi equivalgono a centinaia di pagine di carta stampata, un concetto obsoleto secondo il gruppo editoriale Nature. Tutte le pubblicazioni di ENCODE sono disponibili in versione digitale, interconnesse tra loro e divise in aree tematiche, cosí che i lettori possano identificare un’area di interesse comune tra gli articoli e individuare i dati associati. « La collaborazione tra esperti nelle diverse aree di ricerca è stata la chiave del successo, » spiega Ewan Birney. « ENCODE ha dimostrato come scienzati tra i più influenti, possano lavorare in stretta collaborazione per produrre risorse fondamentali che Contatti: [email protected] Mary Todd-Bergman, Outreach Programme project Leader, Hinxton, UK, Tel: +44 1223 494665, www.ebi.ac.uk Isabelle Kling, Project officer EMBL, Heidelberg, Germany, Tel.: +49 6221 387 8355, www.embl.org, [email protected] possano essere utilizzate dall’intera communita’ scientifica. » « Fino ad ora, la maggior parte dei dati sono stati pubblicati in maniera frammentata e spesso relegate in pubblicazioni statiche a destinazione di una porzione ristretta della communità scientifica. Come puo’ un ricercatore al di fuori di quella specifica communita’ scientifica accedere a queste informazioni se non sa dove trovarle? », commenta Roderic Guigo del Centro de Regulació Genómica (CRG) di Barcelona. “Adesso abbiamo un enciclopedia interattiva che tutti possono utilizzare come punto di riferimento e che farà un’importante differenza.” Fonte articolo Per consultare la liste intera degli articoli pubblicati, prego visita: www.embl.org/press/2012/120905_Hinxton. Contatti: [email protected] Mary Todd-Bergman, Outreach Programme project Leader, Hinxton, UK, Tel: +44 1223 494665, www.ebi.ac.uk Isabelle Kling, Project officer EMBL, Heidelberg, Germany, Tel.: +49 6221 387 8355, www.embl.org, [email protected] ENCODE in cifre Membri del consorzio (Autori dell' articolo principale in 442 Nature1) Instituti con partecipazione attiva 32 (negli USA, GB, Spagna, Svizzera, Giappone et Singapore) PIs (Principal Investigators) 24 Articoli publicato in Nature 6 1 Articoli publicato in Genome Research 17 1 Articoli publicato in Genome Biology1 6 Articoli publicato in BMC Principal aree tematiche a partire dell'articolo principale Elementi speciali 1 2 3 13 3 machine virtuali 1 website 1 applicazioni iPad Tipi cellulari studiati 147 Sperimenti svolti 1649 Numero di anticorpi CHIPati 235 Numero di fattori di trascrizione identificati 119 proteina Numero di localizzazione dove un gene tocca una ~ 4 000 000 Dati Taglia della Figura 1 – tutti i dati rappresentati 30 chilometri x 16 metri Spazio disco utilizato4 15 terabytes (15 x 1012 bytes)** Sequenze di DNA generate 5 terabasi (5 x 1012 basi) Archivi analizati 11 972 ENCODE Wiki 5 Numero de pagine di contenuto 741 Numero di archivi "uploadés" 2955 Numero di aggiornamenti, per giorno 11 Numero di pagine aggiornate dal 2008 18500 Numero di visite per giorno (media su 4.5 anni) 150 Numero totale di visite 248 140 1 Lista degli articoli attacata 2 Legame dalla tabella verso la lista delle aree tematiche 3 Legame verso gli elementi speciali 4 Tutti gli archivi con le sequenze e le analisi generate sono sui server del EMBL-EBI 5 Il funzionamento efficace del consorzio ENCODE ha necessitato di condividere i dati facilmente e in tempo reale. I membri hanno creato quel Wiki per conservare documenti di lavoro centralizzati, facili di accesso, e aggiornati. ENCODE « ENCODE, l’enciclopedia degli elementi del DNA » è un consorzio di ricerca pubblico e aperto formato nel 2003 dal National Human Genome Research Institute (NHGRI) negli Stati-Uniti. Il suo obbiettivo è l'identificazione di tutti gli elementi funzionali del genoma umano. Durante la fase di test (2003-2007) i ricercatori hanno valutato e confrontato i metodi esistenti per la definizione e l'analisi rigorosa di porzioni del genoma umano. Le conclusioni di questa fase di test sono state pubblicate nel giugno 2007 in Nature e Genome Research. Il progetto ha iniziato la sua fase produttiva nel settembre 2007. Le competenze dei scienzati coinvolti in ENCODE copprono tutti gli aspetti della produzione e dell'analisi di dati di biologia molecolare. Durante il progetto, un centro di coordinazione dei dati di ENCODE ha centralizzato tutti i risultati e li a messi a disposizione per il consorzio. L'integrazione di questi dati è stata coordinata da un centro di analisi dei dati. Tutti i risultati prodotti dai partecipanti a ENCODE sono stati resi pubblici dentro delle database e sono disponibili al centro di coordinazione dei dati del progetto: www.genome.gov . EMBL-EBI L’European Bioinformatics Institute (EBI) fa parte dell'European Molecular Biology Laboratory (EMBL). È localizzato sul campus di genomica del Wellcome Trust, a Hinxton accanto a Cambridge (Gran Bretagna). L’EBI è stato creato a partire del lavoro di avanguardia dell'EMBL nella creazione di database per i dati biologici che siano pubbliche per la communità scientifica. Ospita database biologiche fra le più importanti, includendo delle sequenze di DNA (ENA), delle sequenze di proteine (UniProt), dei genomi animali (Ensembl), delle strutture tridimensionali (la Protein Databank européenne), dei dati di sperimenti di espressione genica (ArrayExpress), d’interazzioni proteina-proteina (IntAct), et di vie di signaling (Reactome). L’EBI ospita parecchi gruppi di ricercatori dove i scienzati sviluppano di continuo nuovi strumentii per la communità di bioinformatica. www.ebi.ac.uk/information EMBL L’European Molecular Biology Laboratory è un istituto di ricerca di base finanziato attraverso sovvenzioni pubbliche da parte di 20 stati membri (Austria, Belgio, Croazia, Danimarca, Finlandia, Francia, Germania, Grecia, Irlanda, Islanda, Israele, Italia, Lussemburgo, Norvegia, Paesi Bassi, Portogallo, Regno Unito, Spagna, Svezia, Svizzera) e l’Australia come membro associato. La ricerca all’EMBL è svolta da circa 85 gruppi indipendenti e copre un ampio spettro della biologia molecolare. Il laboratorio ha 5 sedi: la sede principale di Heidelberg e le sedi di Hinxton (European Bioinformatics Institute), Grenoble, Amburgo e Monterotondo, nei pressi di Roma. Le principali missioni dell’EMBL sono: svolgere ricerca di base in biologia molecolare; organizzare attività di formazione per ricercatori, studenti e visitatori a tutti i livelli; offrire supporto ai ricercatori negli stati membri; sviluppare nuovi strumenti e metodi per le scienze della vita da mettere a disposizione della comunità scientifica attraverso il servizio di trasferimento tecnologico. Circa 190 studenti fanno attualmente parte del programma internazionale di PhD dell’EMBL. Il laboratorio offre inoltre una piattaforma di scambio e dialogo con un ampio pubblico attraverso numerose attività di scienza e società come cicli di seminari, il programma dei visitatori e la disseminazione dei risultati scientifici. Politica riguardo l’uso I comunicati stampa dell’EMBL e le immagini incluse fotografie, grafici, filmati e video sono soggetti a copyright dall’EMBL. Sono consentite ristampe e distribuzione a scopo non commerciale attraverso stampa, trasmissioni e mezzi elettronici, a patto che sia riconosciuta l’attribuzione agli autori, fotografi e realizzatori. Copie delle immagini ad alta risoluzione possono essere scaricate dal sito dell’EMBL: www.embl.org