L’enigma del XXI secolo: decifrare il codice della vita David Horner Dipar9mento di Bioscienze Università degli Studi di Milano Via Celoria 26 Milano 20133 [email protected] • Regola di Chargaff – %A = %T – %G = %C James Watson Francis Crick 1953: La struttura del DNA Il Dogma Centrale Il Codice Gene9co … la Stele di RoseSa della biologia molecolare Gene9ca Molecolare (1950-­‐1990) – Flusso dell’informazione gene9ca – Studi fini della regolazione di alcuni geni in sistemi modello (Uomo, Topo, E.coli, Lievito, Arabidopsis etc) – Sequenziamento completo di alcuni genomi piccoli (virus/plasmidi) Sequenziamento Sanger 1 esperimento, 3 giorni, c. 4000 basi Genomi plasmidi virus baSeri funghi piante alghe Inse` molluschi pesci anfibi re9li uccelli mammiferi 104 105 106 107 108 109 1010 1011 Sequenziamento Sanger Automa9zzato 1 esperimento, 1 giorno, c. 100 000 basi Genomi plasmidi virus baSeri funghi piante alghe Inse` molluschi pesci anfibi re9li uccelli mammiferi 104 105 106 107 108 109 1010 1011 Febbriao 2001 (HGMP 2.7 miliardi di dollari) Genomica Comparata Il sequenziamento del genoma umano è stata una pietra miliare della ricerca biologica. Ma I risulta9 furono stupefacen9: 1) Numero di geni (molto) minore dell’aSeso (22000) 2) Tanto DNA ripetuto di funzione ignota 3) I geni stessi sono piu “complessi” dell aSeso Per sfruSare la sequenza per fini biomedici è necessario confrontarla con genomi di altri individui e correlare le differenze gene9che con le differenze feno9piche. Dobbiamo sequenziare tan9 genomi umani (COSTOSISSIMO!) Costo di sequenziamento (per milione di basi) Sequenziamento Solexa/Illumina http://www.illumina.com/ Source: www.illumina.com PCR “a ponte” Sequence Colonies Sequenziamento “Next Genera9on” 600 Gb output per experiment (4-­‐7 days) (6 million reads of length 100nt) Da 2008 Per decifrare l’enigma, ci voleva …. Da9 grezzi Un computer potente Un genio • Sinclair ZX-­‐81 Sequenziamento “Next Genera9on” 600 Gb output per run (6 million reads of length 100nt) Un computer potente Sono un bioinforma9co, faccio questo Un genio GWAS (Carbamazepine allergia) Biologo (Odia la statistica e i computer) Informa/co (non capisce la sta9s9ca o la biologia) molecular biology numerical analysis gene)cs biochemistry algorithmics biophysics evolu)on genomics Bioinforma)ca mathema)cs data management image analysis sta)s)cs Matema/co (incomprensibile agli altri esseri umani, passa il suo tempo scrivendo formule) Oltre il Genoma …. Diverse cellule nel nostro corpo hanno lo stesso DNA ma svolgono funzioni completamente diverse Un essere unamo ha 22 000 geni, mentre un verme ne ha 19 000 (bastano 3000 geni per spiegare la differenza?) Oltre cercare differenze tra genomi, dobbiamo capire come interagiscono i geni e i diversi meccanismi di regolazione Trascrizione Epigene9ca Splicing Alterna9vo di mRNA RNA non-­‐codificante Applicazioni di Sequenziamento NGS • RNA-­‐Seq: Sequenziamento di mRNA/cDNA – Quali geni vengono espressi in un dato 9ssuto/ condizione – Quanto sono espressi, – Quali trascri` alterna9vi vengono espressi? • ChIP-­‐Seq: Sequenziamento di DNA legata da par9colari faSori trascrizionali/istoni – come vengono regola9 diversi geni? • smallRNA-­‐Seq: – Quali miRNA/siRNA vengono espressi, quale mRNA regolano? Degradoma Genoma TrascriSoma Epigenoma Splicing alterna9vo (Proteoma) (InteraSoma) Conclusioni • Nuove tecnologie (es Sequenziamento “Next Genera9on”) ci hanno portato in una “nuova epoca” della ricerca biologica • Ques9 approcci producono un a quan9tà ENORMA di da9 e richiedono l’intervenzione di “bioinforma9ci”, persone specializzate nella ges9one ed analisi di tali da9 nel contesto biologico • Giovani biologi devono capire che una base “solida” in informa9ca sta diventando mportante per seguire una carriera nelle scienze biologiche • La Bioinforma9ca è (secondo me) anche divertente e mi ha dato l’opportunità di interagire con esper9 di tan9 area diverse (ciclo cellulare, microbiologia, virologia, patologia, gene9ca agraria etc) Grazie alla bioinforma9ca, ormai abbiamo un quadro chiaro sulle mala`e complesse hSp://www.cusmibio.unimi.it/urbanbarcodeproject/index.html Controllo su piante o specie animali invasivi Iden9ficazione di prodo` alimentari eso9ci o oSenu9 da animali in via di es9nzione Rilevamento di frodi alimentari: prodo` alimentari surroga9, deriva9 da specie meno costose e di qualita' meno pregiata, vendu9 come specie piu' prelibate e costose