Gli studenti delle lauree magistrali in: Sicurezza e qualità agroalimentare (LM-69 & LM-70) Biotecnologie agrarie e ambientali (LM-7) Biologia cellulare e molecolare (LM-6) interessati al corso di Basi Teoriche e Applicazioni delle Nuove Tecnologie Genomiche 4 cfu Sono invitati a contattare la titolare del corso, Silvia Bongiorni: tel.: 0761-357429 email: [email protected] recapito: DIBAF stanza 23A (seminterrato ex facoltà agraria) GENOMICA STRUTTURALE: 1. 2. 3. 4. 5. 6. 7. 8. GENOMICA FUNZIONALE: 9. Funzionamento dei genomi Anatomia dei genomi Modificazioni della cromatina e l’espressione del genoma Il genoma dei procarioti Microarray e RNA-seq Il genoma degli eucarioti Metil-seq La mappatura dei genomi Chip-seq Mappatura genetica Mappatura fisica Il sequenziamento automatico del DNA Il principio del sequenziamento secondo Sanger Il sequenziamento su larga scala La lettura dei tracciati di sequenziamento Il sequenziamento del genoma I nuovi metodi di sequenziamento Il sequenziamento gerarchico Il sequenziamento shogun Piattaforme di sequenziamento di interi genomi Assemblaggio e annotazione del genoma Copertura del genoma Phrap/Consed Approccio Overlap-Layout-Consensus La verifica delle sequenze Le caratteristiche funzionali delle sequenze genomiche I Progetti Genoma La metagenomica Genotipizzazione Gli SNP e la variazione La genotipizzazione degli SNP Basi Teoriche e Applicazioni delle Nuove Tecnologie Genomiche Obiettivi del corso: Lo scopo del corso è quello di fornire un’ampia panoramica sulle tecnologie di sequenziamento di nuova generazione emerse nell’era post-genomica. Sequenziamento del DNA 1977 - Sanger Sequenziamento del genoma 1996 - S. cerevisae 1998 - C. elegans 2000 - Arabidopsis thaliana 2001 - Homo sapiens Sequenziamento 2° generazione Roche 454 2005 Impossibile v isualizzare l'immagine. La memoria del computer potrebbe essere insufficiente per aprire l'immagine oppure l'immagine potrebbe essere danneggiata. Riav v iare il computer e aprire di nuov o il file. Se v iene v isualizzata di nuov o la x rossa, potrebbe essere necessario eliminare l'immagine e inserirla di nuov o. Applied Solid 2005 Illumina 2004 Sequenziamento 3° generazione Nanopore sequencing - 2010 Ion semiconductor sequencing - 2011 Single molecule sequencing - 2012 Basi Teoriche e Applicazioni delle Nuove Tecnologie Genomiche Obiettivi del corso: Il corso vuole sottolineare la rilevanza degli sviluppi applicativi delle discipline genomiche nell’ambito delle biotecnologie e della ricerca genetico-molecolare. GENOMICA STRUTTURALE: 1. 2. 3. 4. 5. 6. 7. 8. GENOMICA FUNZIONALE: 9. Funzionamento dei genomi Anatomia dei genomi Modificazioni della cromatina e l’espressione del genoma Il genoma dei procarioti Microarray e RNA-seq Il genoma degli eucarioti Metil-seq La mappatura dei genomi Chip-seq Mappatura genetica Mappatura fisica Il sequenziamento automatico del DNA Il principio del sequenziamento secondo Sanger Il sequenziamento su larga scala La lettura dei tracciati di sequenziamento Il sequenziamento del genoma I nuovi metodi di sequenziamento Il sequenziamento gerarchico Il sequenziamento shogun Piattaforme di sequenziamento di interi genomi Assemblaggio e annotazione del genoma Copertura del genoma Phrap/Consed Approccio Overlap-Layout-Consensus La verifica delle sequenze Le caratteristiche funzionali delle sequenze genomiche I Progetti Genoma La metagenomica Genotipizzazione Gli SNP e la variazione La genotipizzazione degli SNP Il GENOMA è l’insieme di tutti i geni di un organismo. L’insieme di tutte le sequenze nucleotidiche codificanti e non, di un organismo. La sequenza completa del suo DNA La scienza dei genomi, la GENOMICA è lo studio della struttura, del contenuto e dell’evoluzione dei genomi La genomica non è più limitata alla determinazione delle sequenze ma si estende anche all’analisi dell’espressione e delle funzioni dei geni e delle proteine Le analisi sperimentali sono integrate strettamente da Bioinformatica Biologia computazionale GENOMICA STRUTTURALE: 1. Anatomia dei genomi Il genoma dei procarioti Il genoma degli eucarioti Organismo Numero bp Numero di geni ΦX-174 5836 10 Mycoplasma pneumoniae 816394 680 Helicobacter pylori 1667867 (1,66 Mb) 1589 Escherichia coli 4639221 (4,64 Mb) 4377 Saccharomyces cerevisiae 12495682 (12,5 Mb) 5770 Caenorhabditis elegans 100258171 (100 Mb) 19099 Drosophila melanogaster 122653977 (122,6 Mb) 13472 Homo sapiens 3,3 x 109 (3289 Mb o 3,3 Gb) 25000 Il genoma dei procarioti DNA batterico DNA plasmidico Il genoma degli eucarioti Compattazione della cromatina 1,70m in 10µ µm 146bp 54bp 2-6 µm genoma cromosoma gene regione intergenica gene Perché alcuni genomi sono così grandi? La quantità di DNA contenuta nel genoma aploide è una caratteristica propria di ciascuna specie vivente ed è definita come valore C Il valore C varia enormemente da <106 bp per un micoplasma a >1011 bp per anfibi ed alcune piante La dimensione del genoma cresce con la complessità dell’organismo. Ma in alcuni gruppi c’è un’enorme variabilità nel contenuto di DNA di specie simili fra loro Il paradosso del valore C si riferisce alla mancanza di correlazione tra le dimensioni del genoma e la complessità biologica I genomi eucariotici contengono sia sequenze uniche che DNA ripetuto Il DNA non ripetuto è formato da sequenze uniche: una copia nel genoma aploide Il DNA ripetuto è formato da sequenze che sono presenti in più copie nel genoma aploide • DNA moderatamente ripetuto (sequenze >100bp ripetute tra le 10 e le 1000 volte) • DNA altamente ripetuto (sequenze <100bp ripetute migliaia di volte) Quanti geni ci sono nei vari genomi? Organismo Numero bp Numero di geni (% codificante) ΦX-174 5836 10 Mycoplasma pneumoniae 816394 680 Helicobacter pylori 1667867 1589 Escherichia coli 4639221 (4,64 Mb) 4377 (88%) Saccharomyces cerevisiae 12495682 (12,5 Mb) 5770 (70%) Caenorhabditis elegans 100258171 (100 Mb) 19099 Drosophila melanogaster 122653977 (122,6 Mb) 13472 Homo sapiens 3,3 x 109 (3289 Mb) 25000 (1,3%) non-coding DNA Junk-DNA Junk-DNA: ruolo nel sileziamento genico Silenziamento post-trascrizionale di geni attivi: ad opera di micro-RNA (miRNA) e small interfering RNA (siRNA) (21-23bp) complementari miRNA e siRNA legano l’mRNA complementare, richiamano il complesso RISC e degradano l’mRNA Junk-DNA: ruolo nell’evoluzione geni umani vs gene di scimpanzè: •differiscono dello 0,1% del genoma (circa 20 geni) •differenze nelle regioni non-coding sono 40 volte superiori (4%) – il ncDNA può fare la differenza tra uomo e scimpanzè Qual è la funzione dei vari geni? Struttura dei geni esone exon expressed region introne intron intervening region Splicing Splicing alternativo A mRNA 1 mRNA 2 C D A B C D E F B AAAAAAA A B C E F AAAAAAA A B C D F mRNA 3 mRNA 4 E A B C AAAAAAA F AAAAAAA F Analisi di sequenze genomiche Gli introni sono abbondanti 94% uomo, 85% moscerini, 95% nematode, 95% piante Genoma umano (25000 geni) solo 2 - 5 volte più geni del moscerino (13472) o del nematode (19099) Lo splicing alternativo è frequente ~ il 75% dei geni umani trascritti subiscono splicing alternativo Geni sovrapposti Alcune sequenze di DNA codificano per più proteine GENOMICA STRUTTURALE: 2. La mappatura dei genomi Mappatura genetica Mappatura fisica Il genoma come si vede? Cromosomi politenici di Drosophila Per poter mettere in ordine i diversi frammenti è necessario disporre di una mappa dettagliata del genoma, ovvero la disposizione di una serie di MARCATORI lungo ciascun cromosoma Un marcatore rappresenta un SITO UNICO presente nel genoma Una mappa è una rappresentazione semplificata dello spazio che evidenzia relazioni tra componenti (oggetti, regioni) di quello spazio Le mappe genomiche rivelano l’organizzazione del materiale ereditario e derivano da due tipi di mappe: 1. Mappe genetiche: posizionano i geni sui cromosomi sulla base della frequenza di ricombinazione 2. Mappe fisiche: usano marcatori all’interno della sequenza, che vanno dai siti di restrizione all’analisi diretta del DNA genomico Mappe Genetiche descrivono l’ordine relativo dei marcatori genetici nei gruppi di associazione o LINKAGE Marcatori = brevi sequenze ripetute di DNA (microsatelliti, Short Tandem Repeats), polimorfismi (Single Nucleotide Polymorphism), siti di restrizione, loci genici Le mappe genetiche sono costruite partendo dai dati di segregazione dei marcatori e dalla loro frequenza di ricombinazione nella progenie La distanza tra marcatori è espressa in centi-Morgan (cM), unità di misura della frequenza di ricombinazione. 1cM = frequenza di ricombinazione dell’1% (circa 1000bp nell’uomo, 2000bp nel topo) Due loci che presentano una frequenza di ricombinazione dell'1% sono definiti distanti 1 cM Per fare una mappa genetica non necessariamente serve conoscere la sequenza La distanza genetica non corrisponde direttamente alla distanza fisica (presenza di sequenze ripetute, la frequenza di ricombinazione varia tra regioni eu/eterocromatiche) MAPMAKER È un programma per la costruzione di mappe genetiche partendo dai dati di linkage I dati di linkage sono trasformati in distanza di mappa tramite una funzione di mappaggio, che esegue aggiustamenti dei dati, tenendo conto che la probabilità di ricombinazione non è direttamente proporzionale alla distanza fisica. Mappe Fisiche è una costellazione di frammenti di DNA sovrapposti, ordinati e orientati, che coprono ciascun cromosoma di un genoma. Le mappe fisiche sono basate sull’analisi diretta del DNA genomico ed indicano l’effettivo numero di coppie di basi (bp), kilobasi (kb) o megabasi (Mb) che separano un marcatore (locus) da quello adiacente. Ci sono diverse strategie per allineare i contig: • Ibridazione (chromosome walking) • Sequenziamento delle estremità (STS, sequence-tagged sites) • Profili di restrizione La mappatura dei genomi Le mappe genetiche e fisiche possono essere correlate Qualsiasi gene clonato può essere mappato geneticamente e posizionato fisicamente nel genoma IL METODO PRINCIPALE PER ALLINEARE TRA LORO MAPPE GENETICHE E MAPPE FISICHE E’ RAPPRESENTATO DALLE MAPPE CITOLOGICHE Mappe citologiche Le Mappe Tutti i dati di sequenza, ricombinazione derivanti da queste mappe sono immagazzinati in banche dati (database) The National Center for Biotechnology Information http://www.ncbi.nlm.nih.gov/ The European Molecular Biology Laboratory http://www.embl.de/ DNA Data Bank of Japan http://www.ddbj.nig.ac.jp/index-e.html