La quantità di DNA umano (circa 3 miliardi di paia di basi) è in eccesso rispetto a quella necessaria Il 15% del DNA associato ai centromeri, costituito da sequenze altamente ripetute (DNA satellite e STR) Il 82% sequenze non codificanti per proteine (codificanti tRNA, rRNA, microRNA e sequenze regolatrici; pseudogeni, e regioni di DNA la cui funzione rimane ignota (junk DNA) solo 1,5-3% del DNA da origine a proteine Il genoma umano 3,2 miliardi di paia di basi di DNA 26000 geni 23 coppie di cromosomi Definizione di gene un gene è una parte di DNA che porta tutte le informazioni necessarie per lo sviluppo di un carattere (segmento di DNA che codifica per una proteina) occupa sul cromosoma una determinata posizione (locus) viene trasmesso alle generazioni successive come un carattere ereditario È costituito da regioni codificanti le proteine (esoni) e regioni non codificanti (introni) fiancheggianti gli esoni Dalla sequenza codificata di un gene alla sua funzione Funzioni dei geni umani Gene ontology (GO) PANTHER (Protein ANalysis THrough Evolutionary Relationships) classification system biological database Genome Sequencing TG..GT TC..CC AC..GC CG..CA TT..TC TG..AC AC..GC GA..GC CT..TG AC..GC GT..GC AC..GC AA..GC AT..AT TT..CC Genome Short fragments of DNA ACGTGGTAA CGTATACAC TAGGCCATA GTAATGGCG CACCCTTAG TGGCGTATA CATA… ACGTGGTAATGGCGTATACACCCTTAGGCCATA Short DNA sequences ACGTGACCGGTACTGGTAACGTACA CCTACGTGACCGGTACTGGTAACGT ACGCCTACGTGACCGGTACTGGTAA CGTATACACGTGACCGGTACTGGTA ACGTACACCTACGTGACCGGTACTG GTAACGTACGCCTACGTGACCGGTA CTGGTAACGTATACCTCT... Sequenced genome 6 DNA Sequencing Basic DNA sequencing o Sanger method (chain termination) o Maxam Gilbert method (chemical termination cleavage) Advanced DNA sequencing o Shotgun Next Generation Sequencing o Solid Sequencing o Illumina Sequencing o Pyrosequencing DNA Sequencing: the chain termination method (Sanger's method) DNA Sequencing: the chain termination method (Sanger's method) A B C D DNA Sequencing: the chain termination method (Sanger's method) deoxy NTPs have a 3’ hydroxyl group …so chain elongation can occur dideoxy NTPs don’t have a 3’ hydroxyl group …so when this NTPs is added, chain elongation terminates DNA Sequencing: the chain termination method (Sanger's method) DNA Sequencing: the chain termination method (Sanger's method) ddATP ddTTP ddGTP ddCTP Denaturing PAGE gels for DNA sequencing: • gel is 40 cm long with a uniform thickness of 0.4 mm • 25-40% 40 % acrylamide/bisacrylamide, mixing ratio 29:1 • 6-8 M urea as their denaturant • TBE as their buffer system • After a 2-2.5 hour run, a sequencing gel will give 200-250 bases of readable sequence starting at or close to the end of the primer. • The radioactive label exposes a sheet of X-ray film by autoradiography ddATP ddTTP ddGTP ddCTP DNA Sequencing: the chain termination method (Sanger's method) dsDNA 5’-ATGGCAGTTATCGATCGAT-3’ 3’-TACCGTCAATAGCTAGCTA-5’ denaturation 5’-ATGGCAGTTATCGATCGAT-3’ 3’-TACCGTCAATAGCTAGCTA-5’ annealing 5’-32P-ATGGCAGTT-3’………….. 3’-TACCGTCAATAGCTAGCTA-5’ ssDNA - extention ATCGATCGAT-3’ 5’-32P-ATGGCAGTT3’-TACCGTCAATAGCTAGCTA-5’ Reading: to identify sequence A G C G T C G C A G DNA Sequencing: chemical termination cleavage (Maxam and Gilbert) A single stranded DNA fragment is obtained by PCR using 5’-end-labeled primer The oligonucleotide employed as primer is end-labeled by treatment with alkaline phosphatase to remove the 5’-phosphate (if it’s present). Then it’s followed the reaction with P32-labeled ATP in the presence of polynucleotide kinase, this enzyme attaches P32-labeled to the 5’-terminal. DNA Sequencing: Sanger method vs. Maxam Gilbert method Sanger Sequencing Maxam Gilbert Sequencing DNA Sequencing: chemical termination cleavage (Maxam and Gilbert) The labeled DNA fragment is then divided into 4 aliquots, each treated with a chemical agent, which modifies a specific base: 1. Aliquot A + dimethyl sulphate, which methylated GUANINE residue 2. Aliquot B + formic acid, which modifies ADENINE and GUANINE residues 3. Aliquot C + hydrazine, which modifies THYMINE and CYTOSINE residues 4. Aliquot D + hydrazine+NaCl 5 mol/l, which makes the reaction specific for CYTOSINE residues The 4 aliquots are incubated with piperidine, which cleaves the sugar phosphate backbone of DNA next to the residue that has been modified Dimethyl sulphate to methylate GUANINE residue GUANINE DMS methylates the N7 position of guanine, which then leads to facile depurination piperidine will cleave the phosphate bond at the 3’ carbon. dimethyl sulphate, formic acid, hydrazine, hydrazine+ NaCl 5 mol/l attack the purine or pyrimidine rings respectively Piperidine will cleave the phosphate bond at the 3’ carbon DNA Sequencing: chemical termination cleavage (Maxam and Gilbert) Reading: to identify sequence Radioactive fragments Unlabelled fragments DNA Sequencing: Sanger method vs. Maxam Gilbert method Sanger method Maxam Gilbert method DNA sequence is annealed to an endlabeled oligonucleotide with [32P], which is then extended by DNA polymerase using a mixture of dNTP DNA sequence is annealed to an endlabeled oligonucleotide with [32P], as primer, which is then extended by DNA polymerase using a mixture of dNTP DNA sequence is stopped using ddNTP as chain terminator DNA sequence is chemically cleaved to leave a signature pattern of bands sequence DNA fragment up to 500 nucleotides in length (250 using forward radiolabelled primer and 250 using reverse radiolabelled primer) sequence DNA fragment up to 500 nucleotides in length (250 using forward radiolabelled primer and 250 using reverse radiolabelled primer) Shotgun for genome sequencing CGATTAGGCGTACGTACGGTCGAATGCAACGTAGGCCTACGAATGCG Shotgun sequencing BAC cloning Shotgun sequencing 1. Amplificazione del DNA mediante clonaggio in vettori BAC (Bacterial Artificial Chromosome) per studiare: geni di grandi dimensioni diversi geni in una sola volta interi genomi virali 2. La sequenza dei frammenti è ottenuta utilizzando il metodo Sanger Shotgun sequencing Fluorescent DNA sequencing Fluorescent DNA sequencing Fluorescent DNA sequencing Capillary Electrophoresis in DNA sequencing Sequencing a lot of samples at the same time Sequenziamento automatizzato usando ddNTP legati a molecole cromogeniche Sequenziamento automatizzato usando ddNTP legati a molecole cromogeniche Vantaggi Lunghe letture di frammenti (~ 900 bps) Adatto per piccoli progetti di sequenziamento Svantaggi Bassa produttività Costoso Shotgun sequencing Avantages Disvantages Much more economical and faster It requires a great skill to allign the overlapped fragments and to deduce the sequence Labour saving because the sequencing reactions are virtually fully automated and the sequences being assemblated by computer programs Complex process Minisequencing single base extension Minisequencing single base extension for SNPs analysis The minisequencing reaction uses a DNA polymerase to extend detection primers that anneal immediately adjacent to the sites of the SNPs. The primers are extended with fluorescently labeled, terminating nucleotide analogues that are complementary to the nucleotide at the SNP site. Minisequencing single base extension Obiettivi principali dell’Human Genome Project determinare la sequenza delle coppie di basi azotate che formano il DNA identificare e mappare (localizzare) i geni Il genoma di qualsiasi individuo (tranne quello dei gemelli monozigoti e degli organismi clonati) è unico; mappare il genoma umano significa quindi fare il sequenziamento di tutte le variazioni di un gene, per questo si è lavorato sul DNA di donatori selezionati con criteri di rappresentatività statistica comprendere la funzione dei geni determinare la sequenza anche di altri organismi per studi applicati alle Scienze Evoluzionistiche creazione banche dati integrate ad un’interfaccia web per la ricerca ed analisi dei dati Principali scoperte del Progetto Genoma Gli esseri umani hanno circa 26.000 geni, più o meno lo stesso numero di quelli dei topi e da confrontarsi con i circa 28.000 di una pianta e i 18.000 di un verme, questa differenza non sembra abbastanza marcata per spiegare la complessità dell'organismo umano rispetto a forme di vita più semplici. Tutte le razze umane sono uguali al 99%. Indicando una discendenza evolutiva da un'unica “madre”. La maggior parte delle mutazioni genetiche avviene nel maschio della specie, il maggiore responsabile nella trasmissione delle variazioni genetiche. La comprensione dell'espressione di questi geni potrà fornire degli indizi sulle cause di alcune malattie. Sequencing the Human Genome 2001: Human Genome Project 2.7G$, 11 years Log10(price) 10 2007: 454 1M$, 3 months 8 6 2008: ABI SOLiD 60K$, 2 weeks 2001: Celera 100M$, 3 years 2010: 5K$, a few days? 4 2009: Illumina, Helicos 40-50K$ 2 2012: 100$, <24 hrs? 2000 2005 Year 2010 Next Generation Sequencing Next Generation Sequencing 1. NGS: sample preparation Frammentazione del DNA e in vitro legame degli «adattatori» In generale, gli step di base nella preparazione di RNA o DNA per analisi NGS sono: (i) frammentazione e/o riduzione delle sequenze bersaglio ad una lunghezza desiderata, (ii) conversione del substrato (RNA o DNA) in DNA a doppia elica, (iii) fissare oligonucleotidi adattatori alle estremità dei frammenti di DNA bersaglio (iv) arricchimento mediante PCR dei prodotti per il sequenziamento della «library». Le dimensioni dei frammenti di DNA bersaglio nella biblioteca finale è un parametro fondamentale per NGS costruzione della «library». Il Next Generation Sequencing, vi darà un sacco di letture di sequenze, ma di tratterà di brevi frammenti di lettura. con Illumina e Ion Torrent le letture sono attualmente della lunghezza di 600 basi. con Roche 454 legge meno di 1kb e PacBio meno di 9 kb di lunghezza. Questo rende molto importante la definizione delle dimensione dei frammenti di DNA da produrre prima della costruzione biblioteca. (i) (ii) (iii) (iv) Metodi per la frammentazione del DNA 1. Fisico 2. Chimico 3. Enzimatico a) 1. Frammentazione fisica del DNA Rottura acustica taglio acustico e ad ultrasuoni sono i principali metodi fisici utilizzati per rompere il DNA. Lo strumento Covaris® (Woburn, MA) è un dispositivo acustico per la rottura del DNA in frammenti di circa 100-5 kb. Covaris produce anche tubi (gTubes) per processare campioni di 6-20 kb. b) Sonicazione Il Bioruptor® (Denville, NJ) è un dispositivo che utilizza ultrasuoni per la frattura della cromatina, del DNA e dei tessuti. Piccole quantità di DNA possono essere tagliate in 150-1 kb di lunghezza. c) Taglio idrodinamico Hydroshear, una sorta di forbici idrauliche della Digilab (Marlborough, MA) utilizzano forze idrodinamiche per tagliare il DNA. Nebulizzatori (Vita Tech, Grand Island, NY) possono anche essere usati per frammentare il DNA in pezzi da 100-3 kb in pochi secondi. Mentre la nebulizzazione ha un basso costo e non richiede l'acquisto di uno strumento, non è tuttavia consigliabile se avete poco materiale di partenza: si può perdere fino al 30% del vostro DNA con questo metodo. Gli altri dispositivi sonicazione e il taglio acustico sono progettate per volumi più piccoli e non causano perdite del DNA di partenza. 2. Frammentazione chimica del DNA Calore e cationi di metalli bivalenti Il taglio chimico è generalmente limitato alla rottura di lunghi frammenti di RNA. Viene tipicamente eseguito tramite la digestione di RNA col calore e cationi di metallo bivalenti (magnesio o zinco). La lunghezza del RNA (115-350 bp) può essere regolata aumentando o diminuendo il tempo di incubazione. 3. Frammentazione del DNA con metodi enzimatici a) a) DNasi I o alter endonucleasi di restrizione, nuclease non-specifiche I metodi enzimatici includono la digestione con DNasi I o Fragmentasi, o una miscela dei due. La Fragmentasi sembra essere la più efficace. Tuttavia, la Fragmentase produce un numero maggiore di artefatti rispetto alla frammentazione con metodi fisici. Transposasi Un metodo enzimatico alternativo è rappresentato dalla tecnologia tagmentation NextEra (Illumina, San Diego, CA), in cui un enzima la Trasposasi frammenta e contemporaneamente inserisce sequenze dell’adattatore in dsDNA. Questo metodo presenta diversi vantaggi, tra cui ridotta manipolazione del campione e brevi tempo di preparazione. Transposase tagmentation reaction La transposasi frammenta e simultaneamente inserisce adattatori dentro un dsDNA Sono state sequenziate library contenenti frammenti di lunghezza superior alle 1500 basi Sonication vs. Transposase fragmentation Scott Brouilette et all. DEVELOPMENTAL DYNAMICS 241:1584–1590, 2012 Legame dell’adattatore