Lezione 4 Il sequenziamento del DNA, Sanger Schema della lezione • Polymerase chain reaction (PCR) • Dal prodotto di PCR al sequenziamento di Sanger • Lettura dei prodotti di sequenziamento con sequenziatori automatici a capillare • Dalle molecole ai files di dati: il “basecalling” e il formato FASTA Schema della lezione • Polymerase chain reaction (PCR) • Dal prodotto di PCR al sequenziamento di Sanger • Lettura dei prodotti di sequenziamento con sequenziatori automatici a capillare • Dalle molecole ai files di dati: il “basecalling” e il formato FASTA Polymerase chain reaction (PCR) qualche ora 25 Aprile 1953 James D. Watson e Francis Crick pubblicano la struttura del DNA (Watson JD, Crick FHC "A Structure for Deoxyribose Nucleic Acid", Nature vol. 171, pp. 737-738; 1953) fondando il campo della genetica molecolare. Premio Nobel nel 1962. 1953 Doppia elica Metà degli anni 50: Arthur Kornberg inizia a studiare il meccanismo di replicazione del DNA. Nel 1957 identifica la prima DNA polimerasi. L’enzima copia in una sola direzione e richiede degli inneschi preesistenti (primer) per iniziare a copiare il filamento. Premio Nobel nel 1959. 1953 Doppia elica 1957 Primi ‘60 Oligonucleoti DNApol Codice di sintetici genetico (primers) All’inizio degli anni 60 Gobind Khorana chiarisce molti aspetti del codice genetico. Successivamente inizia un progetto per la sintesi in vitro di un gene umano e in questi esperimenti getta le basi per l’utilizzo di oligonucleotidi sintetici (usati sia come blocchi per la costruzione del gene, sia come inneschi per la DNA polimerasi). 1968 Premio Nobel per il suo lavoro sul codice genetico. Biotechnology in Yellowstone • 1969 Thomas D. Brock isola un nuovo batterio dalle sorgenti calde dello Yellowstone National Park. Nel 1976 viene islata la DNA polimerasi di T. aquaticus (taq) in grado di mantenere la sua attività oltre i 75°C. 1953 Doppia elica • 1957 Primi ‘60 Oligonucleoti 1969 DNApol Codice di sintetici taq genetico (primers) 1975 Sanger sequencing 1975 Frederick Sanger sviluppa un metodo per determinare la sequenza del DNA. (Sanger F, Nicklen S, Coulson AR "DNA sequencing with chainterminating inhibitors" Proc Natl Acad Sci vol. 74(12) pp. 5463-7; 1977). 1980: Premio Nobel. Nel 1980 tutti i componenti per fare un’ampplificazione con PCR sono conosciuti dalla comunità scientifica K. Mullis 50-68 °C Schema della lezione • Polymerase chain reaction (PCR) • Dal prodotto di PCR al sequenziamento di Sanger • Lettura dei prodotti di sequenziamento con sequenziatori automatici a capillare • Dalle molecole ai files di dati: il “basecalling” e il formato FASTA Dal prodotto di PCR al sequenziamento di Sanger 94-96°C 50-68°C 68-72°C Dal prodotto di PCR al sequenziamento di Sanger Verifica dell’avvenuta reazione (e possibile quantificazione), ad esempio per elettroforesi su gel di agarosio Prodotto di reazione Marker (frammenti a lunghezza nota) Purificazione del prodotto di PCR: Esempio Exo/SAP (dobbiamo pulire da dNTPs e primers residui) Il sequenziamento di Sanger Elongation Strand Separation Primer Annealing Termination Termination Standard Nucleotides Dye-labeled dideoxynucleotides ddNTP incorporation leads to chain growth termination http://www.wiley.com/college/pratt/0471393878/student/animations/dna_sequencing/index.html Schema della lezione • Polymerase chain reaction (PCR) • Dal prodotto di PCR al sequenziamento di Sanger • Lettura dei prodotti di sequenziamento con sequenziatori automatici a capillare • Dalle molecole ai files di dati: il “basecalling” e il formato FASTA Capillary Electrophoresis ABI 3730, 96-capillary cromatogramma Un programma specifico opera il BASECALLING (converte i picchi in A, T, G, C) Schema della lezione • Polymerase chain reaction (PCR) • Dal prodotto di PCR al sequenziamento di Sanger • Lettura dei prodotti di sequenziamento con sequenziatori automatici a capillare • Dalle molecole ai files di dati: il “basecalling” e il formato FASTA Molto importante!!! Good quality I file prodotti dai sequenziatori automatici sono specifici e di solito hanno un’estensione .seq oppure .abi Bad quality (background noise) Apro il file .abi con un programma apposito che legge cromatogrammi (es. Chromas; BioEdit) Questi programmi hanno molte funzioni, quando sono soddisfatto delle mie correzioni posso esportare la sequenza in un formato di testo leggero e leggibile da molti altri programmi (es. programmi di allineamento): FORMATO FASTA Copy FASTA formatted Il segno > contraddistingue il FASTA ed è obbligatorio identifier of the sequence (optional) >XFUS0058 CGTTAGAGGGGACGATTTCTACGTGCCTATGT CCAATGCCACCGGCATTGTTAGGGACCCGTAC GAGTATCCCCAGTACTACCTGGTGGCCCCGTG GGCATACGCCTGCCTGGCAGCGTACATGTTCT TCCTCATTCTCACCGGCTTCCCCGTCAACTTC CTCACCCTGTACGTCACCATCGAGCACAAGAA GCTGCGTACGCCTCTCAACTACATTCTGCTGA ACCTCGCCATTTCCGACCTCTTCATGGTGTTC GGCGGGTTCACCACGACGATGTACACCTCGTT GCACGGCTACTTCGTGTTCGGACGCCTCGGCT GCAACCTGGAAGGCTTCTTCGCGACCCTGGGC sequenza GGTGAAATGGGGCTGTGGTCCCTGGTCGTGCT GGCCTTCGAGAGGTGGATGGTGGTCTGTAAGC CCGTGAGCAACTTCCGCTTCGGAGAGAACCAC GCCATCATGGGCGTGGCCTTCACCTGGGTCAT GGCCTGCTCCTGCGCCGTGCCTCCCCTGGTGG GCTGGTCCCGTTACATCCCCGAGGGCATGCAG TGCTCGTGCGGAGTCGACTACTACACCCGCGC CCCCGGCTACAACAACGAGTCCTTCGTCATCT ACATGTTCATCGTGCACTTCATCATTCCGCTC ATCGTCATATTCTTCTGCTACGGCCGTCTTGT