Lezione 4
Il sequenziamento del DNA,
Sanger
Schema della lezione
• Polymerase chain reaction (PCR)
• Dal prodotto di PCR al sequenziamento di Sanger
• Lettura dei prodotti di sequenziamento con
sequenziatori automatici a capillare
• Dalle molecole ai files di dati: il “basecalling” e il
formato FASTA
Schema della lezione
• Polymerase chain reaction (PCR)
• Dal prodotto di PCR al sequenziamento di Sanger
• Lettura dei prodotti di sequenziamento con
sequenziatori automatici a capillare
• Dalle molecole ai files di dati: il “basecalling” e il
formato FASTA
Polymerase chain reaction (PCR)
qualche
ora
25 Aprile 1953 James D. Watson e Francis Crick pubblicano la
struttura del DNA (Watson JD, Crick FHC "A Structure for
Deoxyribose Nucleic Acid", Nature vol. 171, pp. 737-738;
1953) fondando il campo della genetica molecolare. Premio Nobel
nel 1962.
1953
Doppia elica
Metà degli anni 50: Arthur Kornberg inizia
a studiare il meccanismo di replicazione
del DNA. Nel 1957 identifica la prima DNA
polimerasi. L’enzima copia in una sola
direzione e richiede degli inneschi
preesistenti (primer) per iniziare a copiare
il filamento. Premio Nobel nel 1959.
1953
Doppia elica
1957 Primi ‘60 Oligonucleoti
DNApol Codice
di sintetici
genetico (primers)
All’inizio degli anni 60 Gobind Khorana chiarisce molti
aspetti del codice genetico. Successivamente inizia un
progetto per la sintesi in vitro di un gene umano e in questi
esperimenti getta le basi per l’utilizzo di oligonucleotidi
sintetici (usati sia come blocchi per la costruzione del gene,
sia come inneschi per la DNA polimerasi). 1968 Premio Nobel
per il suo lavoro sul codice genetico.
Biotechnology in Yellowstone
•
1969 Thomas D. Brock isola un nuovo
batterio dalle sorgenti calde dello
Yellowstone National Park. Nel 1976 viene
islata la DNA polimerasi di T. aquaticus
(taq) in grado di mantenere la sua attività
oltre i 75°C.
1953
Doppia elica
•
1957 Primi ‘60 Oligonucleoti 1969
DNApol Codice
di sintetici
taq
genetico (primers)
1975
Sanger sequencing
1975 Frederick Sanger sviluppa un metodo per determinare la sequenza
del DNA. (Sanger F, Nicklen S, Coulson AR "DNA sequencing with chainterminating inhibitors" Proc Natl Acad Sci vol. 74(12) pp. 5463-7;
1977). 1980: Premio Nobel.
Nel 1980 tutti i componenti per fare
un’ampplificazione con PCR sono conosciuti dalla
comunità scientifica
K. Mullis
50-68 °C
Schema della lezione
• Polymerase chain reaction (PCR)
• Dal prodotto di PCR al sequenziamento di Sanger
• Lettura dei prodotti di sequenziamento con
sequenziatori automatici a capillare
• Dalle molecole ai files di dati: il “basecalling” e il
formato FASTA
Dal prodotto di PCR al sequenziamento di Sanger
94-96°C
50-68°C
68-72°C
Dal prodotto di PCR al sequenziamento di Sanger
Verifica dell’avvenuta reazione (e possibile quantificazione), ad esempio
per elettroforesi su gel di agarosio
Prodotto di reazione
Marker (frammenti a lunghezza nota)
Purificazione del prodotto di PCR:
Esempio Exo/SAP (dobbiamo pulire da
dNTPs e primers residui)
Il sequenziamento di Sanger
Elongation
Strand
Separation
Primer Annealing
Termination
Termination
Standard Nucleotides
Dye-labeled
dideoxynucleotides
ddNTP incorporation
leads to chain growth
termination
http://www.wiley.com/college/pratt/0471393878/student/animations/dna_sequencing/index.html
Schema della lezione
• Polymerase chain reaction (PCR)
• Dal prodotto di PCR al sequenziamento di Sanger
• Lettura dei prodotti di sequenziamento con
sequenziatori automatici a capillare
• Dalle molecole ai files di dati: il “basecalling” e il
formato FASTA
Capillary Electrophoresis
ABI 3730, 96-capillary
cromatogramma
Un programma specifico opera il
BASECALLING (converte i picchi
in A, T, G, C)
Schema della lezione
• Polymerase chain reaction (PCR)
• Dal prodotto di PCR al sequenziamento di Sanger
• Lettura dei prodotti di sequenziamento con
sequenziatori automatici a capillare
• Dalle molecole ai files di dati: il “basecalling” e il
formato FASTA
Molto importante!!!
Good quality
I file prodotti dai sequenziatori automatici
sono specifici e di solito hanno
un’estensione .seq oppure .abi
Bad quality (background noise)
Apro il file .abi con un programma apposito che legge cromatogrammi (es. Chromas; BioEdit)
Questi programmi hanno molte funzioni, quando sono soddisfatto delle mie correzioni
posso esportare la sequenza in un formato di testo leggero e leggibile da molti altri
programmi (es. programmi di allineamento): FORMATO FASTA
Copy FASTA formatted
Il segno >
contraddistingue
il FASTA ed è
obbligatorio
identifier of the sequence (optional)
>XFUS0058
CGTTAGAGGGGACGATTTCTACGTGCCTATGT
CCAATGCCACCGGCATTGTTAGGGACCCGTAC
GAGTATCCCCAGTACTACCTGGTGGCCCCGTG
GGCATACGCCTGCCTGGCAGCGTACATGTTCT
TCCTCATTCTCACCGGCTTCCCCGTCAACTTC
CTCACCCTGTACGTCACCATCGAGCACAAGAA
GCTGCGTACGCCTCTCAACTACATTCTGCTGA
ACCTCGCCATTTCCGACCTCTTCATGGTGTTC
GGCGGGTTCACCACGACGATGTACACCTCGTT
GCACGGCTACTTCGTGTTCGGACGCCTCGGCT
GCAACCTGGAAGGCTTCTTCGCGACCCTGGGC
sequenza
GGTGAAATGGGGCTGTGGTCCCTGGTCGTGCT
GGCCTTCGAGAGGTGGATGGTGGTCTGTAAGC
CCGTGAGCAACTTCCGCTTCGGAGAGAACCAC
GCCATCATGGGCGTGGCCTTCACCTGGGTCAT
GGCCTGCTCCTGCGCCGTGCCTCCCCTGGTGG
GCTGGTCCCGTTACATCCCCGAGGGCATGCAG
TGCTCGTGCGGAGTCGACTACTACACCCGCGC
CCCCGGCTACAACAACGAGTCCTTCGTCATCT
ACATGTTCATCGTGCACTTCATCATTCCGCTC
ATCGTCATATTCTTCTGCTACGGCCGTCTTGT