Lezioni di genetica medica

Sequenziamento del DNA con
metodica Sanger
1a generazione
sequenziamento del DNA secondo il metodo
Sanger
Il sequenziamento automatico secondo il metodo Sanger
ha dominato nella scienza e nell’industria per almeno 20
anni e ha consentito il sequenziamento del genoma
umano e la scoperta di oltre 2.500 malattie genetiche
monogeniche
Il metodo Sanger è considerato la tecnologia di “prima
generazione”, mentre i nuovi metodi sono denominati
“next-generation sequencing (NGS)”
Sanger DNA sequencing
2a generazione
“next-generation sequencing (NGS)”
Il principale vantaggio è la possibilità tecnica di produrre un
volume enorme di dati a costi estremamente più bassi
ed in tempi estremamente più rapidi
Il potenziale dell’NGS è simile ai primi tempi della PCR con
il limite principale dovuto all’immaginazione
NGS
Preparazione del DNA da sequenziare
Una comune strategia tecnologie NGS è che il template
è adeso o immobilizzato su una superficie solida o
supporto
L'immobilizzazione di molecole spazialmente separate
permette di eseguite simultaneamente migliaia o milioni
di reazioni di sequenziamento
Come si prepara il DNA?
Tecniche basate sull’amplificazione:
1.
emulsion PCR (emPCR) (454, Life)
2.
solid-phase amplification (Solexa)
Tecniche non basate sull’amplificazione:
1.
immobilizzazione dei primer (Helicos)
2.
immobilizzazione del “template” (Helicos)
3.
immobilizzazione dell’enzima (Pacific, LI-COR)
emulsion PCR (emPCR)
emulsion PCR (emPCR)
Il 5500xl SOLiD legge
200.000.000.000 di basi/corsa
Solid-phase amplification can produce 100–200 million spatially separated
template clusters (Illumina/Solexa)
I gruppi bloccanti
attaccati al 3’
causano un ostacolo
nell’incorporazione
di un altro
nucleotide, ma
l’ostacolo può
essere rimosso
L’Illumina HiSeq2000 legge
oltre 600.000.000.000 di basi
di DNA per corsa
A doubling of sequencing output every 9 months has outpaced and overtaken
performance improvements within the disk storage and high-performance
computation fields
S D Kahn Science 2011;331:728-729
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Whole Genome Seq
Exome Seq
RNA Seq
MeDIP Seq
miRNA Seq
Epigenetics, DNA methylation, ChIP-Seq
Copy Number Variation
Gut Bacteria / Metagenome
Skin Bacteria / Metagenome
Infectious Diseases
NGS Applications in Cancer
Biomarkers
Stem Cells
Detection of Genome Structural Variation
Personalised Medicine Applications
The term NGS defines very different sizes of
analysis!
• Whole genome @40 x (~ 140 Gb of
sequences/sample) √
• Whole exome @60 x (~ 5 Gb/sample) √
√
• A set of 100 aver. candidate genes
(exons) @100 x (~ 0.1 Gb/sample) √
√√
• A single medium-size gene (exons and
introns) @100x (~ 0.005 Gb/sample) √
The genome of
James Watson
7.4 x coverage
234 runs
24.5 billions bp
11 genetic diseases !!
Whole Genome Seq
very heterogeneous genotype, genetic testing for 15/39 loci
Pedigree of the family and segregation of SH3TC2 mutations
Arricchimento “enrichment”
• Tutti i geni (esoni+introni) di una regione cromosomica
dove è mappata una malattia genetica da causa ignota
• Tutti gli esoni di tutti i geni coinvolti in varie forme di
quella malattia genetica
• Tutti gli esoni di tutti i geni noti del genoma umano
(esoma umano)
Meno dell’1% delle mutazioni che causano
malattie genetiche cadono fuori dagli esoni
The RNA is transcribed from
PCR-amplified
oligodeoxynucleotides
originally synthesized on a
microarray, generating
sufficient bait for multiple
captures at concentrations
high enough to drive the
hybridization
minigenome preparation
Come si fa a comprendere quale variazione nella
sequenza del DNA possa avere un significato
patologico?