La quantità di DNA umano (circa 3 miliardi di paia di basi)
è in eccesso rispetto a quella necessaria
 Il 15% del DNA associato ai centromeri,
costituito da sequenze altamente ripetute
(DNA satellite e STR)
 Il 82% sequenze non codificanti per proteine
(codificanti tRNA, rRNA, microRNA e
sequenze regolatrici; pseudogeni, e regioni di
DNA la cui funzione rimane ignota (junk DNA)
 solo 1,5-3% del DNA da origine a proteine
Il genoma umano
3,2 miliardi di paia di basi
di DNA
26000 geni
23 coppie di cromosomi
Definizione di gene
 un gene è una parte di DNA che porta tutte le
informazioni necessarie per lo sviluppo di un
carattere (segmento di DNA che codifica per una
proteina)
 occupa sul cromosoma una determinata posizione
(locus)
 viene trasmesso alle generazioni successive come
un carattere ereditario
 È costituito da regioni codificanti le proteine (esoni)
e regioni non codificanti (introni) fiancheggianti gli
esoni
Dalla sequenza codificata di un gene alla sua funzione
Funzioni dei geni umani
Gene ontology (GO)
PANTHER (Protein ANalysis THrough Evolutionary Relationships)
classification system biological database
Genome Sequencing
TG..GT
TC..CC
AC..GC
CG..CA
TT..TC
TG..AC
AC..GC GA..GC
CT..TG
AC..GC
GT..GC
AC..GC
AA..GC
AT..AT
TT..CC
Genome
Short fragments of DNA
ACGTGGTAA
CGTATACAC
TAGGCCATA
GTAATGGCG
CACCCTTAG
TGGCGTATA
CATA…
ACGTGGTAATGGCGTATACACCCTTAGGCCATA
Short DNA sequences
ACGTGACCGGTACTGGTAACGTACA
CCTACGTGACCGGTACTGGTAACGT
ACGCCTACGTGACCGGTACTGGTAA
CGTATACACGTGACCGGTACTGGTA
ACGTACACCTACGTGACCGGTACTG
GTAACGTACGCCTACGTGACCGGTA
CTGGTAACGTATACCTCT...
Sequenced genome
6
DNA Sequencing
 Basic DNA sequencing
o Sanger method (chain termination)
o Maxam Gilbert method (chemical termination cleavage)
 Advanced DNA sequencing
o Shotgun
 Next Generation Sequencing
o Solid Sequencing
o Illumina Sequencing
o Pyrosequencing
DNA Sequencing: the chain termination method (Sanger's method)
DNA Sequencing: the chain termination method (Sanger's method)
A
B
C
D
DNA Sequencing: the chain termination method (Sanger's method)
deoxy NTPs have a 3’ hydroxyl
group
…so chain elongation can occur
dideoxy NTPs don’t have a 3’
hydroxyl group
…so when this NTPs is added,
chain elongation terminates
DNA Sequencing: the chain termination method (Sanger's method)
DNA Sequencing: the chain termination method (Sanger's method)
ddATP ddTTP ddGTP ddCTP
Denaturing PAGE gels for DNA sequencing:
• gel is 40 cm long with a uniform thickness of 0.4 mm
• 25-40% 40 % acrylamide/bisacrylamide, mixing ratio 29:1
• 6-8 M urea as their denaturant
• TBE as their buffer system
• After a 2-2.5 hour run, a sequencing gel will give 200-250
bases of readable sequence starting at or close to the end
of the primer.
• The radioactive label exposes a sheet of X-ray film by
autoradiography
ddATP ddTTP ddGTP ddCTP
DNA Sequencing: the chain termination method (Sanger's method)
dsDNA
5’-ATGGCAGTTATCGATCGAT-3’
3’-TACCGTCAATAGCTAGCTA-5’
denaturation
5’-ATGGCAGTTATCGATCGAT-3’
3’-TACCGTCAATAGCTAGCTA-5’
annealing
5’-32P-ATGGCAGTT-3’…………..
3’-TACCGTCAATAGCTAGCTA-5’
ssDNA - extention
ATCGATCGAT-3’
5’-32P-ATGGCAGTT3’-TACCGTCAATAGCTAGCTA-5’
Reading: to identify sequence
A
G
C
G
T
C
G
C
A
G
DNA Sequencing: chemical termination cleavage (Maxam and Gilbert)
 A single stranded DNA fragment is obtained by PCR using 5’-end-labeled primer
 The oligonucleotide employed as primer is end-labeled by treatment with alkaline
phosphatase to remove the 5’-phosphate (if it’s present). Then it’s followed the reaction with
P32-labeled ATP in the presence of polynucleotide kinase, this enzyme attaches P32-labeled
to the 5’-terminal.
DNA Sequencing:
Sanger method vs. Maxam Gilbert method
Sanger
Sequencing
Maxam Gilbert
Sequencing
DNA Sequencing: chemical termination cleavage (Maxam and Gilbert)
 The labeled DNA fragment is then divided into 4 aliquots, each treated with a chemical agent, which modifies a specific base:
1. Aliquot A + dimethyl sulphate, which methylated GUANINE residue
2. Aliquot B + formic acid, which modifies ADENINE and GUANINE residues
3. Aliquot C + hydrazine, which modifies THYMINE and CYTOSINE residues
4. Aliquot D + hydrazine+NaCl 5 mol/l, which makes the reaction specific for CYTOSINE residues
 The 4 aliquots are incubated with piperidine, which cleaves the sugar phosphate backbone of DNA next to the residue
that has been modified
Dimethyl sulphate to methylate GUANINE residue
GUANINE
DMS methylates the N7
position of guanine,
which then leads to
facile depurination
piperidine will cleave
the phosphate bond at
the 3’ carbon.
dimethyl sulphate, formic
acid, hydrazine, hydrazine+
NaCl 5 mol/l attack the
purine or pyrimidine rings
respectively
Piperidine will cleave the
phosphate bond at the 3’
carbon
DNA Sequencing: chemical termination cleavage (Maxam and Gilbert)
Reading: to identify sequence
Radioactive
fragments
Unlabelled
fragments
DNA Sequencing:
Sanger method vs. Maxam Gilbert method
Sanger method
Maxam Gilbert method
DNA sequence is annealed to an endlabeled oligonucleotide with [32P], which is
then extended by DNA polymerase using a
mixture of dNTP
DNA sequence is annealed to an endlabeled oligonucleotide with [32P], as
primer, which is then extended by DNA
polymerase using a mixture of dNTP
DNA sequence is stopped using ddNTP as
chain terminator
DNA sequence is chemically cleaved to
leave a signature pattern of bands
sequence DNA fragment up to 500
nucleotides in length
(250 using forward radiolabelled primer
and 250 using reverse radiolabelled
primer)
sequence DNA fragment up to 500
nucleotides in length
(250 using forward radiolabelled primer
and 250 using reverse radiolabelled
primer)
Shotgun for genome sequencing
CGATTAGGCGTACGTACGGTCGAATGCAACGTAGGCCTACGAATGCG
Shotgun sequencing
BAC cloning
Shotgun sequencing
1. Amplificazione del DNA mediante clonaggio in
vettori BAC (Bacterial Artificial Chromosome) per
studiare:
 geni di grandi dimensioni
 diversi geni in una sola volta
 interi genomi virali
2. La sequenza dei frammenti è ottenuta utilizzando il
metodo Sanger
Shotgun sequencing
Fluorescent DNA sequencing
Fluorescent DNA sequencing
Fluorescent DNA sequencing
Capillary Electrophoresis in DNA sequencing
Sequencing a lot of
samples at the same time
Sequenziamento automatizzato usando ddNTP legati a molecole cromogeniche
Sequenziamento automatizzato usando ddNTP legati a molecole cromogeniche
Vantaggi
 Lunghe letture di frammenti (~ 900 bps)
 Adatto per piccoli progetti di
sequenziamento
Svantaggi
Bassa produttività
Costoso
Shotgun sequencing
Avantages
Disvantages
Much more economical and faster
It requires a great skill to allign the
overlapped fragments and to deduce
the sequence
Labour
saving
because
the
sequencing reactions are virtually
fully automated and the sequences
being assemblated by computer
programs
Complex process
Minisequencing single base extension
Minisequencing single base extension for SNPs analysis
The minisequencing reaction uses a DNA polymerase to extend detection primers that anneal immediately adjacent to the
sites of the SNPs. The primers are extended with fluorescently labeled, terminating nucleotide analogues that are
complementary to the nucleotide at the SNP site.
Minisequencing single base extension
Obiettivi principali dell’Human Genome Project
 determinare la sequenza delle coppie di basi
azotate che formano il DNA
 identificare e mappare (localizzare) i geni
 Il genoma di qualsiasi individuo (tranne quello dei
gemelli monozigoti e degli organismi clonati) è
unico; mappare il genoma umano significa quindi fare il
sequenziamento di tutte le variazioni di un gene, per questo
si è lavorato sul DNA di donatori selezionati con criteri di
rappresentatività statistica
 comprendere la funzione dei geni
 determinare la sequenza anche di altri organismi per studi
applicati alle Scienze Evoluzionistiche
 creazione banche dati integrate ad un’interfaccia
web per la ricerca ed analisi dei dati
Principali scoperte del Progetto Genoma
 Gli esseri umani hanno circa 26.000 geni, più o meno lo
stesso numero di quelli dei topi e da confrontarsi con i circa
28.000 di una pianta e i 18.000 di un verme, questa
differenza non sembra abbastanza marcata per spiegare la
complessità dell'organismo umano rispetto a forme di vita
più semplici.
 Tutte le razze umane sono uguali al 99%. Indicando una
discendenza evolutiva da un'unica “madre”.
 La maggior parte delle mutazioni genetiche avviene nel
maschio della specie, il maggiore responsabile nella
trasmissione delle variazioni genetiche.
 La comprensione dell'espressione di questi geni potrà
fornire degli indizi sulle cause di alcune malattie.
Sequencing the Human Genome
2001: Human Genome Project
2.7G$, 11 years
Log10(price)
10
2007: 454
1M$, 3 months
8
6
2008: ABI SOLiD
60K$, 2 weeks
2001: Celera
100M$, 3 years
2010: 5K$,
a few days?
4
2009: Illumina,
Helicos
40-50K$
2
2012: 100$,
<24 hrs?
2000
2005
Year
2010
Next Generation Sequencing
Next Generation Sequencing
1. NGS: sample preparation
Frammentazione del DNA e in vitro legame degli «adattatori»
In generale, gli step di base nella preparazione di RNA o DNA per analisi
NGS sono:
(i)
frammentazione e/o riduzione delle sequenze bersaglio ad una
lunghezza desiderata,
(ii)
conversione del substrato (RNA o DNA) in DNA a doppia elica,
(iii) fissare oligonucleotidi adattatori alle estremità dei frammenti di DNA
bersaglio
(iv) arricchimento mediante PCR dei prodotti per il sequenziamento della
«library».
Le dimensioni dei frammenti di DNA bersaglio nella biblioteca finale è
un parametro fondamentale per NGS costruzione della «library». Il Next
Generation Sequencing, vi darà un sacco di letture di sequenze, ma di
tratterà di brevi frammenti di lettura.
 con Illumina e Ion Torrent le letture sono attualmente della lunghezza
di 600 basi.
 con Roche 454 legge meno di 1kb e
 PacBio meno di 9 kb di lunghezza.
Questo rende molto importante la definizione delle dimensione dei
frammenti di DNA da produrre prima della costruzione biblioteca.
(i)
(ii)
(iii)
(iv)
Metodi per la frammentazione del DNA
1. Fisico
2. Chimico
3. Enzimatico
a)
1. Frammentazione fisica del DNA
Rottura acustica
taglio acustico e ad ultrasuoni sono i principali metodi fisici utilizzati per rompere il DNA. Lo strumento Covaris® (Woburn, MA) è un dispositivo
acustico per la rottura del DNA in frammenti di circa 100-5 kb. Covaris produce anche tubi (gTubes) per processare campioni di 6-20 kb.
b) Sonicazione
Il Bioruptor® (Denville, NJ) è un dispositivo che utilizza ultrasuoni per la frattura della cromatina, del DNA e dei tessuti. Piccole quantità di DNA
possono essere tagliate in 150-1 kb di lunghezza.
c) Taglio idrodinamico
Hydroshear, una sorta di forbici idrauliche della Digilab (Marlborough, MA) utilizzano forze idrodinamiche per tagliare il DNA. Nebulizzatori (Vita
Tech, Grand Island, NY) possono anche essere usati per frammentare il DNA in pezzi da 100-3 kb in pochi secondi.
Mentre la nebulizzazione ha un basso costo e non richiede l'acquisto di uno strumento, non è tuttavia consigliabile se avete poco materiale di
partenza: si può perdere fino al 30% del vostro DNA con questo metodo. Gli altri dispositivi sonicazione e il taglio acustico sono progettate per
volumi più piccoli e non causano perdite del DNA di partenza.
2. Frammentazione chimica del DNA
Calore e cationi di metalli bivalenti
Il taglio chimico è generalmente limitato alla rottura di lunghi frammenti di RNA. Viene tipicamente eseguito tramite la digestione di RNA col calore e
cationi di metallo bivalenti (magnesio o zinco). La lunghezza del RNA (115-350 bp) può essere regolata aumentando o diminuendo il tempo di
incubazione.
3. Frammentazione del DNA con metodi enzimatici
a)
a)
DNasi I o alter endonucleasi di restrizione, nuclease non-specifiche
I metodi enzimatici includono la digestione con DNasi I o Fragmentasi, o una miscela dei due. La Fragmentasi sembra essere la più efficace.
Tuttavia, la Fragmentase produce un numero maggiore di artefatti rispetto alla frammentazione con metodi fisici.
Transposasi
Un metodo enzimatico alternativo è rappresentato dalla tecnologia tagmentation NextEra (Illumina, San Diego, CA), in cui un enzima la
Trasposasi frammenta e contemporaneamente inserisce sequenze dell’adattatore in dsDNA. Questo metodo presenta diversi vantaggi, tra cui
ridotta manipolazione del campione e brevi tempo di preparazione.
Transposase tagmentation reaction
La transposasi frammenta e simultaneamente inserisce adattatori dentro un dsDNA
Sono state sequenziate library contenenti frammenti di lunghezza superior alle 1500 basi
Sonication vs. Transposase fragmentation
Scott Brouilette et all. DEVELOPMENTAL DYNAMICS 241:1584–1590, 2012
Legame dell’adattatore