Sequenziamento del DNA e PCR File - e

Sintesi chimica del DNA
Sintesi in fase solida di oligonucleotidi
Per la sintesi vengono
utilizzati fosforamidi dei
vari nucleotidi. La
fosforamide contiene un
buon gruppo uscente che
promuove la reazione di
formazione di un legame
fosfoestere (fosfito).
Il monomero attivato
aggiunto contiene
dimetossitritile (DMT)
che protegge il 5’ OH e
un gruppo β-cianoetilico
di protezione del gruppo
ossidrilico 3’.
Dopo la sintesi i legami
fosfoestere vengono
ossidati da fosfiti a fosfati
Sequenziamento
Sequenziamento con idrolisi chimica (Maxam and Gilbert 1977)
(formic acid)
• Uso di reagenti chimici che alterano una o al massimo
due basi.
•La base alterata viene essere rimossa (attraverso
riscaldamento) e una seconda reazione con piperidina
porta alla rottura della catena polinucleotidica nel sito
abasico
•I vari frammenti ottenuti dopo l’idrolisi nelle diverse
condizioni sono separati su gel
•Le molecole di DNA, sottoposte alIe differenti reazioni
chimiche e specifiche per le varie basi, sono marcate ad
una estremità. Questo permette di visualizzare solo i
frammenti che iniziano con l’estremità marcata e
terminano con il sito di taglio e la misura loro lunghezza
identifica la posizione della base che è stata alterata nella
specifica reazione
Lettura della sequenza di DNA
Esempio dei frammenti, contenenti l’estremità marcata, ottenibili con l’idrolisi
chimica specifica per la guanina di una molecola di DNA
Sequenziamento chain-terminator o metodo con dideoxinucleotidi (Sanger, 1977)
• Metodo enzimatico che richiede l’uso di una DNA-polimerasi e specifici primer
• La reazione è condotta in presenza di paricolari nucleotidi,ididesossinucleotidi, che
se incorporati portano alla prematura terminazione della sintesi del DNA perchè
privi del 3’OH
Principio della tecnica
3’
5’
T
primer
T
T
T
3’
ddA
ddA
ddA
ddA
5’
Nella reazione oltre al dATP è
presente anche il ddATP (in
genere in rapporto 1:10).
Quando occasionalmente viene
incorporato il ddATP la reazione
di polimerizzazione si interrompe
e la lunghezza del frammento mi
fornisce la posizione della base
usata come ddNTP
•Le molecole di DNA da sequenziare
vengono sottoposte a quattro
differenti reazioni, in ognuna delle
quali è presente un ddNTP.
•Le reazioni di sintesi del DNA
vengono innescate da uno stesso
prime opportunamente marcato per
permettere la migliore
visualizzazione dei frammenti
prodotti.
• I frammenti prodotti durante la
sintesi vengono successivamente
separati su gel e, anche in questo
caso, la misura loro lunghezza
identifica la posizione della base che
è stata utilizzata come ddNTP nella
reazione di polimerizzazione.
Lettura della sequenza di DNA
Sequenziamento automatico
• Nelle quattro differenti reazioni di
polimerizzazione, oltre che essere utilizzati
differenti ddNTP, la sintesi del DNA viene
innescata dallo stesso primer ma marcato con
quattro fluorofori differenti.
• Questo permette di distingure i frammenti che
sono terminati dal ddATP o da un altro ddNTP
perché hanno una fluorescenza differente.
• I prodotti delle quattro reazioni vengono riuniti e analizzati sullo stesso gel. La separazione
elettroforetica permetterà di distinguere i vari frammenti in base alle dimensioni e lo specifico
colore di fluorescenza indicherà la base che si trovava in quella posizione.
Sequenziamento automatico
I prodotti delle quattro reazioni vengono riuniti e separati in continua su gel o elettroforesi capillare.
Un rivelatore è posto alla fine del ge,l o del capillare, e analizza l’intensità ed il colore del frammento
che viaggia nel gel, permettendo cosi di avere informazioni sul tipo di base presente al termine di quel
frammento. Il risultato è una serie di picchi consecutivi, che rappresentano i vari frammenti eluiti a
dimensioni crescenti (ognuno è più lungo di una base) ed il colore identifica la base terminale
(permettendo di leggere direttamente la sequenza del frammento).
La PCR
La Polymerase Chain Reaction o PCR
Replicazione in vitro di determinati tratti di
DNA, selezionati tramite specifici primers
Come funziona?
Miscela di reazione
5’
3’
3’
5’
Primers
d.NTPs
Ripetizione del ciclo
Thermal Stable
DNA Polymerase
Denaturazione
95°C
Taq 5’
3’
3’
Taq
Estensione
Taq
3’
Annealing
50-65°C
5’
3’
5’
5’
3’
5’
3’
Taq
Estensione
72°C
La PCR (il primo ciclo)
La PCR (secondo ciclo)
CICLO
QUANTITA' DI DNA
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
1
2
4
8
16
32
64
128
256
512
1.024
2.048
4.096
8.192
16.384
32.768
65.536
131.072
262.144
524.288
1.048.576
2.097.152
4.194.304
8.388.608
16.777.216
33.554.432
67.108.864
134.217.728
268.435.456
536.870.912
1.073.741.824
1.400.000.000
1.500.000.000
1.550.000.000
1.580.000.000
17
Applicazioni della PCR
• Amplificazione selettiva di specifiche regioni di DNA (la
sequenza di DNA amplificato è delimitata dai primers e la loro
specificità determina la qualità dell’amplificazione
• Indicazioni sulla presenza di specifiche sequenze di DNA in un
campione. Se presenti verranno amplificate e quindi rivelabili
tramite elettroforesi altrimenti possono essere considerate
assenti. In campo diagnostico permette di determinare infezioni
virali (esempio retrovirus o virus difficili da diagnosticare), altri
patogeni, presenza di DNA estraneo, ecc.
• Clonaggio di sequenze informazionali (geni o altre regioni di
DNA), a patto di conoscere le sequenze delle regioni limitrofe
(inizio e fine) per costruire specifici primers.
• Genotipizzazione (DNA fingerprinting)
Genotipizzazione tramite PCR
ANALISI DELLE STR
Le STR (Short Tandem Repeats) sono sequenze di 2-6 bp ripetute
da 3 a 50 volte che si trovano all’interno di regioni introniche
Sono note anche come DNA microsatellite o simple sequence
repeats (SSRs)
Le STR possono essere amplificate mediante PCR
La regione ripetuta è di lunghezza variabile mentre le regioni
adiacenti, dove si legano i primers, sono costanti
Gli individui possono essere omozigoti (i due alleli hanno la stessa
lunghezza) o eterozigoti (i due alleli hanno lunghezze diverse)
Amplificazione di una STR
195 bp
TCAT repeat unit
170 bp
Frequenza allelica nelle STR
45
40
TH01 Marker
35
Frequency
30
Caucasians (N=427)
Blacks (N=414)
Hispanics (N=414)
25
20
15
10
*Proc. Int. Sym. Hum. ID
(Promega) 1997, p. 34
5
0
6
7
8
9
Number of repeats
9.3
10
FBI’s CODIS DNA Database
Loci STR del CODIS
TPOX
D3S1358
D8S1179
D5S818
FGA
CSF1PO
TH01
VWA
D7S820
AMEL
D13S317
D16S539
D18S51
D21S11
AMEL
13 CODIS Core STR Loci with Chromosomal Positions
Analisi comparativa delle STR
Amplificazione contemporanea di più STR mediante Multiplex PCR
Ridotta probabilità di errori introdotti con la PCR
(Informazione nella lunghezza e non nella sequenza)
Risultati uniformi
Possibilità di analizzare campioni in tracce
Analisi mediante DNA-PAGE o elettroforesi capillare
Rapidità nella separazione
Comparazione e/o identificazione
L’analisi comparativa di 13
STR permette di ridurre la
probabilità di un random
match fino a 1 su 1012
Disponibilità di
kit commerciali e
apparecchiature dedicate
Human identity testing
• Casi forensici – analisi comparative tra sospettati e prove
• Test di paternità/maternità – identificazione padre/madre
• Studi storici
• Studi su persone scomparse
• Disastri di massa – identificazione
• Military DNA “dog tag” (alternativa alla piastrina)
• Creazione di DNA databases relativi a criminali condannati
Campioni analizzabili
• Sangue
• Liquido seminale
• Saliva
• Urine
• Capelli
• Denti
• Ossa
• Tessuti
Procedura di analisi
Esempio di un Forensic STR Multiplex Kit
AmpFlSTR® Profiler Plus™
Kit available from PE Biosystems (Foster City, CA)
200 bp
100 bp
300 bp
400 bp
Color Separation
Size Separation
D3
A
vWA
D8
D5
FGA
5-FAM (blue)
D21
D18
JOE (green)
D13
D7
NED (yellow)
ROX (red)
GS500-internal lane standard
9 STRs amplified along with sex-typing marker amelogenin in a single PCR reaction
Human Identity Testing con Multiplex STRs
AmpFlSTR® SGM Plus™ kit
Two different individuals
DNA Size (base pairs)
amelogenin
D19
D3
D8 TH01
VWA D21
D16
D18
D2
FGA
probability of a random match: ~1 in
3 trillion
amelogenin D3
Results obtained in less than 5 hours
with a spot of blood the size of a pinhead
D19
D8
VWA
TH01
D16
D21
FGA
Simultaneous Analysis of 10 STRs and Gender ID
D18
D2
PCR quantitativa
Amplificazione e quantificazione di
specifici frammenti di DNA
• Amplificazione attraverso l’uso della Polymerase Chain
Reaction o PCR (reazione a catena della polimerasi)
• Quantificazione in tempo reale del DNA amplificato mediante
l’uso di sonde fluorescenti (molecole in grado di assorbire la
luce e riemetterla ad un determinato colore)
• L’insieme di queste due tecniche prende il nome di Real-time
PCR
Limite della PCR
Prodotto (T) = (DNA iniziale) x 2n
(n = numero di cicli)
In realtà dopo un certo numero di cicli la
quantità di DNA non aumenta più
esponenzialmente (consumo dei
substrati, ovvero I precursori per
costruire le catene di DNA, e
inattivazione dell’enzima)
DNA amplificato (scala log)
In teoria la quantità di DNA amplificato
raddoppia ad ogni ciclo e il suo
quantitativo può essere espresso dalla
formula
Teorico
Reale
Numero di cicli
Campioni con diverso contenuto iniziale
dello stesso DNA e sottoposti ad
amplificazione mediante PCR seguiranno
delle cinetiche di amplificazione differenti
4 unità
1 unità
1/8 di unità
Determinazione del quantitativo di DNA
amplificato
SYBR Green I
Il SYBR Green I
agente fluorescente intercalante
3’
5’
5’
3’
Estensione
3’
ID
5’
Taq
ID
ID
Taq
5’
ID
ID
3’
Lettura della fluorescenza
l
l
3’
ID
l
ID
ID
ID
ID
Taq
l
ID
ID
l
ID
ID
Taq 5’
3’
Come sono quantificati i dati raccolti
dallo strumento?
Reale
DNA amplificato (scala log)
Teorico
threshold
Detector
Numero di ciclo
Una volta determinata la linea di base (fluorescenza
nei primi cicli di amplificazione), la linea di
threshold viene scelta come il valore di fluorescenza
che statisticamente supera la linea di base (10 volte
la deviazione standard della linea di base).
Ct : threshold cycle
E’ il ciclo al quale la fluorescenza relativa al DNA amplificato
supera il valore della linea di threshold.
Il Ct è proporzionale al numero di sequenze di DNA iniziali
amplificate con la PCR.
Il Ct è proporzionale al numero
di sequenze di DNA iniziali
amplificate con la PCR.
1 unità
Ct = 25
4 unità
Ct =23
4 units
Ct=23
Valori di Ct
23
1/8 di unità
Ct = 28
25
28
Ct : threshold cycle
L’uso di curve di taratura permette anche di determinare il valore
assoluto di specifiche sequenze di DNA nel campione analizzato.
Che cosa è la Real-time PCR?
 Si basa sulla determinazione quantitativa e in tempo reale
dei prodotti di amplificazione della PCR mediante l’uso di
molecole fluorescenti che si legano al DNA
 La Real-time PCR permette di quantificare i livelli di una
specifica molecola di DNA misurando il numero di cicli
(Ct) necessari per ottenere un quantitativo di prodotto
amplificato superiore ad un determinato livello
(threshold)
Applicazioni della Real-time PCR
 Quantificazione precisa di DNA o RNA in campioni
 Stima del numero di copie di un gene (OGM)
 Studi di espressione genica
 RNA (quantificazione del mRNA)
Quantificazione dell’espressione genica
 Tutte le cellule di un organismo contengono lo
stesso DNA (e quindi le stesse informazioni o
geni). Tuttavia non tutti i geni vengono
egualmente espressi (diversità tra cellule)
 Ogni gene espresso viene convertito in mRNA per
poi essere tradotto in proteina
 Le differenti proteine prodotte in una cellula ne
determinano le specifiche funzioni
 E’ possibile quantificare i livelli di mRNA di
specifici geni mediante la Real-time PCR
 L’mRNA viene prima convertito in DNA (cDNA) e
poi sequenze specifiche (corrispondenti a
determinati geni) vengono quantificate mediante
la tecnica
 E’ così possibile identificare e quantificare geni che
vengono diversamente espressi in determinate
cellule o in seguito a modifiche (trasformazione
tumorale)