Reazione a Catena della Polimerasi (PCR = Polymerase Chain Reaction) Indice Concetti di base sulla PCR ........................................................................................................................ 3 Acidi nucleici ............................................................................................................................................ 4 Cenni storici .......................................................................................................................................... 5 Primer ........................................................................................................................................................ 6 Uso di primer sintetici in biologia molecolare ...................................................................................... 6 Primer per il sequenziamento ................................................................................................................ 6 Annealing .............................................................................................................................................. 7 Primer per la PCR ................................................................................................................................. 7 Taq polimerasi....................................................................................................................................... 8 Possibilità ed efficienza della PCR ........................................................................................................... 8 Basi teoriche della PCR ............................................................................................................................ 9 Protocollo della reazione ......................................................................................................................... 10 Impiego della polimerasi per l’innesco dei ciascun ciclo di amplificazione .......................................... 14 Componenti di una reazione di PCR ....................................................................................................... 14 Visualizzazione dei prodotti di amplificazione ....................................................................................... 14 Ottimizzazione dei protocolli di PCR ..................................................................................................... 15 Concentrazione di MgCl2 del tampone .............................................................................................. 15 Purezza dei reagenti ............................................................................................................................ 16 Selezione dei primers .......................................................................................................................... 16 Criteri di scelta dei primer ...................................................................................................................... 16 Specificità............................................................................................................................................ 16 Lunghezza dei primer.......................................................................................................................... 16 Temperatura di annealing.................................................................................................................... 16 Sequenza ............................................................................................................................................. 16 Purezza e quantità del templato .............................................................................................................. 17 Tipo di enzima utilizzato......................................................................................................................... 17 Uso di enhancers ..................................................................................................................................... 17 Parametri del termociclizzatore .............................................................................................................. 18 Hot start PCR .......................................................................................................................................... 18 Strategie per la specificità della PCR ...................................................................................................... 19 Clonaggio di frammenti di DNA ottenuti mediante PCR ....................................................................... 20 TA overhang cloning .............................................................................................................................. 20 Blunt-end cloning .................................................................................................................................... 22 Clonaggio direzionale ............................................................................................................................. 23 Amplificazione di RNA (RT-PCR)......................................................................................................... 23 Metodo di preparazione dell’ RNA ......................................................................................................... 24 Sintesi del primo strand del cDNA con il primer più adatto ................................................................... 25 Amplificazione enzimatica ..................................................................................................................... 25 PCR quantitativa. .................................................................................................................................... 25 Preparazione del campione ................................................................................................................. 25 1 Amplificazione .................................................................................................................................... 25 Detezione del prodotto ........................................................................................................................ 26 Fase logaritmica .............................................................................................................................. 26 End-point (RT) – PCR .................................................................................................................... 26 Multiplex PCR ........................................................................................................................................ 28 Real-time quantitative PCR .................................................................................................................... 29 Molecular beacons .............................................................................................................................. 30 Quantificazione della Real-time quantitative PCR ................................................................................. 31 Quantificazione assoluta (metodo della curva standard) .................................................................... 31 Quantificazione relativa ...................................................................................................................... 34 Metodo comparativo del Ct............................................................................................................. 34 Metodo della curva standard ........................................................................................................... 34 Efficienza relativa dei geni target e del controllo ........................................................................... 34 Applicazioni della Real-time quantitative PCR .............................................................................. 35 Analisi di mutazioni puntiformi .......................................................................................................... 35 Fluorescenza........................................................................................................................................ 35 Misurazioni in parallelo .................................................................................................................. 36 Rivelamento nel tempo ................................................................................................................... 36 La fluorescenza nella PCR quantitativa .......................................................................................... 36 Ibridazione in vicinanza .................................................................................................................. 37 Genotipizzazione ............................................................................................................................. 37 Lettura e analisi dei risultati Real Time PCR ..................................................................................... 38 La bioinformatica per la progettazione di primers per PCR e verifica della specificità, per la progettazione di costrutti ricombinanti e ricerca dei siti di restrizione ................................................... 38 Progettazione di costrutti ricombinanti e ricerca dei siti di restrizione............................................... 47 Analisi di cromatogrammi da sequenziamento ................................................................................... 50 Notizie storiche sulla scoperta della PCR ............................................................................................... 53 Referenze ................................................................................................................................................ 54 2 Reazione a Catena della Polimerasi (PCR = Polymerase Chain Reaction) Concetti di base sulla PCR. Polymerase Chain Reaction (PCR) è una tecnologia che consente di amplificare enzimaticamente in vitro, in modo specifico, sequenze di DNA o di RNA, anche rare, in una miscela complessa, quando siano note le estremità 5’ e 3’ della sequenza stessa. A seguito dell’amplificazione enzimatica, è possibile ottenere, da una sola molecola di DNA, ben 109 molecole. Il principio a cui si ispira la PCR è la replicazione del DNA: Questa tecnologia ha permesso di procedere ad esperimenti che prima erano impossibili, presentando numerose applicazioni nel campo della ricerca di base e della diagnostica: - clonaggio DNA e cDNA, librerie; - mutagenesi in vitro; - ingegnerizzazione DNA; - fingerprinting in scienza forense; - test diagnostici per la presenza di agenti infettivi; - diagnosi prenatale di malattie genetiche; - analisi di predisposizione genetica a patologie; - analisi di variazioni di sequenza alleliche; - sequenziamento di DNA e cDNA; - analisi della struttura dei trascritti a RNA. 3 Acidi nucleici Gli acidi nucleici sono macromolecole aperiodiche a debole reazione acida, deputate alla conservazione e al trasporto dell'informazione genetica delle entità biologiche, virus e cellule. Nella cellula eucariota, sono presenti in strutture a maggior densità nel nucleo, ma sono ugualmente presenti nel citoplasma. Sono deputati alla conservazione e trasmissione dell'informazione biologica negli esseri viventi. Gli acidi nucleici sono delle macromolecole polimeriche lineari, ovvero polimeri di nucleotidi i cui monomeri sono i nucleotidi stessi. Questi sono formati da uno zucchero, una base azotata e alcuni gruppi fosfato. Negli organismi viventi si trovano due tipi di acidi nucleici: DNA (acido desossiribonucleico o deossiribonucleico) RNA (acido ribonucleico) I legami tra i tre gruppi che formano un nucleotide sono: un legame fosfoestere tra il carbonio 3' e il gruppo fosfato; un legame tra il gruppo fosfato e il carbonio 5' del nucleotide seguente. Acido fosforico (gruppo fosfato) La base azotata è esterna allo scheletro formato dagli altri due gruppi e si dice che "si affacci" all'interno della catena. La catena ha forma di elica per i legami difosfato che si formano nella sua struttura secondaria. Tutti gli organismi contengono acidi nucleici sotto forma di DNA e RNA. Il DNA è il depositario dell'informazione genetica che viene trascritta – ossia copiata – in molecole di RNA. L'RNA contiene il codice per sintetizzare specifiche proteine. Lo zucchero dell'RNA è il ribosio; quello del DNA è il desossiribosio. Forma emiacetalica (ciclica) del ribosio e desossiribosio In entrambe le sostanze vi sono due tipi di basi azotate: le puriniche (anello doppio), quali adenina e guanina, derivanti dalla purina; le pirimidiniche (anello semplice) quali timina, citosina e uracile, derivanti dalla purina pirimidina. Le basi azotate che costituiscono il DNA sono adenina (A), guanina (G), citosina (C) e timina (T). Le basi azotate che costituiscono l'RNA sono adenina (A), guanina (G), citosina (C) e uracile (U). La doppia elica di DNA accoppia una pirimidina e una purina, l'adenina si accoppia con la timina e la citosina con la guanina: A-T; C-G. L'RNA (anche se singola catena) accoppia durante le trasmissioni e le traduzioni l'adenina all'uracile (la timina non è presente nell'RNA) e la citosina alla guanina: A-U; C-G. 4 adenina timina citosina guanina uracile In seguito viene riportato come si ottiene il 5’-monofosfatodesossiadenosina (dAMP): 5’-monofosfato perché lo zucchero pentoso aggancia la molecola di H3PO4 in corrispondenza dell’atomo di carbonio in posizione 5’; desossi perche lo zucchero è il desossiribosio, adenosina perché la base azotata è l’adenina. Zucchero pentoso Base azotata Gruppo fosfato Nucleotide - 2H2O → Desossiribosio adenina 5’-monofosfatodesossiadenosina (dAMP) acido fosforico Nei batteri e nelle cellule di organismi superiori, sono presenti entrambi; alcuni virus possiedono solo l'RNA (ad esempio quello della poliomielite o quello dell'AIDS); altri solo il DNA. Negli eucarioti, il DNA si trova nel nucleo e nel mitocondrio, mentre l'RNA si trova nel nucleo, ma soprattutto nel citoplasma. Al DNA spetta il mantenimento dei caratteri ereditari, mentre all'RNA spettano altre mansioni, quale la trasmissione delle informazioni contenute nel DNA verso i siti di sintesi proteica. Un acido nucleico si ottiene con un processo di sintesi per disidratazione tra due o più nucleotidi. RNA e DNA sono molecole molto complesse: è quindi probabile che risultino dall'evoluzione di molecole esistenti precedentemente. Sebbene i loro antenati siano scomparsi dalle attuali forme viventi, sono stati creati in laboratorio diversi acidi nucleici sintetici che possiedono, ad esempio, altri zuccheri come scheletro della molecola. Un acido nucleico particolarmente interessante per queste ipotesi è il TNA (acido treofuranosilnucleico). Cenni storici. La ricerca sulla struttura degli acidi nucleici ebbe inizi più lenti di quella sulle proteine, soprattutto perché gli acidi nucleici non si trovano, come invece alcune proteine fibrose, in uno stato relativamente puro. Il loro nome li definisce come contenuti nel nucleo delle cellule. Furono trovati abbondanti dapprima nel lievito e poi nel timo, ghiandola endocrina attiva fino all'adolescenza. L'associazione tra il periodo dell'adolescenza e la formazione di proteine fu messa in evidenza nel lavoro di Casperssen negli anni 30. Il fatto che assorbivano luce ultravioletta e assumevano certi colori rivelò la loro presenza in vaste quantità nei cromosomi, già noti per essere associati alle trasformazioni genetiche e alla riproduzione. Chimicamente, sono polimeri di unità di base dette nucleotidi, formati da una base azotate (purinica o pirimidinica) legata a uno zucchero pentoso (ribosio nell'acido 5 ribonucleico, RNA, desossiribosio, nell'acido desossiribonucleico, DNA) e a un gruppo fosfato che fa da ponte tra i pentosi di due nucleotidi successivi. Il loro difficile studio strutturale fu iniziato nel 1932 da Astbury, dopo che erano stati isolati e dopo che si era trovato che potevano essere dissolti in un liquido glutinoso, che poteva essere ridotto in filamenti, rivelando una struttura polimerica fibrosa. Astbury dimostrò che i quattro nucleotidi, le purine, adenina e guanina, e le pirimidine, citosina e timina (uracile nel RNA), si disponevano come monete ad angolo retto rispetto all'asse del filo. Furberg dimostrò che il cerchio delle molecole di zucchero era sistemato ad angolo retto in modo da poter essere raggiunto attraverso gli zuccheri dai fosfati per formare un polimero. Quando le analisi chimiche di Chargaff dimostrarono che il numero di purine e pirimidine era esattamente equilibrato, Crick e Watson enunciarono la loro famosa ipotesi secondo la quale l'organizzazione non è a elica singola ma doppia, dato che la purina di una catena si unisce con la pirimidina in un unico avvolgimento con essa. Wilkins e Franklin fecero in seguito una verifica analizzando le con i raggi X. Sebbene anche gli acidi nuclei contengano tutti e quattro i nucleotidi, il loro ordine preciso è quello che costituisce la caratteristica di ogni specifico acido nucleico ed è trasmesso quasi automaticamente quando una nuova ma identica molecola di acido nucleico viene deposta sull'elica della vecchia. Il panorama di questa struttura molecolare degli acidi nucleici contiene tutto quanto è necessario, in linea di principio, per permettere che un nastro, il quale porti e trasmetta informazioni, possa essere costruito nella parte più interna di ogni cellula o particella virale. Primer Un primer (in italiano: innesco) è un filamento di acido nucleico che serve come punto di innesco per la replicazione del DNA. I primer sono necessari perché molte DNA-polimerasi (enzimi che catalizzano la replicazione del DNA) non possono iniziare la sintesi di un nuovo filamento "ex novo", ma possono solo aggiungere nucleotidi ad un filamento preesistente. In natura, generalmente, è l'RNA che viene usato come primer, perché le RNA polimerasi (enzimi che catalizzano la trascrizione del RNA) sono in grado di iniziare la sintesi di una nuova catena senza ricorrere ad un innesco. Gli inneschi vengono sintetizzati da RNA-polimerasi specializzate, chiamate primasi, le quali, dopo la denaturazione della doppia elica, ad opera dell'enzima elicasi e delle proteine destabilizzatrici della doppia elica, si legano ai filamenti stampo e iniziano a sintetizzare corti frammenti di RNA. Su entrambi i lati della forca di replicazione, i primer sono assemblati in direzione 5'→3', in maniera discontinua sul filamento ritardo, (tramite frammenti di Okazaki). La DNA-polimerasi aggiunge i desossiribonucleotidi a partire dall'estremità 3' libera del primer. Dopo aver svolto il loro compito, i primer sono degradati ad opera della polimerasi I, che possiede anche un'attività esonucleasica, o di RNAasi H specializzate. Dopo la rimozione dei primer, lungo il filamento di DNA si vengono a creare dei vuoti, che sono colmati ad opera della DNA-polimerasi I, nei procarioti, e dalla DNA-polimerasi α negli eucarioti. Infine, l'interruzione viene saldata dall'enzima ligasi. Uso di primer sintetici in biologia molecolare. I primer sono utilizzati in molte tecniche di biologia molecolare che richiedono la DNA-polimerasi, come in alcune tecniche di sequenziamento del DNA e nella reazione a catena della polimerasi (PCR). I primer usati in queste tecniche sono dei corti frammenti di DNA, della lunghezza di 18-20 basi. Questi inneschi sono costruiti in laboratorio, attraverso una sintesi chimica. Primer per il sequenziamento. Una tecnica di sequenziamento del DNA che utilizza i primer sintetici è quella di Sanger (detta anche tecnica del dideossi), un metodo enzimatico con il quale corti frammenti di DNA (interrotti, alternativamente, in corrispondenza di uno dei quattro nucleotidi privati 6 dell'ossidrile in posizione 3') sono sintetizzati dalla DNA polimerasi I, che richiede la presenza di primer (che vengono dunque aggiunti alla miscela di reazione). I primer utilizzati in questa procedura possono essere marcati con sostanze fluorescenti per visualizzare i frammenti corrispondenti, in seguito alla loro separazione su gel di agarosio. Annealing. Con il termine annealing (appaiamento), si intende la formazione di un acido nucleico a doppio filamento partendo da due molecole a singola elica. Il termine è entrato nel gergo tecnico di laboratorio per indicare l'appaiamento di un primer o di una sonda di DNA ad una catena a singola elica di DNA durante una reazione a catena della polimerasi. Primer per la PCR. Anche la PCR, una comunissima metodica che permette l'amplificazione di frammenti di DNA, si serve di primer sintetici. Durante la fase di amplificazione vengono infatti utilizzati primer che aderiscono al DNA (fase di annealing), fungendo da innesco per la DNA polimerasi. I due primer utilizzati per la PCR sono definiti reverse e forward, a seconda che siano complementari al filamento 5'→3' o a quello inverso 3'→5'. La costruzione di primer richiede il controllo di alcuni parametri. Uno dei parametri più importanti è la temperatura di melting (Tm) del primer, la temperatura alla quale il 50% delle molecole si trova in forma di doppia elica stabile ed il restante 50% in forma di singola elica. In altre parole, è la temperatura alla quale il 50% delle molecole di DNA sono denaturate. Tale temperatura è strettamente correlata al contenuto nucleotidico in AT (o in CG). I fattori che influenzano la temperatura di melting sono: Composizione del DNA: un incremento pari a 1% di basi complementari G e C determina + 0,4 °C della Tm; Concentrazione della soluzione salina: un aumento di 10 volte la concentrazione di cationi monovalenti della soluzione contenente il DNA determina un aumento di 16,6 °C della Tm. Nella costruzione dei primers è necessario che essi presentino una temperatura di melting e di annealing molto vicine (solitamente le differenze massime si possono attestare intorno a 1-2 °C). I primers che funzionano maggiormente sono di solito quelli più ricchi di C o G alle estremità, perché sono quelli che si legano più fortemente al DNA stampo (instaurando tre legami idrogeno invece di due). La lunghezza dei primer è direttamente proporzionale alla temperatura di melting. Primer troppo corti sono spesso poco specifici; d'altra parte primer con temperature di melting troppo alte possono creare problemi alla DNA polimerasi, che è meno attiva a temperature superiori a 80 °C. La lunghezza ottimale di un primer è generalmente compresa tra 20 e 30 nucleotidi, con temperature di melting comprese tra 55 e 65 °C. Le sequenze dei primer devono essere scelte in modo tale che l'annealing avvenga solo con le sequenze d'interesse del DNA stampo, evitando l'adesione a sequenze simili, con la conseguente perdita di specificità. Viene inoltre evitata la presenza di nucleotidi ripetuti o sequenze complementari all'interno dello stesso primer, per evitare la formazione di loop, o forcine. Anche l'ibridizzazione tra primer diversi, per la presenza di sequenze ripetute e invertite, con formazione di dimeri, determina una diminuzione dell'efficienza dell'annealing. A volte si possono utilizzare primer degenerati, costituiti da miscele di molecole simili ma non identiche (differenti per alcuni nucleotidi all'interno della sequenza). Primer degenerati risultano utili, ad esempio, quando si devono amplificare gli stessi geni provenienti da organismi diversi (che hanno sequenze simili ma non identiche), oppure quando la sequenza del gene è stata ricavata dalla sequenza della proteina corrispondente, tenendo conto della degenerazione del codice genetico. Un altro uso di primer degenerati è quello relativo al campo dell'ecologia microbica, per permettere l'amplificazione di geni di microrganismi di cui non è ancora nota l'informazione genomica. 7 Esistono in rete banche dati alle quali i laboratori di biologia molecolare possono riferirsi per scegliere le sequenze di primer più adatte alla loro ricerca. Un metodo comunemente usato è la ricerca BLAST con la quale possiamo trovare tutte le regioni possibili a cui un primer si può legare. Lo strumento NCBI Primer-BLAST integra progettazione di primer e ricerca BLAST in una sola applicazione. Possono, inoltre, essere eseguite simulazioni al computer di risultati teorici di PCR (PCR Elettronico) per aiutarci nella progettazione di primer. I primers sono gli "inneschi" che si attaccano alla sequenza da amplificare. I primer per la PCR sono: - il primer forward o "senso" ("sense" in inglese) si attacca alla sequenza "non codificante" (è quindi uguale alla sequenza codificante, per questo è detto senso). Il primer forward è complementare al filamento 3' → 5'. - il primer reverse o "antisenso" ("antisense" in inglese) si attacca alla sequenza "codificante. Il primer reverse è complementare al filamento 5' → 3' Taq polimerasi. La Taq polimerasi (DNA polimerasi termostabile) è una polimerasi, proveniente dall'organismo termofilo Thermus aquaticus. L'enzima è costituito da una singola catena polipeptidica, con massa molecolare di 94 kDa. Presenta un'attività principale DNA-polimerasi DNA-dipendente in direzione 5' → 3', per la quale è richiesta una temperatura ottimale di 75-80 °C e la presenza di ioni Mg2+ (ad es. MgCl2); in tali condizioni la reazione avviene con elevata processività e alto numero di turn-over. La reazione polimerasica prevede la formazione del legame fosfodiesterico fra un terminale 3'-OH di un nucleotide di innesco e il fosfato alfa sul 5'-trifosfato di un nucleotide libero (dATP, dGTP, dCTP, dTTP), con rilascio di pirofosfato (PPi). L'enzima segue le regole di complementarità fra le basi (A-T/C-G) imposte dal templato, inoltre, un terminale 3'-OH è sempre richiesto, come per tutte le DNA polimerasi ed in mancanza è sempre necessario un primer per iniziare la sintesi. n(dNP)+ dNTP → n+1(dNP) + PPi Inoltre l'enzima possiede un'attività esonucleasica 5' → 3', mentre non mostra alcuna attività esonucleasica 3 ' → 5'. Questo→ tipo di polimerasi è conosciuta in particolar modo perché utilizzata per la tecnica di reazione a catena della polimerasi, nella fase di annealing. La caratteristica resistenza a temperature elevate permette il suo utilizzo in quanto il DNA, per essere amplificato con tale tecnica, deve essere prima denaturato in due filamenti separati ad una temperatura di 94 °C, temperatura che distrugge le normali polimerasi. Un ulteriore uso riguarda il sequenziamento di frammenti che presentano forti strutture secondarie a basse temperature, per cui l'uso dei normali enzimi sarebbe inadeguato. Possibilità ed efficienza della PCR la PCR può amplificare una quantità di DNA visualizzabile in gel elettroforesi in circa 2 ore; il DNA templato non deve essere necessariamente altamente puro e si può amplificare addirittura da colonie batteriche bollite; la PCR può amplificare una singola molecola di DNA; la lunghezza del frammento di DNA da amplificare può essere in linea teorica ampiamente variabile, fino anche a 25kb. Si ha però un drastico calo di efficienza di amplificazione con target >3 kb. Mediamente i frammenti che si amplificano sono nel range di 100-1500 bp. Prima dell’avvento della PCR l’analisi genetica si avvaleva di varie tecniche: southern blotting (1975): permise il rudimentale mappaggio di geni; 8 sequenziamento di DNA (1978): richiedeva il clonaggio di geni in vettori; la costruzione di library di geni ed il loro screening richiedeva molti mesi di lavoro. Segue uno schema sintetico dei diversi step della metodica della PCR. Basi teoriche della PCR Le basi teoriche della PCR furono descritte già intorno agli anni ’70 da Kjell Kleppe, norvegese del Khorana Laboratory e da Har Gobind Khorana, Nobel in fisiologia o medicina nel 1968, ma suscitò particolare interesse solo nel 1983, quando Kary Mullis, Nobel in chimica dieci anni dopo, descrisse 9 una tecnica che consentiva di ottenere grosse quantità di DNA di geni a copia singola dal DNA genomico. Nella reazione sono presenti tre segmenti di DNA: un segmento a doppia elica da amplificare (templato) e regione di interesse; due oligonucleotidi a singola elica che lo fiancheggiano e che funzionano da primer della reazione. Inoltre intervengono una componente proteica enzimatica trifosfodesossiribonucleotidi (dNTPs), un tampone di reazione e sali. (DNA polimerasi), i Protocollo della reazione La procedura della PCR prevede l’uso di oligonucleotidi sintetici complementari alle regioni 3’ del segmento di DNA target (templato). Gli oligonucleotidi sono aggiunti in largo eccesso rispetto al segmento di DNA da amplificare. Ibridizzano sugli strand opposti del templato e sono orientati con le loro estremità di fronte l’una all’altra, così che la sintesi ad opera della DNA polimerasi (che dirige la crescita in direzione 5’ →3’) si estende attraverso il segmento di DNA tra loro. I primers vengono aggiunti al DNA e la temperatura viene prima alzata a 94-96 °C per denaturare il templato e separare i due strand complementari e poi abbassata a circa 50-60 °C. A tale temperatura il DNA templato rimane denaturato perché gli strands complementari si trovano a concentrazioni troppo basse nella miscela di reazione per incontrarsi durante il breve periodo di 10 incubazione, ma gli oligonucleotidi specifici, che sono a concentrazione molto elevata, possono ibridizzare con le regioni del templato ad essi complementari. Questi oligonucleotidi servono così da primer per la sintesi della catena di DNA, che avviene a temperatura di 60-72 °C a seguito dell’aggiunta di una miscela di reazione contenente dNTPs e l’enzima DNA-polimerasi. Un ciclo di sintesi risulta in due nuovi strand complementari che, come le eliche parentali, possono ibridizzare con i primer a seguito di un successivo ciclo di denaturazione e annealing e funzionare quindi a loro volta da templato. La quantità del templato si duplica ad ogni successivo ciclo di denaturazione, annealing ed estensione, accumulandosi in maniera esponenziale così che 30 cicli dovrebbero risultare in 230 molecole di DNA. Segue lo schema di un ciclo di PCR: Schema esplicativo di due cicli di PCR: 11 Schema di quattro cicli di PCR: Nello schema sotto riportato dell’amplificazione esponenziale teorica e pratica della PCR, possiamo vedere, durante i cicli di amplificazione esponenziale, il frammento desiderato, il numero di copie contenenti il frammento, il numero di copie di DNA contenenti il frammento della corretta lunghezza: 12 Numero di copie di DNA in rapporto ai cicli ed in relazione all’efficienza della PCR: Nella pratica, dopo 1 ciclo si formano un differente numero di copie di DNA della corretta lunghezza contenenti il frammento desiderato. La quantità numerica è di seguito indicata: 100% di efficienza = 2,00 x 90% di efficienza = 1,90 x 80% di efficienza = 1,80 x 70% di efficienza = 1,70 x. Dopo n cicli l’aumento dei prodotti utili è dato dalla seguente relazione: incremento utile = (efficienza)n 13 Con riferimento alla reazione a catena della PCR va detto quanto segue: in pratica, non si formano copie valide fino al terzo ciclo; l’accumulo non è esponenziale nella prima fase; 9 a 30 cicli ci sono circa 1.073.741.824 copie (circa 1 x 10 ) per un’efficienza del 100%, 230.466.618 copie per un’efficienza del 90%, 45.517.160 copie per un’efficienza di 80%, 8.193.466 copie per un’efficienza del 70%. Impiego della polimerasi per l’innesco dei ciascun ciclo di amplificazione Nella sua descrizione originale la metodica della PCR utilizzava il frammento di Klenow dell’enzima DNA polimerasi di Escherichia coli che però, a causa del passaggio di denaturazione ad alta temperatura, doveva essere riaggiunto fresco ad ogni nuovo ciclo di amplificazione. Infatti, questo enzima, essendo termolabile, veniva inattivato durante il passaggio di denaturazione del DNA. L’avvento della Taq DNA polimerasi da Thermophilus aquaticus (Saiki et al, 1988) ha notevolmente facilitato l’automazione di tale procedura e, per la sua termo stabilità e resistenza alle alte temperature, ha permesso di lavorare a temperature di annealing e di estensione (72 °C) molto più elevate, aumentando così la stringenza dell’ibridazione fra primer e templato e quindi la specificità del prodotto amplificato. L’impiego della Taq DNA polimerasi ha portato, pertanto ad importanti miglioramenti della metodica di PCR: la resistenza alle alte temperature ha evitato la necessità di aggiungerlo continuamente durante l’amplificazione; la possibilità di utilizzare una temperatura più elevata durante la fase di estensione (circa 72 °C invece di 37 °C) ha permesso di mantenere un’elevata specificità di appaiamento (annealing) per i primers; l’impiego della Taq DNA polimerasi termostabile ha permesso l’automazione della reazione a catena di amplificazione, semplicemente ponendo la provetta con la miscela di reagenti in un termociclatore opportunamente programmato. Recentemente si è cercato di sviluppare dei sistemi che permettessero di ridurre i tempi di amplificazione. Un esempio è dato dalla PCR effettuata in capillari di vetro che consentono, grazie al ridotto volume di reazione ed al favorevole rapporto superficie/volume, un riequilibrio della temperatura quasi istantanea e di conseguenza l’utilizzo di tempi di denaturazione ed appaiamento estremamente brevi. Componenti di una reazione di PCR I componenti di una reazione di PCR sono lo stampo, i primers, i deossiribonucleotidi trifosfati, il tampone contenente il cloruro di magnesio, l’enzima. Lo stampo è costituito dal DNA a doppio filamento; I primers sono gli oligonucleotidi complementari a regioni dei filamenti opposti che fiancheggiano la sequenza DNA bersaglio; I deossiribonucleotidi trifosfati costituiscono la miscela equimolare di dATP, dTTP, dGTP, dCTP; ++ Il tampone è rappresentato dal cloruro di magnesio e deve fornire ioni Mg essenziali per il funzionamento dell’enzima; L’enzima costituito tradizionalmente dalla Taq polimerasi, enzima termostabile estratto dal batterio termofilo Thermus aquaticus. Visualizzazione dei prodotti di amplificazione La visualizzazione prodotti di amplificazione dei DNA avviene mediante elettroforesi su gel di agarosio. 14 Il gel è contenuto in una cella elettroforetica. Nella cella è presente una soluzione elettrolitica che favorisce il passaggio di corrente elettrica quando è collegata ad un alimentatore. Il voltaggio è calcolato sulla base della lunghezza del gel (5 V/cm). Il DNA estratto o i frammenti amplificati (gli acidi nucleici in soluzione hanno carica negativa per la presenza dei gruppi fosfati) migrano dal polo negativo verso il polo positivo con velocità differente in funzione di: Dimensione dei frammenti di DNA. Concentrazione di agarosio nel gel. Voltaggio applicato ai due poli della cella elettroforetica. Il DNA è visualizzato con radiazioni ultraviolette. L’apparecchio di emissione è il transilluminatore. In fase di polimerizzazione del gel è aggiunto un agente intercalante le basi azotate (bromuro di etidio). Il bromuro di etidio reagisce emettendo fluorescenza quando esposto ai raggi UV e consente la visualizzazione delle bande di DNA. La concentrazione ed il numero di paia di basi dei frammenti amplificati vengono rispettivamente stabiliti, per analogia, dai marker/ladder, che sono frammenti di DNA a concentrazione (marker) e lunghezza (ladder) nota. Sotto viene riportata l’immagine di gel di agarosio mediante trans illuminatore, dove: Line 1 rappresenta il ladder; Line 2, 3, 4, 5, 6, 7, 8, 9 sono i frammenti di DNA amplificati. Ottimizzazione dei protocolli di PCR Molte sono le variabili che possono influenzare l’efficienza della PCR. Ogni PCR è una reazione a sé da ottimizzare, nel senso che condizioni che sono funzionali ed efficienti in una certa PCR possono non esserlo in altre PCR. Le principali variabili da tenere in considerazione nel mettere a punto un protocollo di PCR sono: la concentrazione di MgCl2, la purezza dei reagenti, la selezione dei primers, la purezza e la quantità del templato, il tipo di enzima utilizzato, l’hot start PCR, l’uso di enhancers, i parametri del termociclizzatore. Concentrazione di MgCl2 del tampone: generalmente nella messa a punto di un protocollo di PCR è necessario determinare la concentrazione ottimale di MgCl2, indispensabile per il funzionamento della Taq e dalla cui concentrazione dipende anche la fedeltà della reazione (un eccesso causa una perdita di fedeltà). Il magnesio viene anche chelato da stampo, primers e dNTPs. Gli enzimi e i loro buffer di reazione vengono venduti privi di MgCl2 per permettere appunto all’operatore di settare la concentrazione ottimale per il proprio protocollo e per il proprio set primers/templato. A volte bisogna trovare un compromesso tra resa e specificità. In genere vengono utilizzate concentrazioni che vanno 15 da 1.5 mM a 5 mM (ed oltre, in alcuni casi). L’uso di enhancers permette di aumentare la molarità del sale nel tampone di reazione. Purezza dei reagenti: la presenza di contaminanti (DNAsi, RNAsi) nella miscela di reazione può avere un effetto deleterio sulla reazione stessa. E’ necessario pertanto utilizzare materiale plastico monouso, preferibilmente autoclavato o comunque sterilizzato per evitare la possibile contaminazione con DNAsi e puntali con filtro per evitare possibili aerosol durante il pipettamento. E’ inoltre buona regola utilizzare piccole aliquote di ciascuno dei componenti della miscela di reazione per evitare contaminazioni da DNA precedentemente amplificato (carry-over). Selezione dei primers: questo è senz’altro il fattore più critico da considerare ed il meno facilmente prevedibile nella messa a punto di un protocollo di PCR. Primer, che in linea teorica dovrebbero funzionare al meglio in determinate condizioni, non necessariamente possono dare i risultati sperati. Per massimizzare la possibilità che una coppia di primers funzioni al meglio occorre comunque considerare alcuni parametri. Criteri di scelta dei primer o Specificità: i primers sono disegnati in modo da essere esattamente complementari alla sequenza target. Un buon primer dovrebbe ibridare efficacemente solo con la sequenza di interesse e dare ibridazione non significativa con altre sequenze di DNA contenute nel templato. Esistono al riguardo dei programmi on-line che consentono di verificare questo parametro (programma Blast), come si vede nelle figure seguenti. In alcuni casi però si rende necessario l’uso di primers non perfettamente complementari. Nel caso ad esempio che si voglia amplificare un gene di cui è nota solo la sequenza proteica o nel caso in cui si voglia isolare un gene omologo ad un gene di un’altra specie, si rende necessario l’uso di primer degenerati: in tali casi è preferibile avere la regione di mismatch nella zona in 5’ del primer mentre è meglio evitare mismatch e degenerazioni nella regione 3’ altrimenti l’estensione può non avvenire. R = A, G H = A, C, T Y = C, T B = C, G, T W = A, T V = A, C, G M = A, C D = A, G, T K = G, T N o I = A, C, G, T S = C, G o Lunghezza dei primer: la lunghezza ottimale dei primer è di 20-30 basi (più lunghi quando ricchi di A/T). Primer più lunghi non aumentano la specificità dell’amplificazione. o Temperatura di annealing: le temperature di annealing dei due primer dovrebbero essere simili. La Tm dipende dalla lunghezza e dalla sequenza del primers. Approssimativamente: Tm = 4(G+C)+2(A+T)°C T annealing ~ 2-5°C al di sotto della più bassa Tm dei due primers usati Se la Ta dei due primers è molto diversa si possono verificare amplificazioni asimmetriche o a singolo filamento. o Sequenza: la sequenza dei primer è estremamente importante. 1. Essi devono avere un contenuto in GC simile a quello del templato, e comunque attorno al 45-50%. 2. E’ meglio evitare stretches di basi uguali, per evitare possibili strutture secondarie, che possono aumentare notevolmente la Tm. Esistono a tale proposito dei programmi che sono 16 in grado di predire possibili strutture secondarie nelle condizioni di PCR scelte per il proprio protocollo. 3. L’ultima base in 3’ dovrebbe essere una G o una C. 4. Assenza di sequenze ripetute e invertite che possano far ripiegare i primers su se stessi formando un hairpin 5´- GTTGACTTGATA | | | | | T 3´- GAACTCT In questo caso, inoltre, la regione 3’ è annealata e si impedisce l’annealing al templato. 5. Inoltre i primer possono formare dei dimeri (primer-dimers) derivati dall’annealing delle regioni 3’ dei primers stessi, che possono essere estesi dalla polimerasi: questi prodotti spuri competono con il templato target per l’amplificazione diminuendo in questo modo l’efficienza della PCR. 5´- ACCGGTAGCCACGAATTCGT-3´ | | | | | | | | | | 3´-TGCTTAAGCACCGATGGCCA-5´ Purezza e quantità del templato: alcuni contaminanti che si possono trovare nelle preparazioni di DNA possono diminuire l’efficienza della PCR. Tra questi urea, SDS, sodio acetato, e agarosio (derivato dalla purificazione su gel del DNA). L’estrazione con solventi organici e la precipitazione del campione possono minimizzare questi problemi. Per quanto riguarda la quantità di templato, occorre considerare che una quantità eccessiva può naturalmente aumentare la quantità anche di contaminanti e può anche facilitare la presenza di prodotti aspecifici di amplificazione. Tipo di enzima utilizzato: le caratteristiche peculiari della Taq polimerasi sono essenzialmente la capacità di essere sottoposta a continui cicli di riscaldamento e raffreddamento e di sintetizzare DNA a temperature che evitano la formazione di strutture secondarie e l’annealing imperfetto e non specifico dei primers. Questo enzima è molto processivo e rimane stabile per molti cicli di PCR ma poi tende a esaurirsi. L’aggiunta di maggiori quantità di enzima può talvolta aumentare l’efficienza della PCR, ma può anche portare alla produzione di prodotti aspecifici. Una caratteristica molto importante della Taq polimerasi è la sua possibilità di errore (bassa fedeltà) che non è del tutto trascurabile. Un target di 400 bp contiene un errore nel 33% delle molecole dopo 20 cicli (una base ogni 104). La distribuzione degli errori è a random. L’enzima manca infatti di un’attività proof-reading 3’-5’ nucleasica, che diminuisce la possibilità di errore in altre polimerasi. Questo rappresenta un problema in alcune situazioni, ad esempio quando si vuole clonare o sequenziare un frammento di DNA. Il problema può essere risolto con l’utilizzo di polimerasi termostabili con attività proof-reading (Pfu e Vent polimerasi), che in genere hanno però efficienze inferiori. Un’altra importante caratteristica di Taq pol è la tendenza ad addizionare in 3’ dei nucleotidi in più, in particolare A. Questo può essere un problema quando si vuole fare un clonaggio blunt-end in quanto le estremità dei prodotti di PCR devono essere bluntate per avere ligazione con un vettore blunt-ended. Viceversa questa proprietà può essere sfruttata nel clonaggio in vettori appositamente costruiti (TA cloning vectors). Altri enzimi termostabili possono essere utilizzati in alternativa alla Taq polimerasi. Uso di enhancers: 1. Alcune sostanze possono aumentare la stabilità e la processività dell’enzima o aumentare la stringenza dell’annealing. 17 2. L’effetto di queste sostanze non può però essere facilmente predetto (ciò che migliora l’efficienza di una coppia di primers può diminuire quella di un’altra coppia). 3. Detergenti non ionici (Triton X100,Tween20, Nonidet P40) neutralizzano le cariche di detergenti usati nella preparazione del templato. Alcune sostanze stabilizzano e aumentano l’attività della polimerasi (BSA, gelatina, glicerolo), altre aumentano la solubilità (DMSO), il solfato ammonico è richiesto da alcune polimerasi, la formamide può diminuire la Tm di dsDNA. Parametri del termociclizzatore: ogni step della PCR richiede un certo tempo per essere efficace e al contempo un tempo eccessivo può essere deleterio per la polimerasi. I parametri da impostare sul termociclizzatore dipendono essenzialmente dalla sequenza e dalla lunghezza del templato e dalla sequenza e dalla complementarietà dei primers. 94 °C per 5 min 30 cicli 94 °C per 30 sec 50-60 °C per 30 sec 72°C per 60 sec/kb La fase di denaturazione è in genere molto rapida (94 °C 30 sec). Per certi templati ricchi in GC può essere necessario usare temperature più alte. La fase di annealing è critica per l’appaiamento dei primers: TANN troppo bassa causa un’amplificazione aspecifica TANN troppo alta causa amplificazione con bassa resa Sono di seguito riportati alcuni concetti pratici che è necessario conoscere: 1. Primers con un contenuto in GC<50% richiedono basse T (<55°C), mentre primers ricchi in GC richiedono temperature più alte. 2. Temperature troppo basse possono però facilitare la formazione di prodotti spuri. 3. E’ buona regola, quindi, ottimizzare la temperatura di annealing di ciascuna coppia di primers. La fase di estensione avviene a temperatura di 72 °C, che è ottimale per la Taq polimerasi. 4. La durata di questa fase dipende dalla lunghezza del frammento da amplificare: la processività dell’enzima è, infatti, di circa 1000b al minuto. 5. Importante è anche la scelta del numero di cicli che dipende dall’efficienza della PCR e dalla quantità di templato. 6. Mediamente vengono fatti circa 30 cicli. 7. Un numero eccessivo di cicli può ridurre la specificità dell’enzima. 8. Spesso, al termine della PCR, può essere utile aggiungere un ciclo a 72 °C più lungo, per permettere all’enzima di completare tutti gli strands (estensione finale). 9. Quanti cicli effettuare?: a) Aumentare il numero di cicli oltre 35-40 ha effetti molto piccoli. b) Il plateau si raggiunge quando i reagenti sono consumati e la DNA polimerasi danneggiata. Hot start PCR: poiché la Taq polimerasi ha una certa attività anche a temperatura ambiente, possono generarsi dimeri di primer e prodotti aspecifici derivati dall’annealing dei primers, in regioni a bassa complementarietà, che riducono l’efficienza di amplificazione dei prodotti specifici. Per evitare questo problema ed aumentare l’efficienza di amplificazione della metodica, si può seguire un protocollo detto hot-start, in cui viene omesso uno specifico reagente essenziale nella reazione (in particolare MgCl2 o l’enzima), prima di iniziare lo step di denaturazione oppure mantenendo la miscela di reazione in 18 ghiaccio. L’uso di questi accorgimenti aumenta notevolmente la specificità, la sensibilità e la resa del processo. Sono in vendita polimerasi hot start e vari sistemi hot starts (Amplitaq gold, palline di cera). Strategie per la specificità della PCR Nel caso in cui sono stati disegnati primers per amplificare unicamente le sequenze di cDNA codificanti, ad esempio, per il fattore inibitore della leucemia LIF (una glicoproteina capace di indurre la differenziazione delle cellule mieloidi della leucemiaM1 e di inibire la differenziazione di cellule staminali embrionali murine) è necessario ricorrere a quella che viene chiamata la “touchdown PCR”, impiegando la quale, lo squilibrio tra il corretto e falso annealing viene sanato automaticamente e permette l'amplificazione di una sufficiente e corretta lunghezza della sequenza LIF cDNA. Viene riportato di seguito il confronto schematico della PCR classica e della PCR touchdown. Un’altra metodica per aumentare la specificità è rappresentata dalla “nested primer PCR”. E’ una variante della tecnica di PCR end-point, di cui si dirà più avanti. Prevede due distinte e successive reazioni di amplificazione, i cui aspetti salienti sono:: 1. L’amplificazione è realizzata con un set di primers. 2. Nella prima amplificazione si utilizzano primers più esterni al frammento di DNA da amplificare. 3. Nella seconda amplificazione si utilizzano primers che amplificano un frammento interno a quello amplificato nella reazione precedente. 4. Se il prodotto di amplificazione fosse aspecifico la seconda PCR non andrebbe a buon fine. Lo schema della “nested primer PCR” è di seguito riportato: 19 Clonaggio di frammenti di DNA ottenuti mediante PCR La PCR è un mezzo estremamente potente per l’amplificazione di molecole di DNA anche estremamente rare. La PCR può essere quindi utilizzata per il clonaggio di una sequenza di interesse in un opportuno vettore. La Taq polimerasi ha una certa possibilità di errore, per cui i frammenti clonati in vettori mediante PCR vanno sempre sequenziati per verificare che si tratti dell’amplificato corretto. L’efficienza del clonaggio può essere aumentata aggiungendo estremità adatte ai frammenti amplificati. TA overhang cloning E’ un protocollo molto semplice di clonaggio che sfrutta la capacità della Taq polimerasi di aggiungere dei residui A in coda ai prodotti di amplificazione. 5’ A – 3’ 3’ – A 5’ Si generano quindi delle estremità overhanging in 3’che possono essere facilmente ligate in vettori che, a loro volta, contengono delle estremità T overhanging artificialmente prodotte. Di seguito si riportano due semplici schemi di TA overhang cloning. 20 21 Segue anche un esempio pratico di TA overhang cloning dove la sequenza rappresenta il vettore PCR 2.1 con un prodotto PCR inserito mediante TA overhang cloning. Si noti che il prodotto di PCR è inserito su ogni lato del sito. La freccia indica la partenza della trascrizione per la T7 RNA polimerasi. Blunt-end cloning Viceversa queste estremità aggiunte dalla polimerasi Taq impediscono il clonaggio blunt-end in vettori blunt-ended. Queste extra A possono essere però rimosse con il frammento Klenow della DNA polimerasi di E Coli o con la T4 DNA polimerasi. Si generano così dei frammenti di PCR blunt-ended. 22 Clonaggio direzionale Frammenti di DNA possono essere amplificati per PCR facendo in modo che contengano alle loro estremità 5’ delle sequenze riconosciute da enzimi di restrizione compatibili con siti di restrizione che si trovano nel sito di clonaggio del vettore utilizzato. A tale scopo il frammento di DNA amplificato viene digerito con gli opportuni enzimi di restrizione, purificato e ligato nel vettore opportuno. Amplificazione di RNA (RT-PCR) La quantità di RNA per studi di vario tipo è spesso ridotta. La PCR può essere utilizzata per preparare grandi quantità di cDNA da utilizzare in applicazioni successive quali il clonaggio. Questa tecnica utilizza l’attività enzimatica della trascrittasi inversa, enzima che è in grado di copiare una molecola di RNA in DNA complementare utilizzando come primer un oligonucleotide. Il prodotto della reazione è un prodotto ibrido RNA/DNA. Dopo allontanamento dell’RNA, il cDNA può essere utilizzato come templato per l’amplificazione enzimatica (PCR). La trascrittasi inversa è una DNA polimerasi RNA dipendente, codificata da retrovirus. Esistono diversi enzimi utilizzati in biologia molecolare: Moloney Murine Leukemia Virus (MMLV-RT) 23 Avian Myleoblastosis Virus AMV Tth DNA polimerasi La RT-PCR ha essenzialmente due attività: 1. DNA polimerasi, che viene sfruttata in laboratorio per retrotrascrivere molecole di RNA essenzialmente mRNA) in DNA complementare. 2. RNAse H, che degrada gli ibridi DNA-RNA che si formano durante la retrotrascrizione. Pertanto, viene utilizzata per clonaggio di cDNA e per RT-PCR. ACGGUAUACCGCUAGCCUAAGCAAAAAAA TTTTTTT Primer TTTTTTT ACGGUAUACCGCUAGCCUAAGCAAAAAAA dATP, dCTP, dGTP, dCTP Reverse trascriptasi TGCCGATATGGCGATCGGATTCGTTTTTTT ACGGUAUACCGCUAGCCUAAGCAAAAAAA Nel pianificare un protocollo per l’amplificazione di un RNA occorre considerare alcuni punti: 1. metodo di preparazione dell’RNA; 2. disegno dei primer; 3. sintesi del primo strand del cDNA con il primer più adatto; 4. amplificazione enzimatica. Metodo di preparazione dell’RNA a) Contaminazione del campione di RNA con DNA genomico. La PCR non è in grado di discriminare fra cDNA e DNA genomico. E’ opportuno trattare il campione con DNasi (da inattivare dopo 30 minuti) prima di utilizzarlo in RT-PCR. Un ulteriore controllo consiste nell’effettuare un’amplificazione del campione senza retrotrascriverlo. L’uso di RNA arricchito in mRNA, utilizzando colonne oligodT, migliora la purezza del campione. Un ulteriore accorgimento è quello di scegliere, come primer per la retro-trascrizione, l’oligodT e, come primer per l’amplificazione, oligo posizionati su due esoni diversi (pseudogeni spesso intronless e con code di poliA possono comunque essere amplificati). b) Problema della degradazione dell’RNA. Usare materiale decontaminato da RNAsi. Preparazioni da materiale fresco e uso di sostanze stabilizzanti (tipo RNAlater). 24 Per ottenere full lenght cDNA il problema della degradazione è molto importante, mentre per amplificare ampliconi piccoli si può tollerare un certo grado di degradazione. c) Metodo di purificazione. Si può utilizzare RNA totale o RNA citoplasmatico o poly(A) + RNA a seconda del target. Sintesi del primo strand del cDNA con il primer più adatto Possono essere usati a tale scopo primers diversi in funzione di ciò che si vuole ottenere: a) OligodT: amplifica a partire dal poliA; cDNA completo. b) Primer specifici: amplifica a partire dal sito del primer reverse. Frammento desiderato/CDS completa. c) Esanucleotidi random: amplifica un po’ tutto l’mRNA, ma a pezzi; cDNA non completo, utile nella RT-PCR quantitativa. Amplificazione enzimatica Utilizza l’enzima trascrittasi inversa per trasformare la sequenza di RNA in cDNA e questa reazione è seguita da PCR per amplificare il cDNA. Occorre quindi valutare la scelta dell’enzima retrotrascrittasi e disegnare un protocollo di amplificazione adatti ai propri scopi. PCR quantitativa. L’applicazione di test basati sull’analisi degli acidi nucleici per, ad esempio, la diagnosi di alterazioni genetiche (duplicazioni geniche) o di infezioni virali o per lo studio dell’espressione genica senza amplificazione ha generalmente lo svantaggio della bassa sensibilità delle tecniche usate: southern blotting; northern blotting; RNAse protection assay; dot blot; in situ hybridization. La tecnologia della PCR ha aumentato enormemente la sensibilità di queste tecniche mantenendo una elevata specificità. Nonostante ciò le caratteristiche intrinseche della reazione di PCR non permettono il suo utilizzo nel formato convenzionale per quantificare gli acidi nucleici. I fattori che contribuiscono alla elevata variabilità nell’efficienza della reazione di PCR agiscono a 3 livelli: 1. preparazione del campione 2. amplificazione 3. detezione del prodotto Preparazione del campione estrazione dell’RNA o del DNA e recupero (qualità del templato); reazione di retrotrascrizione (se RNA); manipolazione e stockaggio dei campioni da analizzare. Amplificazione La reazione di PCR ha una cinetica esponenziale fino al punto in cui viene raggiunta la fase di plateau, che gioca un ruolo fondamentale nel determinare la quantità del prodotto finale. La quantità finale di prodotto dipende da vari fattori quali: 25 cinetica di annealing dei primer concentrazione dei diversi reagenti numero di cicli incompleta denaturazione del DNA reannealing dei prodotti di PCR soprattutto negli ultimi cicli temperature di cycling lunghezza dei cicli tempi di ramping formazione di dimeri di primer contaminanti/inibitori Detezione del prodotto L’analisi quantitativa della PCR può essere fatta: 1. in fase logaritmica 2. in end-point Fase logaritmica: all’inizio di una reazione di amplificazione, i reagenti sono in eccesso, templato e prodotto sono a concentrazioni talmente basse che la rinaturazione del prodotto non compete con il legame dei primer. In questo modo l’amplificazione procede ad una velocità esponenziale costante. Il momento in cui la velocità di reazione cessa di essere esponenziale ed entra nella fase lineare di amplificazione è estremamente variabile, anche fra replicati dello stesso campione. Sembra essere dovuto principalmente al fatto che la rinaturazione dei prodotti compete con il legame dei primer, poiché l’aggiunta di reagenti o enzima non ha effetto. Successivamente la velocità dell’amplificazione si avvicina allo zero (plateau) e viene ottenuto pochissimo prodotto. Per avere accuratezza e precisione ottimali occorrerebbe considerare una quantificazione nel punto in cui ciascun campione si trova nella fase esponenziale di amplificazione. End-point (RT) – PCR: è tuttora una tecnica ancora molto usata. Richiede però una messa a punto molto lunga e laboriosa relativamente alla determinazione del range di amplificazione esponenziale per ogni mRNA in studio, alla scelta del controllo interno e/o competitore, alla preparazione degli standard interni. 26 Svantaggi della END-Point PCR: Bassa precisione. Bassa sensibilità. Range dinamico limitato (<2 log). Non automatizzata. Etidio bromuro poco quantitativo, poco sensibile e poco risolutivo. Processamento post-PCR. Nelle 3 figure che seguono si osserva che nei 96 replicati il plateau si ottiene nello stesso punto, ma questo è solo dovuto al fatto che il plot è in scala logaritmica. Gli stessi replicati visti in plot lineare evidenziano invece una netta separazione dei campioni in fase di plateau. Quindi se la quantificazione fosse fatta a plateau non sarebbe corretta. 27 Inoltre, le diluizioni seriali sembrano arrivare a plateau nello stesso punto, anche se la fase esponenziale mostra chiaramente una differenza tra i vari punti della diluizione. Quindi, anche in questo caso, se la quantificazione fosse fatta a plateau non sarebbe corretta. Multiplex PCR Consente l’analisi simultanea di due campioni nella stessa reazione. Due coppie di sonde di ibridazione, ciascuna specifica per un prodotto di amplificazione, vengono marcate con un diverso colorante accettore che emette la fluorescenza a differenti lunghezze d’onda. Il segnale emesso viene letto simultaneamente attraverso due canali di rilevamento fluorimetrico. La metodica consiste nell’utilizzo di diverse coppie di primers nella stessa reazione di amplificazione. Pertanto, risulterà possibile amplificare più frammenti di DNA nella stessa reazione di amplificazione. Un esempio di quadro elettroforetico dopo PCR multiplex è riportato. Si osserva la corsa elettroforetica di frammenti di geni che codificano per fattori di patogenicità caratteristici di Escherichia coli O157 H7. In ogni pozzetto è caricato il DNA estratto dei ceppi di E. coli. 28 Tale tecnica consente di amplificare nella stessa reazione più frammenti di geni caratteristici per una specie, oppure più frammenti specifici appartenenti a specie diverse. Real-time quantitative PCR Teoricamente esiste una relazione quantitativa tra la quantità di campione iniziale e la quantità di prodotto di PCR ad ogni dato ciclo. La real-time PCR rileva la quantità di amplicone durante tutta la reazione. I dati vengono misurati durante la fase esponenziale, momento ottimale per analizzarli. La real-time PCR automatizza il laborioso processo di quantificazione e permette un range dinamico molto più ampio (107). Esistono numerosi protocolli e chimiche diverse per Real-time PCR. Sono tutti basati sulla detezione di prodotti di PCR attraverso la generazione di segnali fluorescenti. Quelli usati più frequentemente sono: sonda dual-labeled, la più comune della quale è la taqman probes, molecular beacons, sybr green, 29 sonde scorpion I primi due dipendono dalla Fluorescence Resonance Energy Transfer (FRET) per generare il segnale fluorescente attraverso l’accoppiamento di una molecola fluorescente e di un quencher (fluorocromo a bassa energia). La sonda TaqMan. Tale sonda ibridizza un tratto di genoma interno al frammento di DNA amplificato dalla coppia di primers. All’estremità 5′ della sonda è legato il Reporter, fluorocromo ad alta energia. All’estremità 3′ è legato il Quencher, fluorocromo a bassa energia. Quando i fluorocromi sono legati alla sonda, i fotoni emessi dal Reporter sono assorbiti dal Quencher, che ha minore livello energetico. Con la sonda TaqMan, nella fase di denaturazione non vi è emissione di fluorescenza. Durante l'annealing, i primers e la sonda si uniscono ai tratti di DNA ad essi complementari e Reporter e Quencher sono ancora legati alla sonda. Nella fase di estensione: l’attivazione della Taq e il conseguente appaiamento dei nucleotidi trifosfati raggiunge la sonda. Il Reporter, all’estremità 5′, si stacca dalla sonda. I fotoni del Reporter non sono più assorbiti dal Quencher ed emettono fluorescenza. Molecular beacons. Sono stati sviluppati da Fred R. Kramer La struttura particolare delle sonde molecular beacons, fa sì che solo in presenza della sequenza complementare la sonda si apra ed ibridizzi al target; il fluoroforo si allontani dal quencher, il quale non può più assorbire i fotoni emessi dal fluoroforo, e la sonda inizi ad emettere fluorescenza. La quantità di segnale emesso è proporzionale alla quantità di sequenza target ed è misurata in Real-Time per quantificare la quantità di sequenza bersaglio. Eurogentc ha la licenza di fornitura di tali sonde ed offre un ampio numero di fluorofori e quencher. La lunghezza massima di una sonda molecular beacon standard, con 3′-DABCYL, è di 45 basi. Di seguito viene riportata lo schema di una sonda molecular beacon: struttura stem-loop con fluoroforo al 5' e quencher al 3'. Il SybrGreen è invece un colorante fluorescente che ha bassa fluorescenza in soluzione, ma emette un forte segnale fluorescente, legandosi a DNA a doppia elica. Il Sybr Green dye è, quindi, una molecola fluorescente che durante la reazione di PCR Real time si intercala all’interno del doppio filamento di DNA originatosi ad ogni ciclo di amplificazione. La miscela di reazione contiene: DNA denaturato primers soluzione tampone nucleotidi trifosfati Sybr green 30 Nella fase di denaturazione il Sybr green è libero nella miscela di reazione. Nella fase di annealing il SYBR Green si posiziona in maniera aspecifica nel solco minore del DNA. Nella fase di elongation si osserva la fluorescenza dovuta dalla presenza del Sybr green nella doppia elica degli ampliconi. La fluorescenza è dovuta al legame del Sybr green all’interno dell’acido nucleico a doppia elica. Il limiti della chimica Sybr green è rappresentato dal fatto che la molecola del colorante fluorescente si lega indistintamente a tutti i frammenti di acido nucleico a doppia elica. Quindi per evitare risultati falsi positivi, i parametri di ogni reazione di amplificazione (scelta di primers specifici, concentrazione del campione, ecc.) devono essere ottimizzati. Nella rappresentazione che segue, sono indicate le molecole del colorante Sybr Green nelle tre fasi di PCR. Quantificazione della Real-time quantitative PCR La quantificazione della real-time quantitative PCR può essere: Assoluta; Relativa. Quantificazione assoluta (metodo della curva standard). Si basa sull’utilizzo di uno standard esterno a quantità nota (DNA plasmidico o cDNA plasmidico o RNA trascritto in vitro), la cui concentrazione viene determinata allo spettrofotometro (260 nm) e viene convertita nel numero assoluto di copie in base al peso molecolare dello standard. Diluizioni seriali dello standard vengono amplificate simultaneamente ai campioni e viene creata in questo modo una curva standard. Il Ct dei campioni viene così confrontato con la curva standard per determinare il numero iniziale di copie. Segue lo schema di come vengono effettuate le diluizioni seriali. 31 Nella quantificazione del prodotto di PCR, identificando il primo ciclo della PCR in corrispondenza del quale inizia l’amplificazione esponenziale del prodotto, è possibile quantificare la concentrazione iniziale del DNA bersaglio. Segue la curva di fluorescenza di campioni a concentrazione nota: Segue l’estrapolazione della curva standard: 32 La linea di base identifica il ciclo in corrispondenza del quale inizia l’aumento esponenziale della fluorescenza per ciascun campione. Riportando in grafico il valore di intersezione con la linea di base (baseline) in funzione del logaritmo della concentrazione iniziale di ciascun campione, si ottiene la curva standard da cui si può estrapolare (collegando i punti in neretto) il valore della concentrazione di campioni a titolo ignoto (curva in rosso). 33 Quantificazione relativa. Questo tipo di approccio viene usato soprattutto in studi di gene-expression. L’approccio si basa sull’uso di uno standard interno che in genere è un house-keeping gene (gene che non “dovrebbe” variare nell’espressione), ch corrisponde al gene referente. Le caratteristiche del housekeeping genes o reference genes (geni di controllo) sono: Stesso numero di copie in tutte le cellule; Espresso in tutte le cellule; Numero medio di copie simile al target gene. I più usati sono: Glyceraldehyde-3-phosphate dehydrogenase (GAPDH) Beta-actin mRNA MHC I (major histocompatability complex I) mRNA Cyclophilin mRNA mRNAs per alcune proteine ribosomiali 28S or 18S rRNA Metodo comparativo del Ct: la quantità del target viene normalizzata rispetto al controllo endogeno (house-keeping gene) ed espressa relativamente ad un campione basale (calibratore) che diventa il campione 1x, mentre tutte le altre quantità vengono espresse come n volte relativamente a quel campione. Il metodo comparativo è detto anche metodo del 2-ΔΔCt o metodo di Livak, dove: ΔΔCt = ΔCt del campione – ΔCt del controllo e il ΔCt campione è il Ct per ogni campione normalizzato relativamente all’housekeeping gene; il ΔCt del controllo è il Ct per il calibratore normalizzato relativamente all’housekeeping gene. Il risultato ottenuto rappresenta il numero di volte di incremento (o decremento) del gene target nel campione relativo al controllo ed è normalizzato rispetto all’espressione dei geni di riferimento interno Metodo della curva standard: diluizioni seriali di DNA o cDNA vengono testate per il gene target e per lo standard interno, vengono costruite le due rispettive curve standard ed estrapolati i valori dei campioni sulle due curve; quindi la quantità del target viene normalizzata dividendola per la quantità di house-keeping gene. Efficienza relativa dei geni target e del controllo: perché questo metodo sia applicabile, occorre che l’efficienza di amplificazione del target gene e del gene endogeno housekeeping siano approssimativamente uguali. Ciò può essere stabilito verificando quanto i ΔCt dei due geni variano con la diluizione del templato. Se il plot della diluizione del DNA versus ΔCt è vicino allo zero, allora l’efficienza di amplificazione del target gene e dell’housekeeping gene sono molto simili. 34 Applicazioni della Real-time quantitative PCR: quantificazioni virali; quantificazioni dell’espressione genica; verifica dell’array; efficacia della terapia farmacologica; misura del danno del DNA; controllo di qualità e saggi di validazione; detezione e cariche di patogeni; studi del genotipo. Analisi di mutazioni puntiformi Sfrutta differenze nella Tm di sonde di ibridazione perfettamente legate al DNA bersaglio o il cui legame è destabilizzato dalla presenza di basi non appaiate. sonda 1 sonda 2 marcata con fluoresceina marcata con LC Red 640 La sonda 1 si ibridizza alla parte della sequenza bersaglio mutata La sonda 2 si ibridizza alla parte della sequenza bersaglio non mutata Al termine della PCR si analizza la curva di melting: se è presente una mutazione, la Tm dell’ibrido sarà più bassa che in assenza di mutazione. Fluorescenza Con questo capitolo si vogliono esprimere alcuni concetti applicativi sulla fluorescenza ed alcuni vantaggi che ne derivano dall’impiego. Il rivelamento basato sulla fluorescenza è largamente diffuso nelle scienze biologiche: In molti campi ha sostituito la marcatura radioattiva. I fluorofori hanno un vantaggio "ambientale", sono più stabili, non destano preoccupazione nell’uso e, non ultimo, creano costi inferiori per il loro smaltimento. 35 Il rivelamento fluorescente viene usato nella microscopia a fluorescenza e nella citometria a flusso (FACS) per la marcatura di anticorpi e il rivelamento immunochimico già da tempo. Nel laboratorio di biologia molecolare ha fatto ingresso con nuove tecniche di sequenziamento all’inizio degli anni novanta. Con la disponibilità delle relative apparecchiature, in particolare del sistema SDS 7700 della Perkin Elmer e del nuovo LightCycler® della Roche Diagnostics, i sistemi a tempo reale basati sulla fluorescenza hanno aperto possibilità completamente nuove alla reazione a catena della polimerasi (PCR). Il rilevamento a fluorescenza non è più sensibile della marcatura immunologica e tanto meno di quella radioattiva. Nella maggior parte dei casi risulta invece da 10 a 1000 volte meno sensibile di una marcatura radioattiva. Circa i vantaggi della fluorescenza nelle misurazioni molecolari, va detto che ci sono due aspetti centrali: da una parte esiste la possibilità di misurazioni in parallelo impiegando fluorofori a colori diversi e dall’altra parte esiste la possibilità di una misurazione continuativa nel tempo. La fluorescenza può essere osservata nel tubo di reazione chiuso (Closet Tube Format). Con le sonde appropriate è inoltre possibile la tipizzazione genica delle sonde durante la stessa amplificazione. La sensibilità assoluta non è quindi il fattore determinante per la scelta di queste tecnologie di rivelamento, considerando anche che si lavora in genere con metodi i amplificazione di acidi nucleici, prevalentemente con la PCR. Misurazioni in parallelo: il termine "fluorescenza" determina la caratteristica di alcuni cromofori di emettere luce a onde più lunghe, ossia spostato verso il rosso, della luce dalla quale vengono eccitati. L’efficacia del processo viene descritto con la resa quantistica Q, un numero tra 0 e 1. Questo fenomeno è noto per fluorofori nei margini di lunghezza d’onda dall’ultravioletto (UV) al visibile (VIS) fino all’infrarosso (IR) oppure, espresso in lunghezze d’onda, da circa 300 a 800 nm. I massimi di assorbimento e di emissione sono sfasati di 15-40 nm (shift di Stokes). Un buon fluoroforo è quindi caratterizzato da un forte assorbimento (un coefficiente elevato di estinzione), da un’alta resa quantistica (Q>0,7) e da un grande shift di Stokes. Allo stesso tempo, la sorgente di luce deve essere scelta in corrispondenza ossia vicino al massimo di assorbimento. Dato che la luce emessa ha una certa larghezza di banda i fluorofori devono avere una distanza di 15-50nm per poter essere rivelati contemporaneamente. I massimi di assorbimento vengono sfasati in modo parallelo e di conseguenza. I fluorofori non devono essere troppo distanti tra loro nel caso di una sorgente di luce monocromatica come il LASER. In pratica questo significa che in dipendenza dell’apparecchio si possono rivelare da due a quattro fluorofori contemporaneamente. Si prevede che in futuro sarà possibile sfruttare anche la diversa stabilità della fluorescenza di fluorofori diversi per l’analisi di sonde multiple. Rivelamento nel tempo: i fluorofori sono sensibili al loro ambiente: molecole nella loro vicinanza, in particolare altri cromofori possono offuscarli ("quench"), ossia ridurre la loro fluorescenza o addirittura estinguerla. E’ anche possibile che fluorofori vicini trasferiscano la loro energia, un fenomeno chiamato, come già visto, trasferimento di energia di risonanza fluorescente (FRET). Sfruttando queste caratteristiche è possibile disegnare sensori molecolari che possono dare informazioni circa la presenza o la configurazione di molecole. Questo a sua volta permette l’osservazione continuativa di una reazione senza che uno dei partner del legame debba essere eliminato o separato come occorre nei saggi classici che si basano sui legami. Esempi per questi metodi "classici" sono i Northern e Southern blot, tecniche di blot inversi, il legame di prodotti di PCR a piastre "microtiter" e a membrane, "arrays" di cDNA o "DNA-Chips" nonché il loro rivelamento mediante sonde radioattive o apteni e anticorpi coniugati da enzimi come ad esempio il sistema della digoxigenina. La fluorescenza nella PCR quantitativa: l’analisi in continuazione dell’amplificazione di acidi nucleici apre delle possibilità del tutto nuove nella quantificazione degli acidi nucleici. La quantità degli acidi nucleici bersaglio è di rilevanza per problemi diversi: Nella virologia si determina il titolo 36 dei virus, ad esempio per monitorare il successo della terapia antivirale. Nel caso delle malattie leucemiche si documentano sia il successo della terapia sia eventuali recidive in modo precoce (Minimal Residual Disease, acronimo, MRD). In seguito a trapianti di midollo osseo si può documentare l’amplificazione delle cellule provenienti dal donatore. Negli alimenti si possono quantificare le componenti, per analizzare ad esempio il contenuto di ingredienti geneticamente modificati. Inizialmente, l’analisi di PCR quantitativa si limitava alla mera stima delle quantità di amplificato nel gel di elettroforesi o si eseguivano saggi multipli in presenza di un competitore per titolare il bersaglio dalla quantità nota di competitore. La determinazione continuativa della quantità di amplificato mediante la fluorescenza permette una misurazione della quantità di templato molto più semplice. Il numero dei cicli di PCR necessari al raggiungimento di una quantità di prodotto predeterminata è proporzionale alla quantità di materiale di partenza per una gamma ampia. Si riportano regolarmente gamme che vanno da quattro a sette ordini di grandezza. I dati vengono raccolti durante la PCR stessa; i risultati vengono ottenuti al più tardi alla fine della reazione senza ulteriori passaggi, senza il rischio di contaminazione da prodotti della stessa amplificazione e senza elettroforesi su gel. Ci sono varie possibilità di generare segnali fluorescenti dipendenti dalla reazione. La più semplice è l’uso di un fluoroforo che emette fluorescenza dopo essersi legato a DNA a doppio filamento (bromuro di etidio, SYBR Green). Tuttavia, questo segnale non è veramente specifico in quanto tali fluorofori rivelano anche dimeri formati dai primer e amplificati aspecifici. Come già visto, esistono vari tipi di sonde che generano un segnale sfruttando la FRET o il "quenching” in dipendenza dalla presenza del filamento a loro complementare. Ibridazione in vicinanza: esistono varie possibilità di far ibridare due oligonucleotidi uno a fianco all’altro o di fronte all’altro. Il metodo probabilmente più efficiente è il legame di due sonde marcate con un unico fluoroforo ad un templato, il formato della sonda di ibridazione (HybProbe) del Lightycler. La misurazione avviene in questo caso sfruttando la fluorescenza del fluoroforo accettante che viene eccitata attraverso un processo di FRET. Il vantaggio rispetto alle sonde di idrolisi è certamente il loro carattere modulare e, per quanto riguarda la PCR quantitativa, la loro relativa insensibilità per "mismatch" singoli ed in particolar modo il loro eccellente utilità per la genotipizzazione. Lo svantaggio consiste eventualmente nella più lunga sequenza che deve essere coperta da due sonde avvicinate. Al posto di due sonde di ibridazione può anche essere utilizzato un primer marcato che viene rivelato mediante una sonda sull’altro filamento e comunque vicino. In modo simile si è cercato di seguire l’amplificazione mediante lo spostamento di una sonda complementare al primer. Tuttavia, anche in questo caso non si può escludere una reazione aspecifica. Per il monitoraggio della PCR sono stati usati anche coppie di oligonucleotidi complementari provviste di un fluoroforo ed un "quencher”. Le sonde si legano in equilibrio al prodotto di PCR e danno così un segnale di fluorescenza. Genotipizzazione: la genotipizzazione analizza i polimorfismi. Ne sono esempio la determinazione della paternità, della specie, della presenza di fattori a rischio genetici e di alleli che determinano determinate malattie. La presenza di polimorfismi può essere rivelata con sonde Taqman e "molecular beacons" solo usando sonde diverse che comprendano tutte le varianti. Se provviste di fluorofori diversi possono essere impiegate anche nello stesso saggio di reazione. Al contrario le sonde di ibridazione hanno il vantaggio che la presenza di una mutazione può essere determinata usando una sola sonda mediante una curva di dissociazione che rivela la diminuzione della temperatura di dissociazione. In caso di omozigosi si ottiene una temperatura di dissociazione unica, alta o bassa, e in caso di eterozigoti si osservano due temperature di transizione. I nuovi metodi di PCR a tempo reale permettono un’analisi molto più rapida di campioni nonché l’analisi qualitativa di acidi nucleici, la loro quantificazione e la genotipizzazione. Il tempo richiesto 37 dalle analisi si riduce a 20-30 minuti in modo tale che possono essere applicati alla valutazione in emergenza. Data l’eliminazione di molti passaggi lavorativi molte analisi possono essere eseguite a costi ridotti, fatto che dovrebbe determinare l’ulteriore diffusione del metodo della PCR nella diagnostica. Sonde coniugate con apteni: le sonde coniugate con apteni vengono frequentemente impiegate per il rivelamento mediante ibridazione di acidi nucleici immobilizzati su membrane in vitro e in sito. Il metodo (schema sottostante) si basa sull’interazione di molecole con un’alta affinità per apteni (ad esempio la streptavidina e la digoxigenina) e su anticorpi che a loro volta sono coniugati ad enzimi reporter la cui attività è facilmente rilevabile (ossidasi, fosfatasi). Nell’incubazione finale si aggiunge il substrato dell’enzima che viene trasformato in un prodotto rivelabile/misurabile. In molti casi questo metodo, basato sull’uso di una sonda “fredda”, offre una valida alternativa per all’uso di sonde radio marcate (sonde “calde”). Tuttavia, vi sono degli svantaggi rispetto alla marcatura radioattiva: 1. Bassa sensibilità (circa 20-50 volte meno della marcatura radioattiva) 2. Bassa efficienza di marcatura che, peraltro, non è misurabile direttamente. Lettura e analisi dei risultati Real Time PCR Circa la lettura dei risultati, quando la sonda emette fluorescenza si ha la conferma in tempo reale dell’amplificazione del tratto di DNA ricercato. L’esame di Real Time PCR avviene in termociclizzatori in grado di registrare la fluorescenza. Rispetto alla PCR end-point non c’è più bisogno di analizzare i risultati dell’amplificazione tramite corsa elettroforetica. Circa l’analisi dei risultati, la fluorescenza emessa in fase di amplificazione è registrata da software dedicati che visualizzano il segnale di fluorescenza come curve di amplificazione. Le curve sono riportate sui monitor collegati al termociclizzatore. L’emissione di fluorescenza è direttamente proporzionale alla quantità di DNA presente. Per elevate concentrazioni di DNA le curve di amplificazione si registrano già dopo i primi cicli di PCR. La bioinformatica per la progettazione di primers per PCR e verifica della specificità, per la progettazione di costrutti ricombinanti e ricerca dei siti di restrizione Per ottenere buoni risultati con la PCR è essenziale progettare in modo accurato gli oligonucleotidi (primer) più adatti allo scopo che vogliamo raggiungere e che serviranno da innesco alla DNA polimerasi durante la reazione di amplificazione. Nella fase di progettazione dei primer è fondamentali considerare una serie di fattori: - specificità di appaiamento - lunghezza (18-25 bp) - contenuto in GC (circa 60%); empiricamente, Tm = 2x(nAT)+4x(nGC) - Tm: è opportuno che siano molto vicine (differenze superiori a 2°C possono determinare amplificazioni aspecifiche) 38 - verificare ed evitare la possibile formazione di strutture secondarie - l'estremità 3' del primer deve terminare con una GC ma non averne più di 3 consecutive. Inoltre, per un’eventuale ottimizzazione delle condizioni, è utile realizzare reazioni di PCR a varie temperature ed in condizioni variabili di primer e di Mg++. L'aggiunta di altri fattori, quali sali e denaturanti o detergenti, può influire sulla stringenza e sulla specificità di appaiamento; le contaminazioni possono essere combattute mediante aggiunta di uracil-N-glicosilasi (UNG), che digerisce i prodotti della PCR precedente. Sebbene queste considerazioni possano apparire fuori dal campo d'interesse prettamente bioinformatico, sono riportate in quanto non ha senso acquisire competenza negli strumenti di progettazione senza conoscere almeno i principi base della tecnica. Anzi, proprio dalla conoscenza dei fattori critici per la PCR sono nati i migliori programmi di analisi, che consentono a loro volta di valutare con un'accuratezza impensabile per calcoli "manuali" rischi e vantaggi della scelta di uno specifico primer o di condizioni di PCR. Consideriamo un esempio in cui si voglia lavorare alla temperatura di massima stringenza di appaiamento primer-target. In particolare, si vuole amplificare un frammento interno della sequenza O49339 presente nel database UniProtKB, per verificarne l’espressione, la correttezza della sequenza depositata nel database, la tessuto specificità o altro. La prima cosa da fare è rintracciare la sequenza nucleotidica codificante (coding sequence). Per le successive fasi di analisi sono disponibili vari programmi bioinformatici, pubblici e commerciali. Tra questi ultimi, si riportano esempi di uso di un software commerciale, il pacchetto LASERGENE© della ditta DNASTAR: In programmi come LASERGENE© è necessario che le sequenze abbiano un formato specifico; a tal fine, nell'esempio riportato, si usa il programma EditSeq©: 39 EditSeq© consente anche di invertire la sequenza o, cosa più importante per la progettazione dei primer, di ottenere la sequenza complementare inversa (reverse complement), che serve per l'individuazione del reverse primer: Inoltre, EditSeq© consente di tradurre la sequenza nucleotidica in aminoacidica: 40 Può essere molto utile anche creare un documento con word processor, dove poter annotare tutte le informazioni del caso. Nell’ esempio: sequenza codificante, codoni di START e STOP (evidenziati in rosso), posizione e sequenza dei primer, che sono evidenziati in rosso: Per analizzarne le eventuali strutture secondarie dei primer si può usare un altro programma del software package LASERGENE©, chiamato Primer Select© (o qualsiasi analogo prodotto commerciale o pubblico). Primer Select© è organizzato nelle solite sezioni File, Edit ed Aiuto ed in quelle specifiche Conditions, Locate, Log, Report ed Options. Ovviamente, tali sezioni sono riportate solo a titolo d'esempio e possono differire tra programmi; tuttavia esse rispecchiano la possibilità di 41 modificare numerosi parametri: Primer Select© richiede in primo luogo che siano impostate le condizioni iniziali di amplificazione e quelle dei primer (di seguito sono mostrate le opzioni preimpostate, modificabili): Si possono anche impostare le condizioni di mispriming, ovvero di appaiamento errato: 42 A questo punto si possono inserire le sequenze di ciascun primer: per poi valutare eventuali appaiamenti dannosi ai fini dell'amplificazione, ad es. tra forward primer: Si può notare che il programma mostra tutti i possibili appaiamenti; per ciascuno di essi indica (in rosso) le basi complementari e riporta per ciascuna coppia il valore di deltaG. Ecco invece la schermata che mostra i possibili appaiamenti tra reverse primer: 43 Nell'esempio precedente tutte le coppie avevano medesimi valori di deltaG; nell'appaiamento tra reverse primer, invece, alcune combinazioni risultano più stabili. Ecco, infine, la schermata dei possibili appaiamenti tra forward e reverse primer: 44 È importante che non ci sia (o almeno sia ridotto il più possibile) appaiamento al 3’ fra i primer, in modo da evitare l’eventuale allungamento da parte della polimerasi. Ciò infatti è oltremodo dannoso in quanto, al ciclo successivo di PCR, avremo in soluzione qualcosa diverso dal primer iniziale. Per quanto riguarda le regioni 5’, piccole zone di appaiamento sono tollerabili, poiché comunque la polimerasi non è in grado di allungare la sequenza dell’oligonucleotide (alterandolo in modo irreversibile). Zone complementari devono essere intervallate da “bolle di repulsione” che destabilizzano le strutture, la presenza di sequenze non complementari all’estremità dei primer aiuta a sciogliere eventuali complessi formatesi in soluzione grazie all’agitazione termica durante lo step di appaiamento. Anche l’esistenza di forcine (hairpin) può creare problemi, in questo caso si possono fare le stesse considerazioni sopra elencate oltre a tenere presente che tanto più stretto è il loop della forcina tanto più questa è instabile. Il programma è in grado di predire anche le forcine: Infine è importante verificare, mediante Primer-BLAST che i primer selezionati mostrino specificità di appaiamento con il bersaglio (target) e non con altre sequenze indesiderate. Ecco i risultati: 45 che mostrano allineamento tra primer forward e 3 sequenze, identiche al 100%: un mRNA predetto, una sequenza genomica ed un mRNA identificato. E' importante controllare i rapporti tra sequenze identificate, poiché un primer che risulti allinearsi con più sequenze potrebbe apparire erroneamente aspecifico. Infatti, proprio in questo esempio, la seconda sequenza riconosciuta è quella genomica, ma la prima è la corrispondente predizione del messaggero e la terza è lo stesso messaggero, identificato e sequenziato. Scorrendo nella finestra con i risultati di BLAST verso le sequenze con score più bassi, si osservano allineamenti parziali del forward primer con regioni genomiche differenti: ciò indica il rischio di amplificazione spuria e la necessità, quindi, di badare alla stringenza, adottando una temperatura di amplificazione non troppo più bassa di quella di fusione (Tm) del primer (forward o reverse) che mostra la Tm più bassa. 46 Progettazione di costrutti ricombinanti e ricerca dei siti di restrizione Quando si clona in un vettore di espressione per ottenere un prodotto proteico chimerico, è necessario mantenere il corretto registro di lettura delle sequenze codificanti. Per studiare la localizzazione subcellulare di una proteina in vivo si può clonarne la sequenza codificante a valle di quella codificante una proteina come la GFP (o una sua variante); ecco un vettore ECFP rappresenta la proteina che si colora (tag) e MCS è invece il sito di policlonaggio, posto al 3’ rispetto al tag e caratterizzato dal fatto di avere siti di restrizione unici all’interno dell’intero vettore: La progettazione dei primer per clonare l’intera sequenza codificante ha vincoli di posizione: si deve includere il codone di STOP originale e variare il meno possibile a livello del codone di START: 47 A questo punto, sulla sequenza clonata va eseguita un’analisi di restrizione in silico, ad es. usando ancora un'applicazione di LASERGENE ©, ovvero MapDraw ©. Questo e programmi analoghi permettono di ottenere una mini-mappa del frammento considerato: elencando anche i siti di taglio unici: 48 e fornire un elenco di enzimi di restrizione che non tagliano all’interno della sequenza: Le possibilità indicate dal programma servono ad individuare il sito od i siti più adeguati al vettore, all'inserto ed alle esigenze di clonaggio. Immaginando di aver scelto Bam HI, diventa necessario ridisegnare i primer di in modo da "aggiungere" alla sequenza dell'amplificato "code" rappresentanti i siti di riconoscimento per Bam HI; in tal modo, dopo la PCR, l'amplificato potrà essere digerito e inserito nel sito Bam HI del vettore. Tuttavia sarà necessario anche fare in modo che, dopo la ligazione, la sequenza nucleotidica della proteina d’interesse sia in registro con il tag (nell'esempio illustrato, ECFP). Vediamo cosa succede digerendo il vettore e l’amplicone con Bam HI e simulando la ligazione, nel caso in cui i primer con code non siano stati disegnati in modo corretto: Prima del taglio: Dopo il taglio: 49 Post-ligazione: Le lettere evidenziate in verde rappresentano l’ultima posizione di ogni codone nel registro di lettura (frame) corrispondente a quello del tag, in rosso è evidenziato il sito di riconoscimento e taglio per Bam HI. Come si vede, usando i primer in figura viene perso il registro di lettura e l'ATG iniziale non è tradotto in metionina, ottenendo un prodotto tronco o comunque tutt’altro che l’originale. Quanto sopra è rapidamente determinabile tramite traduzione dinamica in sequenza aminoacidica della sequenza di DNA dei possibili costrutti con code, mediata da semplici tools bioinformatici, inclusi in software commerciali o disponibili on line presso molti server europei ed americani quali, ad esempio, quelli presenti nella sezione DNA-->protein del server Expasy di Ginevra di cui un esempio è stato riportato nella lezione sulla pagina di proteomic tools di Expasy. Analisi di cromatogrammi da sequenziamento Numerosi programmi consentono la visualizzazione e correzione dei cromatogrammi derivanti da sequenziatori automatici e la loro trasformazione in sequenza letterale. Ad esempio EditView consente di impostare i parametri di visualizzazione sia per il cromatogramma che per la sequenza: Ecco come si presentano il cromatogramma di una sequenza di DNA (visione parziale): 50 e la sua rappresentazione letterale dell'alfabeto: Si può notare che a ciascun picco corrisponde, automaticamente, una base: tuttavia quando ci si sposta verso l'estremità 3' della sequenza, i picchi sono meno netti e distanziati e si possono generare errori: In particolare gli errori dipendono dalla difficoltà, da parte del software di gestione del sequenziatore, di interpretare correttamente i picchi sovrapposti (a sinistra). A ciò può essere posto rimedio selezionando il residuo ambiguo N (a destra): 51 e correggendolo (Fig. C). Per non perderne memoria, si può mantenere la doppia rappresentazione (preepost-correzione) (Fig. D). 52 Notizie storiche sulla scoperta della PCR «Kary, vedi di non cavarti gli occhi». Negli anni ‘50 la madre di Kary Mullis, l’inventore della PCR, apostrofava così quel figlio che giocava un pò troppo con il Piccolo chimico. Nel 1984 Kary ha cambiato le prospettive della scienza inventando una tecnica, la PCR (Reazione a Catena della Polimerasi), per amplificare a piacimento la molecola fondamentale della vita, il Dna. Una innovazione tecnologica che ha permesso, fra le altre cose, di realizzare il Progetto Genoma e sequenziare il genoma umano, creare test genetici diagnostici, mettere a punto analisi del Dna che hanno cambiato le indagini investigative della pubblica sicurezza. Mullis, che per quella scoperta vinse il Nobel per la chimica nel 1993, era a Napoli per festeggiare l'invenzione durante il convegno «PCR 25 anni: passato, presente, futuro» organizzato da Roche Diagnostic. Ripercorrere la sua vita, la scoperta della PCR e le ricerche successive è un'ottima occasione per capire, prima di tutto, che: «La scienza non è affatto noiosa come molti credono - dice Mullis -. Io non saprei immaginare la mia vita senza: è eccitante la scoperta e il lavoro per arrivarci. A un giovane oggi direi "se non hai paura, studia la chimica e ti divertirai un mondo"». L'accenno alla paura non è infondato, visto che Kary, fin da piccolo, si è cimentato in imprese non proprio prive di pericoli: sua madre gli aveva messo a disposizione uno sgabuzzino dove fare tutto quello che voleva e lui ne approfittò per costruire razzi rudimentali e creare miscele esplosive. Per Mullis il laboratorio è sempre stato un posto per giocare. Scienziato irriverente ed eccentrico, è stato contestatore a Berkeley negli anni ‘60, ha applicato il metodo scientifico perfino all'astrologia e ha fatto ampio uso di LSD e altre sostanze non proprio lecite, cosa che ammette con sincerità disarmante. La stessa con cui confessa che la scoperta della PCR «è stata un caso, stavo occupandomi di tutt'altro. Lavoravo in un'azienda californiana di biotecnologie, la Cetus, a un progetto per l'analisi di una mutazione genetica che provoca l'anemia falciforme. Non avere tanto Dna a disposizione era un vero problema: i genitori dei bimbi su cui si sarebbe dovuto fare il test potevano dover aspettare molto tempo prima di avere le risposte, se non avessimo trovato un modo per amplificare il Dna». L a classica "lampadina" si accese nella testa di Mullis un venerdì sera della primavera del 1983, mentre guidava verso le montagne della Contea di Mendocino per un weekend di riposo. D'un tratto capì che poteva ottenere un numero strabiliante di copie di un preciso filamento di Dna con una reazione semplice, per la quale erano già noti tutti gli ingredienti (vedi box). «Era tutto così banale che non riuscivo a credere che nessuno lo avesse già pensato e fatto prima - racconta Mullis -. A Mendocino non avevo telefono, il lunedì mattina mi precipitai in biblioteca prestissimo al mattino. Scoprii che nessuno aveva mai amplificato il DNA, né la cosa per la verità parve interessare granché i miei colleghi. C'è voluto tempo prima che fosse intuita la portata della scoperta e perfino “Nature” e “Science”, le riviste scientifiche più importanti, rifiutarono il mio primo lavoro sulla PCR dicendomi che poteva essere utile solo a una ristretta cerchia di specialisti». Mullis riteneva che il DNA fosse il "big one", il re delle molecole. Ne è ancora convinto, dopo aver "letto" tutto il genoma e scoperto che forse ne sappiamo meno di prima. «Penso di sì, ma la faccenda non è così semplice come avevamo immaginato, con il DNA che produce RNA da cui si sintetizzano le proteine - risponde Kary Mullis -. C'è invece un network complesso, in cui ogni elemento controlla tutti gli altri. La differenza maggiore fra noi e i batteri non è la quantità di DNA, ma il fatto che la sua espressione è diversa a seconda delle cellule: un sacco di fattori decidono che il fegato sia un fegato e non un naso. Oggi è molto difficile avere un'idea complessiva di quello che realmente sappiamo della vita e dei processi che la governano, anche se siamo riusciti a creare perfino la vita artificiale». Che cosa ne pensa in proposito, non ci stiamo spingendo forse troppo in là? «Il progetto è ambizioso e forse non procurerà vantaggi davvero tangibili - riflette Mullis -. Ma tutte le conoscenze apprese nel lungo processo che ci ha portato alla vita artificiale sono invece utilissime per una miriade di applicazioni. È come essere andati sulla Luna: non tanto è importante per quello che ci abbiamo 53 trovato, quanto per tutto ciò che abbiamo imparato per arrivarci. Poi, certo, ci sono implicazioni etiche e filosofiche non di poco conto. Qualsiasi scoperta scientifica può essere messa al servizio di scopi nobili o malvagi; questo però non può bloccare la ricerca. Adesso mi sto occupando di come insegnare al sistema immunitario a rispondere velocemente e meglio a patogeni come l'influenza o lo Stafilococco, dirigendo la risposta verso proteine specifiche del microrganismo legate a un composto contro cui tutti noi costruiamo una risposta immune efficace: se invece di puntare sulle proteine dei germi scegliessi quelle che differenziano una razza dall'altra potrei creare un farmaco tossico per tutti gli appartenenti a un'etnia. Il fatto che questo sia possibile, e pericoloso, non può fermarci nella ricerca di qualcosa che ci protegga meglio dall'influenza o altre malattie infettive contro cui spesso perdiamo la battaglia. Credo però che siano inutili i "controllori" esterni, che spesso non hanno una vera idea di ciò di cui si sta parlando. Mi fido molto di più della capacità di giudizio ed etica degli scienziati». Referenze • Applied Biosystems • http://www.rt-pcr.com • www.molecular-beacons.org • http://www.ambion.com/techlib/basics/rtpcr/ 54