Libreria di cDNA - Classi di Laurea in Biotecnologie

CORSO DI LAUREA IN BIOTECNOLOGIE
MEDICHE E FARMACEUTICHE
LABORATORIO DI BIOLOGIA MOLECOLARE E
BIOINFORMATICA – Modulo A
(anno accademico 2016-2017)
Dott. Mariano Francesco Caratozzolo
Istituto Biomembrane e Bioenergetica – IBBE CNR
Contatti: [email protected]
Programma Modulo A
• Banche di DNA (Librerie geniche)
- Librerie genomiche
- Librerie di cDNA e librarie sottrattive
• Analisi dell’espressione genica
- Analisi del trascrizione (metodi di mappatura delle estremità dei trascritti)
- Metodi per lo studio delle interazioni molecolari tra acidi nucleici e proteine
(DNAsi Footprinting, gel shift, immunoprecipitazione della cromatina)
- Analisi dei trascrittomi (screening differenziale, ibridazione sottrattiva, differential
display, metodi basati sui microarray, RNA-seq)
•
-
Tecniche per lo studio delle modificazioni epigenetiche
Metodi basati su digestione enzimatica
Metodi di arricchimento per affinità
Uso del sodio bisolfito
• Introduzione alla Bioinformatica
-Banche dati primarie e secondarie di acidi nucleici e proteine
Esercitazioni:
- Estrazione di DNA da cellule della mucosa boccale e analisi di DNA fingerprinting
- Analisi del 5’ di un trascritto mediante 5’ RACE
- Ricerca in banche dati di sequenze mediante parole chiave
- Ricerca bibliografica nella banca dati PubMed
- Ricerca in banca dati tramite BLAST
- Allineamento e multiallineamento di sequenze
Testi consigliati:
-Biologia Molecolare - F. Amaldi, P. Benedetti, G. Pesole, P. Plevani
-Dai Geni ai Genomi, Dale JW, von Schantz M: Ed. EdiSES
-Analisi dei geni e dei genomi, Reece RJ Ed. EdiSES
-Appunti di lezione
" SAPPIATELA AMARE. SAPPIATELA
CUSTODIRE E GUARDATELA SEMPRE CON
OCCHI INNAMORATI."
F ria
udwig
TECNICHE DI ISOLAMENTO/MANIPOLAZIONE DEI GENI
Servono a comprendere la funzione e la regolazione dei geni
Sfruttano la tecnologia del DNA ricombinante, grazie alla capacità
di isolare geni per capire, a livello molecolare, come viene
regolata la loro espressione
Richiedono il clonaggio di un segmento di DNA, cioè l’introduzione di un
gene, o un frammento di gene, in una cellula, in modo che venga copiato
dalla cellula, che si replica.
Perciò implica la produzione di numerose copie di quel frammento.
PRIMA PARTE: in vitro, produzione frammenti di DNA da inserire nel vettore
di clonaggio
SECONDA PARTE: in vivo, introduzione della molecola di DNA ricombinante
nell’organismo dove deve replicarsi autonomamente o integrarsi nel genoma
Le molecole di DNA, essendo molto grandi, vanno estratte dall’organismo in esame
e frammentate in molecole di dimensioni gestibili
• Rottura meccanica con ULTRASUONI o SIRINGA AD AGO MOLTO SOTTILE
(Si generano frammenti con estremità à piatte)
• Digestione enzimatica parziale con ENZIMI DI RESTRIZIONE
(Si generano frammenti con estremità piatte o sporgenti a seconda dell’enzima
utilizzato)
• Banche di DNA (Librerie geniche)
- Librerie genomiche (per identificare e isolare i geni di interesse)
- Librerie di cDNA (rappresenta il DNA codificante proteine)
DNA libraries
Genoteche o banche di DNA o librerie geniche
Analogamente ad una libreria, una genoteca è una collezione di
cloni (invece che libri), che rappresentano l ’ intero genoma
(libreria genomica) o l ’ intero trascrittoma (libreria di cDNA),
ottenuta in un opportuno vettore di clonaggio.
A differenza di una normale libreria, però, in una libreria genica
di solito i singoli cloni NON sono indicizzati e non è dato sapere
a quale gene o segmento genomico corrisponde un clone dato.
Per avere questa informazione è necessario effettuare uno
screening della genoteca con le tecniche d’ibridazione.
Tappe per la costruzione di una genoteca genomica
1. Isolamento del DNA da un organismo
2. Taglio del DNA in frammenti
3. Legame dei frammenti di DNA con un vettore di clonaggio
opportunamente scelto
4. Trasferimento del vettore ricombinante nell’organismo ospite
5. Selezione del clone contenente il gene di interesse
6. Recupero del vettore ricombinante e del frammento di DNA di
interesse
Vettori per le librerie geniche
Il primo step per la costruzione di una libreria genica è la scelta del
vettore di clonaggio, in funzione delle dimensioni dell'inserto di DNA che
ogni vettore può accettare.
Principali Vettori di clonaggio
Vettore
dimensione dell’inserto (kb)
Esempi
Plasmidi
0,1-10
pUC18, pBR322
Fagi
8-22
λ
Cosmidi
32-45
pJB8
BAC
100-300
pBAC108L
PAC
75-90
pAd10SacBII
YAC
1000-2000
pYAC4
Fago lambda
Il genoma del fago lambda è una molecola lineare a doppio filamento di
48 kbp.
Le estremità 5 ’ e 3 ’ presentano 12b a singolo filamento chiamate
estremità cos, che sono complementari tra loro e permettono la
circolarizzazione del DNA dopo l’infezione della cellula ospite.
Il vantaggio maggiore rispetto ai plasmidi è l’efficienza con la quale il
fago può infettare E.coli
Non essenziale
per il ciclo litico
cos
cos
Non essenziale
per il ciclo litico
Ciclo vitale di λ
In seguito all’infezione da parte
del fago λ, le cellule di E.coli
possono andare incontro a due
destini diversi:
- ciclo litico (cII inattivo)
- ciclo lisogeno (cII attivo)
trascrizione di cI (repressore
del ciclo litico)
ciclo lisogenico
ciclo litico
Dipendenza del ciclo litico o
lisogeno dalle condizioni
ambientali
Cellule in terreno ricco
Proteasi attive
Degradazione di cII
Ciclo litico
Impacchettamento del DNA di lambda
Ciclo litico di λ
-Il fago λ è mescolato con
cellule di E.coli in una soluzione
di soft agar chiamata top agar.
-La coltura batterica infettata è
poi versata su una piastra di
agar solido.
-Il risultato di un infezione
fagica consiste nella formazione
di placche di lisi traslucide sullo
strato di batteri a confluenza.
Fago lambda
La mappa genetica del fago λ comprende circa 40 geni che possono essere suddivisi
in tre gruppi funzionali:
-a sinistra, comprende i geni che codificano per proteine strutturali della testa e
della coda;
-al centro, contiene geni responsabili per la lisogenia. Gran parte di questa regione
non é essenziale per la crescita litica e può essere eliminata per la costruzione di
vettori.
-a destra contiene i geni coinvolti nella replicazione del DNA e nel ciclo litico.
Non essenziale
per il ciclo litico
Non essenziale
per il ciclo litico
Fago lambda come vettore di clonaggio
Lo sviluppo di vettori di clonaggio di tipo λ è stato possibile perché:
1. La regione non è essenziale per il ciclo litico può essere rimossa
dal genoma senza alterare il ciclo litico e la formazione delle
placche di lisi.
Un vettore privo di questa regione può contenere circa 14,5 kbp di
DNA estraneo, che ricostituirebbero la lunghezza originale del
genoma di λ. Esistono nei bracci di λ altre regioni non essenziali
che possono essere rimosse.
il DNA estraneo inseribile è di circa 22 Kbp
Per il packaging esiste:
-un limite inferiore, pari al 78% del genoma di λ, circa 37 Kbp, al
di sotto il DNA non viene impaccato e il fago non è vitale
-un limite superiore, pari al 105% della lunghezza del suo DNA
(circa 51Kbp)
Fago lambda come vettore di clonaggio
I siti di taglio per gli enzimi di restrizione naturali presenti nel
genoma di lambda sono stati eliminati senza causare perdita delle
funzioni geniche e ciò ha permesso di sviluppare derivati del fago
utilizzabili come vettori di clonaggio.
In linea generale, tutti i λ utilizzati come vettori sono stati
estesamente modificati e in particolare sono stati creati siti di
restrizione unici nella regione centrale per il clonaggio.
Vettori λ di clonaggio
- vettori d'inserzione, in cui il DNA esogeno è inserito in un sito unico di
restrizione;
- vettori di sostituzione, in cui il DNA esogeno sostituisce un pezzo di DNA del
vettore (stuffer).
Vettori lambda d'inserzione
Possono accettare inserti di dimensioni da 8 fino a 10-12 Kbp.
Sono generalmente utilizzati per costruire librerie di cDNA.
Vettori lambda d'inserzione
cI
braccio sinistro 32,7 Kbp
λgt10
braccio destro 10,6 Kbp
EcoRI
lacZ
λZAP
braccio sinistro 19.9 Kbp
braccio destro 21,9 Kbp
EcoRI
λgt10 è un buon esempio di inattivazione inserzionale. Il sito EcoRI è
posizionato in mezzo al gene cI. Un inserzione al suo interno, dunque
distruggerà l’integrità strutturale del repressore e il fago non sarà più in
grado di entrare nel ciclo lisogeno. Quindi i fagi senza inserzioni avranno
colonie torbide (miscela di fagi lisogeni e litici) mentre i fagi con
l’inserzione daranno placche chiare (placche litiche).
λZAP contiene l ’ MCS nel gene lacZ ’ e i cloni ricombinanti sono
identificabili attraverso lo screening bianco-blu.
Vettori lambda di sostituzione
possono contenere inserti da 10 a 22 Kbp e sono in genere utilizzati
per costruire librerie genomiche.
Vettori lambda di sostituzione
Stuffer
EMBL4
braccio sinistro 19.9 Kbp
SalI,
BamHI,
EcoRI
braccio destro 8,8 Kbp
SalI,
BamHI,
EcoRI
Stuffer
braccio sinistro 19.2Kbp
polylinker
Charon40
braccio destro 9,6Kbp
polylinker
λEMBL4 (42Kpb) contiene uno stuffer di 14 kpb tra il braccio destro e
sinistro.
La ligazione delle sole braccia produrrebbe un genoma di sole 28kpb,
troppo corto per essere impacchettato nella particella fagica.
Questo consente a λEMBL4 i contenere inserti lunghi fino a 23kbp.
Packaging del DNA in vitro
Sebbene il DNA nudo del fago lambda possa essere inserito in un batterio per
trasformazione, la dimensione del genoma di λ rende questa metodica poco
efficiente.
In alternativa si utilizza il sistema di packaging in vitro.
Il packaging in vitro è ottenuto
mescolando il DNA ricombinante di λ,
con due ceppi di E.coli che portano
fagi λ lisogeni difettivi nel processo
d’impacchettamento:
-ceppo
BHB2690, produce teste
fagiche vuote, perché mancante della
proteina D necessaria per il packaging
del DNA;
-ceppo BHB2688, non produce la
proteina E, e quindi le teste ma
contiene la proteina del packaging.
Mescolando i i genomi ricombinanti di
λ con i due lisati, si completano
queste deficienze e si ottengono tutti i
componenti necessari per il corretto
impacchettamento.
Si
ottengono
particelle di λ mature che possono
infettare ceppi wt di E.coli.
Packaging del DNA in vitro
La reazione di packaging in vitro è più efficiente se il DNA è in forma multimerica
perchè l ’ enzima coinvolto nel packaging del DNA taglia le molecole in
corrispondenza dei siti cos su una molecola multimerica.
Vettori Cosmidici
L’unica necessità per avere il packaging di DNA in un fago λ è la presenza di due siti
cos separati da una regione di 37-51kpb.
Da questa osservazione furono sviluppati i cosmidi.
Un cosmide è un vettore, di circa 5
Kpb, contenente un sito cos di λ .
Inoltre contiene:
-una ori,
-un marcatore di resistenza ad un
antibiotico
-un sito unico di restrizione per
l’inserimento del DNA.
.
Cosmidi
Il cosmide ricombinante, per essere un
buon substrato per la reazione di
packaging deve avere dimensione tra
37-51Kpb.
Quindi, considerando la dimensione
media di un vettore cosmidico, la
dimensione di un inserto che può essere
clonato in un cosmide varia tra 32 e
47Kpb, che rappresenta più di quanto è
possibile clonare nei vettori lambda (822kpb).
Dopo il packaging, le particelle fagiche
sono usate per infettare cellule di E.coli.
In E.coli il DNA circolarizza grazie alla
complementarietà delle estremità cos e
viene mantenuto nella cellula come un
plasmide.
La selezione dei trasformanti è basata
sulla resistenza ad un antibiotico e si
formeranno colonie batteriche anziché
placche di lisi.
Problemi con l’uso dei COSMIDI
I cosmidi, come i plasmidi, sono molto stabili e il DNA ricombinante
può essere mantenuto per lunghi periodi di tempo.
Problemi:
1. l’inserzione di lunghi inserti può rendere difficile il mantenimento
dei cosmidi in E.coli
2. Formazione di concatenameri
il DNA cosmidico tende a formare concatenameri circolari e queste
molecole non possono essere utilizzate per l’impacchettamento
3. Ligazione di più inserti
falsa immagine del’organizzazione del DNA dell’inserto
Soluzione: Si può tagliare il cosmide con due enzimi di restrizione diversi e
trattare l’inserto con fosfatasi
4. Riarrangiamenti degli inserti
(forse perché il tempo di replicazione è piu’ lungo rispetto ad un plasmide)
Cromosomi artificiali
Sono vettori a replicazione autonoma nei quali è possibile inserire
frammenti di DNA esogeno di dimensioni maggiori rispetto a quelli che
è possibile clonare nel genoma del fago lambda e nei cosmidi.
Cromosomi artificiali:
YAC: yeast artificial chromosome (500kbp);
BAC: bacterial artificial chromosome (200kbp);
PAC: P1 artificial chromosome (70-95kbp)
Vettori YAC
I vettori YAC permettono il clonaggio, in cellule di lievito, di frammenti lunghi oltre
le 500kbp.
I vettori YAC contengono:
-un centromero (cen4)
-una
sequenza
a
replicazione
autonoma (ars2) che permette la
replicazione autonoma rispetto alle
origini di replicazione cromosomiche;
-telomeri (tel) necessari per la
replicazione e il mantenimento dei
cromosomi in lievito;
-2 marcatori di selezione in lievito
(ura3 e trp1)
-gene sup4 che codifica per un tRNA
soppressore
-un’origine di replicazione batt (oriC)
- un marcatore selettivo batterico
(amp), per la propagazione in E. coli
prima del clonaggio.
Clonaggio in un vettore YAC
Il vettore è tagliato con enzimi di
restrizione per produrre due braccia
ciascuna con un telomero all’estremità e
un marcatore di selezione.
1° braccio contiene:
-sequenza ARS2
-Centromero CEN4
-marcatore trp1
2° braccio contiene:
-marcatore ura3
L’inserto è ligato tra le due braccia e la
molecola ricombinante è trasferita per
trasformazione in cellule di lievito, difettive
per Ura3, trp1 e ade2
Cellule di lievito ade2- sono difettive nella via di
biosintesi dell’adenina causando l ’accumulo di
un intermedio nel vacuolo, che determina una
colorazione rossa
(ADE2=fosforibosilamino-imidazolo-carbossilasi)
Il DNA esogeno inattiva il gene SUP4 (tRNATyr soppressore), che inserisce residuo Tyr in
corrispondenza di una mutazione non senso in ade2:
-vettori non ricombinanti daranno l’espressione di SUP4 con formazione di colonie bianche;
-vettori ricombinanti in cui SUP4 è stato inattivato per inserimento di DNA esogeno daranno
colonie rosse.
I ricombinanti sono selezionati come colonie rosse in terreno privo di uracile e triptofano
Difficoltà nell’uso degli YAC
Molecole di DNA molto grandi sono fragili e causano riarrangiamenti
10-60% di cloni di librerie YAC sono chimere (parti diverse del
genoma unite insieme)
Cloni instabili e gli inserti di DNA esogeno spesso vengono persi
E’ difficile separare lo YAC dagli altri cromosomi del lievito per le
dimensioni simili
Resa di estrazione di DNA YAC molto bassa
Vettori BAC
I vettori BAC permettono il clonaggio, in cellule batteriche, di frammenti lunghi
circa 200kbp.
I vettori BAC contengono:
- origine di replicazione (oriS) che mantiene
il loro livello ad una copia per cellula;
-4 geni (repE, parA, parB e parC) necessari
per la replicazione e il mantenimento del
numero di copie;
- un marcatore di selezione che conferisce
resistenza ad un antibiotico (CAM);
- il gene lacZ ’ contenente un MCS per il
clonaggio dell ’ inserto, che consente lo
screening bianco-blu dei cloni ricombinanti;
-un sito cos di λ, e un sito loxP, utilizzati per
il taglio specifico del BAC contenente
l’inserto per la mappatura per restrizione.
(cos tagliato da terminasi di λ ; loxP tagliato
da ricombinasi cre)
Per la trasformazione batterica si usa l’elettroporazione.
L’inserto dei BAC è molto stabile e può rimanere intatto per diverse centinaia di
generazioni.
Limite: BAC sono presenti in uno o due copie per cellule
Vettori PAC
I vettori PAC, derivati dal batteriofago P1, permettono di clonare
frammenti di DNA genomico di dimensioni tra 70-95kbp.
Il batteriofago P1 ha un genoma più grande di lambda (110-115kpb) e
sono stati sviluppati vettori con i componenti essenziali per la replicazione
di P1 inseriti in un plasmide.
Il fago P1 possiede due origini di replicazione: una per controllare la
replicazione litica (replicone litico di P1) e l ’ altra per mantenere il
plasmide durante la crescita non litica (replicone plasmidico)
Dopo aver infettato E.coli il batteriofago P1 può:
esprimere le proprie funzioni litiche
100-200 nuove particelle fagiche
reprimere le proprie funzioni litiche
il genoma fagico viene mantenuto
come un grosso plasmide stabile in
basso numero di copie
Vettori PAC
I vettori PAC contengono:
-origine di replicazione (ori) e il
gene
per
la
resistenza
all ’ ampicillina (AMP) per la
propagazione e la selezione del
vettore nei batteri;
il replicone plasmidico;
-il replicone litico di P1;
- il sito pac, per l ’ assemblaggio
delle particelle fagiche;
- un marcatore di selezione che
conferisce
resistenza
ad
un
antibiotico (KAN);
- due siti loxP, necessari per la
circolarizzazione del vettore dopo la
transfezione nell’ospite.
- il gene sacB, codifica per la levansucrasi, tossica per cellule di E.coli che
crescono in saccarosio.
Clonaggio in PAC
BamHI
Per il clonaggio:
-il vettore è digerito con BamHI e ScaI
-il DNA genomico è digerito parzialmente
con MboI che produce estremità compatibili
ScaI
con BamHI.
1. Ligazione: L’unico ricombinante vitale
è quello in cui l’inserto è fiancheggiato
da braccio lungo e braccio corto.
Ligazione tra le due braccia lunghe: non è
presente il sito pac e non è possibile alcun
impacchettamento nella testa del fago.
Ligazione tra le due braccia corte: non è
presente alcun replicone e non da ’ cloni
vitali
2. Trasfezione: il DNA è circolarizzato ai
siti loxP grazie alla proteina cre di E.coli e si
replica utilizzando il replicone plasmidico di
P1.
La propagazione in saccarosio permette la
crescita solo delle colonie contenenti
l ’ inserto (l ’ espressione di sacB abrogata
dall’inserto)
I PAC ricombinanti vengono mantenuti come plasmidi in E.coli
utilizzando la resistenza alla Kanamicina
Per aumentare il numero di copie fino a 25
induzione del replicone litico P1, che è controllato da un
promotore lac, con IPTG
Vantaggi dall’uso di vettori PAC
-Clonaggio di frammenti di grosse dimensioni
-Nessun riarrangiamento o delezione di DNA
-Il DNA plasmidico è di facile estrazione e manipolazione
Librerie geniche
Libreria genomica: collezione di cloni che rappresentano l ’ intero
genoma di un organismo
Libreria di cDNA: collezione di cloni che rappresentano l ’ intero
trascrittoma.
Un aspetto importante di una libreria genica è la sua rappresentatività:
una libreria si dice rappresentativa quando contiene, in almeno una
copia, tutte le possibili sequenze.
Un ’ altra caratteristica delle librerie geniche è quella di essere
ridondanti, e di contenere molte copie di alcune sequenze, complicando
la ricerca e selezione (screening) della sequenza che vogliamo analizzare.
Caratteristiche di una genoteca genomica
Una genoteca per essere utile deve essere completa e rappresentativa: deve
contenere tutto il genoma di un organismo e ogni parte del genoma deve essere
ugualmente rappresentata
Per ottenere una genoteca con tali caratteristiche è necessario tagliare il genoma
in
FRAMMENTI GRANDI (per clonarli in vettori di clonaggio ad alta capacità)
CASUALI (generati da tagli casuali)
OMOGENEI (aventi tutti la stessa lunghezza)
PARZIALMENTE SOVRAPPONIBILI (caratteristica essenziale per il mappaggio ed
il sequenziamento di geni molto grandi)
Costruzione di una Libreria Genomica
1. Scelta del vettore di clonaggio opportuno
2. Frammentazione del genoma in pezzi di dimensioni tali da essere clonati
in vettore appropriato.
Il tipo di frammentazione è importante per la qualità della libreria finale. Idealmente
il DNA dovrebbe essere rotto in frammenti casuali e sovrapposti, in modo tale da
avere copie rappresentative di tutti i frammenti del genoma.
Frammentazione del genoma
1. Digestione con enzimi di restrizione
Il DNA genomico può essere frammentato con enzimi di restrizione avendo
cura di effettuare la digestione in condizioni tali che la digestione sia
parziale (tempi di digestione o quantità di enzima sub-ottimali).
Digestione parziale vs Digestione completa
La digestione parziale di un genoma garantisce che non tutti i siti di restrizione siano
tagliati e che la libreria prodotta possa contenere cloni sovrapposti.
Ad es. Se un gene di interesse contiene piu’ siti di taglio per un enzima, i frammenti
prodotti da una digestione completa potrebbero essere troppi piccoli e sarebbero
eliminati dal frazionamento o non adatti per il clonaggio nel vettore prescelto e di
conseguenza il gene potrebbe non essere rappresentato nella libreria.
Inoltre, una popolazione di inserti parzialmente sovrapposti tra loro, è essenziale per
le procedure di chromosome walking necessarie nei progetti di sequenziamento e
nello screening di geni.
Digestione parziale di un genoma
-enzima che taglia siti a 4 pb (Sau3A, AluI, HaeIII):1/256pb
-enzima che taglia siti a 6bp (EcoRI): 1/4x103 bp,
enzima che taglia siti a 8bp (NotI): 1/65x103 bp,
La strategia comunemente usata è quella di utilizzare uno o piu’ enzimi
che tagliano siti a 4 pb (Sau3A, AluI, HaeIII) e di condurre una
digestione parziale
La probabilità di taglio in un genoma spesso non è uguale in ogni sito; la
natura della regione adiacente e la formazione di strutture secondarie nel
DNA possono produrre una probabilità di taglio piu’ alta per alcuni siti
piuttosto che per altri.
Questo inconveniente può essere evitato conducendo digestioni separate
con enzimi differenti, che permette anche di aumentare la
rappresentatività della libreria.
Frammentazione del genoma
2. Rottura meccanica
E’ possibile frammentare il DNA genomico con metodi fisici, come la
sonicazione, o il passaggio attraverso un sottile ago di una siringa.
Questi metodi presentano il vantaggio di produrre frammentazioni
casuali (maggiore rappresentatività), ma lo svantaggio di produrre
frammenti sia con estremità “ blunt ” che con estremità 5 ’ e 3 ’
“irregolari”, non adatte alla ligazione, che devono essere rese blunt.
In molti casi è necessario dover aggiungere dei linkers per il clonaggio
nel vettore appropriato.
Scelta del vettore e della dimensione della libreria
I fattori principali da valutare nella costruzione di una libreria genomica
riguardano:
- la grandezza del genoma;
- la dimensione media dei frammenti che costituiranno la libreria,
da cui dipende il numero di cloni indipendenti (N) necessari per avere una
ragionevole probabilità di rappresentare tutto il genoma.
Per esempio, per il genoma di E.coli di ~4x106bp, utilizzando per la sua
frammentazione un enzima di restrizione con un sito di riconoscimento di
6bp (EcoRI), che taglia in media ogni 4x103 bp,
basterebbero 4x106 / 4x103 =~1000 cloni per avere una libreria che
rappresenti di tutto il genoma.
Questo però sarebbe possibile solo se tutti i cloni:
-fossero differenti tra loro;
-fossero non sovrapposti tra loro.
In realtà, le due condizioni non sono soddisfatte poiché per definizione:
1) una libreria è una collezione di frammenti casuali.
2) in una libreria, i cloni devono essere parzialmente sovrapposti.
Sebbene sia impossibile ottenere una libreria che garantisca la presenza
di tutta l ’ informazione genetica del genoma di partenza, la formula
proposta da Clarke e Carbon, stima con ragionevole approssimazione il
numero di cloni indipendenti (N), che una libreria deve contenere per
avere una probabilità P di contenere il clone di nostro interesse :
ln (1 - P)
N=
ln (1 - f)
P = probabilità che la libreria contenga il frammento
d’interesse di solito tra 0.95 e 0.99),
f = frazione del genoma rappresentato da un “clone” medio
(media dimensioni inserti/dimensione totale del genoma)
La formula è equivalente a
a = dimensione inserti;
b = dimensione del genoma;
N= ln (1- P)
ln (1- a )
b
…ma quanti cloni sono necessari per ottenere una una genoteca
completa?????
• dimensione del genoma (esempio: genoma umano 2,8 x 106 kb)
• dimensione media dei frammenti da clonare (esempio 20 kb)
Calcolare:
n: grandezza del genoma / dimensione media dei frammenti da clonare
n: 2,8 x 106 kb / 20 kb = 1,4 x 105 frammenti
Considerando la variabilità e la casualità del clonaggio, abbiamo bisogno di ottenere un
numero di cloni ricombinanti ben maggiore di n per ottenere una genoteca completa.
E’ possibile calcolare esattamente il numero di cloni ricombinanti in relazione alla
probabilità di includere una data sequenza nella genoteca:
N= numero di cloni necessari per avere una genoteca completa
P= probabilità che una regione genomica qualsiasi sia inclusa nella genoteca
ln= logaritmo naturale del numero in parentesi
Quindi per costruire una libreria rappresentativa di un genoma di
grosse dimensioni cercheremo di:
•clonare inserti di grosse dimensioni per diminuire il numero di cloni
necessari a rappresentare interamente il genoma.
Questa aspettativa condiziona la scelta del vettore per il clonaggio,
che verrà scelto in funzione di questi parametri.
Librerie Genomiche
Scelta del vettore
Stima delle Dimensioni della libreria genomica in base ai vettori utilizzati
Organismo
Dimensione
media del
genoma
Tipo di
vettore
Dimensione
media
dell’inserto
P
Dimensione
della libreria
Batterio
4 × 106
Plasmide
Fago λ
Cosmide
BAC
4 kb
18 kb
40 kb
300 kb
0.99
0.99
0.99
0.99
4.6 × 103
1.0 × 103
458
59
Mammifero
3 × 109
Plasmide
Fago λ
Cosmide
BAC
4 kb
18 kb
40 kb
300 kb
0.99
0.99
0.99
0.99
3.5 × 106
7.7 × 105
3.5 × 105
4.6 × 104
Per le librerie genomiche batteriche: i vettori lambda di sostituzione rappresentano
un buon compromesso tra dimensioni dell’inserto e lo screening per l’individuazione
del clone d’interesse
Per le librerie genomiche di mammifero: i vettori lambda richiederebbero lo screening
di circa un milione di cloni; l’utilizzo di inserti di dimensioni maggiori è supportato dal
fatto che i geni contengono introni e spesso un’intero gene potrebbe essere troppo
grande per essere contenuto in un vettore lambda.
Allestimento di una libreria genomica
L’allestimento di una library genomica prevede:
-frammentazione del genoma
-selezione dei frammenti delle dimensioni prescelte
-clonaggio nel vettore scelto
-per vettori plasmidici si effettua la trasformazione del ligato nelle
cellule batteriche;
-per il vettore lambda, il cosmide e PAC, i prodotti di ligazione
sono mescolati con gli estratti della reazione di packaging per
l ’ assemblaggio delle particelle fagiche infettive della coltura
batterica
Amplificazione di una libreria
La libreria è costituita da:
-colonie batteriche se è
cosmidico o vettore BAC
stato
utilizzato
un
vettore
plasmidico,
-placche fagiche distribuite su uno strato di batteri con vettori di tipo
lambda
Riunendo le colonie o le placche fagiche ricombinanti si ottiene la
libreria primaria che dovrebbe contenere una copia rappresentativa
di ogni regione del genoma.
I cloni ricombinanti sono lavati via dalle piastre e raccolti in provetta.
La libreria primaria spesso è a basso titolo (il titolo della libreria è
espresso in pfu/ml o phage forming units/ml o plasmid forming
units/ml) e, spesso, è necessario amplificarla.
Per amplificare la libreria, la collezione di fagi o di colone batteriche
viene piastrata nuovamente e la progenie viene raccolta a formare una
libreria amplificata.
La libreria amplificata è di solito in un volume maggiore di quella
primaria e quindi diventa una risorsa da poter utilizzare piu‘volte .
Crescita e conservazione delle librerie geniche
Le librerie costituite da una sospensione di colonie batteriche (derivanti
da vettore plasmidico, cosmidico o vettore BAC) sono conservate a 80°C in presenza di glicerolo che le protegge dall’effetto deleterio del
congelamento
Le librerie costituite da placche fagiche sono conservate a -80°C come
particelle virali in assenza di cellule, crioprotette da DMSO.
Screening di una libreria
Quando la libreria deve essere sottoposta a screening, ne viene
scongelata un’aliquota da piastrare e la restante parte è mantenuta
congelata.
Prima del piastramento è sempre necessario determinare il titolo
della libreria perché è diminuito rispetto al momento in cui la libreria
è stata congelata.
Per determinare il titolo si prepara una serie di diluizioni successive
da piastrare (colonie batteriche) o da utilizzare per l’infezione di
cellule batteriche (placche fagiche)
Il titolo della libreria (numero di colonie o placche/ml) permette di
determinare la quantità della libreria necessaria per ogni piastra
nella fase di screening per ottenere il numero di cloni indipendenti
(N).
Screening primario della libreria
Una volta definito il numero di cloni N, statisticamente necessari per
identificare il clone di interesse, lo screening del gene d’interesse è
effettuato piastrando la libreria in relativamente poche piastre di grandi
dimensioni, seminate a grande densità: screening primario.
Screening primario della libreria
1) Replica su filtro di
ciascuna piastra: colony lift
per il trasferimento di colonie
batteriche; plaque lift per il
trasferimento delle placche
fagiche.
2) Il filtro è trattato con alcali
(0,5M NaOH) per rilasciare il
DNA dalle cellule batteriche o
dalle particelle fagiche e per
denaturare il DNA
4) Il filtro è neutralizzato e
poi sottoposto a raggi UV o a
80°C per fissare il DNA alla
membrana
5) il filtro è ibridato con la sonda che identifica il gene d’interesse.
6) Il segnale d’ibridazione positivo indica la posizione del clone
d’interesse sulla piastra originaria
Screening secondario della libreria
Lo screening primario è normalmente effettuato ad alta densità iniziale, in
modo da analizzare in un singolo esperimento un elevato numero di
ricombinanti.
Questo significa che difficilmente si otterrà un ricombinante puro allo
screening primario, perché per le librerie fagiche ogni singola placca di lisi
conterrà molte placche di lisi indistinguibili tra di loro; per le librerie
plasmidiche, ogni colonia batterica sarà strettamente adiacente alle altre.
Si procede quindi al cosidetto screening secondario che consiste nel
recuperare i cloni di partenza nella regione di agar in corrispondenza della
posizione del segnale positivo e nel ri-piastrarli a più bassa densità.
Librerie di cDNA
La libreria di cDNA è una collezione di cloni di cDNA che rappresentano
tutti gli mRNA presenti in un campione cellulare in una determinata
circostanza.
Rappresenta quindi tutti i geni che sono espressi nel campione cellulare
analizzato.
Pertanto una genoteca di cDNA è tessuto e stadio specifica..
Considerando che la dimensione media di un mRNA è intorno a 2-3 Kb, e
che le popolazioni di mRNA sono meno complesse della potenzialità
genetica complessiva, i vettori di elezione per le librerie di cDNA sono
vettori plasmidici o vettori fagici ad inserzione, come λgt10 e λgt11.
La Costruzione della libreria di cDNA richiede:
-Estrazione dell’RNA totale
-Purificazione dell’mRNA mediante oligodT
-Sintesi del cDNA
-Clonaggio del cDNA nel vettore scelto
Purificazione dell’mRNA mediante oligo-dT
L ’ mRNA poliadenilato può ibridare con sequenze sintetiche di oligo(dT)
(corti polimeri di desossitimidina), mentre le altre specie di RNA che non
ibridano con l’oligo(dT) possono essere eliminate.
frazione
PoliA+
Sintesi del cDNA
Poiché non è possibile clonare direttamente l ’ mRNA, è necessario
convertirlo in cDNA mediante l’utilizzo della Trascrittasi inversa, una
DNA polimerasi RNA-dipendente.
La Trascrittasi inversa possiede:
• attività polimerasica 5’-3’, a partire da un primer di DNA o RNA per
iniziare la sintesi;
•attività di RNasi H;
•manca di attività proof-reading.
Le Trascrittasi inverse utilizzate sono:
- MMLV-RT ottenuta dal virus della leucemia murina di Moloney. È un
singolo polipeptide di 71 KDa.
- AMV-RT ottenuta dal virus della mieloblastosi aviaria. È costituita da due
subunità di 64 e 96 KDa.
L’ MMLV-RT mostra una più debole attività RNasi H rispetto all’ AMV-RT,
quindi è più vantaggiosa quando è utilizzata nella sintesi del cDNA da
lunghe molecole di mRNA.
Sintesi del cDNA
I
Nucleasi S1
Sintesi del cDNA
Un metodo più recente utilizza la terminal transferasi (TdT) per aggiungere alle
estremità -3’OH del cDNA una coda omopolimerica.
La TdT è una DNA polimerasi
stampo-indipendente
che
catalizza l ’ aggiunta di dNTP
all’estremità 3’OH di filamenti di
DNA.
Sarà quindi possibile utilizzare
primers formati dai nucleotidi
complementari
alla
coda
omopolimerica per innescare la
sintesi
del
filamento
complementare in modo più
efficiente della forcina.
Rimozione dell’RNA dagli ibridi RNA-DNA
Mediante trattamento con alcali
DNA polimerasi
La PCR come alternativa al clonaggio dei cDNA
La trascrizione inversa seguita da PCR (RT-PCR) porta all’amplificazione di mRNA
sottoforma di cDNA.
Se si utilizzano primer specifici per un cDNA si ottiene l’amplificazione selettiva di
quel cDNA.
E’ una tecnica rapida e sensibile che permette di:
• determinare la presenza o l’assenza di un trascritto in un tipo cellulare
• stimare i livelli di espressione di un trascritto (trascrizione inversa + real time)
• clonare un cDNA senza la necessità di costruire ed analizzare una genoteca di
cDNA
Si ricorre alla costruzione della genoteca di cDNA se:
• non si conosce la sequenza del cDNA e pertanto non si possono costruire i primer
specifici
• difficile reperibilità del materiale biologico
Librerie di cDNA basate su PCR
Primers oligo-dT ancorati per la sintesi del cDNA
•Sono costituiti in modo che l’estremità 3’ contenga un residuo di G, A
oC
5’-T12-18 V-3‘
dove V=G, A o C
•Tali primer avviano la retrotrascrizione solo se appaiati all’estremità
5’ della coda di poly-A
•In questo modo le molecole di cDNA avranno dimensioni uniformi
Clonaggio del cDNA
Se le estremità del cDNA sono piatte, per il clonaggio è necessario ligare degli
adattatori (adapter) in modo da rendere le molecole di cDNA compatibili con il
vettore scelto.
Clonaggio direzionale del cDNA
Le molecole di mRNA sono direzionali
Clonaggio direzionale del cDNA
Utilizzando oligonucleotidi modificati che inseriscono siti unici di restrizione
ad entrambe le estremità del cDNA a doppio filamento è possibile ottenere
il clonaggio direzionale nel vettore scelto.
-oligo dT contiene all’estremità 5’
una sequenza che rappresenta il
sito di riconoscimento di XhoI;
-oligo dG contiene all’estremità 5’
una sequenza che rappresenta il
sito di riconoscimento di EcoRI.
DNA polimerasi
Il cDNA prodotto conterrà un sito
EcoRI all ’ estremità 5 ’ e un sito
XhoI all’estremità 3’.
Questo rende possibile il clonaggio
direzionale del cDNA nel vettore
tagliato con EcoRI e XhoI.
In questo modo il promotore a
monte del sito EcoRI potrà dirigere
la trascrizione del filamento la cui
sequenza è uguale a quella
dell’mRNA da cui è derivato.
Limiti delle strategie convenzionali basate sull’utilizzo
degli utilizzo degli oligodT
Gli RNA procaritici e alcuni mRNA eucariotici non hanno code di poliA
L’innesco all’estremità 3’ dei trascritti induce la creazione di genoteche
arricchite di molecole di cDNA che rappresentano le estremità 3’ dei
messaggeri
Per trascritti lunghi è difficile ottenere cDNA interi (full-lenght)
E’ necessario clonare cDNA completi se si vuole esprimere la proteina o
quando si vuole studiare la struttura del gene
E’ necessario clonare cDNA completi se si vuole esprimere la proteina o
quando si vuole studiare la struttura del gene
Metodi per aumentare la rappresentatività
delle estremità 5’ degli mRNA
Le metodiche descritte spesso producono librerie
di cDNA che non
rappresentano le estremità 5’ degli mRNA.
Questo inconveniente può essere superato utilizzando random primer al
posto dell’oligo dT per la sintesi del cDNA.
I random primers inizieranno la
sintesi in punti intermedi, è quindi
maggiore è la probabilità che
possano appaiarsi all’estremità 5’
dell’mRNA.
Il cDNA ottenuto non è completo
ma i cloni corrispondenti alle
estremità 5 ’
possono essere
confrontati con i cloni che portano
le estremità 3 ’ per risalire alla
sequenza completa del cDNA.
Librerie di cDNA normalizzate
Uno dei problemi associato al sequenziamento sistemico delle librerie di cDNA è
rappresentato dal fatto che alcuni trascritti sono molto abbondanti ed altri sono
rari, ma non per questo meno importanti.
Se si adotta un approccio di sequenziamento casuale di cloni di cDNA si finisce
con il sequenziare ripetutamente i cloni abbondanti, riducendo considerevolmente
la produzione di sequenze utili.
Per ovviare a questo inconveniente si procede spesso alla normalizzazione
delle librerie di cDNA.
Si tratta di una tecnica che sfrutta la diversa cinetica di ibridazione delle doppie
eliche di acidi nucleici: i cDNA più abbondanti si appaiano più rapidamente e
possono essere rimossi dal pool di cDNA che in tal modo si arricchisce delle
sequenze meno rappresentate.
In una libreria normalizzata
ogni
sequenza
dovrebbe
essere rappresentata lo stesso
numero di volte; ovviamente
questo non è praticamente
possibile, ma calibrando le
condizioni si riescono ad
ottenere
risultati
soddisfacenti.
Si perdono informazioni sul
livello di espressione dei geni
Librerie di cDNA sottrattive
Le librerie sottrattive sono prodotte allo scopo di identificare i geni che sono
differenzialmente espressi tra due tipi cellulari.
2 librerie di cDNA:
-driver (controllo), è marcata con biotina;
-tester (campione), non è marcata.
Le due
librerie sono denaturate
mescolate per permettere l’ibridazione.
3 combinazioni d’ibridazione:
-molecole di cDNA presenti solo nel
riformeranno la doppia elica
- molecole di cDNA presenti solo nel
riformeranno la doppia elica
-molecole di cDNA presenti nel driver
tester possono formare ibridi
e
poi
driver
tester
e nel
I prodotti d ’ ibridazione sono caricati su una
colonna alla quale è attaccata l’avidina.
Solo gli ibridi del tester, non marcati, non si
attaccheranno alla colonna.
La PCR dei due campioni con primer unici della
libreria tester portano alla formazione di:
-una libreria di sottrazione, che contiene
sequenze uniche del tester, non presenti nel
driver;
-una libreria di selezione contenente le
sequenze condivise da entrambe le librerie .