COSTRUZIONE DI
GENOTECHE
Definizione di genoteca
Una genoteca è una collezione completa di frammenti di
DNA, inseriti singolarmente in un vettore di clonaggio.
¾ Genoteche di DNA genomico
¾ Genoteche di DNA cromosomico
¾ Genoteche di cDNA
GENOTECHE DI DNA
GENOMICO
Perché costruire una genoteca genomica?
Per mappare il genoma.
Per identificare/isolare un gene.
Tappe per la costruzione di una
genoteca genomica
1. Isolamento del DNA da un organismo
2. Taglio del DNA in frammenti
3. Legame dei frammenti di DNA
con un vettore di clonaggio
opportunamente scelto
4. Trasferimento del vettore
ricombinante nell’organismo ospite
5. Selezione del clone
contenente il gene di interesse
6. Recupero del vettore ricombinante e
del frammento di DNA di interesse
Caratteristiche di una genoteca genomica
Una genoteca per essere utile deve essere completa e
rappresentativa:
rappresentativa deve contenere tutto il genoma di un
organismo e ogni parte del genoma deve essere ugualmente
rappresentata
Per ottenere una genoteca con tali caratteristiche è necessario tagliare il
genoma in FRAMMENTI
GRANDI
(per clonarli in vettori di clonaggio ad alta capacità)
CASUALI
(generati da tagli casuali)
OMOGENEI
(aventi tutti la stessa lunghezza)
PARZIALMENTE SOVRAPPONIBILI
(caratteristica essenziale per il mappaggio ed il sequenziamento di geni molto grandi)
Taglio del DNA genomico in frammenti grandi e casuali
• Rottura meccanica
(Si generano frammenti con estremità piatte)
Sonicatore
Siringa ad ago molto sottile
• Digestione enzimatica parziale
(Si generano frammenti con estremità piatte o sporgenti a seconda dell’enzima
utilizzato)
Produzione dei frammenti da clonare per digestione
enzimatica parziale
Per ottenere una digestione
parziale bisogna limitare la
quantità e/o il tempo di
incubazione dell’enzima con
il DNA genomico.
Prima del clonaggio bisogna
selezionare i frammenti in
base alla loro lunghezza.
……ma quanti cloni sono necessari per ottenere una genoteca completa?????
• dimensione del genoma (esempio: genoma umano 2,8 x 106 kb)
• dimensione media dei frammenti da clonare (esempio 20 kb)
Calcolare:
n: grandezza del genoma / dimensione media dei frammenti da clonare
n: 2,8 x 106 kb / 20 kb = 1,4 x 105 frammenti
Considerando la variabilità e la casualità del clonaggio, abbiamo bisogno
di ottenere un numero di cloni ricombinanti ben maggiore di n per ottenere
una genoteca completa. E’ possibile calcolare esattamente il numero di
cloni ricombinanti in relazione alla probabilità di includere una data
sequenza nella genoteca:
ln(1-P)
N=
ln(1-0,95)
= 4,2 x
N=
ln(1-1/n)
ln(1-0,99)
ln(1-1/ 1,4 x 105)
105
= 6,5 x 105
N=
ln(1-1/ 1,4 x 105)
N= numero di cloni necessari per avere una genoteca completa
P= probabilità che una regione genomica qualsiasi sia inclusa nella genoteca;
ln= logaritmo naturale del numero in parentesi
Dimensioni ottimali di genoteche genomiche in
funzione dei vettori utilizzati
Organismo
Dimensione Tipo di
del genoma vettore
Dimensione P
Dell’inserto
Dimensione
della libreria
Batterio
4 × 106
Plasmide
Fago λ
Cosmide
BAC
4 kb
18 kb
40 kb
300 kb
0.99
0.99
0.99
0.99
4.6 × 103
1.0 × 103
458
59
Mammifero 3 × 109
Plasmide
Fago λ
Cosmide
BAC
4 kb
18 kb
40 kb
300 kb
0.99
0.99
0.99
0.99
3.5 × 106
7.7 × 105
3.5 × 105
4.6 × 104
Costruzione di una genoteca
genomica rappresentativa
in vettori λ Charon 4A
Maniatis et al., 1978
Costruzione di una
genoteca genomica
rappresentativa
in vettori λ EMBL
GENOTECHE DI DNA
CROMOSOMICO
GENOTECHE DI DNA CROMOSOMICO
Mediante l’uso di un apparecchio chiamato FACS,
FACS Fluorescence Activated
Cell Sorter, si possono isolare singoli cromosomi umani sulla base delle
loro dimensioni. Una volta separato qualche milione di cromosomi di un
solo tipo, se ne può estrarre il DNA e farne una genoteca come se si
trattasse di un normale genoma.
Esistono 24 genoteche cromosomiche umane: una per ciascuno dei 22
autosomi, una per l’X e una per Y.
Il vantaggio delle genoteche cromosomiche è che richiedono un numero di
cloni dalle 10 alle 30 volte inferiore a quello richiesto per una genoteca
genomica e permettono una maggiore rapidità nell’individuazione e nella
purificazione di cloni specifici.
GENOTECHE DI
cDNA
Caratteristiche delle genoteche di cDNA
Definizione
I cloni di una genoteca di cDNA rappresentano gli mRNA maturi presenti in un tipo
cellulare al momento in cui è stato estratto l’RNA. Una genoteca di cDNA riflette,
quindi, l’attività genica di una data popolazione cellulare in un determinato momento
dello sviluppo dell’organismo. Pertanto una genoteca di cDNA è tessuto e stadio
specifica.
Perchè costruire una genoteca di cDNA?
Per isolare geni molto grandi (es: il gene della distrofina umana è lungo 2,5 Mb)
Per esprimere la proteina in batteri
Per studiare la struttura di un gene confrontando il cDNA con il gene
Per studiare l’espressione tessuto- e stadio-specifica di un gene
Tappe della costruzione di una genoteca di cDNA
• Isolare l’RNA totale di una popolazione cellulare
• Purificare gli mRNA
• Sintetizzare i cDNA
• Clonare i cDNA in vettori di clonaggio
Isolamento dell’mRNA dall’RNA totale
In seguito all’estrazione di RNA totale da una popolazione cellulare si
ottiene: 10% di mRNA; 15% di tRNA; 75% di rRNA
Caricamento
TTTTT
TTTTT
AAAAAAAA
AAAAAAAA
La purificazione del mRNA su
colonne di oligo (dT) sfrutta
l’affinità tra le code di poli(A)
degli mRNA e le dT immobilizzate su un supporto solido
Lavaggio
TTTTT
Eluizione
TTTTT
TTTTT
TTTTT
TTTTT
AAAAA
TTTTT
TTTTT
TTTTT
TTTTT
AAAAA
TTTTT
TTTTT
TTTTT
TTTTT
TTTTT
TTTTT
TTTTT
TTTTT
TTTTT
TTTTT
TTTTT
TTTTT
TTTTT
TTTTT
TTTTT
TTTTT
TTTTT
TTTTT
TTTTT
TTTTT
TTTTT
TTTTT
TTTTT
TTTTT
TTTTT
AAAAAAAA
AAAAAAAA
AAAAAAAA
cDNA Library Construction
mRNA
5’
Reverse transcription
5’
mRNA Rev.
cDNA Trans.
hybrid 3’
5’
AAAAAAAAAAA3’
TTTTTTTTTTTT5’
AAAAAAAAAAA3’
TTTTTTTTTTTT5’
AAAAAAAAAAA3’
cDNA after RNaseH treatment
3’
RN
aseH
TTTTTTTTTTTT5’
Double stranded cDNA after DNA polymerase
3’
5’
Insert into vector
A
A
A
AA
A
A
DNA
Pol
TTTTTTTTTTTT5’
AAAAAAAAAAA3’
Costruzione di una genoteca di cDNA (A)
Sintesi di cDNA a doppio filamento
con oliogo dT, trascrittasi inversa,
RNasi H, DNA polimerasi e
nucleasi S1
Clonaggio delle molecole di cDNA
a doppio filamento con estremità
piatte
aggiungendo
code
omopolimeriche di dCTP con la
terminal trasferasi
Svantaggio. Perdita dell’informazione
al 5’ per l’attività della nucleasi S1
Costruzione di una
genoteca di cDNA (B)
Aggiunta di code omopolimeriche
all’estremità 3’ del 1° filamento di
cDNA neosintetizzato ad opera della
terminal transferasi
Il gradiente di saccarosio alcalino
serve:
1) per l’idrolisi dell’RNA
2) per recuperare i cDNA e
allontanare i ribonucleotidi ottenuti
dall’idrolisi dell’RNA
Il clonaggio avviene mediante
l’aggiunta
di
ulteriori
code
omopolimeriche tramite linker
Clonaggio
direzionale dei cDNA
DNA polimerasi +
dNTP
Vantaggio: permette di clonare
l’inserto nell’orientamento giusto a fini
dell’espressione
Limiti delle strategie convenzionali basate
sull’utilizzo degli oligo dT
9Gli RNA procaritici e alcuni mRNA eucariotici non hanno code
di poliA
9L’innesco all’estremità 3’ dei trascritti induce la creazione di
genoteche arricchite di molecole di cDNA che rappresentano le
estremità 3’ dei messaggeri
9Per trascritti lunghi è difficile ottenere cDNA interi (full-lenght)
E’ necessario clonare cDNA completi se si vuole
esprimere la proteina o quando si vuole studiare la
struttura del gene
La sintesi del cDNA produce, a partire da molecole di
messaggero uguali, molecole di DNA di diversa lunghezza.
Sovrarappresentazione del 3’ se la sintesi è innescata da oligo-dT
cDNA-1 (full-lenght)
3’
5’
mRNA
cDNA-2
3’
5’
cDNA-3
3’
5’
3’
5’
TTTTTTTT 5’
AAAAAAAA 3’
cDNA-4
TTTTTTTT 5’
AAAAAAAA 3’
TTTTTTTT 5’
AAAAAAAA 3’
TTTTTTTT 5’
AAAAAAAA 3’
Produzione di cDNA completi
Selezione dei cDNA completi
con l’ RNasi A che degrada
esclusivamente gli RNA a
singolo filamento, lasciando
intatti gli ibridi DNA-RNA
Isolamento delle molecole a
lunghezza completa grazie
alla loro affinità per il fattore
di inizio della traduzione eIF4E, che lega il cap presente
all’estremità 5’ degli mRNA
La PCR come alternativa al clonaggio dei cDNA
La trascrizione inversa seguita da PCR (RT-PCR) porta
all’amplificazione di mRNA sottoforma di cDNA. Se si utilizzano
primer specifici per un cDNA si ottiene l’amplificazione selettiva di
quel cDNA. E’ una tecnica rapida e sensibile che permette di:
• determinare la presenza o l’assenza di un trascritto in un tipo
cellulare
• stimare i livelli di espressione di un trascritto (trascrizione inversa
+ real time)
• clonare un cDNA senza la necessità di costruire ed analizzare una
genoteca di cDNA
Si ricorre alla costruzione della genoteca di cDNA se:
• non si conosce la sequenza del cDNA e pertanto non si possono
costruire i primer specifici
• difficile reperibilità del materiale biologico
Costruzione di una genoteca di cDNA mediante RT-PCR
Se si utilizzano primer universali si
amplificano tutti i cDNA presenti nel
campione di partenza. Dopo amplificazione
per PCR i cDNA possono essere clonati per
ottenere una genoteca di cDNA.
Vantaggio:
Vantaggio se il materiale biologico di
partenza è molto scarso.
Svantaggio:
Svantaggio i cDNA più corti si amplificano
meglio di quelli più lunghi pertanto
risulteranno
sovrarappresentati
nella
genoteca.
SCREENING DI
GENOTECHE
A Library
The clone of interest
Sreening delle genoteche
Sulla base
della sequenza
nucleotidica
Ibridazione
• cDNA
• gene di specie diversa
• sonda dedotta da
seq. parziale proteina
• chromos. walking
Applicabile a tutte le genoteche
Sulla base
della struttura/funzione
(vettori di espressione)
• riconoscimento con Ab
• interazione con ligandi
• complementazione/acquisizione di funzione
Applicabile alle genoteche di cDNA costruite con vettori di espressione
Screening mediante ibridazione con acidi
nucleici: colony blot
Autoradiogarfia
Le colonie batteriche da analizzare vengono trasferite su di una membrana
di nitrocellulosa o di nylon mediante la tecnica del replica plating
Screening mediante ibridazione con acidi
nucleici: plaque lift
Le placche fagiche da analizzare
vengono trasferite su di una
membrana di nitrocellulosa o di nylon
mediante la tecnica del replica
plating
Lo screening di placche fagiche
presenta due vantaggi:
1. da una singola piastra madre si
possono produrre più repliche
pertanto si possono effettuare
screening multipli;
2. il segnale di ibridazione è più
pulito poiché si trasferisce sul filtro
meno DNA cromosomico batterico,
che può ibridare in maniera
aspecifica con la sonda
Screening mediante ibridazione con acidi
nucleici: arrayed libraries
I singoli cloni vengono prelevati e
trasferiti in maniera ordinata su una
membrana, a formare una griglia.
I singoli cloni vengono prelevati dalla
piastra e inoculati in pozzetti di
piastre microtiter.
Macchine robot
prelevano contemporaneamente tutti i
cloni da una piastra microtiter e li
depositano sulla membrana.
Questo
processo
automatizzato
consente di ottenere copie multiple
delle membrane da ibridare.
Sonde di ibridazione per lo
screening di genoteche
9Sequenza omologa (cDNA)
9Sequenza parzialmente omologa:
- gene simile della stessa specie
- stesso gene di un’altra specie
9Oligonucleotide (14-20 mer)
degenerato sintetizzato
chimicamente ottenuto per “traduzione inversa” di una corta
sequenza proteica
¾ Sonde a DNA
¾ Sonde a RNA
¾ Marcatura terminale
¾ Marcatura interna
¾ Traccianti radioattivi
¾ Traccianti chimici
Oligonucleotidi degenerati
come sonde di ibridazione
Si utilizzano quando:
• non si conosce la sequenza
nucleotidica del gene che si sta
cercando
• si
conosce
almeno
parzialmente la sequenza della
proteina codificata dal gene di
interesse
E’ preferibile costruire la sonda a partire da una
sequenza proteica ricca in metionina o in triptofano
Chromosome walking
Un clone viene utilizzato come
sonda per identificare i cloni
immediatamente a monte e
valle di esso.
E’ utile per isolare e mappare
un’intera regione genomica che
si estende su più cloni.
L’unico
ostacolo
è
rappresentato dalla presenza di
sequenze altamente ripetute
nel genoma.
Screening di genoteche per PCR
E’ utilizzabile quando:
• si conosce almeno in parte la sequenza nucleotidica del gene che si sta
cercando
• si conosce la sequenza della proteina codificata dal gene di interesse. In
tal caso occorrono primer degenerati, utili anche per isolare membri di una
famiglia genica
i cloni non vengono trasferiti su supporto solido,
ma in pozzetti di piastre microtiter. Più cloni
possono essere trasferiti nello stesso pozzetto
limitando il numero di amplificazioni da effettuare
Sreening delle genoteche
Sulla base
della sequenza
nucleotidica
Ibridazione
• cDNA
• gene di specie diversa
• sonda dedotta da
seq. parziale proteina
• chromos. walking
Applicabile a tutte le genoteche
Sulla base
della struttura/funzione
(vettori di espressione)
• riconoscimento con Ab
• interazione con ligandi
• complementazione/acquisizione di funzione
Applicabile alle genoteche di cDNA costruite con vettori di espressione
Screening
mediante Ab
specifici
Condizione necessaria per questo screening:
• Disponibilità di un anticorpo contro la proteina codificata dal gene di interesse
Condizione non necessaria per questo screening:
• La proteina può anche non essere funzionale
Screening per interazione: south-western, northwestern e interazione con ligandi alternativi
Condizioni necessarie per questo screening:
• La proteina deve essere funzionale
• Il sito di legame per il ligando deve essere contenuto in un unico polipeptide
Condizioni non necessarie per questo screening:
• Non bisogna conoscere né la sequenza del gene né la sequenza della proteina
• Non bisogna avere anticorpi a disposizione
Il south-western è molto utile per identificare i fattori di trascrizione, attivatori
e repressori che legano sequenze regolative come promotori, enhancers,
ecc.
Screening funzionale
Condizioni non necessarie per questo screening:
• Non bisogna conoscere né la sequenza del gene né la sequenza della proteina
• Non bisogna avere anticorpi a disposizione
Condizioni necessarie per questo screening:
• La proteina deve essere funzionale
• La funzione svolta dalla proteina deve essere testabile:
1. Analisi per acquisizione di funzione. La proteina conferisce alla cellula
ospite un nuovo fenotipo (esempio: oncogeni umani sono stati identificati
grazie alla loro capacità di stimolare la proliferazione di fibroblasti murini
quiescenti.
2. Analisi medianti complementazione di funzione. Alcuni cloni di cDNA
possono essere isolati per complementazione di un difetto genico portato dalla
cellula ospite (in genere un batterio o un lievito). Questa analisi è applicabile
solo per lo screening di attività enzimatiche molto conservate nel corso
dell’evoluzione. Molti geni umani sono stati isolati sulla base della loro capacità
di complementare mutazioni nei corrispondenti geni di lievito (esempi: geni
codificanti enzimi metabolici, geni del ciclo cellulare.
Clonaggio differenziale
genoteche di sottrazione
Screening di microarrays