I vettori di grandi dimensioni per il clonaggio genico
BAC (Bacterial Artificial Chromosome)
Tipo di vettore che permette di inserire fino a 300Kb di inserto, è stato creato usando
come modello il plasmide F (fattore di fertilità responsivo della coniugazione batterica),
grazie ai geni del fattore F che conferiscono al vettore una bassa percentuale di coclonazione e ricombinazione interna è presente solo in 1 o 2 copie per cellula. E' molto
stabile nelle generazioni, e per la trasformazione batterica con questo vettore si usa
l'elettroporazione.
Il plasmide 2 µ
YAC (yeast artificial chromosome)
Tra i vettori di lievito i vettori YAC sono
particolarmente importanti, perché, grazie alla
dimensione degli inserti che possono contenere, sono
molto utilizzati nella preparazione e screening di librerie
molto complesse.
I vettori YAC infatti possono accettare inserti grandi
fino a 2 Mb, anche se l’efficienza di trasformazione è
molto bassa.
Vengono mantenuti e propagati in E.coli
I componenti essenziali di un vettore YAC sono:
• Centromeri (CEN), telomeri (TEL) e sequenze a
replicazione autonoma (ARS)
• Marcatore di resistenza (Amp) per stabilire una
selezione positiva in E.coli
• Ori
• Marcatori di selezione auxotrofica come TRP1 e
URA3 per selezionare in lievito
• Siti di restrizione unici (es., EcoRI and BamHI)
Procedura
1.Digerire parzialmente il DNAbersaglio con EcoRI e il
vettore YAC con EcoRI e BamHI
2.Separare i due bracci
3.Ligare vettore YAC e inserto
4.Trasformare le cellule di lievito, selezionando per i 2
marcatori diversi posizionati ciascuno su un braccio
diverso.
ESPRESSIONE GENICA
IN SISTEMI ETEROLOGHI
1. PERCHE’ ESPRIMERE GENI IN SISTEMI ETEROLOGHI.
2. QUALI SISTEMI ETEROLOGHI UTILIZZARE PER L’ESPRESSIONE
DEI GENI
Il problema di esprimere geni in sistemi eterologhi nasce dall’interesse generale ad ottenere grandi quantità di peptidi
di interesse pratico o scientifico e dalla difficoltà di esprimere geni, di qualunque natura,in organismi superiori assai
complessi e soggetti a regolazioni non sempre pienamente comprese.
Al contrario, invece, il livello di conoscenze accumulate su alcuni organismi “semplici”, specialmente procariotici,
ha stimolato lo sviluppo di numerosi sistemi di espressione eterologhi basati essenzialmente sull’utilizzo di appositi
vettori di espressione.
E’ virtualmente possibile esprimere geni in sistemi di ogni tipo utilizzando vettori d’espressione appropriati,in
funzione di esigenze specifiche. I più diffusi sono Escherichia coli, Bacillus subtilis, lievito, cellule d’insetto, cellule
vegetali e cellule di mammifero in coltura. L’espressione in E.coli è di gran lunga la più semplice e, forse, per questo
la più utilizzata come prototipo di espressione genica in sistemi eterologhi.
Le conoscenze correnti permettono di sfruttare le potenzialità dell’espressione genica in organismi complessi che,
Sempre più spesso vengono utilizzati come bioreattori
MT:
Per esprimere
MT:
vantaggi
vantaggiee
svantaggi
svantaggi
caratteristiche
caratteristiche
ospiti
Batteri
ospiti
d’espressione
d’espressione
ceppi
ceppiproteasi
proteasi
-- Funghi
Piante
un gene eterologo bisogna definire due componenti:
un vettore d’espressione
un ospite per l’espressione
Escherichia coli
Bacillus subtilis
Saccaromices cerevisiae
Pichia pastoris
Aspergillus nidulans
Specie modello
(Arabidopsis thaliana, Nicotiana tabacco,ecc)
Insetti
Dorifera californica
drosophila melanogaster
Animali
oociti
cellule in coltura
organismi interi
protoplasti
cellule in coltura
piante transgeniche
cellule d’insetto in coltura
organismi interi
Principali proteine ricombinanti di interesse medico espresse in microorganismi
Insulina umana
Ormone della crescita umano
Vaccino per l’epatite B
Interferone α
Attivatore del plasminogeno tissutale
Eritropoietina
Inteferone γ
Fattore stimolante la crescita delle
colonie di macrofagi e granulociti
Fattore stimolante la crescita
di colonie di granulociti
Interleuchina-2 umana
Fattore VIII
DNasi umana
Glucocerebrosidasi
Interferone β
Fattore IX
Interferone consenso
PGF
PDGF- β
Recettore FNT
Glucagone
Diabete
Nanismo ipofisario
Prevenzione dell’epatite B
Tricoleucemia
Infarto miocardico acuto
Anemia associata ad insufficenza renale cronica
Granulomatosi cronica
Trapianto di midollo osseo
Neutropenia causata da chemioterapeia
Carcinoma del rene
Emofilia A
Fibrosa cistica
Morbo di Gaucher
Sclerosi multipla
Emofilia B
Infezione cronica da HCV
Trombocitopenia indotta da chemioterapia
Ulcerazione arti inferiori da diabete
Artrite reumatoide
Ipoglicemia
Ormone della crescita umana hGH (somatotropina)
Scoperto nel 1912 l’ormone della crescita umano viene sintetizzato in
età giovanile dalla ghiandola pituitaria, nell’ipofisi. La sua deficienza
è causa del nanismo ipofisario che può essere efficacemente limitato
dalla somministrazione di hGH. Veniva inizialmente estratto dalle
ghiandole pituitarie di cadaveri di uomini o scimmie, a costi
elevatissimi e con considerevoli problemi pratici e sanitari. In
particolare, sia gli operatori sanitari che i pazienti trattati erano esposti
al rischio di contrarre la malattia di Creutzfeld-Jacob
Attualmente tutti questi problemi sono risolti dalla produzione del hGH
per via ricombinate e l’ormone della crescita è oggetto di un fiorente
commercio prevalentemente come farmaco anti-invecchiamento
Principali proteine ricombinanti prodotte in Bioreattori
Topo
(latte)
Coniglio
Pecora
Capra
Coniglio
Maiale
Topo
Topo
(latte)
(latte)
(latte)
(sangue)
(sangue)
(urina)
(sperma)
Tabacco
Tabacco
Tabacco
Riso
Tabacco
Tabacco
Animali transgenici
β-lattoglobulina di pecora
Attivatore del plasminogeno tissutale umano
Urochinasi umana
Ormone della crescita umano
Fibrinogeno umano
Seta di ragno
Eritropoietina umana
Anti-tripsina umana
Attivatore del plasminogeno tissutale umano
Anti-tripsina umana
Anticorpi umani
Ormone della crescita umano
Ormone della crescita umano
Piante trasgeniche
Ormone della crescita umano
Albumina serica
Fattore di crescita dell’epidermide
α-Interferone
Anticorpi
Emoglobina
A comparison of some properties of different vaccine types
(from Hansson et al. Biotechnol. Appl. Biochem. (2000) 32, 95–107)
____________________________________________________________________________________________________________________________________________________________
Vaccine type
Advantages
Drawbacks
____________________________________________________________________________________________________________________________________________________________
Live vaccines (attenuated)
One or few doses normally required.
Long-lasting protection.
Both humoral and cellular responses Poorly
Controlled attenuation normally required.
Risk of reversion to pathogenicity.
Certain risk of transmission
Killed vaccines
No risk of reversion to pathogenicity.
No risk of transmission
Multiple doses typically required
Poorly defined composition.
Antigen must be produced by cultivation of a pathogen
Mainly humoral responses
Adjuvants normally needed
Subunit vaccines
(non-recombinant)
Defined composition
Various delivery systems available
Antigen must be produced and purified by cultivation o
a pathogen
Multiple doses typically required
Adjuvants needed
Subunit vaccines
(recombinant)
No risk of pathogenicity since the pathogenic
organism is not present
Defined composition
Various delivery systems available
Simplified large-scale production
Further engineering possible
Multiple doses typically required
Adjuvants needed
VETTORI D’ESPRESSIONE
I SEGNALI CHE ASSICURANO L’ESPRESSIONE GENICA NEI PROCARIOTI SONO
MOLTO DIVERSI E SE UN GENE EUCARIOTICO VIENE SEMPLICEMENTE
TRASFERITO IN UNA CELLULA BATTERICA HA POCHE PROBABILITA’ DI ESSERE
ESPRESSO.
COSTRUIRE UN VETTORE D’ESPRESSIONE SIGNIFICA ESSENZIALMENTE
COSTRUIRE UN VETTORE DI REPLICAZIONE CONTENENTE TUTTI QUEI
SEGNALI CAPACI DI OTTIMIZZARE LA CORRETTA TRASCRIZIONE E
TRADUZIONE DEI GENI ETEROLOGHI NELL’OSPITE IN CUI AVVIENE
L’ESPRESSIONE.
PER AUMENTARE LE RESE, INFINE, IN GENERE SI CERCA DI OTTIMIZZARE LA
STABILITA’ DEI PRODOTTI DI ESPRESSIONE, SIA A LIVELLO TRASCRIZIONALE
CHE TRADUZIONALE.
Alcuni ceppi di E. coli frequentemente utilizzati per l’espressione di proteine ricombinanti
Ceppo batterico
Produttore
Caratteristiche
E. coli BL21(DE3)
Novagen
Esprime la polimerasi del fago T7 a seguito di
induzione con IPTG. E’ difettivo delle proteasi lon
e omp-t
E. coli BL21(DE3)-pLysS
Novagen
Come le BL21(DE3) esprime la T7 RNApol.
Esprime dal plasmide pLysS il lisozima T7. Adatto
per l’espressione di proteine tossiche
E. coli Origami
Novagen
Ha mutazioni sui geni trxB e gor (reduttasi). Facilita
la formazione dei ponti disolfuro citoplasmatici
E. coli Origami-pLysS
Novagen
Come il precedente con l’aggiunta del sistema
pLysS per il controllo trascrizionale
E. coli Rosetta
Novagen
Possiede i tRNA per codoni rari. Facilita
l’espressione di proteine eucariotiche in E. coli
E. coli Rosetta-gami-pLysS
Novagen
Come il precedente con l’aggiunta del sistema
pLysS per il controllo trascrizionale
E. coli BL21-codon plus
Stratagene
Possiede i geni dei tRNA più rari per arginina
(AGA/AGG), isoleucina (AUA) e leucina (CUA)
E. coli C41 e C43 (DE3)
Lucigen
Adatti per l’espressione di proteine tossiche di ogni
origine
OTTIMIZZAZIONE DELLA TRASCRIZIONE
IL LIVELLO DI ESPRESSIONE DI UN GENE DIPENDE IN LARGA MISURA DALLA FORZA
DEL PROMOTORE CHE LO CONTROLLA DETERMINANDO LA FREQUENZA CON LA
QUALE LA RNA POLIMERASI INIZIA LA TRASCRIZIONE.
CONSEGUENTEMENTE SONO STATI ISOLATI ED OTTIMIZZATI UN CERTO NUMERO DI
PROMOTORI FORTI DI E.coli CHE SONO PRESENTI NELLA MAGGIOR PARTE DEI VETTORI
D’ESPRESSIONE ATTUALI. IN PIU’, POICHE’ IL LIVELLO DI CONOSCENZA DEI
PROMOTORI PROCARIOTICI E’ MOLTO AVANZATO, SONO STATI ELABORATI ANCHE
PROMOTORI IN PARTE O TOTALMENTE SINTETICI SULLA BASE DELLE SEQUENZE
CONSENSUS OTTIMALI.
UN PROMOTORE PROCARIOTICO TIPICO E’ COSTITUITO DA CIRCA 60 bp CONTENENTI
DUE SEQUENZE CONSENSO A -35 (ttcaga) e -10 (tataat). LA SPAZIATURA IDEALE TRA
-35 e -10 VARIA TRA 16 a 17 bp . QUELLA TRA -10 E ATG E’ DI 9 bp.
In alcuni promotori sono state caratterizzate recentemente regioni “UP”
ulteriormente a monte che aumentano l’efficienza di trascrizione
TRA I PROMOTORI PIU’ COMUNI RICORDIAMO:
Lac, lacUV10, trc, tac, T3, T7, Lambda Pr, Lambda Pl
OTTIMIZZAZIONE DELLA FINE DELLA TRASCRIZIONE
Una volta che L’RNA polimerasi ha iniziato la trascrizione, continua a incorporare
Ribonucleotidi fino a quando non incontra un segnale di stop
Questi segnali sono molto diversi tra eucarioti e procarioti.
Nei procarioti esistono due tipi di segnali di terminazione
diversi:
• I segnali fattore-indipendente
•I segnali fattore-dipendente
I primi l’interruzione della trascrizione è mediata dalla struttura che assume il
Trascritto in funzione della sua particolare sequenza, tipicamente una ripetizione
Invertita seguita da una serie di adenine
Nei segnali fattore-dipendente, invece, la terminazione della trascrizione è mediata
Da uno dei tre fattori di terminazione noti:
Rho (ρ)
Tau (τ)
NusA
OTTIMIZZAZIONE DELLA TRADUZIONE
L’inizio della traduzione in E.coli, richiede la presenza, sulla porzione non tradotta al 5’
del mRNA, di una regione di legame al ribosoma (RBS). Nei batteri è costituita da una
Sequenza, chiamata SHINE-DALGARNO (SD), complementare al 3’ del rRNA 16S
presente nella subunità ribosomale piccola 30S. La sua sequenza consenso è:
5’-UAAGGAGG-3’
Subito dopo la sequenza di Shine-Dalgarno deve essere presente un codone di inizio, quasi
Sempre AUG. In una piccola percentuale di casi può essere presente il codone GUG.
La spaziatura ottimale tra SD e AUG è di 8 bp
E’ importante che la sequenza nucleotidica tra la SD e il codone d’inizio non sia disturbata
da strutture secondarie ( es. hairpin loops
) che possono interferire drasticamente con il
legame al ribosoma e la conseguente traduzione.
OTTIMIZZAZIONE DELLA STABILITA’
La resa di un prodotto di espressione dipende, in larga misura, dalla stabilità della proteina. Sappiamo
che la stabilità delle proteine dipende dalla presenza di amino acidi stabilizzanti all’ estremità Nterminale e di amino acici destabilizzanti all’estremità C-terminale. Modificando, tramite ingegneria
genetica, la sequenza codificante una proteina, possiamo alterarne la composizione aminoacidica ed
aumentarne la stabilità.
Stabilità conferita alla β-galattosidasi da diversi aa all’ N-terminale
Amino acido
Tempo di dimezzamento
> 20 ore
> 30’
> 20’
≈ 10’
≈ 3’
≈ 1’
Met, Ser, Ala, Thr, Val, Gly
Ile, Glu
Tyr, Gln
Pro
Phe, Leu, Asp, Lys
Arg
Le sequenze PEST
Le sequenze PEST , ricche in prolina (P), acido glutammico (E), serina (S) e treonina (T), spesso
fiancheggiate da gruppi di amino acidi positivi, sono target di degradazione e destabilizzano le
proteine batteriche che le contengono. L’eliminazione delle sequenze PEST, mediante mutagenesi
sito-specifica, può migliorare la stabilità delle proteine ricombinanti
OTTIMIZZAZIONE DELLA STABILITA’
Utilizzo di codoni alternativi
Poiché organismi diversi possono utilizzare preferenzialmente codoni sinonimi per
specificare uno stesso amminoacido e poiché è nota la percentuale di utilizazione
media dei codoni sinonimi in molti organismi è possibile aumentare i livelli di
espressione modificando i codoni del gene di interesse senza alterarne il prodotto
di espressione
L’utilizzo di ceppi carenti in proteasi
Un altro modo per ottimizzare la stabilità dei prodotti di espressione, consiste
nel minimizzare la degradazione proteolitica a carico delle proteine espresse
A causa della presenza in E.coli di più di venti proteasi, solo alcune delle quali
risultano essere caratterizzate, questo obbiettivo è difficile da ottenere.
Sono tuttavia disponibili ceppi di coli mutanti che risultano difettiva in una o
Più di queste proteasi, come ad esempio omp
Promotore/operatore
BamHI
ShineDalgarno
Terminatore
Ap
ori
RBS
mRNA
5’
AUG (start codon)
UAA (stop codon)
3’
Proteine native
Proteine di fusione
Espressione di proteine native
NcoI
BamHI
RBS
AGGAAAC AGAACCATGGGAGGATCCGTCGGATAATTAGCTGA
TCC TTTG TCTT GGTACCCT CCTAGGCAGCCTATTAATCGACT
AGGAAAC AGAAC
TCC TTTG TCTT GGTAC
AGGAAAC AGAACCATGG
TCC TTTG TCTT GGTACC
ATG
Met
GATCCGTCGGATAATTAGCTGA
GCAGCCTATTAATCGACT
C-DNA
GGATCCGTCGGATAATTAGCTGA
CCTAGGCAGCCTATTAATCGA CT
TAA
IL PROBLEMA DELLO SCHEMA DI LETTURA (FRAME)
LEI NON AMA CHE LUI. LUI NON AMA PIU’ LEI.
NON SAI PIU’ CHI SEI.
L EIN ONA MAC HEL UIL UIN ONA MAP IU’L EIN
ONS AIPI U’CH ISE I
LE INO NAM ACH ELU ILU INO NAM API U’LE INO
NSA IPI U’CH ISE I
Espressione di proteine di fusione
BamHI
AGGAAAC AGAACCATG
TCC TTTG TCTT GGTAC
AGGAAAC AGAACCATG
TCC TTTG TCTT GGTAC
BamHI
GST
GST
HindIII
GGATCCGTCGAAGCTTGATAATTAGCTGA
CCTAGGCAGCTTCGAACTATTAATCGA CT
G
CCTAG
AGCTTGATAATTAGCTGA
ACTATTAATCGACT
HindIII
cDNA IgG
TAA
ATG
AGGAAAC AGAACCATG
TCC TTTG TCTT GGTAC
GST
GST
Met
GGATCC
CCTAGG
cDNA IgG
IgG
AAGCTT
TTCGAA
Glu Ala Gly Ser Val Ala Cys Tyr
AGGAAAC AGAACCATG
TCC TTTG TCTT GGTAC
GST
GGATCC
CCTAGG
cDNA IgG
AAGCTT
TTCGAA
IgG
GST
Met
Glu Ala Gly Ser Lys Phe Met Asp
AGGAAAC AGAACCATG
TCC TTTG TCTT GGTAC
GST
GST
Met
GGATCCAAA
CCTAGGTTT
?
cDNA IgG
AAGCTT
TTCGAA
Regolazione dei vettori d’espressione
La maggior parte dei vettori d’espressione, come la maggior parte
dei geni, sono regolati.
Perchè i vettori d’espressione sono (quasi) sempre regolati
• L’espressione di una proteina eterologa tende ad essere identificata come “estranea” e
degradata dalla cellula che attiva specifiche proteasi. La possibilità di indurre l’espressione della proteina permette di minimizzare le degradazioni proteolitiche aumentando
le rese.
•Alcune proteine possono essere tossiche o, comunque, interferire con la crescita dell’
ospite di espressione. In alcuni casi fino al 50% delle proteine totali sono costituite
dalla proteina ricombinante, a discapito delle proteine che assicurano il normale
metabolismo di E.coli.
La possibilità di limitare l’espressione della proteina alla sola fase di induzione
permette il normale sviluppo della cellula.
•La possibilità, di indurre sperimentalmente l’espressione della proteina rappresenta un
primo strumento di verifica dei livelli di espressione; comparando un estratto proteico
indotto con uno non indotto si riesce facilmente ad evidenziare la presenza della proteina
etrologa putativa (di cui conosciamo il peso molecolare)
Principali sistemi di regolazione
I batteri si sono evoluti per adattarsi rapidamente ad un ambiente altamente variabile, ottimizzando al
massimo i consumi energetici. I loro geni, generalmente raggrupati in unità di trascrizione dette operoni,
tendono ad esprimersi solo quando serve (es.geni per l’utilizzo di zuccheri) o a smettere di esprimersi quando
non serve (es. geni per la sintesi di aminoacidi)
Poichè i sistemi di regolazione batterici sono molto efficenti tutti i vettori d’espressione
li utilizzano quasi integralmente
Uno dei sistemi più utilizzato è quello basato sull’operone del lattosio. Funziona
posizionando in qualunque promotore la regione dell’operatore lac e fornendo,
contemoraneamente il gene lacI, che codifica per il repressore del lattosio e funziona
in trans. Per evitare interferenze con i geni endogeni dell’operone lac, inoltre, il vettore d’espressione deve essere ospitato in un ospite di genotipo ∆lac
operatore lac
Qualunque promotore
lacI
lac I in qualunque posizione
Per indurre l’espressione di geni eterologhi clonati in vettori d’espressione regolati da questo sistema
si utilizza l’induttore gratuito IPTG (isopropil-β-tio-D-glucoside)
Nonostante la loro efficenza i sistemi di regolazione procariotici sono sempre “leaky”.
Una repressione assoluta, infatti, impedirebbe al sistema di essere ri-attivato. La
completa repressione dell’operone del lattosio per esempio, reprimendo completamente anche l’espressione della lattosio permeasi, impedirebbe l’assunzione di lattosio
eventualmente presente nel mezzo di coltura.
I sistemi di regolazione dei vettori d’espressione hanno lo stesso problema, aggravato
dagli alti livelli di espressione che tendono a saturare i sistemi di regolazione. Ne
consegue che il principale problema di molti vettori d’espressione è quello di essere
troppo “leaky”e di esprimere un pò (troppa) proteina anche in condizioni non induttive
Per superare questo problema sono stati messi a punto dei sistemi di regolazione
“stringenti” che minimizzano il livello di espressione basale di geni repressi.
Un modo comune per aumentare la stringenza di sistemi di regolazione è quello di
aumentare il dosaggio genico dei geni di regolazione
Un altro modo, ancora più efficiente per avere regolazione stringente consiste nel
creare delle regolazioni a cascata come, per esempio nei vettori della serie PET.
Si è rivelato molto efficiente anche il promotore del operone dell’arabinosio che è
quantitativamente represso da quantità crescenti di arabinosio
Evoluzione dei vettori d’espressione
Promotore/operatore
M13
ShineDalgarno
BamHI
Terminatore
TAG
lacI
oriC
Ap
ori
TAG per affinità
TAG
Vettori
______________________________________________________
•Calmodulin binding peptide (CBP)
pCAl
•6xHis
pQE, pET
•Proteina A (IgG binding domain)
pEZZ
•Chitin binding domain (CBD)
Impact
•Glutatione S-transferasi (GST)
pGEX
•MBP (Maltose binding protein)
pMAL
•Strep tag (Streptavidin binding tag)
•Flag tag
•Myc tag
I vettori con Tag ad istidina
Esistono numerosi vettori commerciali che includono il Tag ad istidina per esprimere fusioni
N-teminali o C-terminali. Di solito nel caso delle fusioni N-terminali è presente un sito di riconoScimento per una proteasi interposto tra la sequenza che codifica il Tag ed il gene
E’ possibile, in teoria, inserire la sequenza codificante una poli-istidina in qualunque vettore, in
qualunque posizione inserendo la sequenza per PCR
5'-Oligo 5'- XXXXX CAT CAC CAT CAC CAT CAC X -3'
3'-Oligo 3'X GTA GTG GTA GTG GTA GTG XXXXX -5'
His His His His His His
Vettori forniti da Novagen (alcuni esempi)
pET22b(+) (adatto per l’espressione periplasmica attraverso il peptide segnale pelB
pET30a(+)
pET42a(+) (fusione con GST)
E.coli
+ IPTG
Il sistema GATEWAY
Uno dei problemi fondamentali dell’espressione di proteine eterologhe è che è
difficile stabilire le giuste condizioni di espressione. Un gene dato può esprimersi
bene in un vettore e male in un altro. Un vettore capace di esprimere proteine
funzionali a bassa rese può essere inadatto ad esprimere proteine ad alta resa per
produrre anticorpi. Una certa proteina può essere espressa in modo più o meno
solubile in vettori diversi ecc ecc.
Una delle migliori soluzioni a
questo problema è offerta dal
sistema Gateway, un sistema,
basato sulle proprietà di
ricombinazione sito-specifiche
del fago λ, messo a punto e
commercializzato dalla
Invitrogen.
Vettore di espressione
eucariotica
Testo di riferimento:
"Dai geni ai genomi" 1^ edizione italiana, di Jeremy W. Dale
e Malcom von Schantz. 1994 EdiSES
Per questa lezione consultare i capitoli 6, 15 e 16
________________
Testi di approfondimento generale:
“Biotecnologia molecolare” 1^ edizione italiana, di Bernard R.
Glick e Jack J. Pasternack. 1999 Zanichelli
"Genomi 2" T.A.Brown 2004 EdiSES