I vettori di grandi dimensioni per il clonaggio genico BAC (Bacterial Artificial Chromosome) Tipo di vettore che permette di inserire fino a 300Kb di inserto, è stato creato usando come modello il plasmide F (fattore di fertilità responsivo della coniugazione batterica), grazie ai geni del fattore F che conferiscono al vettore una bassa percentuale di coclonazione e ricombinazione interna è presente solo in 1 o 2 copie per cellula. E' molto stabile nelle generazioni, e per la trasformazione batterica con questo vettore si usa l'elettroporazione. Il plasmide 2 µ YAC (yeast artificial chromosome) Tra i vettori di lievito i vettori YAC sono particolarmente importanti, perché, grazie alla dimensione degli inserti che possono contenere, sono molto utilizzati nella preparazione e screening di librerie molto complesse. I vettori YAC infatti possono accettare inserti grandi fino a 2 Mb, anche se l’efficienza di trasformazione è molto bassa. Vengono mantenuti e propagati in E.coli I componenti essenziali di un vettore YAC sono: • Centromeri (CEN), telomeri (TEL) e sequenze a replicazione autonoma (ARS) • Marcatore di resistenza (Amp) per stabilire una selezione positiva in E.coli • Ori • Marcatori di selezione auxotrofica come TRP1 e URA3 per selezionare in lievito • Siti di restrizione unici (es., EcoRI and BamHI) Procedura 1.Digerire parzialmente il DNAbersaglio con EcoRI e il vettore YAC con EcoRI e BamHI 2.Separare i due bracci 3.Ligare vettore YAC e inserto 4.Trasformare le cellule di lievito, selezionando per i 2 marcatori diversi posizionati ciascuno su un braccio diverso. ESPRESSIONE GENICA IN SISTEMI ETEROLOGHI 1. PERCHE’ ESPRIMERE GENI IN SISTEMI ETEROLOGHI. 2. QUALI SISTEMI ETEROLOGHI UTILIZZARE PER L’ESPRESSIONE DEI GENI Il problema di esprimere geni in sistemi eterologhi nasce dall’interesse generale ad ottenere grandi quantità di peptidi di interesse pratico o scientifico e dalla difficoltà di esprimere geni, di qualunque natura,in organismi superiori assai complessi e soggetti a regolazioni non sempre pienamente comprese. Al contrario, invece, il livello di conoscenze accumulate su alcuni organismi “semplici”, specialmente procariotici, ha stimolato lo sviluppo di numerosi sistemi di espressione eterologhi basati essenzialmente sull’utilizzo di appositi vettori di espressione. E’ virtualmente possibile esprimere geni in sistemi di ogni tipo utilizzando vettori d’espressione appropriati,in funzione di esigenze specifiche. I più diffusi sono Escherichia coli, Bacillus subtilis, lievito, cellule d’insetto, cellule vegetali e cellule di mammifero in coltura. L’espressione in E.coli è di gran lunga la più semplice e, forse, per questo la più utilizzata come prototipo di espressione genica in sistemi eterologhi. Le conoscenze correnti permettono di sfruttare le potenzialità dell’espressione genica in organismi complessi che, Sempre più spesso vengono utilizzati come bioreattori MT: Per esprimere MT: vantaggi vantaggiee svantaggi svantaggi caratteristiche caratteristiche ospiti Batteri ospiti d’espressione d’espressione ceppi ceppiproteasi proteasi -- Funghi Piante un gene eterologo bisogna definire due componenti: un vettore d’espressione un ospite per l’espressione Escherichia coli Bacillus subtilis Saccaromices cerevisiae Pichia pastoris Aspergillus nidulans Specie modello (Arabidopsis thaliana, Nicotiana tabacco,ecc) Insetti Dorifera californica drosophila melanogaster Animali oociti cellule in coltura organismi interi protoplasti cellule in coltura piante transgeniche cellule d’insetto in coltura organismi interi Principali proteine ricombinanti di interesse medico espresse in microorganismi Insulina umana Ormone della crescita umano Vaccino per l’epatite B Interferone α Attivatore del plasminogeno tissutale Eritropoietina Inteferone γ Fattore stimolante la crescita delle colonie di macrofagi e granulociti Fattore stimolante la crescita di colonie di granulociti Interleuchina-2 umana Fattore VIII DNasi umana Glucocerebrosidasi Interferone β Fattore IX Interferone consenso PGF PDGF- β Recettore FNT Glucagone Diabete Nanismo ipofisario Prevenzione dell’epatite B Tricoleucemia Infarto miocardico acuto Anemia associata ad insufficenza renale cronica Granulomatosi cronica Trapianto di midollo osseo Neutropenia causata da chemioterapeia Carcinoma del rene Emofilia A Fibrosa cistica Morbo di Gaucher Sclerosi multipla Emofilia B Infezione cronica da HCV Trombocitopenia indotta da chemioterapia Ulcerazione arti inferiori da diabete Artrite reumatoide Ipoglicemia Ormone della crescita umana hGH (somatotropina) Scoperto nel 1912 l’ormone della crescita umano viene sintetizzato in età giovanile dalla ghiandola pituitaria, nell’ipofisi. La sua deficienza è causa del nanismo ipofisario che può essere efficacemente limitato dalla somministrazione di hGH. Veniva inizialmente estratto dalle ghiandole pituitarie di cadaveri di uomini o scimmie, a costi elevatissimi e con considerevoli problemi pratici e sanitari. In particolare, sia gli operatori sanitari che i pazienti trattati erano esposti al rischio di contrarre la malattia di Creutzfeld-Jacob Attualmente tutti questi problemi sono risolti dalla produzione del hGH per via ricombinate e l’ormone della crescita è oggetto di un fiorente commercio prevalentemente come farmaco anti-invecchiamento Principali proteine ricombinanti prodotte in Bioreattori Topo (latte) Coniglio Pecora Capra Coniglio Maiale Topo Topo (latte) (latte) (latte) (sangue) (sangue) (urina) (sperma) Tabacco Tabacco Tabacco Riso Tabacco Tabacco Animali transgenici β-lattoglobulina di pecora Attivatore del plasminogeno tissutale umano Urochinasi umana Ormone della crescita umano Fibrinogeno umano Seta di ragno Eritropoietina umana Anti-tripsina umana Attivatore del plasminogeno tissutale umano Anti-tripsina umana Anticorpi umani Ormone della crescita umano Ormone della crescita umano Piante trasgeniche Ormone della crescita umano Albumina serica Fattore di crescita dell’epidermide α-Interferone Anticorpi Emoglobina A comparison of some properties of different vaccine types (from Hansson et al. Biotechnol. Appl. Biochem. (2000) 32, 95–107) ____________________________________________________________________________________________________________________________________________________________ Vaccine type Advantages Drawbacks ____________________________________________________________________________________________________________________________________________________________ Live vaccines (attenuated) One or few doses normally required. Long-lasting protection. Both humoral and cellular responses Poorly Controlled attenuation normally required. Risk of reversion to pathogenicity. Certain risk of transmission Killed vaccines No risk of reversion to pathogenicity. No risk of transmission Multiple doses typically required Poorly defined composition. Antigen must be produced by cultivation of a pathogen Mainly humoral responses Adjuvants normally needed Subunit vaccines (non-recombinant) Defined composition Various delivery systems available Antigen must be produced and purified by cultivation o a pathogen Multiple doses typically required Adjuvants needed Subunit vaccines (recombinant) No risk of pathogenicity since the pathogenic organism is not present Defined composition Various delivery systems available Simplified large-scale production Further engineering possible Multiple doses typically required Adjuvants needed VETTORI D’ESPRESSIONE I SEGNALI CHE ASSICURANO L’ESPRESSIONE GENICA NEI PROCARIOTI SONO MOLTO DIVERSI E SE UN GENE EUCARIOTICO VIENE SEMPLICEMENTE TRASFERITO IN UNA CELLULA BATTERICA HA POCHE PROBABILITA’ DI ESSERE ESPRESSO. COSTRUIRE UN VETTORE D’ESPRESSIONE SIGNIFICA ESSENZIALMENTE COSTRUIRE UN VETTORE DI REPLICAZIONE CONTENENTE TUTTI QUEI SEGNALI CAPACI DI OTTIMIZZARE LA CORRETTA TRASCRIZIONE E TRADUZIONE DEI GENI ETEROLOGHI NELL’OSPITE IN CUI AVVIENE L’ESPRESSIONE. PER AUMENTARE LE RESE, INFINE, IN GENERE SI CERCA DI OTTIMIZZARE LA STABILITA’ DEI PRODOTTI DI ESPRESSIONE, SIA A LIVELLO TRASCRIZIONALE CHE TRADUZIONALE. Alcuni ceppi di E. coli frequentemente utilizzati per l’espressione di proteine ricombinanti Ceppo batterico Produttore Caratteristiche E. coli BL21(DE3) Novagen Esprime la polimerasi del fago T7 a seguito di induzione con IPTG. E’ difettivo delle proteasi lon e omp-t E. coli BL21(DE3)-pLysS Novagen Come le BL21(DE3) esprime la T7 RNApol. Esprime dal plasmide pLysS il lisozima T7. Adatto per l’espressione di proteine tossiche E. coli Origami Novagen Ha mutazioni sui geni trxB e gor (reduttasi). Facilita la formazione dei ponti disolfuro citoplasmatici E. coli Origami-pLysS Novagen Come il precedente con l’aggiunta del sistema pLysS per il controllo trascrizionale E. coli Rosetta Novagen Possiede i tRNA per codoni rari. Facilita l’espressione di proteine eucariotiche in E. coli E. coli Rosetta-gami-pLysS Novagen Come il precedente con l’aggiunta del sistema pLysS per il controllo trascrizionale E. coli BL21-codon plus Stratagene Possiede i geni dei tRNA più rari per arginina (AGA/AGG), isoleucina (AUA) e leucina (CUA) E. coli C41 e C43 (DE3) Lucigen Adatti per l’espressione di proteine tossiche di ogni origine OTTIMIZZAZIONE DELLA TRASCRIZIONE IL LIVELLO DI ESPRESSIONE DI UN GENE DIPENDE IN LARGA MISURA DALLA FORZA DEL PROMOTORE CHE LO CONTROLLA DETERMINANDO LA FREQUENZA CON LA QUALE LA RNA POLIMERASI INIZIA LA TRASCRIZIONE. CONSEGUENTEMENTE SONO STATI ISOLATI ED OTTIMIZZATI UN CERTO NUMERO DI PROMOTORI FORTI DI E.coli CHE SONO PRESENTI NELLA MAGGIOR PARTE DEI VETTORI D’ESPRESSIONE ATTUALI. IN PIU’, POICHE’ IL LIVELLO DI CONOSCENZA DEI PROMOTORI PROCARIOTICI E’ MOLTO AVANZATO, SONO STATI ELABORATI ANCHE PROMOTORI IN PARTE O TOTALMENTE SINTETICI SULLA BASE DELLE SEQUENZE CONSENSUS OTTIMALI. UN PROMOTORE PROCARIOTICO TIPICO E’ COSTITUITO DA CIRCA 60 bp CONTENENTI DUE SEQUENZE CONSENSO A -35 (ttcaga) e -10 (tataat). LA SPAZIATURA IDEALE TRA -35 e -10 VARIA TRA 16 a 17 bp . QUELLA TRA -10 E ATG E’ DI 9 bp. In alcuni promotori sono state caratterizzate recentemente regioni “UP” ulteriormente a monte che aumentano l’efficienza di trascrizione TRA I PROMOTORI PIU’ COMUNI RICORDIAMO: Lac, lacUV10, trc, tac, T3, T7, Lambda Pr, Lambda Pl OTTIMIZZAZIONE DELLA FINE DELLA TRASCRIZIONE Una volta che L’RNA polimerasi ha iniziato la trascrizione, continua a incorporare Ribonucleotidi fino a quando non incontra un segnale di stop Questi segnali sono molto diversi tra eucarioti e procarioti. Nei procarioti esistono due tipi di segnali di terminazione diversi: • I segnali fattore-indipendente •I segnali fattore-dipendente I primi l’interruzione della trascrizione è mediata dalla struttura che assume il Trascritto in funzione della sua particolare sequenza, tipicamente una ripetizione Invertita seguita da una serie di adenine Nei segnali fattore-dipendente, invece, la terminazione della trascrizione è mediata Da uno dei tre fattori di terminazione noti: Rho (ρ) Tau (τ) NusA OTTIMIZZAZIONE DELLA TRADUZIONE L’inizio della traduzione in E.coli, richiede la presenza, sulla porzione non tradotta al 5’ del mRNA, di una regione di legame al ribosoma (RBS). Nei batteri è costituita da una Sequenza, chiamata SHINE-DALGARNO (SD), complementare al 3’ del rRNA 16S presente nella subunità ribosomale piccola 30S. La sua sequenza consenso è: 5’-UAAGGAGG-3’ Subito dopo la sequenza di Shine-Dalgarno deve essere presente un codone di inizio, quasi Sempre AUG. In una piccola percentuale di casi può essere presente il codone GUG. La spaziatura ottimale tra SD e AUG è di 8 bp E’ importante che la sequenza nucleotidica tra la SD e il codone d’inizio non sia disturbata da strutture secondarie ( es. hairpin loops ) che possono interferire drasticamente con il legame al ribosoma e la conseguente traduzione. OTTIMIZZAZIONE DELLA STABILITA’ La resa di un prodotto di espressione dipende, in larga misura, dalla stabilità della proteina. Sappiamo che la stabilità delle proteine dipende dalla presenza di amino acidi stabilizzanti all’ estremità Nterminale e di amino acici destabilizzanti all’estremità C-terminale. Modificando, tramite ingegneria genetica, la sequenza codificante una proteina, possiamo alterarne la composizione aminoacidica ed aumentarne la stabilità. Stabilità conferita alla β-galattosidasi da diversi aa all’ N-terminale Amino acido Tempo di dimezzamento > 20 ore > 30’ > 20’ ≈ 10’ ≈ 3’ ≈ 1’ Met, Ser, Ala, Thr, Val, Gly Ile, Glu Tyr, Gln Pro Phe, Leu, Asp, Lys Arg Le sequenze PEST Le sequenze PEST , ricche in prolina (P), acido glutammico (E), serina (S) e treonina (T), spesso fiancheggiate da gruppi di amino acidi positivi, sono target di degradazione e destabilizzano le proteine batteriche che le contengono. L’eliminazione delle sequenze PEST, mediante mutagenesi sito-specifica, può migliorare la stabilità delle proteine ricombinanti OTTIMIZZAZIONE DELLA STABILITA’ Utilizzo di codoni alternativi Poiché organismi diversi possono utilizzare preferenzialmente codoni sinonimi per specificare uno stesso amminoacido e poiché è nota la percentuale di utilizazione media dei codoni sinonimi in molti organismi è possibile aumentare i livelli di espressione modificando i codoni del gene di interesse senza alterarne il prodotto di espressione L’utilizzo di ceppi carenti in proteasi Un altro modo per ottimizzare la stabilità dei prodotti di espressione, consiste nel minimizzare la degradazione proteolitica a carico delle proteine espresse A causa della presenza in E.coli di più di venti proteasi, solo alcune delle quali risultano essere caratterizzate, questo obbiettivo è difficile da ottenere. Sono tuttavia disponibili ceppi di coli mutanti che risultano difettiva in una o Più di queste proteasi, come ad esempio omp Promotore/operatore BamHI ShineDalgarno Terminatore Ap ori RBS mRNA 5’ AUG (start codon) UAA (stop codon) 3’ Proteine native Proteine di fusione Espressione di proteine native NcoI BamHI RBS AGGAAAC AGAACCATGGGAGGATCCGTCGGATAATTAGCTGA TCC TTTG TCTT GGTACCCT CCTAGGCAGCCTATTAATCGACT AGGAAAC AGAAC TCC TTTG TCTT GGTAC AGGAAAC AGAACCATGG TCC TTTG TCTT GGTACC ATG Met GATCCGTCGGATAATTAGCTGA GCAGCCTATTAATCGACT C-DNA GGATCCGTCGGATAATTAGCTGA CCTAGGCAGCCTATTAATCGA CT TAA IL PROBLEMA DELLO SCHEMA DI LETTURA (FRAME) LEI NON AMA CHE LUI. LUI NON AMA PIU’ LEI. NON SAI PIU’ CHI SEI. L EIN ONA MAC HEL UIL UIN ONA MAP IU’L EIN ONS AIPI U’CH ISE I LE INO NAM ACH ELU ILU INO NAM API U’LE INO NSA IPI U’CH ISE I Espressione di proteine di fusione BamHI AGGAAAC AGAACCATG TCC TTTG TCTT GGTAC AGGAAAC AGAACCATG TCC TTTG TCTT GGTAC BamHI GST GST HindIII GGATCCGTCGAAGCTTGATAATTAGCTGA CCTAGGCAGCTTCGAACTATTAATCGA CT G CCTAG AGCTTGATAATTAGCTGA ACTATTAATCGACT HindIII cDNA IgG TAA ATG AGGAAAC AGAACCATG TCC TTTG TCTT GGTAC GST GST Met GGATCC CCTAGG cDNA IgG IgG AAGCTT TTCGAA Glu Ala Gly Ser Val Ala Cys Tyr AGGAAAC AGAACCATG TCC TTTG TCTT GGTAC GST GGATCC CCTAGG cDNA IgG AAGCTT TTCGAA IgG GST Met Glu Ala Gly Ser Lys Phe Met Asp AGGAAAC AGAACCATG TCC TTTG TCTT GGTAC GST GST Met GGATCCAAA CCTAGGTTT ? cDNA IgG AAGCTT TTCGAA Regolazione dei vettori d’espressione La maggior parte dei vettori d’espressione, come la maggior parte dei geni, sono regolati. Perchè i vettori d’espressione sono (quasi) sempre regolati • L’espressione di una proteina eterologa tende ad essere identificata come “estranea” e degradata dalla cellula che attiva specifiche proteasi. La possibilità di indurre l’espressione della proteina permette di minimizzare le degradazioni proteolitiche aumentando le rese. •Alcune proteine possono essere tossiche o, comunque, interferire con la crescita dell’ ospite di espressione. In alcuni casi fino al 50% delle proteine totali sono costituite dalla proteina ricombinante, a discapito delle proteine che assicurano il normale metabolismo di E.coli. La possibilità di limitare l’espressione della proteina alla sola fase di induzione permette il normale sviluppo della cellula. •La possibilità, di indurre sperimentalmente l’espressione della proteina rappresenta un primo strumento di verifica dei livelli di espressione; comparando un estratto proteico indotto con uno non indotto si riesce facilmente ad evidenziare la presenza della proteina etrologa putativa (di cui conosciamo il peso molecolare) Principali sistemi di regolazione I batteri si sono evoluti per adattarsi rapidamente ad un ambiente altamente variabile, ottimizzando al massimo i consumi energetici. I loro geni, generalmente raggrupati in unità di trascrizione dette operoni, tendono ad esprimersi solo quando serve (es.geni per l’utilizzo di zuccheri) o a smettere di esprimersi quando non serve (es. geni per la sintesi di aminoacidi) Poichè i sistemi di regolazione batterici sono molto efficenti tutti i vettori d’espressione li utilizzano quasi integralmente Uno dei sistemi più utilizzato è quello basato sull’operone del lattosio. Funziona posizionando in qualunque promotore la regione dell’operatore lac e fornendo, contemoraneamente il gene lacI, che codifica per il repressore del lattosio e funziona in trans. Per evitare interferenze con i geni endogeni dell’operone lac, inoltre, il vettore d’espressione deve essere ospitato in un ospite di genotipo ∆lac operatore lac Qualunque promotore lacI lac I in qualunque posizione Per indurre l’espressione di geni eterologhi clonati in vettori d’espressione regolati da questo sistema si utilizza l’induttore gratuito IPTG (isopropil-β-tio-D-glucoside) Nonostante la loro efficenza i sistemi di regolazione procariotici sono sempre “leaky”. Una repressione assoluta, infatti, impedirebbe al sistema di essere ri-attivato. La completa repressione dell’operone del lattosio per esempio, reprimendo completamente anche l’espressione della lattosio permeasi, impedirebbe l’assunzione di lattosio eventualmente presente nel mezzo di coltura. I sistemi di regolazione dei vettori d’espressione hanno lo stesso problema, aggravato dagli alti livelli di espressione che tendono a saturare i sistemi di regolazione. Ne consegue che il principale problema di molti vettori d’espressione è quello di essere troppo “leaky”e di esprimere un pò (troppa) proteina anche in condizioni non induttive Per superare questo problema sono stati messi a punto dei sistemi di regolazione “stringenti” che minimizzano il livello di espressione basale di geni repressi. Un modo comune per aumentare la stringenza di sistemi di regolazione è quello di aumentare il dosaggio genico dei geni di regolazione Un altro modo, ancora più efficiente per avere regolazione stringente consiste nel creare delle regolazioni a cascata come, per esempio nei vettori della serie PET. Si è rivelato molto efficiente anche il promotore del operone dell’arabinosio che è quantitativamente represso da quantità crescenti di arabinosio Evoluzione dei vettori d’espressione Promotore/operatore M13 ShineDalgarno BamHI Terminatore TAG lacI oriC Ap ori TAG per affinità TAG Vettori ______________________________________________________ •Calmodulin binding peptide (CBP) pCAl •6xHis pQE, pET •Proteina A (IgG binding domain) pEZZ •Chitin binding domain (CBD) Impact •Glutatione S-transferasi (GST) pGEX •MBP (Maltose binding protein) pMAL •Strep tag (Streptavidin binding tag) •Flag tag •Myc tag I vettori con Tag ad istidina Esistono numerosi vettori commerciali che includono il Tag ad istidina per esprimere fusioni N-teminali o C-terminali. Di solito nel caso delle fusioni N-terminali è presente un sito di riconoScimento per una proteasi interposto tra la sequenza che codifica il Tag ed il gene E’ possibile, in teoria, inserire la sequenza codificante una poli-istidina in qualunque vettore, in qualunque posizione inserendo la sequenza per PCR 5'-Oligo 5'- XXXXX CAT CAC CAT CAC CAT CAC X -3' 3'-Oligo 3'X GTA GTG GTA GTG GTA GTG XXXXX -5' His His His His His His Vettori forniti da Novagen (alcuni esempi) pET22b(+) (adatto per l’espressione periplasmica attraverso il peptide segnale pelB pET30a(+) pET42a(+) (fusione con GST) E.coli + IPTG Il sistema GATEWAY Uno dei problemi fondamentali dell’espressione di proteine eterologhe è che è difficile stabilire le giuste condizioni di espressione. Un gene dato può esprimersi bene in un vettore e male in un altro. Un vettore capace di esprimere proteine funzionali a bassa rese può essere inadatto ad esprimere proteine ad alta resa per produrre anticorpi. Una certa proteina può essere espressa in modo più o meno solubile in vettori diversi ecc ecc. Una delle migliori soluzioni a questo problema è offerta dal sistema Gateway, un sistema, basato sulle proprietà di ricombinazione sito-specifiche del fago λ, messo a punto e commercializzato dalla Invitrogen. Vettore di espressione eucariotica Testo di riferimento: "Dai geni ai genomi" 1^ edizione italiana, di Jeremy W. Dale e Malcom von Schantz. 1994 EdiSES Per questa lezione consultare i capitoli 6, 15 e 16 ________________ Testi di approfondimento generale: “Biotecnologia molecolare” 1^ edizione italiana, di Bernard R. Glick e Jack J. Pasternack. 1999 Zanichelli "Genomi 2" T.A.Brown 2004 EdiSES