CORSO DI LAUREA IN BIOTECNOLOGIE MEDICHE E FARMACEUTICHE LABORATORIO DI BIOLOGIA MOLECOLARE E BIOINFORMATICA – Modulo A (anno accademico 2016-2017) Dott. Mariano Francesco Caratozzolo Istituto Biomembrane e Bioenergetica – IBBE CNR Contatti: [email protected] Programma Modulo A • Banche di DNA (Librerie geniche) - Librerie genomiche - Librerie di cDNA e librarie sottrattive • Analisi dell’espressione genica - Analisi del trascrizione (metodi di mappatura delle estremità dei trascritti) - Metodi per lo studio delle interazioni molecolari tra acidi nucleici e proteine (DNAsi Footprinting, gel shift, immunoprecipitazione della cromatina) - Analisi dei trascrittomi (screening differenziale, ibridazione sottrattiva, differential display, metodi basati sui microarray, RNA-seq) • - Tecniche per lo studio delle modificazioni epigenetiche Metodi basati su digestione enzimatica Metodi di arricchimento per affinità Uso del sodio bisolfito • Introduzione alla Bioinformatica -Banche dati primarie e secondarie di acidi nucleici e proteine Esercitazioni: - Estrazione di DNA da cellule della mucosa boccale e analisi di DNA fingerprinting - Analisi del 5’ di un trascritto mediante 5’ RACE - Ricerca in banche dati di sequenze mediante parole chiave - Ricerca bibliografica nella banca dati PubMed - Ricerca in banca dati tramite BLAST - Allineamento e multiallineamento di sequenze Testi consigliati: -Biologia Molecolare - F. Amaldi, P. Benedetti, G. Pesole, P. Plevani -Dai Geni ai Genomi, Dale JW, von Schantz M: Ed. EdiSES -Analisi dei geni e dei genomi, Reece RJ Ed. EdiSES -Appunti di lezione " SAPPIATELA AMARE. SAPPIATELA CUSTODIRE E GUARDATELA SEMPRE CON OCCHI INNAMORATI." F ria udwig TECNICHE DI ISOLAMENTO/MANIPOLAZIONE DEI GENI Servono a comprendere la funzione e la regolazione dei geni Sfruttano la tecnologia del DNA ricombinante, grazie alla capacità di isolare geni per capire, a livello molecolare, come viene regolata la loro espressione Richiedono il clonaggio di un segmento di DNA, cioè l’introduzione di un gene, o un frammento di gene, in una cellula, in modo che venga copiato dalla cellula, che si replica. Perciò implica la produzione di numerose copie di quel frammento. PRIMA PARTE: in vitro, produzione frammenti di DNA da inserire nel vettore di clonaggio SECONDA PARTE: in vivo, introduzione della molecola di DNA ricombinante nell’organismo dove deve replicarsi autonomamente o integrarsi nel genoma Le molecole di DNA, essendo molto grandi, vanno estratte dall’organismo in esame e frammentate in molecole di dimensioni gestibili • Rottura meccanica con ULTRASUONI o SIRINGA AD AGO MOLTO SOTTILE (Si generano frammenti con estremità à piatte) • Digestione enzimatica parziale con ENZIMI DI RESTRIZIONE (Si generano frammenti con estremità piatte o sporgenti a seconda dell’enzima utilizzato) • Banche di DNA (Librerie geniche) - Librerie genomiche (per identificare e isolare i geni di interesse) - Librerie di cDNA (rappresenta il DNA codificante proteine) DNA libraries Genoteche o banche di DNA o librerie geniche Analogamente ad una libreria, una genoteca è una collezione di cloni (invece che libri), che rappresentano l ’ intero genoma (libreria genomica) o l ’ intero trascrittoma (libreria di cDNA), ottenuta in un opportuno vettore di clonaggio. A differenza di una normale libreria, però, in una libreria genica di solito i singoli cloni NON sono indicizzati e non è dato sapere a quale gene o segmento genomico corrisponde un clone dato. Per avere questa informazione è necessario effettuare uno screening della genoteca con le tecniche d’ibridazione. Tappe per la costruzione di una genoteca genomica 1. Isolamento del DNA da un organismo 2. Taglio del DNA in frammenti 3. Legame dei frammenti di DNA con un vettore di clonaggio opportunamente scelto 4. Trasferimento del vettore ricombinante nell’organismo ospite 5. Selezione del clone contenente il gene di interesse 6. Recupero del vettore ricombinante e del frammento di DNA di interesse Vettori per le librerie geniche Il primo step per la costruzione di una libreria genica è la scelta del vettore di clonaggio, in funzione delle dimensioni dell'inserto di DNA che ogni vettore può accettare. Principali Vettori di clonaggio Vettore dimensione dell’inserto (kb) Esempi Plasmidi 0,1-10 pUC18, pBR322 Fagi 8-22 λ Cosmidi 32-45 pJB8 BAC 100-300 pBAC108L PAC 75-90 pAd10SacBII YAC 1000-2000 pYAC4 Fago lambda Il genoma del fago lambda è una molecola lineare a doppio filamento di 48 kbp. Le estremità 5 ’ e 3 ’ presentano 12b a singolo filamento chiamate estremità cos, che sono complementari tra loro e permettono la circolarizzazione del DNA dopo l’infezione della cellula ospite. Il vantaggio maggiore rispetto ai plasmidi è l’efficienza con la quale il fago può infettare E.coli Non essenziale per il ciclo litico cos cos Non essenziale per il ciclo litico Ciclo vitale di λ In seguito all’infezione da parte del fago λ, le cellule di E.coli possono andare incontro a due destini diversi: - ciclo litico (cII inattivo) - ciclo lisogeno (cII attivo) trascrizione di cI (repressore del ciclo litico) ciclo lisogenico ciclo litico Dipendenza del ciclo litico o lisogeno dalle condizioni ambientali Cellule in terreno ricco Proteasi attive Degradazione di cII Ciclo litico Impacchettamento del DNA di lambda Ciclo litico di λ -Il fago λ è mescolato con cellule di E.coli in una soluzione di soft agar chiamata top agar. -La coltura batterica infettata è poi versata su una piastra di agar solido. -Il risultato di un infezione fagica consiste nella formazione di placche di lisi traslucide sullo strato di batteri a confluenza. Fago lambda La mappa genetica del fago λ comprende circa 40 geni che possono essere suddivisi in tre gruppi funzionali: -a sinistra, comprende i geni che codificano per proteine strutturali della testa e della coda; -al centro, contiene geni responsabili per la lisogenia. Gran parte di questa regione non é essenziale per la crescita litica e può essere eliminata per la costruzione di vettori. -a destra contiene i geni coinvolti nella replicazione del DNA e nel ciclo litico. Non essenziale per il ciclo litico Non essenziale per il ciclo litico Fago lambda come vettore di clonaggio Lo sviluppo di vettori di clonaggio di tipo λ è stato possibile perché: 1. La regione non è essenziale per il ciclo litico può essere rimossa dal genoma senza alterare il ciclo litico e la formazione delle placche di lisi. Un vettore privo di questa regione può contenere circa 14,5 kbp di DNA estraneo, che ricostituirebbero la lunghezza originale del genoma di λ. Esistono nei bracci di λ altre regioni non essenziali che possono essere rimosse. il DNA estraneo inseribile è di circa 22 Kbp Per il packaging esiste: -un limite inferiore, pari al 78% del genoma di λ, circa 37 Kbp, al di sotto il DNA non viene impaccato e il fago non è vitale -un limite superiore, pari al 105% della lunghezza del suo DNA (circa 51Kbp) Fago lambda come vettore di clonaggio I siti di taglio per gli enzimi di restrizione naturali presenti nel genoma di lambda sono stati eliminati senza causare perdita delle funzioni geniche e ciò ha permesso di sviluppare derivati del fago utilizzabili come vettori di clonaggio. In linea generale, tutti i λ utilizzati come vettori sono stati estesamente modificati e in particolare sono stati creati siti di restrizione unici nella regione centrale per il clonaggio. Vettori λ di clonaggio - vettori d'inserzione, in cui il DNA esogeno è inserito in un sito unico di restrizione; - vettori di sostituzione, in cui il DNA esogeno sostituisce un pezzo di DNA del vettore (stuffer). Vettori lambda d'inserzione Possono accettare inserti di dimensioni da 8 fino a 10-12 Kbp. Sono generalmente utilizzati per costruire librerie di cDNA. Vettori lambda d'inserzione cI braccio sinistro 32,7 Kbp λgt10 braccio destro 10,6 Kbp EcoRI lacZ λZAP braccio sinistro 19.9 Kbp braccio destro 21,9 Kbp EcoRI λgt10 è un buon esempio di inattivazione inserzionale. Il sito EcoRI è posizionato in mezzo al gene cI. Un inserzione al suo interno, dunque distruggerà l’integrità strutturale del repressore e il fago non sarà più in grado di entrare nel ciclo lisogeno. Quindi i fagi senza inserzioni avranno colonie torbide (miscela di fagi lisogeni e litici) mentre i fagi con l’inserzione daranno placche chiare (placche litiche). λZAP contiene l ’ MCS nel gene lacZ ’ e i cloni ricombinanti sono identificabili attraverso lo screening bianco-blu. Vettori lambda di sostituzione possono contenere inserti da 10 a 22 Kbp e sono in genere utilizzati per costruire librerie genomiche. Vettori lambda di sostituzione Stuffer EMBL4 braccio sinistro 19.9 Kbp SalI, BamHI, EcoRI braccio destro 8,8 Kbp SalI, BamHI, EcoRI Stuffer braccio sinistro 19.2Kbp polylinker Charon40 braccio destro 9,6Kbp polylinker λEMBL4 (42Kpb) contiene uno stuffer di 14 kpb tra il braccio destro e sinistro. La ligazione delle sole braccia produrrebbe un genoma di sole 28kpb, troppo corto per essere impacchettato nella particella fagica. Questo consente a λEMBL4 i contenere inserti lunghi fino a 23kbp. Packaging del DNA in vitro Sebbene il DNA nudo del fago lambda possa essere inserito in un batterio per trasformazione, la dimensione del genoma di λ rende questa metodica poco efficiente. In alternativa si utilizza il sistema di packaging in vitro. Il packaging in vitro è ottenuto mescolando il DNA ricombinante di λ, con due ceppi di E.coli che portano fagi λ lisogeni difettivi nel processo d’impacchettamento: -ceppo BHB2690, produce teste fagiche vuote, perché mancante della proteina D necessaria per il packaging del DNA; -ceppo BHB2688, non produce la proteina E, e quindi le teste ma contiene la proteina del packaging. Mescolando i i genomi ricombinanti di λ con i due lisati, si completano queste deficienze e si ottengono tutti i componenti necessari per il corretto impacchettamento. Si ottengono particelle di λ mature che possono infettare ceppi wt di E.coli. Packaging del DNA in vitro La reazione di packaging in vitro è più efficiente se il DNA è in forma multimerica perchè l ’ enzima coinvolto nel packaging del DNA taglia le molecole in corrispondenza dei siti cos su una molecola multimerica. Vettori Cosmidici L’unica necessità per avere il packaging di DNA in un fago λ è la presenza di due siti cos separati da una regione di 37-51kpb. Da questa osservazione furono sviluppati i cosmidi. Un cosmide è un vettore, di circa 5 Kpb, contenente un sito cos di λ . Inoltre contiene: -una ori, -un marcatore di resistenza ad un antibiotico -un sito unico di restrizione per l’inserimento del DNA. . Cosmidi Il cosmide ricombinante, per essere un buon substrato per la reazione di packaging deve avere dimensione tra 37-51Kpb. Quindi, considerando la dimensione media di un vettore cosmidico, la dimensione di un inserto che può essere clonato in un cosmide varia tra 32 e 47Kpb, che rappresenta più di quanto è possibile clonare nei vettori lambda (822kpb). Dopo il packaging, le particelle fagiche sono usate per infettare cellule di E.coli. In E.coli il DNA circolarizza grazie alla complementarietà delle estremità cos e viene mantenuto nella cellula come un plasmide. La selezione dei trasformanti è basata sulla resistenza ad un antibiotico e si formeranno colonie batteriche anziché placche di lisi. Problemi con l’uso dei COSMIDI I cosmidi, come i plasmidi, sono molto stabili e il DNA ricombinante può essere mantenuto per lunghi periodi di tempo. Problemi: 1. l’inserzione di lunghi inserti può rendere difficile il mantenimento dei cosmidi in E.coli 2. Formazione di concatenameri il DNA cosmidico tende a formare concatenameri circolari e queste molecole non possono essere utilizzate per l’impacchettamento 3. Ligazione di più inserti falsa immagine del’organizzazione del DNA dell’inserto Soluzione: Si può tagliare il cosmide con due enzimi di restrizione diversi e trattare l’inserto con fosfatasi 4. Riarrangiamenti degli inserti (forse perché il tempo di replicazione è piu’ lungo rispetto ad un plasmide) Cromosomi artificiali Sono vettori a replicazione autonoma nei quali è possibile inserire frammenti di DNA esogeno di dimensioni maggiori rispetto a quelli che è possibile clonare nel genoma del fago lambda e nei cosmidi. Cromosomi artificiali: YAC: yeast artificial chromosome (500kbp); BAC: bacterial artificial chromosome (200kbp); PAC: P1 artificial chromosome (70-95kbp) Vettori YAC I vettori YAC permettono il clonaggio, in cellule di lievito, di frammenti lunghi oltre le 500kbp. I vettori YAC contengono: -un centromero (cen4) -una sequenza a replicazione autonoma (ars2) che permette la replicazione autonoma rispetto alle origini di replicazione cromosomiche; -telomeri (tel) necessari per la replicazione e il mantenimento dei cromosomi in lievito; -2 marcatori di selezione in lievito (ura3 e trp1) -gene sup4 che codifica per un tRNA soppressore -un’origine di replicazione batt (oriC) - un marcatore selettivo batterico (amp), per la propagazione in E. coli prima del clonaggio. Clonaggio in un vettore YAC Il vettore è tagliato con enzimi di restrizione per produrre due braccia ciascuna con un telomero all’estremità e un marcatore di selezione. 1° braccio contiene: -sequenza ARS2 -Centromero CEN4 -marcatore trp1 2° braccio contiene: -marcatore ura3 L’inserto è ligato tra le due braccia e la molecola ricombinante è trasferita per trasformazione in cellule di lievito, difettive per Ura3, trp1 e ade2 Cellule di lievito ade2- sono difettive nella via di biosintesi dell’adenina causando l ’accumulo di un intermedio nel vacuolo, che determina una colorazione rossa (ADE2=fosforibosilamino-imidazolo-carbossilasi) Il DNA esogeno inattiva il gene SUP4 (tRNATyr soppressore), che inserisce residuo Tyr in corrispondenza di una mutazione non senso in ade2: -vettori non ricombinanti daranno l’espressione di SUP4 con formazione di colonie bianche; -vettori ricombinanti in cui SUP4 è stato inattivato per inserimento di DNA esogeno daranno colonie rosse. I ricombinanti sono selezionati come colonie rosse in terreno privo di uracile e triptofano Difficoltà nell’uso degli YAC Molecole di DNA molto grandi sono fragili e causano riarrangiamenti 10-60% di cloni di librerie YAC sono chimere (parti diverse del genoma unite insieme) Cloni instabili e gli inserti di DNA esogeno spesso vengono persi E’ difficile separare lo YAC dagli altri cromosomi del lievito per le dimensioni simili Resa di estrazione di DNA YAC molto bassa Vettori BAC I vettori BAC permettono il clonaggio, in cellule batteriche, di frammenti lunghi circa 200kbp. I vettori BAC contengono: - origine di replicazione (oriS) che mantiene il loro livello ad una copia per cellula; -4 geni (repE, parA, parB e parC) necessari per la replicazione e il mantenimento del numero di copie; - un marcatore di selezione che conferisce resistenza ad un antibiotico (CAM); - il gene lacZ ’ contenente un MCS per il clonaggio dell ’ inserto, che consente lo screening bianco-blu dei cloni ricombinanti; -un sito cos di λ, e un sito loxP, utilizzati per il taglio specifico del BAC contenente l’inserto per la mappatura per restrizione. (cos tagliato da terminasi di λ ; loxP tagliato da ricombinasi cre) Per la trasformazione batterica si usa l’elettroporazione. L’inserto dei BAC è molto stabile e può rimanere intatto per diverse centinaia di generazioni. Limite: BAC sono presenti in uno o due copie per cellule Vettori PAC I vettori PAC, derivati dal batteriofago P1, permettono di clonare frammenti di DNA genomico di dimensioni tra 70-95kbp. Il batteriofago P1 ha un genoma più grande di lambda (110-115kpb) e sono stati sviluppati vettori con i componenti essenziali per la replicazione di P1 inseriti in un plasmide. Il fago P1 possiede due origini di replicazione: una per controllare la replicazione litica (replicone litico di P1) e l ’ altra per mantenere il plasmide durante la crescita non litica (replicone plasmidico) Dopo aver infettato E.coli il batteriofago P1 può: esprimere le proprie funzioni litiche 100-200 nuove particelle fagiche reprimere le proprie funzioni litiche il genoma fagico viene mantenuto come un grosso plasmide stabile in basso numero di copie Vettori PAC I vettori PAC contengono: -origine di replicazione (ori) e il gene per la resistenza all ’ ampicillina (AMP) per la propagazione e la selezione del vettore nei batteri; il replicone plasmidico; -il replicone litico di P1; - il sito pac, per l ’ assemblaggio delle particelle fagiche; - un marcatore di selezione che conferisce resistenza ad un antibiotico (KAN); - due siti loxP, necessari per la circolarizzazione del vettore dopo la transfezione nell’ospite. - il gene sacB, codifica per la levansucrasi, tossica per cellule di E.coli che crescono in saccarosio. Clonaggio in PAC BamHI Per il clonaggio: -il vettore è digerito con BamHI e ScaI -il DNA genomico è digerito parzialmente con MboI che produce estremità compatibili ScaI con BamHI. 1. Ligazione: L’unico ricombinante vitale è quello in cui l’inserto è fiancheggiato da braccio lungo e braccio corto. Ligazione tra le due braccia lunghe: non è presente il sito pac e non è possibile alcun impacchettamento nella testa del fago. Ligazione tra le due braccia corte: non è presente alcun replicone e non da ’ cloni vitali 2. Trasfezione: il DNA è circolarizzato ai siti loxP grazie alla proteina cre di E.coli e si replica utilizzando il replicone plasmidico di P1. La propagazione in saccarosio permette la crescita solo delle colonie contenenti l ’ inserto (l ’ espressione di sacB abrogata dall’inserto) I PAC ricombinanti vengono mantenuti come plasmidi in E.coli utilizzando la resistenza alla Kanamicina Per aumentare il numero di copie fino a 25 induzione del replicone litico P1, che è controllato da un promotore lac, con IPTG Vantaggi dall’uso di vettori PAC -Clonaggio di frammenti di grosse dimensioni -Nessun riarrangiamento o delezione di DNA -Il DNA plasmidico è di facile estrazione e manipolazione Librerie geniche Libreria genomica: collezione di cloni che rappresentano l ’ intero genoma di un organismo Libreria di cDNA: collezione di cloni che rappresentano l ’ intero trascrittoma. Un aspetto importante di una libreria genica è la sua rappresentatività: una libreria si dice rappresentativa quando contiene, in almeno una copia, tutte le possibili sequenze. Un ’ altra caratteristica delle librerie geniche è quella di essere ridondanti, e di contenere molte copie di alcune sequenze, complicando la ricerca e selezione (screening) della sequenza che vogliamo analizzare. Caratteristiche di una genoteca genomica Una genoteca per essere utile deve essere completa e rappresentativa: deve contenere tutto il genoma di un organismo e ogni parte del genoma deve essere ugualmente rappresentata Per ottenere una genoteca con tali caratteristiche è necessario tagliare il genoma in FRAMMENTI GRANDI (per clonarli in vettori di clonaggio ad alta capacità) CASUALI (generati da tagli casuali) OMOGENEI (aventi tutti la stessa lunghezza) PARZIALMENTE SOVRAPPONIBILI (caratteristica essenziale per il mappaggio ed il sequenziamento di geni molto grandi) Costruzione di una Libreria Genomica 1. Scelta del vettore di clonaggio opportuno 2. Frammentazione del genoma in pezzi di dimensioni tali da essere clonati in vettore appropriato. Il tipo di frammentazione è importante per la qualità della libreria finale. Idealmente il DNA dovrebbe essere rotto in frammenti casuali e sovrapposti, in modo tale da avere copie rappresentative di tutti i frammenti del genoma. Frammentazione del genoma 1. Digestione con enzimi di restrizione Il DNA genomico può essere frammentato con enzimi di restrizione avendo cura di effettuare la digestione in condizioni tali che la digestione sia parziale (tempi di digestione o quantità di enzima sub-ottimali). Digestione parziale vs Digestione completa La digestione parziale di un genoma garantisce che non tutti i siti di restrizione siano tagliati e che la libreria prodotta possa contenere cloni sovrapposti. Ad es. Se un gene di interesse contiene piu’ siti di taglio per un enzima, i frammenti prodotti da una digestione completa potrebbero essere troppi piccoli e sarebbero eliminati dal frazionamento o non adatti per il clonaggio nel vettore prescelto e di conseguenza il gene potrebbe non essere rappresentato nella libreria. Inoltre, una popolazione di inserti parzialmente sovrapposti tra loro, è essenziale per le procedure di chromosome walking necessarie nei progetti di sequenziamento e nello screening di geni. Digestione parziale di un genoma -enzima che taglia siti a 4 pb (Sau3A, AluI, HaeIII):1/256pb -enzima che taglia siti a 6bp (EcoRI): 1/4x103 bp, enzima che taglia siti a 8bp (NotI): 1/65x103 bp, La strategia comunemente usata è quella di utilizzare uno o piu’ enzimi che tagliano siti a 4 pb (Sau3A, AluI, HaeIII) e di condurre una digestione parziale La probabilità di taglio in un genoma spesso non è uguale in ogni sito; la natura della regione adiacente e la formazione di strutture secondarie nel DNA possono produrre una probabilità di taglio piu’ alta per alcuni siti piuttosto che per altri. Questo inconveniente può essere evitato conducendo digestioni separate con enzimi differenti, che permette anche di aumentare la rappresentatività della libreria. Frammentazione del genoma 2. Rottura meccanica E’ possibile frammentare il DNA genomico con metodi fisici, come la sonicazione, o il passaggio attraverso un sottile ago di una siringa. Questi metodi presentano il vantaggio di produrre frammentazioni casuali (maggiore rappresentatività), ma lo svantaggio di produrre frammenti sia con estremità “ blunt ” che con estremità 5 ’ e 3 ’ “irregolari”, non adatte alla ligazione, che devono essere rese blunt. In molti casi è necessario dover aggiungere dei linkers per il clonaggio nel vettore appropriato. Scelta del vettore e della dimensione della libreria I fattori principali da valutare nella costruzione di una libreria genomica riguardano: - la grandezza del genoma; - la dimensione media dei frammenti che costituiranno la libreria, da cui dipende il numero di cloni indipendenti (N) necessari per avere una ragionevole probabilità di rappresentare tutto il genoma. Per esempio, per il genoma di E.coli di ~4x106bp, utilizzando per la sua frammentazione un enzima di restrizione con un sito di riconoscimento di 6bp (EcoRI), che taglia in media ogni 4x103 bp, basterebbero 4x106 / 4x103 =~1000 cloni per avere una libreria che rappresenti di tutto il genoma. Questo però sarebbe possibile solo se tutti i cloni: -fossero differenti tra loro; -fossero non sovrapposti tra loro. In realtà, le due condizioni non sono soddisfatte poiché per definizione: 1) una libreria è una collezione di frammenti casuali. 2) in una libreria, i cloni devono essere parzialmente sovrapposti. Sebbene sia impossibile ottenere una libreria che garantisca la presenza di tutta l ’ informazione genetica del genoma di partenza, la formula proposta da Clarke e Carbon, stima con ragionevole approssimazione il numero di cloni indipendenti (N), che una libreria deve contenere per avere una probabilità P di contenere il clone di nostro interesse : ln (1 - P) N= ln (1 - f) P = probabilità che la libreria contenga il frammento d’interesse di solito tra 0.95 e 0.99), f = frazione del genoma rappresentato da un “clone” medio (media dimensioni inserti/dimensione totale del genoma) La formula è equivalente a a = dimensione inserti; b = dimensione del genoma; N= ln (1- P) ln (1- a ) b …ma quanti cloni sono necessari per ottenere una una genoteca completa????? • dimensione del genoma (esempio: genoma umano 2,8 x 106 kb) • dimensione media dei frammenti da clonare (esempio 20 kb) Calcolare: n: grandezza del genoma / dimensione media dei frammenti da clonare n: 2,8 x 106 kb / 20 kb = 1,4 x 105 frammenti Considerando la variabilità e la casualità del clonaggio, abbiamo bisogno di ottenere un numero di cloni ricombinanti ben maggiore di n per ottenere una genoteca completa. E’ possibile calcolare esattamente il numero di cloni ricombinanti in relazione alla probabilità di includere una data sequenza nella genoteca: N= numero di cloni necessari per avere una genoteca completa P= probabilità che una regione genomica qualsiasi sia inclusa nella genoteca ln= logaritmo naturale del numero in parentesi Quindi per costruire una libreria rappresentativa di un genoma di grosse dimensioni cercheremo di: •clonare inserti di grosse dimensioni per diminuire il numero di cloni necessari a rappresentare interamente il genoma. Questa aspettativa condiziona la scelta del vettore per il clonaggio, che verrà scelto in funzione di questi parametri. Librerie Genomiche Scelta del vettore Stima delle Dimensioni della libreria genomica in base ai vettori utilizzati Organismo Dimensione media del genoma Tipo di vettore Dimensione media dell’inserto P Dimensione della libreria Batterio 4 × 106 Plasmide Fago λ Cosmide BAC 4 kb 18 kb 40 kb 300 kb 0.99 0.99 0.99 0.99 4.6 × 103 1.0 × 103 458 59 Mammifero 3 × 109 Plasmide Fago λ Cosmide BAC 4 kb 18 kb 40 kb 300 kb 0.99 0.99 0.99 0.99 3.5 × 106 7.7 × 105 3.5 × 105 4.6 × 104 Per le librerie genomiche batteriche: i vettori lambda di sostituzione rappresentano un buon compromesso tra dimensioni dell’inserto e lo screening per l’individuazione del clone d’interesse Per le librerie genomiche di mammifero: i vettori lambda richiederebbero lo screening di circa un milione di cloni; l’utilizzo di inserti di dimensioni maggiori è supportato dal fatto che i geni contengono introni e spesso un’intero gene potrebbe essere troppo grande per essere contenuto in un vettore lambda. Allestimento di una libreria genomica L’allestimento di una library genomica prevede: -frammentazione del genoma -selezione dei frammenti delle dimensioni prescelte -clonaggio nel vettore scelto -per vettori plasmidici si effettua la trasformazione del ligato nelle cellule batteriche; -per il vettore lambda, il cosmide e PAC, i prodotti di ligazione sono mescolati con gli estratti della reazione di packaging per l ’ assemblaggio delle particelle fagiche infettive della coltura batterica Amplificazione di una libreria La libreria è costituita da: -colonie batteriche se è cosmidico o vettore BAC stato utilizzato un vettore plasmidico, -placche fagiche distribuite su uno strato di batteri con vettori di tipo lambda Riunendo le colonie o le placche fagiche ricombinanti si ottiene la libreria primaria che dovrebbe contenere una copia rappresentativa di ogni regione del genoma. I cloni ricombinanti sono lavati via dalle piastre e raccolti in provetta. La libreria primaria spesso è a basso titolo (il titolo della libreria è espresso in pfu/ml o phage forming units/ml o plasmid forming units/ml) e, spesso, è necessario amplificarla. Per amplificare la libreria, la collezione di fagi o di colone batteriche viene piastrata nuovamente e la progenie viene raccolta a formare una libreria amplificata. La libreria amplificata è di solito in un volume maggiore di quella primaria e quindi diventa una risorsa da poter utilizzare piu‘volte . Crescita e conservazione delle librerie geniche Le librerie costituite da una sospensione di colonie batteriche (derivanti da vettore plasmidico, cosmidico o vettore BAC) sono conservate a 80°C in presenza di glicerolo che le protegge dall’effetto deleterio del congelamento Le librerie costituite da placche fagiche sono conservate a -80°C come particelle virali in assenza di cellule, crioprotette da DMSO. Screening di una libreria Quando la libreria deve essere sottoposta a screening, ne viene scongelata un’aliquota da piastrare e la restante parte è mantenuta congelata. Prima del piastramento è sempre necessario determinare il titolo della libreria perché è diminuito rispetto al momento in cui la libreria è stata congelata. Per determinare il titolo si prepara una serie di diluizioni successive da piastrare (colonie batteriche) o da utilizzare per l’infezione di cellule batteriche (placche fagiche) Il titolo della libreria (numero di colonie o placche/ml) permette di determinare la quantità della libreria necessaria per ogni piastra nella fase di screening per ottenere il numero di cloni indipendenti (N). Screening primario della libreria Una volta definito il numero di cloni N, statisticamente necessari per identificare il clone di interesse, lo screening del gene d’interesse è effettuato piastrando la libreria in relativamente poche piastre di grandi dimensioni, seminate a grande densità: screening primario. Screening primario della libreria 1) Replica su filtro di ciascuna piastra: colony lift per il trasferimento di colonie batteriche; plaque lift per il trasferimento delle placche fagiche. 2) Il filtro è trattato con alcali (0,5M NaOH) per rilasciare il DNA dalle cellule batteriche o dalle particelle fagiche e per denaturare il DNA 4) Il filtro è neutralizzato e poi sottoposto a raggi UV o a 80°C per fissare il DNA alla membrana 5) il filtro è ibridato con la sonda che identifica il gene d’interesse. 6) Il segnale d’ibridazione positivo indica la posizione del clone d’interesse sulla piastra originaria Screening secondario della libreria Lo screening primario è normalmente effettuato ad alta densità iniziale, in modo da analizzare in un singolo esperimento un elevato numero di ricombinanti. Questo significa che difficilmente si otterrà un ricombinante puro allo screening primario, perché per le librerie fagiche ogni singola placca di lisi conterrà molte placche di lisi indistinguibili tra di loro; per le librerie plasmidiche, ogni colonia batterica sarà strettamente adiacente alle altre. Si procede quindi al cosidetto screening secondario che consiste nel recuperare i cloni di partenza nella regione di agar in corrispondenza della posizione del segnale positivo e nel ri-piastrarli a più bassa densità. Librerie di cDNA La libreria di cDNA è una collezione di cloni di cDNA che rappresentano tutti gli mRNA presenti in un campione cellulare in una determinata circostanza. Rappresenta quindi tutti i geni che sono espressi nel campione cellulare analizzato. Pertanto una genoteca di cDNA è tessuto e stadio specifica.. Considerando che la dimensione media di un mRNA è intorno a 2-3 Kb, e che le popolazioni di mRNA sono meno complesse della potenzialità genetica complessiva, i vettori di elezione per le librerie di cDNA sono vettori plasmidici o vettori fagici ad inserzione, come λgt10 e λgt11. La Costruzione della libreria di cDNA richiede: -Estrazione dell’RNA totale -Purificazione dell’mRNA mediante oligodT -Sintesi del cDNA -Clonaggio del cDNA nel vettore scelto Purificazione dell’mRNA mediante oligo-dT L ’ mRNA poliadenilato può ibridare con sequenze sintetiche di oligo(dT) (corti polimeri di desossitimidina), mentre le altre specie di RNA che non ibridano con l’oligo(dT) possono essere eliminate. frazione PoliA+ Sintesi del cDNA Poiché non è possibile clonare direttamente l ’ mRNA, è necessario convertirlo in cDNA mediante l’utilizzo della Trascrittasi inversa, una DNA polimerasi RNA-dipendente. La Trascrittasi inversa possiede: • attività polimerasica 5’-3’, a partire da un primer di DNA o RNA per iniziare la sintesi; •attività di RNasi H; •manca di attività proof-reading. Le Trascrittasi inverse utilizzate sono: - MMLV-RT ottenuta dal virus della leucemia murina di Moloney. È un singolo polipeptide di 71 KDa. - AMV-RT ottenuta dal virus della mieloblastosi aviaria. È costituita da due subunità di 64 e 96 KDa. L’ MMLV-RT mostra una più debole attività RNasi H rispetto all’ AMV-RT, quindi è più vantaggiosa quando è utilizzata nella sintesi del cDNA da lunghe molecole di mRNA. Sintesi del cDNA I Nucleasi S1 Sintesi del cDNA Un metodo più recente utilizza la terminal transferasi (TdT) per aggiungere alle estremità -3’OH del cDNA una coda omopolimerica. La TdT è una DNA polimerasi stampo-indipendente che catalizza l ’ aggiunta di dNTP all’estremità 3’OH di filamenti di DNA. Sarà quindi possibile utilizzare primers formati dai nucleotidi complementari alla coda omopolimerica per innescare la sintesi del filamento complementare in modo più efficiente della forcina. Rimozione dell’RNA dagli ibridi RNA-DNA Mediante trattamento con alcali DNA polimerasi La PCR come alternativa al clonaggio dei cDNA La trascrizione inversa seguita da PCR (RT-PCR) porta all’amplificazione di mRNA sottoforma di cDNA. Se si utilizzano primer specifici per un cDNA si ottiene l’amplificazione selettiva di quel cDNA. E’ una tecnica rapida e sensibile che permette di: • determinare la presenza o l’assenza di un trascritto in un tipo cellulare • stimare i livelli di espressione di un trascritto (trascrizione inversa + real time) • clonare un cDNA senza la necessità di costruire ed analizzare una genoteca di cDNA Si ricorre alla costruzione della genoteca di cDNA se: • non si conosce la sequenza del cDNA e pertanto non si possono costruire i primer specifici • difficile reperibilità del materiale biologico Librerie di cDNA basate su PCR Primers oligo-dT ancorati per la sintesi del cDNA •Sono costituiti in modo che l’estremità 3’ contenga un residuo di G, A oC 5’-T12-18 V-3‘ dove V=G, A o C •Tali primer avviano la retrotrascrizione solo se appaiati all’estremità 5’ della coda di poly-A •In questo modo le molecole di cDNA avranno dimensioni uniformi Clonaggio del cDNA Se le estremità del cDNA sono piatte, per il clonaggio è necessario ligare degli adattatori (adapter) in modo da rendere le molecole di cDNA compatibili con il vettore scelto. Clonaggio direzionale del cDNA Le molecole di mRNA sono direzionali Clonaggio direzionale del cDNA Utilizzando oligonucleotidi modificati che inseriscono siti unici di restrizione ad entrambe le estremità del cDNA a doppio filamento è possibile ottenere il clonaggio direzionale nel vettore scelto. -oligo dT contiene all’estremità 5’ una sequenza che rappresenta il sito di riconoscimento di XhoI; -oligo dG contiene all’estremità 5’ una sequenza che rappresenta il sito di riconoscimento di EcoRI. DNA polimerasi Il cDNA prodotto conterrà un sito EcoRI all ’ estremità 5 ’ e un sito XhoI all’estremità 3’. Questo rende possibile il clonaggio direzionale del cDNA nel vettore tagliato con EcoRI e XhoI. In questo modo il promotore a monte del sito EcoRI potrà dirigere la trascrizione del filamento la cui sequenza è uguale a quella dell’mRNA da cui è derivato. Limiti delle strategie convenzionali basate sull’utilizzo degli utilizzo degli oligodT Gli RNA procaritici e alcuni mRNA eucariotici non hanno code di poliA L’innesco all’estremità 3’ dei trascritti induce la creazione di genoteche arricchite di molecole di cDNA che rappresentano le estremità 3’ dei messaggeri Per trascritti lunghi è difficile ottenere cDNA interi (full-lenght) E’ necessario clonare cDNA completi se si vuole esprimere la proteina o quando si vuole studiare la struttura del gene E’ necessario clonare cDNA completi se si vuole esprimere la proteina o quando si vuole studiare la struttura del gene Metodi per aumentare la rappresentatività delle estremità 5’ degli mRNA Le metodiche descritte spesso producono librerie di cDNA che non rappresentano le estremità 5’ degli mRNA. Questo inconveniente può essere superato utilizzando random primer al posto dell’oligo dT per la sintesi del cDNA. I random primers inizieranno la sintesi in punti intermedi, è quindi maggiore è la probabilità che possano appaiarsi all’estremità 5’ dell’mRNA. Il cDNA ottenuto non è completo ma i cloni corrispondenti alle estremità 5 ’ possono essere confrontati con i cloni che portano le estremità 3 ’ per risalire alla sequenza completa del cDNA. Librerie di cDNA normalizzate Uno dei problemi associato al sequenziamento sistemico delle librerie di cDNA è rappresentato dal fatto che alcuni trascritti sono molto abbondanti ed altri sono rari, ma non per questo meno importanti. Se si adotta un approccio di sequenziamento casuale di cloni di cDNA si finisce con il sequenziare ripetutamente i cloni abbondanti, riducendo considerevolmente la produzione di sequenze utili. Per ovviare a questo inconveniente si procede spesso alla normalizzazione delle librerie di cDNA. Si tratta di una tecnica che sfrutta la diversa cinetica di ibridazione delle doppie eliche di acidi nucleici: i cDNA più abbondanti si appaiano più rapidamente e possono essere rimossi dal pool di cDNA che in tal modo si arricchisce delle sequenze meno rappresentate. In una libreria normalizzata ogni sequenza dovrebbe essere rappresentata lo stesso numero di volte; ovviamente questo non è praticamente possibile, ma calibrando le condizioni si riescono ad ottenere risultati soddisfacenti. Si perdono informazioni sul livello di espressione dei geni Librerie di cDNA sottrattive Le librerie sottrattive sono prodotte allo scopo di identificare i geni che sono differenzialmente espressi tra due tipi cellulari. 2 librerie di cDNA: -driver (controllo), è marcata con biotina; -tester (campione), non è marcata. Le due librerie sono denaturate mescolate per permettere l’ibridazione. 3 combinazioni d’ibridazione: -molecole di cDNA presenti solo nel riformeranno la doppia elica - molecole di cDNA presenti solo nel riformeranno la doppia elica -molecole di cDNA presenti nel driver tester possono formare ibridi e poi driver tester e nel I prodotti d ’ ibridazione sono caricati su una colonna alla quale è attaccata l’avidina. Solo gli ibridi del tester, non marcati, non si attaccheranno alla colonna. La PCR dei due campioni con primer unici della libreria tester portano alla formazione di: -una libreria di sottrazione, che contiene sequenze uniche del tester, non presenti nel driver; -una libreria di selezione contenente le sequenze condivise da entrambe le librerie .