Principi di biologia molecolare dei microrganismi I genomi microbici La conoscenza della sequenza completa del genoma di un organismo è importante per comprendere: 1. come l’organismo funzioni 2. quale sia la sua storia evolutiva Oltre 100 genomi procariotici sono stati completamente sequenziati. I genomi microbici Molti dei genomi interamente sequenziati appartengono: • a patogeni causa di malattie gravi e molto diffuse, • a batteri come gli ipertermofili che potrebbero offrire importanti sviluppi in biotecnologia, dal momento che gli enzimi di questi microrganismi sono stabili a elevate temperature. Nella lista dei microrganismi completamente sequenziati ci sono anche Bacillus subtilis ed E.coli che rimangono sistemi modello ampiamente studiati. I genomi microbici Attraverso la ricerca di geni simili in microrganismi differenti, e attraverso la determinazione dei geni non essenziali con la mutagenesi mediante trasposoni, i ricercatori hanno concluso che sono necessari dai 265 ai 350 geni codificanti proteine per stabilire la minima funzionalità cellulare. I genomi microbici I genomi procariotici sequenziati hanno dimensioni che vanno da 0.58 Mb a 8.7 Mb. Quelli più piccoli hanno le dimensioni dei virus più grandi e i genomi più grandi hanno più geni di quelli dei microrganismi eucariotici. L’informazione genetica Affinché un organismo possa crescere e riprodursi, l’informazione genetica contenuta nella doppia elica del DNA deve poter essere replicata con precisione ed essere utilizzata come stampo, inizialmente, per la sintesi di RNA specifici e successivamente per la sintesi delle proteine. Trasferimento dell’informazione genetica nei procarioti Un singolo mRNA spesso contiene più di una regione codificante (mRNA policistronici) Trasferimento dell’informazione genetica negli eucarioti Le regioni non codificanti (introni) sono rimosse dal trascritto primario di RNA prima della traduzione. Gli mRNA degli eucarioti sono quasi sempre monocistronici La struttura del DNA Basi azotate presenti nel DNA: ADENINA GUANINA CITOSINA TIMINA Nel DNA a doppio filamento abbiamo l’appaiamento specifico tra A e T e tra G e C per mezzo di legami idrogeno. Evidenziati: •in rosso gli atomi che si trovano nel solco maggiore e che interagiscono con proteine. •in verde lo scheletro zucchero-fosfato NUCLEOTIDE Base azotata fosfato zucchero Complementarietà ed antiparallelismo Nella molecola di DNA i 2 filamenti sono disposti in modo antiparallelo, cioè appaiati “testa “testa-coda” coda”.. Ad ogni estremità della doppia elica un filamento termina con un gruppo 5’-fosfato, l’altro con un 3’-ossidrile ossidrile.. Le basi in rosso rappresentano le pirimidine (C e T) e quelle in giallo le purine (A e G). Ogni coppia AT ha 2 legami idrogeno, mentre ogni coppia GC ha 3 legami idrogeno Struttura secondaria del DNA Nel DNA ci sono spesso sequenze di basi che non hanno proprietà codificanti, ma che influenzano la struttura secondaria del DNA o il modo in cui esso interagisce con le proteine. Spesso si trovano brevi sequenze ripetute in senso inverso (INVERTITE RIPETUTE). Quando tali sequenze sono vicine possono portare alla formazione di strutture del DNA cruciformi con una morfologia del tipo ansa-stelo (stem-loop), per appaiamento di basi complementari sullo stesso filamento. Le estremità coesive Le estremità delle molecole di DNA lineare possono contenere sequenze importanti nel determinare cambiamenti strutturali. Alcune molecole di DNA lineare presentano estremità a singolo filamento complementari (estremità coesive) che possono appiarsi con formazione di una molecola circolare. Strutture a forcina Alcune molecole di DNA lineare presentano, ad ogni estremità, strutture a forcina (hairpin),simili alle strutture ansastelo, ma quasi completamente prive dell’ansa. Queste strutture possono formarsi da regioni a singola elica che si trovano all’estremità di una molecola che contengono sequenze invertite ripetute Denaturazione termica del DNA Se si espone il DNA ad elevate temperature, i legami idrogeno tra le due eliche tendono a rompersi e le due eliche potranno così separarsi. Questo processo è detto denaturazione (melting) e si può misurare sperimentalmente, in quanto a parità di sequenza nucleotidica, DNA a singola e doppia elica differiscono tra loro per l’assorbimento di luceUV. Il DNA con un elevato contenuto in GC si denatura a una temperatura più alta di una molecola di pari dimensioni con più coppie AT Con il procedere della denaturazione l’assorbimento di luce UV da parte del DNA aumenta. La transizione è piuttosto brusca, e la temperatura, Tm, è direttamente correlata a l contenuto in GC della molecola. IL PATRIMONIO GENETICO DEI PROCARIOTI • GENERALMENTE 1 MOLECOLA CIRCOLARE DI DNA (eccezioni V.cholerae 2 cromosomi e Agrobacterium e Streptomyces cromosoma lineare) • MEDIAMENTE 3-6 x 106 bp • PESO MOLECOLARE ± 2-4 x 109 Da • MOLECOLA SUPERAVVOLTA • LUNGHEZZA 1,1 mm Struttura del DNA: il superavvolgimento Una molecola di DNA si dice rilassata quando possiede l’esatto numero di giri d’elica atteso in base alla lunghezza in coppie di basi. L’organizzazione strutturale superiore che permette alla molecola di DNA di essere impacchetta nella cellula è il superavvolgimento Superavvolgimento del DNA nei procarioti Nei batteri è presente un enzima particolare, la DNA girasi (topoisomerasi II), in grado di introdurre nel DNA superavvolgimenti negativi. Step I: Ripiegamento della molecola di DNA circolare Step II: Introduzione di rotture a doppio filamento ad opera della topoisomerasi II, nel punto di contatto tra le due catene di DNA Step III: Saldatura della rottura a doppio filamento dal lato opposto dell’elica intatta Struttura del DNA: il superavvolgimento La doppia elica di DNA del cromosoma batterico non costituisce una singola molecola superavvolta, ma è organizzata in svariati domini superavvolti superavvolti.. In E. coli si stima che esistano circa 50 di tali domini, ognuno dei quali sarebbe stabilizzato grazie a legami con proteine specifiche Organizzazione del DNA negli eucorioti Negli eucarioti la molecola di DNA lineare a doppia elica si avvolge intorno ad un nucleo di proteine istoniche, in modo regolare formando strutture chiamate nucleosomi, che possono aggregarsi a formare la cromatina. La replicazione del DNA: la prima tappa del flusso dell’informazione genetica La replicazione del DNA viene definita semiconservativa, in quanto le due doppie eliche risultanti da tale processo sono costituite da un filamento neosintetizzato e uno parentale. La replicazione del DNA Il precursore di ognuno dei nuovi nucleotidi nella catena è un nucleoside 5’-trifosfato dal quale vengono rimossi i due fosfati terminali, mentre il fosfato interno viene legato covalentemente al deossiribosio della catena nascente. La replicazione del DNA La replicazione del DNA procede sempre dall’estremità con il gruppo 5’-fosfato verso l’estremità con il gruppo 3’-ossidrile Gli enzimi che catalizzano le reazioni di addizione dei nucleotidi vengono definiti DNA polimerasi e tutte sintetizzano la nuova molecola di DNA nella direzione 5’-3’. Non si conosce nessuna DNA polimerasi in grado di dare inizio a una nuova catena di DNA: esse sono solo in grado di aggiungere un nucleotide a un gruppo 3’-OH preesistente. Quindi, per iniziare una nuova catena deve essere presente un innesco che nella maggior parte dei casi è costituito da una breve sequenza di RNA ed è sintetizzato da enzimi chiamati primasi. La replicazione del DNA Come in quasi tutti i procarioti, anche in E. coli il cromosoma è una molecola circolare che possiede un singolo sito di origine della replicazione costituita da una sequenza specifica di circa 300 basi che viene riconosciuta da proteine specifiche. A livello dell’origine di replicazione la doppia elica di DNA si apre e la replicazione inizia su entrambi i filamenti. Man mano che la replicazione procede la forca di replicazione si muove lungo il DNA. Spesso la replicazione è bidirezionale a partire dall’origine di replicazione e perciò ci sono due forche di replicazione che si muovono in direzioni opposte. Nel DNA circolare, la replicazione bidirezionale porta alla formazione di una struttura caratteristica chiamata forma teta (θ). La replicazione del DNA In E. coli ci sono 5 DNA polimerasi, ma a livello delle forche di replicazione l’enzima principale nel processo replicativo è la DNA polimerasi III. A livello della forca di replicazione la doppia elica si srotola per azione di proteine chiamate elicasi. Si viene così a formare una piccola regione a singolo filamento che viene subito complessata dalla proteina affine al DNA a singola elica, che lo stabilizza. La replicazione del DNA è un processo accuratamente regolato e i sistemi di regolazione agiscono essenzialmente a livello dell’origine. La replicazione del DNA La DNA elicasi svolge la doppia elica di DNA La replicazione del DNA Sul filamento che cresce dal 5’fosfato verso il 3’-ossidrile, detto filamento guida, la sintesi procede in modo continuo. Sul filamento opposto, definito filamento copia, la sintesi del DNA ha luogo in modo discontinuo perché non c’è, a livello della forca di replicazione, un gruppo 3’-OH al quale può essere aggiunto il nuovo nucleotide. Perciò sul filamento copia deve essere sintetizzato un piccolo innesco di RNA da una primasi che viene poi sostituita dalla DNA polimerasi III che continua ad aggiungere nucleotidi finchè non raggiunge il DNA precedentemente sintetizzato. La replicazione del DNA Raggiunto il frammento di DNA precedentemente sintetizzato, la DNA polimerasi III si ferma e viene coinvolta la DNA polimerasi I che svolge più di una attività; oltre a sintezzare DNA, grazie alla sua attività di esonuclesica 5’-3’ può rimuovere gli inneschi di RNA che incontra avanzando. Una volta che l’innesco è stato eliminato e sostituito con DNA, la DNA polimerasi I viene rilasciata. L’ultimo legame fosfodiesterico della catena viene prodotto dalla DNA ligasi enzima coinvolto insieme alla DNA polimerasi I anche nei meccanismi di riparo del DNA. La replicazione del DNA In corrispondenza di un origine di replicazione vengono iniziate due forche replicative. Ciò richiede un innesco per ognuna delle due eliche guida che crescono in direzione opposta La replicazione del DNA Durante la replicazione le due eliche vengono sintetizzate da due molecole accoppiate di DNA polimerasi III grazie al ripiegamento ad ansa dell’elica copia. Il replisoma è un complesso contenente elicasi, primasi e due molecole di DNA polimerasi III, oltre a diverse altre proteine. Il complesso di replicazione si posiziona nella parte centrale della cellula batterica e serve da officina di replicazione, in quanto spinge lo stampo di DNA al proprio interno promuovendo la replicazione, durante la quale è il DNA che si muove non la polimerasi. La replicazione del DNA Gli errori nella replicazione introducono mutazioni. Il tasso di mutazione negli organismi viventi è notevolmente basso basso:: tra 10 10--8 e 10 10--11 errori per coppia di basi inserita.. inserita In parte quest’accuratezza si basa anche sul fatto che sia la DNA polimerasi I che III possiedono un’attività enzimatica definita “ correzione delle bozze” (proofreading), un’attività esonuclesica 3’-5’ che permette la rimozione del nucleotide inserito erroneamente e la successiva sostituzione con quello corretto. La trascrizione La trascrizione dell’informazione genetica da DNA ad RNA viene realizzata dall’enzima RNA polimerasi, che catalizza la formazione di legami fosfodiesterici tra i ribonucleotidi e richiede la presenza di DNA come stampo. Nella maggior parte dei casi lo stampo di DNA per l’RNA polimerasi è una molecola a doppia elica, ma per ogni gene soltanto uno dei due filamenti è trascritto. L’RNA polimerasi a differenza della DNA polimerasi può iniziare direttamente la sintesi della catena nucleotidica che si allunga in direzione 5’-3’. Durante l’allungamento di una catena di RNA, i nucleotidi vengono aggiunti al 3’-OH del ribosio del ribonucleotide precedente con rilascio di due legami fosfato ad alta energia. La prima base dell’RNA è quasi sempre una purina, un’adenina o una guanina. La trascrizione • Nei batteri è presente una singola RNA polimerasi mentre negli eucarioti ci sono tre enzimi. • In E. coli l’enzima è costituito da quattro tipi di subunità proteiche: b, b’, a (presente in due copie) e s. • Le subunità interagiscono a formare l’enzima attivo, oloenzima, ma il fattore sigma (s) non è legato saldamente al complesso e può facilmente dissociarsi, determinando la formazione di quello che è chiamato “core” dell’enzima che da solo può catalizzare la formazione dell’RNA. • Il fattore sigma è invece la subunità della polimerasi principalmente coinvolta nella fase di riconoscimento dei promotori, ovvero il sito idoneo per avviare la trascrizione La trascrizione: fasi della sintesi dell’ RNA 1. I siti d’inizio e di terminazione sono sequenze specifiche del DNA 2. Il fattore sigma permette alla RNA polimerasi di riconoscere il promotore ed il sito d’inizio 3. La trascrizione inizia ed il fattore sigma viene rilasciato La trascrizione: fasi della sintesi dell’ RNA 4. Crescita della catena di mRNA. L’RNA polimerasi si muove lungo la catena di DNA provocando l’apertura della doppia elica e la trascrizione di uno dei due filamenti 5. Quando il sito di terminazione viene raggiunto , la crescita della catena si arresta 6. Rilascio dell’RNA polimerasi e dell’mRNA La trascrizione: il promotore All’interno della regione promotore vi sono due sequenze altamente conservate che vengono riconosciute dal fattore sigma; entrambe localizzate a monte del sito d’inizio della trascrizione. La regione -10, localizzata 10 basi prima dell’inizio della trascrizione, è detta Pribnow box e possiede una sequenza consenso che corrisponde a TATAAT. La regione -35, che si trova circa 35 basi prima dell’inizio della trascrizione e possiede una sequenza consenso che è TTGACA. La trascrizione: i terminatori La trascrizione si arresta in corrispondenza di regioni dette terminatori della trascrizione. Nei batteri una sequenza di terminazione classica contiene una sequenza invertita ripetuta con un segmento centrale di basi non ripetute che quando viene trascritta può formare una struttura ansa-stelo. Nel caso in cui queste strutture ansa-stelo siano seguite da uridine ripetute in serie, si vengono a formare degli efficienti terminatori della trascrizione. (Esempio di terminatori intrinseci). Altri terminatori: Rho Esistono altri terminatori che richiedono oltre alla polimerasi la presenza di altri fattori proteici specifici. • In E. coli un tipo di terminatore richiede la presenza della proteina Rho la quale si lega tenacemente all’RNA e scorre lungo la molecola verso il complesso RNApolimerasi-DNA. • Una volta che la polimerasi si è fermata in corrispondenza di un sito di terminazione Rho dipendente, Rho può provocare il distacco dell’ mRNA e della polimerasi dal DNA, terminando la trascrizione. Le unità di trascrizione I cromosomi sono organizzati in unità fiancheggiate da siti in corrispondenza dei quali il processo trascrizionale ha inizio e fine: le unità di trascrizione. Esistono unità di trascrizione che ospitano due o più geni, che saranno cotrascritti, dando luogo a una singola molecola di RNA chiamata mRNA policistronico dal quale verranno sintetizzati contemporaneamente più polipeptidi. Nei procarioti i geni dei tRNA sono in genere cotrascritti e spesso anche con i geni per l’rRNA. Tutti questi trascritti devono essere processati prima che vengano prodotte molecole di . rRNA o tRNA mature, che vengono definiti RNA stabili in quanto non sono degradati a differenza dell’mRNA che non viene processato ed è estremamente instabile per cui viene rapidamente degradato dalle nucleasi della cellula Gli introni self-splicing Nei procarioti, all’interno dei geni che codificano proteine sono stati scoperti solo pochi introni e la maggior parte dei ribozimi è costituita proprio da introni selfsplicing, che sono in grado di autorimuoversi da una molecola di RNA giuntando tra loro gli esoni adiacenti. Gli introni self-splicing si differenziano dalla maggior parte degli enzimi proteici in quanto di norma possono catalizzare la loro reazione soltanto una volta. Si pensa che i ribozimi siano le vestigia di una forma di vita più semplice, “la vita ad RNA”, che può aver preceduto l’era delle proteine come principali catalizzatori cellulari. La sintesi delle proteine la L’ultima tappa del trasferimento dell’informazione biologica, traduzione si avvale sempre di uno stampo di acidi nucleici, ma in questo caso il prodotto finale è una proteina. Il codice genetico Per convenzione ci si riferisce sempre al codice genetico come mRNA piuttosto che come DNA, perché è con uno stampo di mRNA, in cui ogni tripletta di basi chiamato codone codifica per uno specifico aminoacido, che avviene il processo di traduzione. Oltre ai codoni specifici per i diversi aminoacidi, ci sono speciali codoni come il codone d’inizio (AUG) che codifica per l’aminoacido N-formilmetionina e codoni non-senso o di stop (UAA, UAG, UGA) che non corrispondono ad alcun aminoacido e costituiscono i segnali di terminazione della traduzione di un gene. Il codice genetico La caratteristica forse più interessante del codice genetico risiede nel fatto che molti aminoacidi sono codificati da triplette diverse ma non correlate tra loro. Quindi, sapendo che in una proteina un aminoacido si trova in una determinata posizione, non possiamo automaticamente risalire al codone corrispondente sull’RNA;tale proprietà di mancata corrispondenza viene definita degenerazione del codice genetico. La sintesi delle proteine Nella cellula un codone è letto dall’appaiamento delle basi con un tRNA a livello di una sequenza di tre basi definita anticodone. Per alcuni aminoacidi esiste più di un tRNA ma ci sono anche tRNA che leggono più di un codone. Questo è reso possibile dal fatto che le molecole di tRNA possono formare a volte appaiamenti classici solo con le prime due basi del codone, sopportando in terza posizione anche un’altra base; questo fenomeno di appaiamento erroneo (mismatch) viene chiamato vacillamento. La selenocisteina: il ventunesimo aminoacido UGA è generalmente un efficiente codone di arresto in E. coli, ma è stato dimostrato che esso può anche essere tradotto direttamente come codone per la selenocisteina in alcuni mRNA La sintesi delle proteine Con un codice a triplette è assolutamente essenziale che la traduzione inizi nel punto esatto, altrimenti l’intero modulo (o fase) di lettura verrebbe spostato con la conseguente formazione di una proteina diversa o di nessuna proteina. Per convenzione la fase di lettura corretta è chiamata fase 0, mentre le altre due possibili fasi di lettura sono indicate con -1 e +1. Perché un mRNA possa essere tradotto deve contenere una fase di lettura aperta (open reading frame, ORF), che consiste in un codone di inizio seguito da numerosi codoni e da un codone di stop nella stessa fase di lettura del codone d’inizio. Lo schema rappresenta la regione interna di un mRNA I ribosomi procariotici I ribosomi costituiscono il sito presso il quale avviene la sintesi proteica e nei procarioti sono costituiti da una subunità 30S e da una subunità 50S che formano il ribosoma 70S. Ogni subunità è un complesso ribonucleoproteico costituto da rRNA e proteine. I ribosomi procariotici ed eucariotici La subunità 30S contiene l’rRNA 16S e circa 20 proteine, mentre la 50S contiene gli rRNA 5S e 23S e circa 30 proteine. La sintesi delle proteine Struttura degli 16S rRNA I ribosomi dei batteri riconoscono lo specifico codone AUG come codone d’inizio grazie all’aiuto di una breve sequenza localizzata nell’mRNA a monte dello stesso, chiamato sequenza Shine-Dalgarno. sequenza complementare alla Shine-Dalgarno La sintesi delle proteine La struttura di un tRNA può essere rappresentata con una forma a quadrifoglio ed alcune regioni della struttura secondaria prendono il nome dalle basi che si ritrovano più frequentemente (l’ansa TC e l’ansa D) o dalla funzione specifica svolta (l’ansa dell’anticodone e l’estremità accettrice). tRNA per la Phe di lievito La sintesi delle proteine Le molecole di tRNA contengono alcune basi leggermente diverse da quelle presenti negli altri RNA, in quanto modificate non solo per metilazione, ma attraverso modificazioni chimiche che insieme al processamento sono necessarie per rendere la molecola funzionale. La sintesi delle proteine Nei diversi tRNA si nota che alcune basi e alcune strutture secondarie sono conservate mentre alcune regioni sono variabili. STABILE Una delle regioni variabili della molecola è quella dell’anticodone che contiene i tre nucleotidi coinvolti nel processo di riconoscimento ed appaiamento con il codone. In tutti i l’estremità tRNA, invece, 3’, detta accettrice, è costituita da tre nucleotidi non appaiati che sono sempre CCA, ed è proprio al ribosio del residuo terminale che l’aminoacido si lega covalentemente tramite un legame estere. VARIABILE Reale ripiegamento della molecola di tRNA La sintesi delle proteine A. Struttura secondaria del tRNA B. Struttura terziaria del tRNA La sintesi delle proteine Per una corretta sintesi proteica risulta fondamentale il riconoscimento tra tRNA e l’aminoacil-tRNA-sintetasi. La reazione chimica specifica tra un aminoacido e un tRNA catalizzata dalla aminoacil-tRNA sintetasi coinvolge dapprima l’attivazione dell’aminoacido tramite la reazione con l’ATP. L’intermedio aminoacil-AMP che si forma rimane legato all’enzima fino al momento della collisione con l’appropriata molecola di tRNA; l’aminoacido attivato è poi trasferito al tRNA per formare un tRNA carico. A questo punto il tRNA carico lascia la sintetasi e viene trasportato da un fattore proteico verso il ribosoma. Il tRNA e il suo specifico aminoacido vengono trasportati assieme da un enzima, anch’esso specifico, che fa sì che un determinato tRNA riceva l’aminoacido corretto. Questi enzimi in grado di attivare gli aminoacidi stabilizzando il legame con il proprio tRNA sono detti aminoacil-tRNA sintetasi. La sintesi delle proteine: la fase d’inizio L’mRNA scorre attraverso il ribosoma legato essenzialmente alla subunità 30S. Nella subunità 50S invece si distingue un sito A, accettore, dove si lega il tRNA caricato del suo aminoacido ed un sito P, peptidico, dove il peptide nascente è legato a un tRNA. Sebbene tutte le proteine inizino con una metionina, questo aminoacido viene generalmente rimosso da una specifica proteasi alla fine della traduzione. La sintesi delle proteine: la fase d’inizio L’inizio è caratterizzato formazione del d’inizio, costituito 30S che si unisce formare un dall’mRNA, dal formilmetionina e Inoltre, in questa guanosintrifosfato. • • • • • • dalla complesso dalla subunità alla subunità 50S a ribosoma attivo, tRNA per la dai fattori d’inizio. fase è richiesto il - legame subunità 30S / IF3 - riconoscimento del mRNA (sequenza Shine-Dalgarno) - legame IF2 / fMet-tRNA - fMet-tRNA nel sito P - idrolisi del GTP per l’assemblaggio del ribosoma - rilascio IF2 - IF3 La sintesi delle proteine: la fase di elongazione ii Il tRNA che trattiene il peptide nascente (f-Met) si muove dal sito A al sito P, lasciando libero il primo sito per un altro tRNA carico (Asp). iii Formazione del legame peptidico ad opera dell’enzima peptidil transferasi, tra aminoacidi su molecole di tRNA adiacenti.Questa attività enzimatica è svolta dal rRNA 23S della subunità maggiore del ribosoma. La sintesi delle proteine: traslocazione e rilascio L’ultimo evento del ciclo di allungamento della catena polipeptidica è la traslocazione, che richiede uno specifico fattore di elongazione EF-G (traslocasi GTP-dipendente) e una molecola di GTP per ogni tRNA traslocato. A ogni tappa di traslocazione il messaggero avanza di tre nucleotidi, esponendo un nuovo codone nel sito A. La traslocazione spinge il tRNA ormai vuoto in un nuovo sito, chiamato sito E (di uscita) e viene rilasciato dal ribosoma. La terminazione della sintesi proteica La terminazione della sintesi proteica avviene quando si raggiunge un codone di stop, cui non è in grado di legarsi nessun tRNA. Particolari proteine, chiamate fattori di rilascio, riconoscono i segnali di terminazione della catena e tagliano il polipeptide ancora legato all’ultimo tRNA e rilasciano la proteina completa. La sintesi delle proteine: il polisoma Quando diversi ribosomi stanno simultaneamente traducendo un singolo messaggero, il complesso viene definito polisoma. I polisomi aumentano la velocità e l’efficienza di traduzione di un messaggero. Accoppiamento trascrizione-traduzione