DNA: il materiale genetico

Espressione genica:
trascrizione
Corso di Genetica
per Scienze per l’Ambiente e la
Natura
Alberto Pallavicini
Schema generale
Nel 1956 Crick postulò il Dogma centrale:
DNA
RNA
PROTEINE
Non tutti i geni codificano per le proteine (non vengono tradotti).
•
mRNA=RNA messaggero
•
tRNA=RNA transfer
•
rRNA=RNA ribosomale
•
snRNA=piccolo RNA nucleare
La sintesi dell’RNA
Ad ogni gene sono associati delle sequenze chiamate elementi
regolatori che sono coinvolti nelle regolazione dell’espressione
genica.
La trascrizione è catalizzata da un enzima RNA polimerasi. Per
cominciare necessità dello srotolamento della doppia elica. Nei
procarioti è mediato direttamente dalla polimerasi mentre negli
eucarioti è opera di u n complesso multiproteico.
La sintesi dell’RNA
La sintesi avviene in direzione 5’-3’.
L’elica che viene letta si chiama elica stampo e quella sintetizzata
o quella complementare viene chiamata elica senso.
I precursori dell’RNA sono i ribonucleosidi trifosfato ATP, GTP,
CTP, UTP.
La sintesi è molto simile a quella del DNA.
La sintesi dell’RNA
Le RNA polimerasi non richiedono l’utilizzo di un innesco a
RNA, ma non possiedono attività di correttore di bozze.
Utilizza UTP anziché la timina, pertanto se nell’elica stampo di
trova un nucleotide A verrà inserito nella catena di RNA un
nucleotide U.
Inizio della trascrizione: i promotori
La trascrizione avviene in tre fasi: inizio, allungamento e
terminazione.
Particolari segnali vengono utilizzati per indicare i punti di inizio e
di termine.
Generalmente un gene procariote può essere diviso in tre regioni:
•Una sequenza a monte del punto di inizio della trascrizione,
chiamata promotore, riconosciuta dalla polimerasi.
•La regione codificante.
•Il terminatore a valle della regione codificante.
Inizio della trascrizione: i promotori
Con l’analisi comparativa delle sequenze a monte di regioni
codificanti e con lo studio degli effetti provocatio dalle
alterazioni di tali sequenze sono state identificate i E. coli 2
regioni importanti per l’inizio della trascrizione.
Queste sequenze sono localizzate a –35 e –10 bp a monte di +1.
Inizio della trascrizione: i promotori
La sequenza consenso per la regione a –35 è: 5’-TTGACA-3’
La regione a –10 (Pribnow box) è: 5’-TATAAT-3’
Affinchè la trascrizione abbia inizio un complesso multipeptidico
(oloenzima). L’oloenzima è composto dal core della RNA
polimerasi (i peptidi 2α-β-β’) legato ad un altro fattore (σ). Questo
fattore è indispensabile per il riconoscimento delle sequenze –35 e
–10.
In E. coli ci sono numerosi fattori σ che giocano un fattore
importante per la regolazione dell’espressione genica.
Allungamento e terminazione
Dopo che sono stati polimerizzati i primi nucleotidi il fattore σ si
dissocia e può essere utilizzato in altre reazioni di inizio della
trascrizione.
Il nucleo enzimatico procede nella sintesi srotolando il DNA. La
tensione prodotta serve per fare riformare la doppia elica dietro la
RNA polimerasi.
La trascrizione procede alla velocità di 30-35 nucleotidi al
secondo.
La terminazione è segnalata da delle sequenze di terminazione.
Terminazione
Trascrizione negli eucarioti
Negli eucarioti (al contrario dei procarioti) tre diverse polimerasi
trascrivono i 4 tipi diversi di RNA.
La RNA polimerasi I localizzata esclusivamente nel nucleolo
catalizza la sintesi degli rRNA.
La RNA polimerasi II che si trova nel nucleoplasma sintetizza gli
mRNA.
La RNA polimerasi III anch’essa nupleoplasmatica sintetizza gli
tRNA, 5S rRNA, snRNA.
Sono state isolate le RNA polimerasi in base alla loro diversa
sensibilità alla tossina α-amanitina.
La trascrizione da parte della
RNA polimerasi II
Descriveremo ora gli eventi per la sintesi di mRNA codificante le
proteine.
Il prodotto della RNA polimerasi II e una molecola chiamata
mRNA precursore (pre-mRNA).
I promotori per i geni che codificano per le proteine sono stati
analizzati in 2 modi:
•esaminare gli effetti delle mutazioni che alterano l’espressione.
•confrontare tra loro le sequenze e verificare se ci sono elementi
comuni.
Si sono così identificati gli elementi promotori basali e elementi
promotori prossimali.
La trascrizione da parte della RNA
polimerasi II
Promotori Basali negli eucarioti:
TATA box localizzato a –25, la sequenza completa TATAAAA. Si
denatura più facilmente.
CAAT box localizzato a –75, GC box localizzati a –90.
Hanno tutti un’attività generica nell’inizio della trascrizione.
L’accurato inzio della trascrizione e la sua modulazione richiede
l’assemblaggio della RNA polimerasi II con alcuni fattori base
della trascrizione (TF).
Il complesso che si forma è sufficiente per un basso livello
trascrizionale, per un maggiore livello sono necessari altri fattori
chiamati attivatori che si legano agli enhancer.
Oltre a queste regioni attivatrici abbiamo anche regioni
silenziatrici (silencer) che si legano a fattori trascrizionali
repressori.
Entrambi funzionano sia a valle che a monte del gene.
Gli RNA messaggeri eucarioti
La molecola di mRNA è generalmente composta in tre parti:
Sequenza leader o 5’ UTR
Sequenza codificante
La sequenza di coda o 3’ UTR
Le regioni 5’ e 3’ UTR possono contenere sequenze regolatrici.
Differenze tra procarioti ed eucarioti
La maturazione dell’mRNA
Gli mRNA eucariotici sono generalmente modificati sia
all’estremità 5’ che all’estremità 3’.
Nel 1977 Roberts, Sharp e Berger hanno visto che nei geni di certi
virus animali erano presenti sequenze non codificanti.
Negli eucarioti la maggior parte dei geni che codificano per
proteine contengono introni, intramezzate alle altre sequenze
presenti nell’mRNA: gli esoni.
Introne = intervening sequences
Esone = expressed sequences
Modifiche al 5’ e al 3’
Capping del 5’
Dopo la sintesi di circa 20-30
nucleotidi l’estremità 5’ viene
modificata con l’aggiunta di un
cappuccio (cap).
Generalmente si tratta di una 7-metilguanosina.
Modifiche al 5’ e al 3’
Poliadenilazione del 3’
Non si è ancora trovata
una sequenza di
terminazione della
trascrizione.
Esistono dei siti
chiamati siti di
poliadenilazione
posizionati a 10-30 bp a valle della sequenza consenso AAUAAA
Esiste una specifica poliA-polimerasi
Transcription termination at protein-coding genes is
triggered by cleavage and polyadenylation specificity
factor (CPSF), cleavage stimulatory factor (CstF),
cleavage factor I (CFI) and CFII,
Gli introni
I pre-mRNA contengono spesso un certo numero di introni.
Essi devono essere excisi.
Si era già notato che nel nucleo esistevano un gran numero di
molecole di RNA di diverse lunghezze chiamate hnRNA.
La prima dimostrazione avvenne solo nel 1978 con Leder.
Studiando la β-globina umana hanno visto che hnRNA
corrispondente era coolineare con il gene mentre l’mRNA non lo
era. Conclusero che fosse presente in introne di 800 bp.
Oggi si sa che alcuni geni presentano anche decine di introni di
varie dimensioni, alcuni di poche bp fino a molte migliaia.
La maturazione dell’mRNA
Lo spliceosoma
Modifiche al 5’ e al 3’
RNA editing
Fenomeno scoperto a metà degli anni 80 nel protozooo
Tripanosoma.
Nelle piante superiori ci sono cambiamenti tra C e U per produrre
codone d’inizio da un codono ACG
Nei mammiferi nell’apolipoproteinaB Formazione di stop codon
tessuto specifica
Trascrizione di altri geni
Trascrizione dell’rRNA procariotico
Trascrizione dell’rRNA eucariotico
Espressione genica:
traduzione
Il codice genetico
I tre tipi principali di RNA operano assieme per sintetizzare le
proteine durante il processo della traduzione.
La sequenza di aminoacidi sintetizzata è specificata dalla
sequenza di nucleotidi nella molecola di mRNA.
Le regole che determinano questa codifica sono racchiuse nel
codice genetico.
Gli aminoacidi sono 20 e i nucleotidi 4.....come facciamo?
I polipeptidi sono polimeri
Se considerate nei loro livelli fondamentali le strutture dei
polipeptidi e degli acidi nucleici sono uguali. Polimeri entrambi.
Gli aminoacidi:
Gruppo R:
polare o nonpolare
positivo,
negativo o
senza carica
Il legame peptidico
La struttura polimerica di un polipeptide viene ottenuta legando
assieme una serie di AA con legami peptidici.
Condensazione tra un gruppo carbossilico e il gruppo aminico di
due AA.
Diversi livelli della struttura proteica
La struttura della proteine
La sequenza aminoacidica è la chiave della struttura e della
funzione della proteina.
Ciò può venire facilmente compreso considerando la struttura
secondaria nella quale sono noti alcuni aminoacidi che a causa
delle loro caratteristiche chimico-fisiche , interagiscono e si legano
ad altri aa.
Oppure formano strutture ad α-elica o a foglietto-β.
La prova avviene dalla denaturazione –rinaturazione.
Anche la funzione dipende strettamente dalla struttura primaria.
Es. proteine che interagiscono con il DNA.
Il codice genetico
Durante gli anni 50 i pochi biologi molecolari, riuniti attorno alla
figura di Crick, cercarono di capire come l’informazione si
trasmettesse tra il DNA e le proteine.
Si cominciò con il semplificare il problema usando come dogma la
colinearità tra gene e proteina.
Ciascuna parola del codice è costituita da una tripletta di
nucleotidi.
1 nucleotide = 4 parole del codice
2 nucleotidi = 16 parole del codice
3 nucleotidi = 64 parole del codice
La decifrazione del codice
Verso la fine degli anni 50 due progressi tecnologici permisero la
decifrazione del codice:
La sintesi di molecole di RNA artificiali con la polinucleotide
fosforilasi (Ochoa, 1955)
La sintesi di RNA in un sistema privo di cellule (Niremberg e
Matthaei).
Analisi con omopolimeri:
Nel 1961 si scopri che l’omopolimero poli(U) codifica per la
fenilalanina. In seguito analizzarono il poli(A) e poli(C).
La decifrazione del codice
Eteropolimeri a
caso:
sapendo la percentuale
di C rispetto alle A
avevamo la probabilità
che ci fosse un codone
rispetto all’altro.
Comunque non tutti i
codoni riuscirono ad
essere identificati.
Eteropolimeri ordinati:
Khorana riusci a sintetizzare polimeri partendo da dinucleotidi
per cui AC darà i due tipi di codoni ACA e CAC.
ma anche da trinucleotidi UGU darà UGU,GUU,UUG.
Aspetti del codice genetico
Il codice è degenerato:
Tutti gli aminoacidi, tranne metionina e triptofano, hanno più di un
codone. I codoni con il maggior numero di siononimi sono spesso
raggruppati in famiglie (GGA;GGU,GGG,GGC codificano per la
glicina).
Il codice contiene i codoni per la punteggiatura:
Tre codoni UAA, UGA, UAG non codificano per un aminoacido
ma se presenti nel mezzo di un eteropolimero causano
l’interruzione della sintesi proteica. Sono i codoni di terminazione.
Ugualmente il codono AUG è sempre presente all’inizione di un
gene e segnala l’inizio della traduzione (attenzione che codifica
anche per la metionina, ed è l’unico).
Aspetti del codice genetico
Il codice genetico non è universale:
Quando nell 1966 venne completata la decifrazione del codice
genetico si dette per scontato che fosse universale.
Risultava difficile pensare ad alterazione del codice compatibili
con la vita.
Nel 1979 Sanger scoprì che i geni dei mitocondri umani usano un
codice genetico lievemente diverso. Differenze sono state trovate
anche per geni nucleari in protozoi Tetrahymena e Paramecium.
Il caso del codone UGA e la selenocisteina.
Esiste un segnale nel 3’UTR che fa in modo che il codone UGA
venga riconosciuto da un tRNA con la selenocisteina.
Aspetti del codice genetico
L’anticodone vacilla:
dovrebbero esserci circa
61 diversi tRNA.
Ipotesi del vacillamento
La base 5’
dell’anticodone non è
sottoposta a restrizioni
dal punto di vista
tridimensionale come le
altre due basi
Il ruolo del tRNA nella traduzione
Ciascuna cellula contiene un certo numero di tRNA.
Ogni tRNA viene distinto dalla sua specificità per uno dei 20 AA.
Una molecola di tRNA forma un legame covalente con il suo AA e
può legarsi solo al codone per quell’AA.
Più tRNA per un AA (isoaccettori).
Aminoacilazione del tRNA
Il caricamento del tRNA, il legame si forma tra il gruppo
carbossilico dell’aa e il gruppo 3’OH del terminale nucleotidico del
tRNA. Questo meccanismo è controllato dalle aminoacil-tRNA
sintetasi.
Inizio della traduzione
Il primissimo evento nella traduzione è il legame della subunità
30S ad una molecola di mRNA.
Il sito di legame del ribosoma assicura che il punto d’inizio
della traduzione avvenga in posizione esatta.
Il corretto sito di legame viene indicato come sito di legame al
ribosoma. In E.coli ha come sequenza consenso:
5’-AGGAGGU-3’
Questa sequenza, nota come sequenza di Shine-Dalgarno si appaia
all’RNA 16S.
Una volta legato all’mRNA la subunita 30S si muove fino a che
incontra un codone AUG.
Inizio della traduzione
Formazione del complesso di inizio.
Il processo di traduzione inizia, quando un tRNA aminoacetilato si
associa mediante accoppiamento di basi con un codone di inizio.
Questo tRNA iniziatore è caricato con metionina.
Nei batteri essa viene modificata con un gruppo formico
(fmet).Tale sostituzione blocca l’aminogruppo direzionando in
questo modo la polimerizzazione.
La molecola di mRNA, la subunità 30S e il tRNAfmet costituiscono
il complesso di inizio.
Inizio della traduzione
Fattori di inizio
L’area principale della ricerca sulla traduzione, per la quale manca
ancora una comprensione totale, è il ruolo svolto da alcuni fattori
proteici non ribosomali.
Ad esempio l’inizio in E.coli richiede tre proteine chiamate fattori
di inizio. IF1 e IF3 sembrano importanti per la dissociazione tra le
subunita 30S e 50S.
IF2 partecipa al legame del tRNA iniziatore caricato.
L’elongazione della catena polipeptidica
Una volta che il complesso di inizio si sia formato, la subunità
grande del ribosoma si può legare.
Richiesta dell’idrolisi di una molecola di GTP.
Il risultato è la produzione di due siti distinti e separati nei quali le
molecole di tRNA si possono legare.
Il sito peptidico (P) è inizialmente occupato dal tRNAfmet.
Il sito aminoacilico (A) è posto in corrispondenza del secondo
codone ed è inizialmente vuoto.
L’elongazione inizia quando la corretta molecola di tRNA entra nel
sito A. Servono due fattori di elongazione EF-Tu e EF-Ts.
L’elongazione della catena polipeptidica
Formazione del legame peptidico e traslocazione.
Ora i due siti del ribosoma sono occupati da molecole di tRNA
aminoacetilate e i due AA sono a diretto contatto.
Il passaggio successivo è la formazione del legame peptidico.
La reazione è catalizzata dall’enzima peptidil transferasi. Questo
è un enzima complesso e misterioso forse la stessa rRNA 23S ne fa
parte (ribozimi?). Agisce assieme ad un secondo enzima
ribosomale la tRNA deacilasi, che spezza il legame fmet-tRNA.
A questo punto avviene una traslocazione. Il ribosoma scivola
lungo l’mRNA per una distanza di tre nucleotidi il tRNA-aa entra
nel sito P scalzando il tRNAfmet scarico.
L’elongazione della catena polipeptidica
Ciascun mRNA può essere tradotto da vari ribosomi nello
stesso tempo.
Dopo molti cicli di elongazione, l’inizio della molecola di mRNA
non è piu associata con il ribosoma e un secondo ciclo di
traduzione può cominciare.
Il risultato finale è un polisoma, un mRNA che viene tradotto da
vari ribosomi nello stesso tempo.
Sono anche visualizzabili al microscopio elettronico.
Terminazione della catena
La terminazione avviene quando un codone di terminazione
(UAA,UAG o UGA) entra nel sito A.
Non vi sono molecole di tRNA con anticodoni capaci di appaiarsi
con questi codoni di terminazione; al contrario, uno dei due fattori
di rilascio ( RF1 o RF2) entrano nel sito A e tagliano via il
polipeptide completato dalla molecola di tRNA terminale.
Il ribosoma rilascia il polipeptide e l’mRNA e successivamente si
dissocia nelle subunita 30S e 50S.
Il polipeptide si ripiega nella sua struttura terziaria ed inizia la sua
vita funzionale all’interno dellla cellula.
Terminazione della catena
La traduzione negli eucarioti
La traduzione negli eucarioti è sostanzialmente uguale a quella di
E. coli.
La maggior differenza consiste nel legame della subunità piccola
(40S) all’mRNA.
Dopo che il 40S ha contattato il CAP la subunità minore si sposta
lungo il 5’ UTR fino a quando non inccontra l’AUG di inizio.
L’AUG di inizio non necessariamente è il primo che viene
incontrato e quello che serve ad iniziare la traduzione è
caratterizzato dall’essere immerso in un intorno di sequenze che lo
caratterizzano. La sequenza con sensu di inzio è GCCA/GCCAUGG
dove A/G tre basi a monte del AUG e la G a valle dell’AUG
influenzano l’efficienza di inizio fino a 10 volte.