V. TRASCRIZIONE E TRADUZIONE DEL DNA
0) CONCETTI BASE
La trasformazione delle informazioni genetiche in proteine richiede due passaggi:
la trascrizione del DNA in mRNA e la traduzione dell’mRNA in una catena
polipeptidica.
Il codice genetico è a triplette, cioè ogni aminoacido è codificato da una sequenza
di tre basi azotate.
1) LA STRUTTURA DELLE PROTEINE
Come sappiamo, se si legano assieme una dopo l’altra più molecole di aminoacidi, si
ottiene una catena polipeptidica (o polipeptide), che si ripiega su se stessa assumendo
una particolare conformazione tridimensionale: il risultato è una proteina.
Le proteine, in genere formate da centinaia di subunità amminoacidiche, hanno una
particolare forma tridimensionale; questa dà a ognuna di esse la propria funzione
specifica, che, espressa in termini generali, consiste nella capacità di legarsi a altre
molecole.
Un gran numero di proteine con solo 20 aminoacidi
Le decine di migliaia di proteine diverse presenti negli organismi sono ottenute tutte
combinando assieme solo 20 aminoacidi. Che una così grande varietà di proteine derivi
da un numero relativamente ridotto di subunità non stupisce: basti pensare che la
lingua italiana ha migliaia di parole e poco più di una ventina di lettere dell’alfabeto; è
infatti l’ordine in cui queste si susseguono a determinare se si ottiene per esempio
“colorito” o “otricolo”. Analogamente, una proteina differisce dall’altra per la sequenza
di aminoacidi.
La Figura 6.1a riporta la formula di struttura di due aminoacidi, la glicina (gly) e
l’isoleucina (ile); dalla Figura 6.1b si vede che essi occupano le prime due posizioni in
una delle due catene polipeptidiche di cui è composta l’insulina. Questa proteina, che
rende possibile il passaggio del glucosio dal sangue nelle cellule del nostro organismo, è
rappresentata schematicamente in Figura 6.1c.
Ma come viene costruita in una cellula la catena di aminoacidi di una proteina? In altre
parole, in che modo gli aminoacidi gly, ile, val, ecc. vengono legati assieme in un ben
determinato ordine a formare una data proteina? Per ora sappiamo che i geni
codificano per le proteine e che un gene è un tratto di DNA caratterizzato da una
particolare sequenza delle basi azotate A, T, C e G. In che modo questa sequenza
determina quella degli aminoacidi di una proteina?
2) IL PROCESSO DI SINTESI DELLE PROTEINE
A grandi linee, il processo di
sintesi delle proteine può
essere descritto in modo
abbastanza semplice. Per
prima cosa, un tratto di
DNA contenuto nel nucleo
della cellula si srotola e in
corrispondenza di esso i due
filamenti della doppia elica
si separano; a questo punto,
il messaggio che esso
contiene (costituito dalla
sequenza di basi azotate
presente su uno dei due
filamenti) viene copiato su
una
molecola
di
RNA
messaggero (mRNA).
Questa molecola (paragonabile a un pezzo di nastro
magnetico su cui sono
copiate
le
informazioni
contenute in un tratto di
“nastro master” di DNA)
fuoriesce poi dal nucleo
della cellula (Figura 6.2).
La destinazione del “nastro” di mRNA è un ribosoma, un corpicciolo presente nel
citoplasma che può essere considerato come un “banco di lavoro” molecolare: è infatti
in esso che le istruzioni (il “nastro” di mRNA) e le materie prime (gli aminoacidi) si
incontrano e danno come risultato la formazione del prodotto (una proteina).
A mano a mano che il “nastro” di mRNA viene “letto” nel ribosoma, gli aminoacidi
vengono legati l’uno dopo l’altro nell’ordine indicato dall’mRNA a formare una catena
polipeptidica, che si va via via allungando. Quando la costruzione di questa è terminata,
essa si stacca dal ribosoma e si ripiega su se stessa formando una proteina. Ma come
arrivano gli aminoacidi al ribosoma? Vi sono trasportati da un secondo tipo di RNA,
l’RNA di trasporto (tRNA).
La prima parte di questo processo (quella in cui le istruzioni del DNA vengono copiate
nell’mRNA) è detta trascrizione; la seconda parte (quella in cui, in base alle istruzioni
contenute nell’mRNA, viene fabbricata la catena polipeptidica) è detta traduzione.
Trascrizione e traduzione sono i due stadi fondamentali del processo di sintesi delle
proteine.
Un gene determina la sequenza di amminoacidi di un particolare polipeptide,
responsabile di un carattere ereditario
Un organismo è la manifestazione di una particolare combinazione di proteine, ognuna
formata da una o più catene polipeptidiche. Un gene codifica l’informazione per una
singola catena polipeptidica, nel senso che la sua particolare sequenza lineare di
nucleotidi determina la particolare sequenza di amminoacidi del polipeptide.
Nella conversione dell’informazione da polinucleotide a polipeptide interviene una
molecola intermediaria, l’RNA (da ribonucleic acid, acido ribonucleico). Nelle cellule,
l’informazione genetica passa dal DNA all’RNA e da questo alle proteine.
La Figura 9.6 illustra il flusso dell’informazione codificata. Per prima cosa la cellula
trascrive (copia) le istruzioni codificate di un
gene in una molecola di RNA, che passa poi nel
citoplasma, nella sede di formazione del
polipeptide (i ribosomi).
Qui le istruzioni contenute nella molecola di
RNA dirigono l’attività di sintesi, determinando quale polipeptide (quale sequenza di
amminoacidi) si forma.
Nei ribosomi varie proteine e particolari
molecole di RNA traducono infatti le
istruzioni dell’RNA nell’esatto prodotto genico
del quale è stata ordinata la costruzione.
Per comprendere questo flusso d’informazione è necessario conoscere la struttura
dell’RNA, che differisce da quella del DNA principalmente per tre caratteristiche:
I nucleotidi dell’RNA contengono il ribosio (Figura 6.3), uno zucchero che ha un
atomo di ossigeno in più rispetto allo zucchero del DNA (il desossiribosio). Si
tratta di una differenza importante, perché permette agli enzimi di distinguere i
due tipi di sostanze.
Come il DNA, anche l’RNA contiene quattro basi azotate, ma una di queste,
l’uracile, è tipica dell’RNA. L’uracile sostituisce la timina, essendo complementare
all’adenina.
Le molecole di RNA sono formate da un solo filamento, per cui le basi azotate
possono essere esposte e formare legami a idrogeno con altre molecole.
La trascrizione dei messaggi genetici nelle molecole di mRNA permette che l’informazione sia trasferita ai ribosomi
L’informazione contenuta nel DNA raggiunge i ribosomi tramite un tipo di RNA
opportunamente chiamato, vista la funzione, RNA messaggero (mRNA). Le molecole di
RNA si formano nella trascrizione, un processo che per certi versi assomiglia alla
sintesi di un nuovo filamento di DNA.
Durante la trascrizione (Figura 9.7) i due filamenti del DNA si separano temporaneamente e, su uno dei due filamenti di DNA che funge da stampo, si forma un filamento
complementare di mRNA.
Una molecola di mRNA è molto più piccola di una di DNA, dato che contiene in genere
meno di un migliaio di nucleotidi.
La RNA polimerasi, l’enzima che catalizza il processo, incorpora nella catena in via di
formazione soltanto ribunonucleotidi. Inoltre l’enzima è in grado di distinguere i due
filamenti del DNA, scegliendo il complementare a quello che codifica le corrette
sequenze amminoacidiche (filamento anticodificante). La trascrizione del filamento
codificante produrrebbe infatti RNA contenenti messaggi privi di senso.
L’informazione genetica registrata in un gene viene così trascritta in una molecola di
mRNA che, avendo una sequenza di nucleotidi complementari a quella del DNA, ne
trasporta il messaggio.
Terminata la sua sintesi, questo “messaggero” mobile abbandona lo stampo e porta
l’informazione codificata ai ribosomi, dove controlla la sintesi di uno specifico
polipeptide. Come vedremo tra breve, questo processo richiede anche l’intervento di
altri due tipi di RNA, l’RNA di trasporto e l’RNA ribosomiale.
Vi è una corrispondenza tra le triplette di nucleotidi (codoni) dei messaggi genetici e
gli amminoacidi delle proteine
Nella sintesi delle proteine, la successione lineare di nucleotidi di una molecola di
mRNA viene letta a gruppi di brevi sequenze di nucleotidi, chiamate codoni, ognuna
delle quali rappresenta una “parola molecolare”.
Ogni codone è lungo tre nucleotidi (tripletta) e specifica l’inserimento in un
determinato punto della catena polipeptidica in via di formazione di uno (e solo quello)
dei venti amminoacidi.
Il codone CAC, per esempio, determina sempre l’introduzione dell’amminoacido
istidina, il codone CUA specifica l’amminoacido leucina e così di seguito.
Il messaggio genetico viene letto codone dopo codone fino al completamento della
proteina. Con un alfabeto genetico di quattro lettere (A, G, C e U) sono possibili 64
combinazioni in triplette (4 x 4 x 4), ampiamente sufficienti per assegnare a ognuno
dei 20 amminoacidi almeno un corrispondente codone. L’ipotesi che il codice del DNA
fosse un codice di triplette, cioè che ogni amminoacido fosse specificato da una
sequenza di tre basi azotate del DNA fu avanzata per la prima volta dal biochimico
sudafricano Sydney Brenner.
L’elaborazione dell’RNA messaggero
Negli organismi eucarioti il trascritto primario, cioè il “nastro” di mRNA che si forma
dalla trascrizione, non è funzionale; prima di passare nel citoplasma, esso deve subire
una serie di modificazioni.
Dopo l’aggiunta di un “cappuccio” iniziale (che permetterà l’aggancio al ribosoma) e di
una coda di ribunonucleotidi tutti con la base azotata A, il trascritto primario viene
sottoposto a un processo che può essere paragonato al montaggio che un regista fa
del suo film.
In genere, il regista, prima unisce, nell’ordine da lui previsto, i tratti di pellicola girati
nelle varie scene; successivamente, passa a un lavoro di “taglia e cuci”, cioè,
visionando il materiale, decide quali scene includere e quali tagliare; in quest’ultimo
caso, unisce il tratto di pellicola che precede e quello che segue la scena eliminata.
Introni ed esoni
Qualcosa del genere avviene anche con l’mRNA degli eucarioti. Come mostra la Figura
6.10, speciali enzimi tagliano via dal trascritto primario certi tratti, i cosiddetti
introni, e saldano assieme le porzioni restanti: il risultato è un mRNA maturo che non
contiene più introni, ma solo esoni, come vengono chiamati i tratti del trascritto
primario che codificano per amminoacidi.
Da questo si conclude che gli introni
sono tratti non codificanti, non
contengono cioè istruzioni relative
all’assemblaggio di amminoacidi in
proteine. Perché allora il DNA li
contiene? Come si può scoprire
leggendo DNA apparentemente
“insignificante” si stanno costantemente trovando nuovi elementi che
sembrano indicare che anche queste
sequenze “inutili” hanno una loro
funzione.
La sintesi dei polipeptidi comporta la decodificazione dei codoni degli mRNA ad opera
degli RNA di trasporto
La formazione di un polipeptide secondo l’informazione contenuta nell’mRNA si chiama
traduzione e, tra i processi biosintetici che avvengono nelle cellule, è il più complesso.
Il processo di traduzione (sintesi delle proteine) richiede la presenza di mRNA,
amminoacidi, numerosi enzimi, ribosomi e di una fonte di energia chimica
rappresenta-ta da molecole di ATP (o GTP). Inoltre vi partecipa un secondo tipo di
RNA, che decodifica i codoni dell’mRNA e li traduce nel linguaggio delle proteine (gli
amminoacidi). Questo “decodificatore molecolare” si chiama RNA di trasporto
(tRNA).
Gli RNA di trasporto funzionano come qualunque apparecchio decodificatore:
riconoscono una serie di simboli e li converto in una serie corrispondente. La funzione
decodificatrice dei tRNA dipende strettamente dalla loro forma tridimensionale
(Figura 9.8).
Ad un capo della molecola vi è una sequenza di tre nucleotidi specifica per ogni tRNA,
l’anticodone, che può unirsi per complementarietà dei nucleotidi con un codone
dell’mRNA. Dalla parte opposta all’anticodone, il tRNA presenta un sito al quale si lega
uno specifico amminoacido. (Un tRNA legato covalentemente al corrispondente
amminoacido si chiama tRNA “carico”).
In tutti i tRNA i due capi opposti della molecola si trovano esattamente alla stessa
distanza. Un tRNA inserisce il suo amminoacido nella giusta posizione del polipeptide,
ogni volta che nell’mRNA compare il codone corrispondente.
Per fare un esempio, il codone UCU dell’mRNA si lega solo con l’anticodone AGA del
tRNA che trasporta l’amminoacido serina; ne consegue che, quando nella traduzione di
un mRNA si raggiunge un codone UCU, in quel punto del polipeptide in via di
formazione viene sempre introdotta la serina.
Il tRNA rappresenta quindi il collegamento tra il linguaggio dei codoni dell’mRNA e il
linguaggio degli amminoacidi.
Il codice genetico
I ricercatori impiegarono la prima metà degli anni Sessanta per decifrare tutto il
“codice genetico” e, quando il lavoro fu completato, a ogni parola molecolare (codone)
era associato il corrispondente amminoacido (Figura 9.9).
Tra gli aspetti più interessanti, emerse che il codice genetico è “universale”, cioè un
determinato codone corrisponde allo stesso amminoacido, indipendentemente dal tipo
di organismo, sia esso un batterio, un lievito, un fungo, un abete o un essere umano. In
tutti questi organismi, per esempio, il codone CAU determina sempre l’inserimento
dell’amminoacido tirosina.
Si ritiene che tutti gli organismi abbiano ereditato il codice universale da un antenato
comune, vissuto molto prima che il primo organismo eucariote facesse la comparsa
nello scenario della vita.
Il carattere universale del codice genetico comporta anche che i geni umani possano
funzionare in organismi come i batteri, e viceversa; ciò ha per noi sia conseguenze
negative sia positive.
Per esempio, proprio perché i loro geni funzionano anche nelle cellule umane, i virus –
che possono causare malattie che vanno dal comune raffreddore all’AIDS – sono in
grado di impadronirsi del “macchinario” delle cellule umane e utilizzarlo ai propri fini
(Figura 6.9); tale “macchinario” costruisce infatti proteine sia con le istruzioni del
DNA umano sia con quelle del DNA virale.
Per quanto riguarda il versante positivo, oggi, mediante le tecniche della biotecnologia,
siamo in grado di utilizzare virus e batteri per sintetizzare le più svariate molecole
biologiche come l’insulina e l’ormone della crescita umani; in questo caso, sono
determinati geni umani che vengono fatti agire in laboratorio all’interno di opportuni
microrganismi.
Dei 64 codoni, quattro richiedono particolare attenzione. Tre di essi (UGA, UAG e
UAA) non corrispondono ad alcun amminoacido e fungono da segnali di arresto, alla
conclusione della sintesi di un polipeptide (codoni di arresto o, anche, codoni non
senso). Un altro codone, AUG, che corrisponde all’amminoacido metionina, è il codone
d’inizio. AUG è sempre presente all’inizio della porzione codificante degli mRNA e dà
avvio alla sintesi proteica.
Si può notare anche che il codice genetico è ridondante, cioè un amminoacido può
essere specificato da più di una tripletta. In effetti, quasi tutti gli amminoacidi sono
codificati da più codoni dell’mRNA, che spesso differiscono tra loro per la terza
base azotata. Viceversa, ogni codone codifica per un solo amminoacido.
Ci si può fare un’idea di come gli scienziati siano riusciti a decifrare il codice genetico
leggendo l’approfondimento Come è stato decifrato il codice genetico?.
La traduzione è un processo in tre fasi che avviene sui ribosomi, veri e propri “banchi
di lavoro” molecolari
La traduzione avviene nei ribosomi, organelli formati da alcune decine di proteine
differenti e da un certo numero di molecole di RNA. Il tipo di RNA contenuto nei
ribosomi si chiama RNA ribosomiale (rRNA) ed è il terzo tipo di RNA prodotto dalle
cellule.
Mentre gli mRNA trasportano un’informazione codificata e i tRNA servono a
decodificarla, gli rRNA sono principalmente molecole strutturali, che formano
un’impalcatura alla quale si possono legare le varie proteine ribosomiali.
Queste ultime svolgono diverse funzioni: alcune servono a tenere assieme la
particella ribosomiale, mentre altre si legano agli mRNA o ai tRNA e partecipano
attivamente come enzimi alla sintesi dei polipeptidi.
I ribosomi sono componenti non specifici dell’apparato di traduzione, delle specie di
“banchi di lavoro”, sui quali può essere tradotto qualsiasi mRNA.
Un ribosoma attivo è formato da due subunità, una più grande, l’altra più piccola
(Figura 9.10). Le due subunità di un ribosoma si uniscono all’inizio della sintesi del
polipeptide, per poi separarsi quando la sintesi si conclude.
Un ribosoma attivo (formato dalle due subunità) ha un solco attraverso il quale può
scorrere la molecola di mRNA. Inoltre un ribosoma possiede due siti in cui possono
essere accolti due tRNA, in modo che i loro amminoacidi si vengano a trovare vicini
sulla subunità maggiore. Questa contiene un enzima che forma legami covalenti tra gli
amminoacidi adiacenti.
Mentre il ribosoma scorre lungo l’RNA messaggero, nuovi amminoacidi vengono
aggiunti al polipeptide in corso di formazione, nell’ordine determinato dall’mRNA.
L’energia necessaria per formare i legami tra gli aminoacidi proviene da molecole del
tipo dell’ATP.
I momenti principali del processo sono mostrati nelle Figure 6.13 e 9.11, anche se, per
maggiore chiarezza, sono stati omessi molti enzimi e alte molecole accessorie.
Nella traduzione si riconoscono tre fasi:
l’inizio;
l’allungamento della catena polipeptidica;
la conclusione del processo o terminazione.
Nella fase di inizio si forma il complesso tra mRNA, subunità minore e tRNA e il
messaggio viene posizionato correttamente
Il processo di traduzione comincia quando l’mRNA si lega alla subunità minore di un
ribosoma. Il legame avviene sempre in corrispondenza del codone d’inizio AUG ed è
seguito dall’unione del primo tRNA (il cui anticodone è UAC, complementare al codone
d’inizio). Questo tRNA trasporta la metionina, che è quindi il primo amminoacido di un
polipeptide in corso di formazione.
Il legame del codone AUG al ribosoma determina una “griglia di lettura”, assicura cioè
che la traduzione incominci dal nucleotide giusto. Se la lettura del messaggio iniziasse
uno o due nucleotidi più in là, verrebbero lette le triplette sbagliate e, di conseguenza,
gli amminoacidi incorporati nel polipeptide non sarebbero quelli richiesti.