pdf - La doppia elica del DNA 50 anni dopo

il codice genetico
UUU
UUC
UUA
UUG
FENILANINA
LEUCINA
CUU
CUC
CUA
CUG
LEUCINA
UCU
UCC
UCA
UCG
SERINA
CCU
CCC
CCA
CCG
PROLINA
UAU
UAC
UAA
UAG
CAU
CAC
CAA
CAG
TIROSINA
STOP
ISTIDINA
GLUTAMMINA
UGU
UGC
UGA
UGG
CUU
CUC
CUA
CUG
codice e messaggi
CISTEINA
STOP
TRIPTOFANO
e
ARGININA
1
2
3
4
1. M. Nirenberg 2. Geni interrotti e processamento dell’RNA messaggero 3. Sidney Brenner
4. Il nematode Cenorabitis elegans, uno dei più importanti organismi modello della biologia moderna
perchè si può seguire il destino di ogni singola cellula durante lo sviluppo.
AUU
AUC
AUA
AUG
ISOLEUCINA
METIONINA
GUU
GUC
GUA
GUG
e1
VALINA
ACU
ACC
ACA
ACG
GCU
GCC
GCA
GCG
TREONINA
ALANINA
AAU
AAC
AAA
AAG
GAU
GAC
GAA
GAG
ASPARAGINA
LISINA
ASPARAGINA
A. GLUTAMICO
AGU
AGC
AGA
AGG
GGU
GGC
GGA
GGG
SERINA
definire un gene
ARGININA
Un gene è un tratto di DNA che in molti casi “codifica” (contiene le istruzioni)
per specificare la sequenza degli amminoacidi in una proteina. Un gene è fatto
di DNA. La sequenza che forma un gene può trovarsi su una qualsiasi dei due
filamenti che costituiscono la doppia elica.
GLICINA
La dimensione di un gene è molto variabile, da meno di un migliaio a centinaia
di migliaia di nucleotidi. Non tutta l’informazione contenuta in un gene prende
parte attiva alla sintesi delle proteine. In aggiunta alle zone codificanti, il gene
contiene anche alcune zone non codificanti.
che cos’è il codice genetico?
e2
Una “parola” scritta in “codice genetico” è composta da tre lettere (ACG,
GAA, …) dette triplette o codoni. Il “vocabolario genetico” comprende quindi 64
parole (4x4x4=64). Queste parole vengono tradotte in aminoacidi, e visto che
di aminoacidi ce ne sono solo 20 il codice è sovrabbondante o “degenerato”:
uno stesso aminoacido è rappresentato da più triplette (GAA e GAG vogliono
dire la stessa parola, lo stesso aminoacido).
Alcune triplette rappresentano un codice di “fine lettura”, o “stop”.
Il codice è stato decifrato da Marshal Niremberg usando stringhe di DNA
sintetiche. In seguito, a ogni aminoacido è stato associata la tripletta
corrispondente.
Come fa il linguaggio del DNA a essere tradotto nel linguaggio
delle proteine? Il tramite tra questi due sistemi di informazione
è L’RNA transfer (tRNA), il quale con una estremità può
appaiarsi alle triplette corrispondenti del messaggero e
con l’altra estremità trasporta l’aminoacido corrispondente.
Gli aminoacidi vengono, quindi allineati in accordo con
il linguaggio del DNA
organismo
Micoplasma genitalium
Saccaromyces cerevisiae
Arabidopsis thaliana
Caenorhabditis elegans
Batterio influenzale
Drosophila melanogaster
Neisseria meningitdis
Homo sapiens
numero di geni nel genoma
517
6,275
~ 20,000
19,099
1,743
13,601
2,158
~ 30,000
quanti sono i geni?
L'analisi delle sequenze dei vari genomi consente di stimare il numero
dei geni dei vari organismi. Nell'uomo è dell’ordine di 35.000 -40.000.
L'uomo ha circa solo il doppio dei geni del verme nematode
Caenorhabditis elegans (19.000) o del moscerino della frutta
Drosophila melanogaster (14.000). Il livello di complessità di
un organismo non dipende in modo lineare dal numero di geni.
Il numero di geni in una specie non dipende dalla dimensione del
genoma. Alcuni animali ritenuti semplici hanno dimensioni del genoma
molto grandi. Organismi ritenuti simili hanno genomi di dimensioni molto
diverse. Tali differenze sono dovute a sequenze di DNA ripetute molte
volte e che non codificano per alcuna proteina.
La percentuale di DNA ripetitivo varia dal 15% nel genoma dei batteri
sino al 70% in Caenorhabditis elegans e 95% nell'uomo.
I genomi degli organismi eucarioti contengono
geni interrotti
Sequenze chiamate “esoni” si alternano con gli “introni”, sequenze
che in generale non codificano per alcuna proteina. L’insieme degli
esoni di un gene rappresenta il suo RNA messaggero maturo.
Gli introni vengono rimossi dall’RNA con un complesso meccanismo
chiamato “splicing”.