il codice genetico UUU UUC UUA UUG FENILANINA LEUCINA CUU CUC CUA CUG LEUCINA UCU UCC UCA UCG SERINA CCU CCC CCA CCG PROLINA UAU UAC UAA UAG CAU CAC CAA CAG TIROSINA STOP ISTIDINA GLUTAMMINA UGU UGC UGA UGG CUU CUC CUA CUG codice e messaggi CISTEINA STOP TRIPTOFANO e ARGININA 1 2 3 4 1. M. Nirenberg 2. Geni interrotti e processamento dell’RNA messaggero 3. Sidney Brenner 4. Il nematode Cenorabitis elegans, uno dei più importanti organismi modello della biologia moderna perchè si può seguire il destino di ogni singola cellula durante lo sviluppo. AUU AUC AUA AUG ISOLEUCINA METIONINA GUU GUC GUA GUG e1 VALINA ACU ACC ACA ACG GCU GCC GCA GCG TREONINA ALANINA AAU AAC AAA AAG GAU GAC GAA GAG ASPARAGINA LISINA ASPARAGINA A. GLUTAMICO AGU AGC AGA AGG GGU GGC GGA GGG SERINA definire un gene ARGININA Un gene è un tratto di DNA che in molti casi “codifica” (contiene le istruzioni) per specificare la sequenza degli amminoacidi in una proteina. Un gene è fatto di DNA. La sequenza che forma un gene può trovarsi su una qualsiasi dei due filamenti che costituiscono la doppia elica. GLICINA La dimensione di un gene è molto variabile, da meno di un migliaio a centinaia di migliaia di nucleotidi. Non tutta l’informazione contenuta in un gene prende parte attiva alla sintesi delle proteine. In aggiunta alle zone codificanti, il gene contiene anche alcune zone non codificanti. che cos’è il codice genetico? e2 Una “parola” scritta in “codice genetico” è composta da tre lettere (ACG, GAA, …) dette triplette o codoni. Il “vocabolario genetico” comprende quindi 64 parole (4x4x4=64). Queste parole vengono tradotte in aminoacidi, e visto che di aminoacidi ce ne sono solo 20 il codice è sovrabbondante o “degenerato”: uno stesso aminoacido è rappresentato da più triplette (GAA e GAG vogliono dire la stessa parola, lo stesso aminoacido). Alcune triplette rappresentano un codice di “fine lettura”, o “stop”. Il codice è stato decifrato da Marshal Niremberg usando stringhe di DNA sintetiche. In seguito, a ogni aminoacido è stato associata la tripletta corrispondente. Come fa il linguaggio del DNA a essere tradotto nel linguaggio delle proteine? Il tramite tra questi due sistemi di informazione è L’RNA transfer (tRNA), il quale con una estremità può appaiarsi alle triplette corrispondenti del messaggero e con l’altra estremità trasporta l’aminoacido corrispondente. Gli aminoacidi vengono, quindi allineati in accordo con il linguaggio del DNA organismo Micoplasma genitalium Saccaromyces cerevisiae Arabidopsis thaliana Caenorhabditis elegans Batterio influenzale Drosophila melanogaster Neisseria meningitdis Homo sapiens numero di geni nel genoma 517 6,275 ~ 20,000 19,099 1,743 13,601 2,158 ~ 30,000 quanti sono i geni? L'analisi delle sequenze dei vari genomi consente di stimare il numero dei geni dei vari organismi. Nell'uomo è dell’ordine di 35.000 -40.000. L'uomo ha circa solo il doppio dei geni del verme nematode Caenorhabditis elegans (19.000) o del moscerino della frutta Drosophila melanogaster (14.000). Il livello di complessità di un organismo non dipende in modo lineare dal numero di geni. Il numero di geni in una specie non dipende dalla dimensione del genoma. Alcuni animali ritenuti semplici hanno dimensioni del genoma molto grandi. Organismi ritenuti simili hanno genomi di dimensioni molto diverse. Tali differenze sono dovute a sequenze di DNA ripetute molte volte e che non codificano per alcuna proteina. La percentuale di DNA ripetitivo varia dal 15% nel genoma dei batteri sino al 70% in Caenorhabditis elegans e 95% nell'uomo. I genomi degli organismi eucarioti contengono geni interrotti Sequenze chiamate “esoni” si alternano con gli “introni”, sequenze che in generale non codificano per alcuna proteina. L’insieme degli esoni di un gene rappresenta il suo RNA messaggero maturo. Gli introni vengono rimossi dall’RNA con un complesso meccanismo chiamato “splicing”.