Corso di Laurea in Chimica e Tecnologie Farmaceu,che a.a. 2011-­‐2012 Università di Catania Il Codice Gene,co Il dogma centrale, il flusso dell’informazione genica e la decifrazione della informazione del DNA Stefano Forte Il dogma centrale e le prime ipotesi sul codice gene,co • Le funzioni del materiale gene,co – Deve potersi replicare – Deve potersi esprimere • • • • • • Come avviene l’espressione? Negli eucario, in DNA non abbandona il nucleo Il DNA lo stesso in tuJe le cellule di un organismo Il DNA rimane costante nel tempo Nel 1945 Beadle: un gene -­‐> un enzima Linearità geni e sequenze proteiche Il dogma centrale e le prime ipotesi sul codice gene,co Il flusso dell’informazione genica • L informazione genica è contenuta nel DNA • Questa informazione è perpetuata nelle generazioni future tramite il processo semiconservativo chiamato duplicazione del DNA • L espressione della informazione genica è invece un processo che passa attraverso un intermediario transitorio: l RNA messaggero. Questa molecola è sintetizzata sulla base di uno STAMPO sul DNA e l informazione in esso contenuta serve per dirigere la sintesi di proteine. • L informazione passa (quasi) sempre dal DNA all’RNA e da questo alle proteine. Mantenimento dell’informazione DNA Trasferimento dell'informazione Trascrizione Retrotrascrizione RNA Traduzione Informazione contenuta nella Informazione contenuta nella sequenza Effettuata da alcuni virus sequenza a RNA e nella quantità chiamati retrovirus Ruolo funzionale Proteina Informazione contenuta nella struttura e nella quantità Il contenuto informa,vo del DNA La struttura del DNA è costante. Il DNA è sempre una doppia elica INDIPENDENTEMENTE dalla sequenza di nucleotidi che lo compone. L ossatura di zucchero e fosfato è costante. La parte variabile, e quindi più informativa, è rappresentata dalla sequenza di BASI AZOTATE. Per questo motivo è possibile rappresentare l’informazione contenuta nel DNA con una lunga sequenza composta da un alternanza 4 caratteri che rappresentano le basi azotate del DNA. GCGGCGGCGGGCGGGTACTGGCTTCTGGGGCCAGGGGCCAGGGGCGGTGGGCGCCGGGACCGCGG AGCTGAGGAGCGGGGCCCGGCCAGGGCTGGAGACTTTGCGCCCGGGGGCACCGGGGCTGCGCGCGG TCGCACACATCCACCGGCGCGGCTTCCCTCGGCGGCCCGGGCTCCGCTCATCCTGCGGCGGGCGGCG CCGCTCAGGGGCGGGAAGAGGAGGCGGTAGACGCGACCACAGAAGATGTCGGGCCAAACGCTCACGG ATCGGATCGCCGCCGCTCAGTACAGCGTTACAGGCTCTGCTGTAGCAAGAGCGGTCTGCAAAGCCACTA CTCATGAAGTAATGGGCCCCAAGAAAAAGCACCTGGACTATTTGATCCAGGCTACCAACGAGACCAATGT TAATATTCCTCAGATGGCCGACACTCTCTTTGAGCGGGCAACAAACAGTAGCTGGGTGGTTGTGTTTAAG GCTTTAGTGACAACACATCATCTCATGGTGCATGGAAATGAGAGATTTATTCAATATTTGGCTTCTAGAAATA CACTATTCAATCTCAGCAATTTTTTGGACAAAAGTGGATCCCATGGTTATGATATGTCTACCTTCATAA Le proteine: natura ed informazione • Le proteine sono macromolecole polimeriche. I costituenti delle proteine sono gli aminoacidi. • Gli aminoacidi sono molecole caratterizzate dalla presenza di un gruppo aminico (basico) ed un gruppo acido che costituiscono la parte costante della molecola e da un residuo variabile che conferisce ad ogni aminoacido caratteristiche diverse. • Il gruppo acido di un aminoacido ed il gruppo basico dell aminoacido successivo si uniscono tra loro tramite un legame covalente forte chiamato legame peptidico. La ripetizione lineare di questi legami peptidici costituisce lo scheletro della catena polipeptidica. • I residui , che costituiscono la parte variabile, possono interagire tra loro. Residui apprtenenti ad aminoacidi distanti tra loro possono interagire tramite legami deboli portando ad un ripiegamento della catena lineare della proteina. Queste interazioni sono alla base della struttura 3d della proteina. Le proteine: natura ed informazione Gli aminoacidi Esistono 20 diversi aminoacidi che combina, tra loro cos,tuiscono tuJe le proteine contenute negli organismi viven,. Ques, aminoacidi hanno struJura chimica e proprietà diverse. Le proteine: natura ed informazione Così come già visto per le sequenze di DNA o RNA, che vengono rappresentate come stringhe composte dal susseguirsi di 4 possibili caraJeri che corrispondono ai 4 possibili nucleo,di, anche le sequenze proteiche possono essere rappresentate da stringhe. In questo caso i possibili aminoacidi sono 20 e di conseguenza anche l’alfabeto u,lizzato nelle sequenze proteiche è cos,tuito da (almeno) 20 caraJeri. HQVKVQGCWGRWRWQEFENAEGDEYAADLAQGSPATAAQNGPDVYVLPLTEVSLPMAKQPGRSVQLLKSTDVGRHSL LYLKEIGRGWFGKVFLGEVNSGISSAQVVVKELQASASVQEQMQFLEEVQPYRALKHSNLLQCLAQCAEVTPYLLVMEFC PLGDLKGYLRSCRVAESMAPDPRTLQRMACEVACGVLHLHRNNFVHSDLALRNCLLTADLTVKIGDYGLAHCKYREDYFV TADQLWVPLRWIAPELVDEVHSNLLVVDQTKSGNVWSLGVTIWELFELGTQPYPQHSDQQVLAYTVREQQLKLPKPQLQL TLSDRWYEVMQFCWLQPEQRPTAEEVHLLLSYLCAKGATEAEEEFERRWRSLRPGGGGVGPGPGAAGPMLGGVVELA AASSFPLLEQFAGDGFHADGDDVLTVTETSRGLNFEYKWEAGRGAEAFPATLSPGRTARLQELCAPDGAPPGVVPVLSA HSPSLGSEYFIRLEEAAPAAGHDPDCAGCAPSPPATADQDDDSDGSTAASLAMEPLLGHGPPVDVPWGRGDHYPRRSLA RDPLCPSRSPSPSAGPLSLAEGGAEDADWGVAAFCPAFFEDPLGTSPLGSSGAPPLPLTGEDELEEVGARRAAQRGHW RSNVSANNNSGSRCPESWDPVSAGCHAEGCPSPKQTPRASPEPGYPGEPLLGLQAASAQEPGCCPGLPHLCSAQGLA PAPCLVTPSWTETASSGGDHPQAEPKLATEAEGTTGPRLPLPSVPSPSQEGAPLPSEEASAPDAPDALPDSPTPATGGEV SAIKLASALNGSSSSPEVEAPSSEDEDTAEATSGIFTDTSSDGLQARRPDVVPAFRSLQKQVGTPDSLDSLDIPSSASDGG YEVFSPSATGPSGGQPRALDSGYDTENYESPEFVLKEAQEGCEPQAFAELASEGEGPGPETRLSTSLSGLNEKNPYRDS AYFSDLEAEAEATSGPEKKCGGDRAPGPELGLPSTGQPSEQVCLRPGVSGEAQGSGPGEVLPPLLQLEGSSPEPSTCPS GLVPEPPEPQGPAKVRPGPSPSCSQFFLLTPVPLRSEGNSSEFQGPPGLLSGPAPQKRMGGPGTPRAPLRLALPGLPAA LEGRPEEEEEDSEDSDESDEELRCYSVQEPSEDSEEEAPAVPVVVAESQSARNLRSLLKMPSLLSETFCEDL La necessità di codificare l’informazione • L informazione genica passa del DNA all’RNA. L informazione contenuta in queste molecole è simile, ed il meccanismo di trasmissione dell’informazione (la complementarietà delle basi) permette di copiare l informazione del DNA sull’RNA utilizzando lo stesso alfabeto (con l eccezione dell’utilizzo dell’U al posto della T) AATGTATTC TTACATAAG • • AAUGUAUUC TTACATAAG Nel passaggio da RNA a proteina il tipo di informazione cambia notevolmente. Si deve passare da un alfabeto chimico basato su 4 diversi nucleotidi ad un alfabeto chimico basato su 20 diverse aminoacidi. L impossibilità di mantenere una corrispondenza univoca tra nucleotide ed aminoacido impone l utilizzo di una codifica Decifrazione del codice gene,co • Quan,tà e densità di informazione • Coppie? TripleJe? Quadruple? Tuple? a. Un gruppo di tre basi codifica per un aminoacido b. Il codice non è sovrapposto c. La sequenza di basi viene leJa a par,re da un punto di inizio fisso e non c’è par,colare punteggiatura Decifrazione del codice gene,co Le mutazioni per inserzione o delezione alterano tuJa la sequenza proteica a valle per frameshi\ Decifrazione del codice gene,co Mutan, del gene RII del fago T4 oJenu, mediante traJamento con acrilammide (induzione di inserzioni o delezioni) Decifrazione del codice gene,co Decifrazione del codice gene,co Decifrazione del codice gene,co StruJura del codice gene,co e sue proprietà Il fenomeno per il quale esistono diverse triplette che codificano per lo stesso aminoacido è definito come degenerazione del codice La maggior parte degli aminoacidi è codificata da 2 o più triplette. La metionina è codificata solo dal codone AUG che rappresenta anche il codone di inizio della sintesi proteica. I codoni UGG UAA e UAG sono chiamati codoni di STOP. Ad essi con corrisponde nessun aminoacido ma rappresentano i segnali di terminazione per la sintesi proteica. La retrotraduzione? Il codice genetico Le conseguenze della degenerazione del codice • E sempre possibile passare dall informazione contenuta nei nucleotidi alla corrispondente sequenza proteica: ad ogni tripletta può essere associato uno ed un solo aminoacido. • Non è mai possibile ottenere, in modo univoco, una sequenza nucleotidica a partire dalla sequenza proteica da essa generata MEFGLKEFLLNPSTPEGKLTPQRQTNPVWYACAWA Sequenza proteica AUG GAG UUU GGA GAA UUC GGC GGG GGU La retrotraduzione non è risolvibile in maniera esatta e non può essere dai sistemi biologici. Il codice genetico Il vacillamento della terza base I CODONI CHE RAPPRESENTANO LO STESSO A.A., O A.A. CORRELATI, HANNO SEQUENZE SIMILI. SPESSO LA BASE CHE OCCUPA LA TERZA POSIZIONE DEL CODONE NON E’ SIGNIFICATIVA, COME DIMOSTRA IL FATTO CHE NEI GRUPPI DI 4 CODONI CHE RAPPRESENTANO LO STESSO A.A., SOLO LA TERZA BASE E’ DIFFERENTE.