Corso di Laurea in Chimica e Tecnologie Farmaceu,che a.a. 2014-­‐2015 Università di Catania Il Codice Gene,co Il dogma centrale, il flusso dell’informazione genica e la decifrazione della informazione del DNA Stefano Forte Il dogma centrale e le prime ipotesi sul codice gene,co •  Le funzioni del materiale gene,co –  Deve potersi replicare –  Deve potersi esprimere • 
• 
• 
• 
• 
• 
Come avviene l’espressione? Negli eucario, in DNA non abbandona il nucleo Il DNA lo stesso in tuLe le cellule di un organismo Il DNA rimane costante nel tempo Nel 1945 Beadle: un gene -­‐> un enzima Linearità geni e sequenze proteiche Il dogma centrale e le prime ipotesi sul codice gene,co Il flusso dell’informazione genica
• L’informazione genica è contenuta nel DNA
• Questa informazione è perpetuata nelle generazioni future tramite il processo
semiconservativo chiamato duplicazione del DNA
• L’espressione della informazione genica è invece un processo che passa
attraverso un intermediario transitorio: l’RNA messaggero. Questa molecola è
sintetizzata sulla base di uno STAMPO sul DNA e l’informazione in esso contenuta
serve per dirigere la sintesi di proteine.
• L’informazione passa (quasi) sempre dal DNA all’RNA e da questo alle proteine.
Mantenimento dell’informazione
DNA
Trasferimento dell'informazione
Trascrizione
Retrotrascrizione
RNA
Traduzione
Informazione contenuta nella
Informazione contenuta nella
sequenza
Effettuata da alcuni virus sequenza
a RNA
e nella quantità
chiamati retrovirus
Ruolo funzionale
Proteina
Informazione contenuta nella
struttura e nella quantità
Il contenuto informa,vo del DNA
La struttura del DNA è costante. Il DNA è sempre una doppia elica INDIPENDENTEMENTE
dalla sequenza di nucleotidi che lo compone.
L’ossatura di zucchero e fosfato è costante.
La parte variabile, e quindi più informativa, è rappresentata dalla sequenza di BASI
AZOTATE.
Per questo motivo è possibile rappresentare l’informazione contenuta nel DNA con una lunga
sequenza composta da un alternanza 4 caratteri che rappresentano le basi azotate del DNA.
GCGGCGGCGGGCGGGTACTGGCTTCTGGGGCCAGGGGCCAGGGGCGGTGGGCGCCGGGACCGCGG
AGCTGAGGAGCGGGGCCCGGCCAGGGCTGGAGACTTTGCGCCCGGGGGCACCGGGGCTGCGCGCGG
TCGCACACATCCACCGGCGCGGCTTCCCTCGGCGGCCCGGGCTCCGCTCATCCTGCGGCGGGCGGCG
CCGCTCAGGGGCGGGAAGAGGAGGCGGTAGACGCGACCACAGAAGATGTCGGGCCAAACGCTCACGG
ATCGGATCGCCGCCGCTCAGTACAGCGTTACAGGCTCTGCTGTAGCAAGAGCGGTCTGCAAAGCCACTA
CTCATGAAGTAATGGGCCCCAAGAAAAAGCACCTGGACTATTTGATCCAGGCTACCAACGAGACCAATGT
TAATATTCCTCAGATGGCCGACACTCTCTTTGAGCGGGCAACAAACAGTAGCTGGGTGGTTGTGTTTAAG
GCTTTAGTGACAACACATCATCTCATGGTGCATGGAAATGAGAGATTTATTCAATATTTGGCTTCTAGAAATA
CACTATTCAATCTCAGCAATTTTTTGGACAAAAGTGGATCCCATGGTTATGATATGTCTACCTTCATAA
Le proteine: natura ed informazione
•  Le proteine sono macromolecole polimeriche. I costituenti delle
proteine sono gli aminoacidi.
•  Gli aminoacidi sono molecole caratterizzate dalla presenza di
un gruppo aminico (basico) ed un gruppo acido che
costituiscono la parte costante della molecola e da un
“residuo” variabile che conferisce ad ogni aminoacido
caratteristiche diverse.
•  Il gruppo acido di un aminoacido ed il gruppo basico
dell’aminoacido successivo si uniscono tra loro tramite un
legame covalente forte chiamato legame peptidico. La
ripetizione lineare di questi legami peptidici costituisce lo
“scheletro” della catena polipeptidica.
•  I “residui”, che costituiscono la parte variabile, possono
interagire tra loro. Residui apprtenenti ad aminoacidi distanti
tra loro possono interagire tramite legami deboli portando ad
un “ripiegamento” della catena lineare della proteina. Queste
interazioni sono alla base della struttura 3d della proteina.
Le proteine: natura ed informazione
Gli aminoacidi Esistono 20 diversi aminoacidi che combina, tra loro cos,tuiscono tuLe le proteine contenute negli organismi viven,. Ques, aminoacidi hanno struLura chimica e proprietà diverse. Le proteine: natura ed informazione
Così come già visto per le sequenze di DNA o RNA, che vengono rappresentate come stringhe composte dal susseguirsi di 4 possibili caraLeri che corrispondono ai 4 possibili nucleo,di, anche le sequenze proteiche possono essere rappresentate da stringhe. In questo caso i possibili aminoacidi sono 20 e di conseguenza anche l’alfabeto u,lizzato nelle sequenze proteiche è cos,tuito da (almeno) 20 caraLeri. HQVKVQGCWGRWRWQEFENAEGDEYAADLAQGSPATAAQNGPDVYVLPLTEVSLPMAKQPGRSVQLLKSTDVGRHSL
LYLKEIGRGWFGKVFLGEVNSGISSAQVVVKELQASASVQEQMQFLEEVQPYRALKHSNLLQCLAQCAEVTPYLLVMEFC
PLGDLKGYLRSCRVAESMAPDPRTLQRMACEVACGVLHLHRNNFVHSDLALRNCLLTADLTVKIGDYGLAHCKYREDYFV
TADQLWVPLRWIAPELVDEVHSNLLVVDQTKSGNVWSLGVTIWELFELGTQPYPQHSDQQVLAYTVREQQLKLPKPQLQL
TLSDRWYEVMQFCWLQPEQRPTAEEVHLLLSYLCAKGATEAEEEFERRWRSLRPGGGGVGPGPGAAGPMLGGVVELA
AASSFPLLEQFAGDGFHADGDDVLTVTETSRGLNFEYKWEAGRGAEAFPATLSPGRTARLQELCAPDGAPPGVVPVLSA
HSPSLGSEYFIRLEEAAPAAGHDPDCAGCAPSPPATADQDDDSDGSTAASLAMEPLLGHGPPVDVPWGRGDHYPRRSLA
RDPLCPSRSPSPSAGPLSLAEGGAEDADWGVAAFCPAFFEDPLGTSPLGSSGAPPLPLTGEDELEEVGARRAAQRGHW
RSNVSANNNSGSRCPESWDPVSAGCHAEGCPSPKQTPRASPEPGYPGEPLLGLQAASAQEPGCCPGLPHLCSAQGLA
PAPCLVTPSWTETASSGGDHPQAEPKLATEAEGTTGPRLPLPSVPSPSQEGAPLPSEEASAPDAPDALPDSPTPATGGEV
SAIKLASALNGSSSSPEVEAPSSEDEDTAEATSGIFTDTSSDGLQARRPDVVPAFRSLQKQVGTPDSLDSLDIPSSASDGG
YEVFSPSATGPSGGQPRALDSGYDTENYESPEFVLKEAQEGCEPQAFAELASEGEGPGPETRLSTSLSGLNEKNPYRDS
AYFSDLEAEAEATSGPEKKCGGDRAPGPELGLPSTGQPSEQVCLRPGVSGEAQGSGPGEVLPPLLQLEGSSPEPSTCPS
GLVPEPPEPQGPAKVRPGPSPSCSQFFLLTPVPLRSEGNSSEFQGPPGLLSGPAPQKRMGGPGTPRAPLRLALPGLPAA
LEGRPEEEEEDSEDSDESDEELRCYSVQEPSEDSEEEAPAVPVVVAESQSARNLRSLLKMPSLLSETFCEDL
La necessità di codificare l’informazione • 
L’informazione genica passa del DNA all’RNA. L’informazione
contenuta in queste molecole è simile, ed il meccanismo di
trasmissione dell’informazione (la complementarietà delle basi)
permette di copiare l’informazione del DNA sull’RNA utilizzando lo
stesso alfabeto (con l’eccezione dell’utilizzo dell’U al posto della T)
AATGTATTC
TTACATAAG
• 
• 
AAUGUAUUC
TTACATAAG
Nel passaggio da RNA a proteina il tipo di informazione cambia
notevolmente. Si deve passare da un alfabeto chimico basato su 4
diversi nucleotidi ad un alfabeto chimico basato su 20 diverse
aminoacidi.
L’impossibilità di mantenere una corrispondenza univoca tra
nucleotide ed aminoacido impone l’utilizzo di una codifica
Decifrazione del codice gene,co •  Quan,tà e densità di informazione •  Coppie? TripleLe? Quadruple? Tuple? a.  Un gruppo di tre basi codifica per un aminoacido b.  Il codice non è sovrapposto c.  La sequenza di basi viene leLa a par,re da un punto di inizio fisso e non c’è par,colare punteggiatura Decifrazione del codice gene,co Le mutazioni per inserzione o delezione alterano tuLa la sequenza proteica a valle per frameshi\ Decifrazione del codice gene,co Mutan, del gene RII del fago T4 oLenu, mediante traLamento con acrilammide (induzione di inserzioni o delezioni) Decifrazione del codice gene,co Decifrazione del codice gene,co Decifrazione del codice gene,co StruLura del codice gene,co e sue proprietà Il fenomeno per il quale esistono
diverse triplette che codificano
per lo stesso aminoacido è
definito come “degenerazione
del codice”
La maggior parte degli
aminoacidi è codificata da 2 o più
triplette. La metionina è
codificata solo dal codone AUG
che rappresenta anche il codone
di inizio della sintesi proteica. I
codoni UGG UAA e UAG sono
chiamati codoni di STOP. Ad essi
con corrisponde nessun
aminoacido ma rappresentano i
segnali di terminazione per la
sintesi proteica.
La retrotraduzione? Il codice genetico
Le conseguenze della degenerazione del codice
• E’ sempre possibile passare dall’informazione contenuta nei nucleotidi alla
corrispondente sequenza proteica: ad ogni tripletta può essere associato uno ed un solo
aminoacido.
• Non è mai possibile ottenere, in modo univoco, una sequenza nucleotidica a partire
dalla sequenza proteica da essa generata
MEFGLKEFLLNPSTPEGKLTPQRQTNPVWYACAWA
Sequenza proteica
AUG
GAG
UUU
GGA
GAA
UUC
GGC
GGG
GGU
La retrotraduzione non è risolvibile in
maniera esatta e non può essere dai
sistemi biologici.
Il codice genetico
Il vacillamento della terza base
I CODONI CHE RAPPRESENTANO LO STESSO A.A., O A.A.
CORRELATI, HANNO SEQUENZE SIMILI.
SPESSO LA BASE CHE OCCUPA LA TERZA POSIZIONE DEL CODONE
NON E’ SIGNIFICATIVA, COME DIMOSTRA IL FATTO CHE NEI
GRUPPI DI 4 CODONI CHE RAPPRESENTANO LO STESSO A.A., SOLO
LA TERZA BASE E’ DIFFERENTE.