Corso di Laurea in Chimica e Tecnologie Farmaceu6che a.a. 2014-­‐2015 Università di Catania La stru(ura del gene Stefano Forte I Geni
•  Il gene è l'unità ereditaria e funzionale degli
organismi viventi.
•  La maggior parte dei geni codifica proteine, che
sono le macromolecole maggiormente coinvolte
nei processi biochimici e metabolici della cellula.
•  Altri geni non codificano proteine, ma producono
RNA non codificante, che può giocare un ruolo
fondamentale nella sintesi delle proteine e
nell'espressione genica (La trascrizione del DNA
in RNA e la traduzione dell'RNA in proteina).
•  Parte del contenuto dei geni non viene trascritto,
ma può coordinare la stessa espressione genica.
•  Tra queste regioni figurano i promotori, i
terminatori e gli introni .
Tre classi di geni
•  I geni non sono sequenze casuali ma hanno caratteristiche ben
precise.
•  Buona parte dell'informazione contenuta in un gene viene "copiata" in
una molecola di RNA; il resto del gene è coinvolto comunque nel
processo di "copia" (trascrizione).
•  Alcuni tipi di RNA vengono utilizzati per la sintesi delle proteine, altri
svolgono svariati tipi di funzioni.
•  Esistono tre classi di geni, che differiscono in base al tipo di RNA che
viene prodotto con la loro espressione:
–  Geni della I classe
•  RNA ribosomiale (rRNA)
–  Geni della II classe
•  RNA messaggero (mRNA)
•  Piccoli RNA nucleari (snRNA)
•  Micro RNA (miRNA)
–  Geni della III classe
• 
• 
• 
• 
RNA transfer (tRNA)
Piccoli RNA nucleolari (snoRNA)
Piccoli RNA citoplasmatici (scRNA)
Micro RNA (miRNA)
L'RNA messaggero
•  Gli RNA Messaggeri (mRNA) sono gli unici
tipi di RNA codificante.
•  Sono i trascritti dei geni che codificano
proteine.
•  Trasportano l'informazione genica nel
citoplasma, dove tale informazione viene
impiegata per la sintesi delle proteine.
•  Costituiscono solo il 4% circa degli RNA
totali della cellula ed hanno vita breve, in
quanto vengono degradati poco dopo la
sintesi proteica.
I principali RNA non codificanti
•  RNA ribosomiali (rRNA)
–  Sono i più abbondanti nelle cellule
–  Sono parte integrante dei ribosomi, le
particelle dove ha luogo la sintesi proteica
•  RNA transfer (tRNA)
–  Sono piccole molecole coinvolte nella
sintesi proteica
–  Trasportano gli aminoacidi ai ribosomi in
modo tale da permettere la loro unione
nell'ordine specificato dalla sequenza
nucleotidica dell'mRNA
Altri tipi di RNA non codificante
•  Piccoli RNA nucleari (snRNA)
–  Sono coinvolti nella maturazione degli mRNA
•  Piccoli RNA nucleolari (snoRNA)
–  Svolgono un ruolo cruciale nella maturazione
delle molecole di rRNA
•  Piccoli RNA citoplasmatici (scRNA)
–  Gruppo eterogeneo che comprende molecole
con una varietà di funzioni diverse, alcune
ancora misteriose
•  microRNA (miRNA)
–  Sono piccole molecole che regolano
l'espressione genica a livello post-trascrizionale
Com'è fatto un gene?
ATGGAGGAGGACATGTACGTGGACATTTTCCTGGACCCTTATACCTTCCAGATGGAGGAGGACATGTACGTGGACATTTTCCTGGACCCTTATACCTTCCAGGATGACTTTCCTCCAGCTACGTCTCAACTAT
TCAGCCCAGGAGCGCCTTTAGATGTGCACCCACTTAATCCATCCAATCCAGAGACTGTATTTCATTCACATCTTGGTGCAGTCAAAAAGGCACCCAGTGACTTTTCATCTGTGGATCTAAGCTTCTTACCAG
ATGAACTTACCCAAGAAAATAAAGACCGAACTGTCACTGGAAACAAAGTCACAAATGAGGAAAGCTTTAGGACTCAAGATTGGCAAAGTCAGTTGCAGTTGCCTGATGAACAAGGCAGTGGGCTGAAC
TTGAATAGCAACAGTTCACCAGATACCCAGTCATGTCTGTGCTCTCATGATGCTGACTCCAACCAGCTCTCTTCAGAAACACCAAATTCCAATGCCTTACCTGTGGTATTGATATCATCCATGACACCAATGA
ACCCTGTTACAGAATGTTCTGGAATTGTGCCTCAATTACAGAATGTAGTTTCCACTGCAAATCTGGCCTGTAAATTGGATCTGAGAAAAATAGCTTTGAATGCCAAAAACACAGAATATAATCCAAAGAGGT
TTGCTGCAGTCATAATGAGGATCCGAGAGCCAAGGACCACAGCTCTTATATTTAGCTCTGGGAAAGTGGTCTGTACAGGAGCCAAAAGTGAAGACGAGTCTCGGCTGGCAGCAAGAAAGTATGCTCGCGT
GGTGCAGAAGCTGGGGTTCCCCGTCAGATTCTTCAATTTTAAAATTCAGAACATGGTTGCAAGCTGTGATGTGAAATTTCCCATCAGGCTGGAGATTTTGGCACTAACCCATCGGCAGTTCAGTAGTTATGA
GCCTGAACTGTTCCCTGGCCTTATTTATAAGATGGTGAAACCGCAGGTTGTGCTGCTCATCTTTGCATCTGGAAAGGTTGTACTGACAGGTGCCAAAGAGCGTTCTGAGATCTACGAAGCATTTGAAAACA
TGTATCCTATTCTAGAAAGTTTTAAGAAAGTCTGAATGGAGGAGGACATATACCTGGACCTCTTCCTGGATCCTTATACCATCCAGGATGACTTTCCTCCAGCTATGTCTCAACTGTTCAGCCCAGGAGTGCC
TTTAGACATGCACTCACTTCCATCTAATCCAGAGACTGTGTTTCATCCACATCTTGGTGGAGTCAAAAAGGCATCCACTGACTTTTCATCTGTGGATCTAAGCTTCTTACCAGATGAACTTACCCAAGAAAA
TAGAGACCAAACTGTCACTGGAAACAAGCTGGCAAGTGAGGAAAGCTGTAGGACTCGAGATCGACAAAGTCAGTTGCAGTTGCCCGATGAACATGGCAGTGAGCTGAACTTGAATAGCAACAGTTCAC
CAGATCCCCAGTCATGCCTGTGCTTTGATGATGCTCACTCCAACCAGCCCTCTCCAGAAACACCAAACTCCAATGCCTTACCTGTGGCATTGATAGCATCCATGATGCCAATGAACCCTGTTCCAGGATTTT
CTGGAATTGTGCCTCAATTACAGAATGTAGTTTCCACTGCAAATCTGGCCTGTAAATTGGATCTGAGAAAAATAGCCCTGAATGCCAAAAACACAGAATATAACCCAAAGAGGTTTGCTGCAGTAATAATG
AGGATCCGAGAGCCAAGGACAACAGCTCTCATCTTTAGCTCTGGGAAAGTGGTCTGTACAGGAGCCAAAAGTGAAGAGGAGTCTCGGCTGGCAGCGAGAAAGTATGCTCGTGTGGTGCAGAAGCTCGG
GTTCCCTGTCAGATTCTTCAATTTTAAAATTCAGAACATGGTTGGAAGCTGTGATGTGAAATTTCCCATCAGGCTGGAGATTTTGGCACTAACCCATCGGCAGTTCAGTAGTTATGAACCTGAACTTTTCCCC
GGCCTTATTTATAAGATGGTAAAACCACAGGTTGTGTTGCTAATCTTTGCATCTGGAAAAGTTGTGTTAACAGGTGCCAAAGAGCGTTCTGAGATCTATGAAGCATTTGAAAACATGTATCCTATTCTAGAAA
GTTTTAAGAAAGTCTGAATGGAGCAGGAGGAGACCTACCTGGAGCTCTACCTGGACCAGTGCGCCGCTCAGGATGGCCTTGCCCCACCCAGGTCTCCCCTGTTCAGCCCAGTTGTACCTTATGATATGTAC
ATACTGAATGCATCCAATCCGGATACTGCATTTAATTCGAACCCTGAAGTCAAAGAAACATCTGGTGATTTCTCATCTGTGGATCTTAGCTTCCTACCAGATGAAGTTACCCAGGAAAATAAAGACCAGCCT
GTCATTAGCAAACACGAAACTGAAGAAAATTCTGAAAGCCAAAGTCCACAAAGTAGGTTGCCATCACCCAGCGAACAGGACGTTGGGCTGGGCTTAAACAGCAGCAGTTTGTCAAATTCCCATTCACAG
CTGCACCCTGGTGATACTGACTCAGTCCAGCCCTCTCCTGAGAAACCAAACTCCGACTCCTTGTCTCTGGCATCCATAACTCCCATGACACCAATGACCCCTATTTCAGAATGTTGTGGAATTGTACCTCAA
CTACAGAATATAGTTTCCACTGTAAACCTGGCCTGTAAGTTGGATCTGAAGAAAATAGCTTTGCATGCAAAAAATGCAGAATATAACCCAAAGAGGTTTGCTGCTGTCATAATGAGGATCCGAGAGCCCAG
GACAACAGCCCTTATATTTAGCTCTGGGAAGATGGTCTGCACGGGAGCCAAAAGTGAAGAGCAGTCTCGACTTGCAGCAAGAAAATATGCTCGTGTGGTGCAGAAGCTTGGGTTCCCTGCCAGATTCCTC
GATTTTAAAATTCAGAACATGGTTGGAAGCTGTGATGTGAGATTTCCCATCAGGCTGGAAGGTTTGGTGCTAACCCATCAGCAGTTCAGTAGTTACGAGCCTGAACTGTTTCCTGGTCTTATTTATAGAATG
GTAAAACCACGAATTGTGTTGCTTATCTTTGTATCTGGAAAAGTTGTGTTGACAGGTGCCAAAGAACGTTCTGAGATCTATGAAGCATTTGAAAACATCTATCCTATTCTAAAAGGTTTTAAAAAAGCCTGA
GAAGTCCCCTGGGTAACTTCCAGGCAGCTTCATTTCTGAAGAGTCCAAACTGCAGCATAGAGGACTTATGAAAAACTGTAAAAAATTGGTTTTAAGTGTTCCATTAAACCCAAAGAAAACAGTCACACAA
CAAAGCCAGACACAGAAAATTAGGGTGACATGTTTCCTGTCATATGTGGAGCCTAGAGAACATAGAGATGATGTGAAAGCAGAAGGAGCTATCAAGAAAAAGGAAAGCAGATGGGGCAGCAGATCCATG
GGAATACTGGCAGAACTGTATAATGGAAGAATGTCGTATGCACATATGAACATGTCATAATGAAACCTAGTATTTTGTACAGTTAATATGGACTAGACAATAGCACAAAGAAATTAGAGATTAGTCTAGCTAT
ATGAAGAGGCTACATCAAAGATCACTCCTTTTTGATGGACAAATTTAATTCCTTATAACTGTAGAGCTGAGATATTCACTTGCTTGTCAGACATTAAATGTATCCCACTCTTAGGGTCTAGAAGTTACCCAGA
CTTCTTGTACCATGGTCCCATCTATCTTCAAAGTCAGCAGTGACGACTCTGCCTTATGACAAGGTCATCTCCTGCTTTCAAATCCCTCCCAAAGAGTGGCCAATTCCTCCTTGGCTGCTCAGTCAGTAAGGG
CAGGCTTGGATCCTTTCCCTTTCCTAACAATGGACTTGGAATTTTAATTACATCTTCAAAACCCAAGAGCATTTGGTTTTTTTTAGATAACTGGGAGATACATTTGGAGATAGGGATTTGGGGAGCCACCGAA
ACATTCTACCTACCATAGGAAATAGTTATAAATCTATTTTACTGGCTGGAGAGATGGCCAAGCAGTTAAGAATACTTTCTGCTTTTTCAAAGGATAGAAATTCTGTTCCTAGCACCCACACTGGGCTTCTTAG
TGATTCCAACTCTACAGGACCTGATGCCTCCTTCTCTCTGGCTTCCTTAGATACCAGTTTGTACTGGCACATGCATATGCACAGGAGAAGGCTCTCTCTCTCTCTCTCCCCCCCCCCCCTCTCTCTCTCTCAC
ACACACACACAAGATGGTGAGATATAATTAATAAAATAAAGTAAAATTTGGATCTGTTTTAGTCAGTTTGGGATGCCATAATAAAACACCACAAACTGGGCAGTTTAAACCACAGAAATTTCCTTCATAGTT
CTGAAGGCTGGAGATCTAAGATCAAGGTCCCTGCAGATTTGGTCTCTCCTGTAGCAATCCTCCATCTTTCCTTTTAGGTAGCTGCCTTAATGTTGCTCTTTTTACAGCTTTTTCTTTGTATTTCTATGAAAACA
TCAGACATATTGGATTGGGGCTTCTACACATGATCTTCATGGGATAAGCAATAACCATAGTTACTGATCTGTGAGGCTGGTTCTGAGTGTGCAGCTCAGTAGGCTGTCTCATTTACAGACACTATGACATTAC
ATCACACATCACTATATAAATCCCAGATTTTTCAAAAGGATCCCCCTATTTTTATTGGAATGTCTGACTCTAGTGCAGGTTATCCAAGCTCCATTCTCAGGTTCGTTTTATCCACCAAGACTGAGCAGATGAGC
TGGGCACAGAGACATGATGATGAATAATTTAAATTGTTCCTTTTAAACAGTAGAATCAAGTAAGGAAGATTTAAAAATACATTTTGCAATCTCTTACATCAAAGTGTCTTCTTCTAGAACAGTTCAATACAGT
TAAGCTAAGACATTTGAATTAAAGCGTTTAAGAAAGAAAAGCTTCTCTGGATATTTGGTTTTACATTAACTTCTTGAGTTGTCTGAACCCTAACTGTGGAATTTGCACAGCTGTAGGCAAATTCTCTGTAATA
GGTGAAAATCTACCTGGGGTGTGAAGGTGAAGAATAATTACAGAAATATCACATCTGAATAGATGAGGGGATTCAGCGGGCAAGGGTGCTTGCCACCAAGCCTGACACTCTGGGTTTGATCCTTGTGTTTC
TTCCAGAGCTGGAAGGAGAGAACCTACTCCTGAAAATTGTCTTCTGACCATAACATGAGCTCTGCACTGTGCATGTGTCCATGCACACATGCCAATGAAGATAAATCAATATTAGAAATATCACATCTAAGA
ATCTGGGTATGGTGATGCTCATGCATGTTGTAACCCCAGAACTTAGGAGCTGGAGGATATACAAGTTTGTGGCTAGCCTGGACTACATGAGAAGAGAAGGGGGAAGGGAAAGAGAAGGAAAAGAAGAAA
AGAAAAGGAAAAGGATAAGGATAAAGGCAGAAGAGAAAAGCATTCTTTTCTCACTTGCACAATGAGAAAACCTTATCATGCTACTCTACTGGAAGCACTAGTCTCGGCCCTCCTCTTCTTCTGGGTGCCA
CCAGCTGTGTCTTGCCTGGCTCATCAACTCCTTCTCTGCTTCTCACCTGACTCCTCAGCTCATTCACAGCATCTGTGCAAGGCAGCAGAGCTGGTCCCGCCTCACTGCGTGCTCCCTGAGGCTGATAAAAG
GTATCTGCTCCCACAGCCAGACTGGTACTAACAAAGCTTCTTCCACTTGCCTGGACGCTGATTCCTTTGCTTGTCCTCAGCTCTACGATGACTTTCCTCCAGCTATGTCTCAACTGTTCAGCCCAGGAGTGC
CTTTAGACATGCACTCACTTCCATCTAATCCAGG
Struttura dei Geni eucariotici
codificanti
•  I geni codificanti sono quelli che vengono
trascritti in mRNA.
•  Contengono una parte realmente
codificante, che specifica la sequenza degli
aminoacidi che costituiranno la proteina, ed
una parte non codificante.
•  A monte della sequenza che verrà trascritta
in mRNA vi sono le sequenze regolatrici.
•  La sequenza trascritta è costituita da due
tipi di elementi, detti esoni ed introni.
•  Solo gli esoni contengono informazioni per
la sintesi della proteina.
Struttura del gene
Sequenze regolatrici
•  Le sequenze regolatrici sono situate a monte del sito
di inizio della trascrizione.
•  Svolgono un ruolo fondamentale nell'espressione del
gene, permettendo l'avvio e la regolazione della
trascrizione.
•  Le sequenze regolatrici prossimali, cioè vicine al sito
di inizio della trascrizione, sono dette Promotori.
•  Elementi Promotori fondamentali sono il TATA box, il
CAAT box e il GC box.
•  Altri elementi regolatori distali, cioè lontani dal sito di
inizio della trascrizione, sono gli enhancers e i
silencers (i primi amplificano, i secondi reprimono la
trascrizione).
Sequenza trascritta
•  La sequenza che viene trascritta in
mRNA, contiene le informazioni
necessarie per la sintesi proteica
(regione codificante tradotta) ed
altre sotto-sequenze non tradotte.
•  La regione codificante è formata da
elementi chiamati Esoni, intervallati
da elementi non codificanti chiamati
Introni.
Com'è fatta una sequenza
codificante?
•  I geni sono sequenze nucleotidiche, sequenze
di 4 tipi diversi di caratteri: A, C, G e T.
•  I geni che codificano proteine contengono
schemi di lettura aperti, ORF (Open Reading
Frames), costituiti da una serie di triplette di
nucleotidi dette codoni.
•  L'informazione contenuta nel gene specifica la
sequenza della proteina che dovrà essere
sintetizzata, ovvero la successione degli
aminoacidi della proteina, mediante una
successione di codoni:
ATGGGACAGCAGGGATTTAATTAA
Ogni codone specifica uno ed un solo
aminoacido.
Come sono fatte le ORF?
•  Le ORF cominciano con un codone di inizio, normalmente
ATG, e finiscono con un codone di stop che può essere TAA,
TAG o TGA.
Il DNA è formato da due filamenti complementari che sono avvolti a formare
una doppia elica, conformazione a bassa energia che conferisce stabilità alla
molecola.
Le due estremità sono dette per convenzione 5’ e 3’. Le sequenze vengono lette
sempre nell’ordine 5’ -> 3’, su entrambi i filamenti.
Gli appaiamenti canonici (di Watson/Crick) sono:
A-T
G-C
5’- AGTAGAACGCCAAATCGAGCCTAGCATA – 3’
3’- TCATCTTGCGGTTTAGCTCGGATCGTAT – 5’
La sequenza di un gene si trova su uno dei due filamenti: solo uno dei due filamenti
contiene la sequenza da trascrivere.
Come sono fatte le ORF? (2)
•  Ogni sequenza di DNA ha 6 possibili schemi di
lettura, tre in una direzione e tre nella direzione
opposta sul filamento complementare:
GGT-----------------------TGG------------------------ATG-------------------------5’- ATGGTAACGCCAAATCGAGCCTAGCATA – 3’
3’- TCATCTTGCGGTTTAGCTCGGATCGTAT – 5’
------------------------TAT
----------------------GTA
--------------------CGT
•  Normalmente la ORF codificante è quella più
lunga.
I codoni
•  I codoni della ORF corretta
specificano la sequenza di aminoacidi
della proteina corrispondente.
•  Il primo codone, che è di solito ATG,
specifica sia l'inizio della traduzione
che un particolare aminoacido, la
Metionina (M).
•  I tre codoni di stop invece indicano
solo la fine della traduzione e non
codificano nessun aminoacido.
5’- GTATGAACGCCAAATCGAGCTAGCATA – 3’
Non tutti gli esoni codificano
•  Gli esoni sono normalmente codificanti, ad
eccezione di quelli alle estremità 5' e 3' del gene.
•  Tali esoni prendono il nome di UTR (UnTranslated
Introni
Region).
Esoni
•  In questo caso il 5' UTR è costituito da tutto il 1°
esone e da parte del 2° esone (regione
arancione).
•  La regione codificante è indicata in blu, inizia nel
2° esone e termina nell'ultimo esone.
•  Il 3' UTR è costituito da parte dell'ultimo esone
(regione gialla).
Il segnale di
poliadenilazione
Segnale di
poliadenilazione
Un gene… tante proteine
Promotore Alternativo
Un gene… tante proteine
Splicing Alternativo
Struttura dei geni
procariotici
•  La struttura dei geni procariotici è più semplice.
•  Spesso, nei genomi procariotici, diversi geni vengono
controllati da un'unica regione regolatrice: un tale insieme
di geni viene definito operone (Es. operone formato dai
geni A, B, C, D, E).
•  I geni dell'operone codificano determinate proteine.
•  Il promotore, a monte dei geni, è necessario all'inizio della
trascrizione.
•  L'operatore, nella sequenza regolatrice, regola l'espressione
dei geni.
Com'è fatto un promotore?
•  La funzione di un promotore non è di
essere trascritta e tradotta, ma di
farsi riconoscere dalle proteine.
•  L'informazione per la funzione del
promotore sta direttamente nella sua
sequenza, che costituisce il segnale.
•  La sequenza di un promotore non
deve necessariamente essere
contigua e lo spazio tra due elementi
distaccati può essere parte stessa del
segnale.