Corso di Laurea in Chimica e Tecnologie Farmaceu6che a.a. 2014-­‐2015 Università di Catania La stru(ura del gene Stefano Forte I Geni • Il gene è l'unità ereditaria e funzionale degli organismi viventi. • La maggior parte dei geni codifica proteine, che sono le macromolecole maggiormente coinvolte nei processi biochimici e metabolici della cellula. • Altri geni non codificano proteine, ma producono RNA non codificante, che può giocare un ruolo fondamentale nella sintesi delle proteine e nell'espressione genica (La trascrizione del DNA in RNA e la traduzione dell'RNA in proteina). • Parte del contenuto dei geni non viene trascritto, ma può coordinare la stessa espressione genica. • Tra queste regioni figurano i promotori, i terminatori e gli introni . Tre classi di geni • I geni non sono sequenze casuali ma hanno caratteristiche ben precise. • Buona parte dell'informazione contenuta in un gene viene "copiata" in una molecola di RNA; il resto del gene è coinvolto comunque nel processo di "copia" (trascrizione). • Alcuni tipi di RNA vengono utilizzati per la sintesi delle proteine, altri svolgono svariati tipi di funzioni. • Esistono tre classi di geni, che differiscono in base al tipo di RNA che viene prodotto con la loro espressione: – Geni della I classe • RNA ribosomiale (rRNA) – Geni della II classe • RNA messaggero (mRNA) • Piccoli RNA nucleari (snRNA) • Micro RNA (miRNA) – Geni della III classe • • • • RNA transfer (tRNA) Piccoli RNA nucleolari (snoRNA) Piccoli RNA citoplasmatici (scRNA) Micro RNA (miRNA) L'RNA messaggero • Gli RNA Messaggeri (mRNA) sono gli unici tipi di RNA codificante. • Sono i trascritti dei geni che codificano proteine. • Trasportano l'informazione genica nel citoplasma, dove tale informazione viene impiegata per la sintesi delle proteine. • Costituiscono solo il 4% circa degli RNA totali della cellula ed hanno vita breve, in quanto vengono degradati poco dopo la sintesi proteica. I principali RNA non codificanti • RNA ribosomiali (rRNA) – Sono i più abbondanti nelle cellule – Sono parte integrante dei ribosomi, le particelle dove ha luogo la sintesi proteica • RNA transfer (tRNA) – Sono piccole molecole coinvolte nella sintesi proteica – Trasportano gli aminoacidi ai ribosomi in modo tale da permettere la loro unione nell'ordine specificato dalla sequenza nucleotidica dell'mRNA Altri tipi di RNA non codificante • Piccoli RNA nucleari (snRNA) – Sono coinvolti nella maturazione degli mRNA • Piccoli RNA nucleolari (snoRNA) – Svolgono un ruolo cruciale nella maturazione delle molecole di rRNA • Piccoli RNA citoplasmatici (scRNA) – Gruppo eterogeneo che comprende molecole con una varietà di funzioni diverse, alcune ancora misteriose • microRNA (miRNA) – Sono piccole molecole che regolano l'espressione genica a livello post-trascrizionale Com'è fatto un gene? ATGGAGGAGGACATGTACGTGGACATTTTCCTGGACCCTTATACCTTCCAGATGGAGGAGGACATGTACGTGGACATTTTCCTGGACCCTTATACCTTCCAGGATGACTTTCCTCCAGCTACGTCTCAACTAT TCAGCCCAGGAGCGCCTTTAGATGTGCACCCACTTAATCCATCCAATCCAGAGACTGTATTTCATTCACATCTTGGTGCAGTCAAAAAGGCACCCAGTGACTTTTCATCTGTGGATCTAAGCTTCTTACCAG ATGAACTTACCCAAGAAAATAAAGACCGAACTGTCACTGGAAACAAAGTCACAAATGAGGAAAGCTTTAGGACTCAAGATTGGCAAAGTCAGTTGCAGTTGCCTGATGAACAAGGCAGTGGGCTGAAC TTGAATAGCAACAGTTCACCAGATACCCAGTCATGTCTGTGCTCTCATGATGCTGACTCCAACCAGCTCTCTTCAGAAACACCAAATTCCAATGCCTTACCTGTGGTATTGATATCATCCATGACACCAATGA ACCCTGTTACAGAATGTTCTGGAATTGTGCCTCAATTACAGAATGTAGTTTCCACTGCAAATCTGGCCTGTAAATTGGATCTGAGAAAAATAGCTTTGAATGCCAAAAACACAGAATATAATCCAAAGAGGT TTGCTGCAGTCATAATGAGGATCCGAGAGCCAAGGACCACAGCTCTTATATTTAGCTCTGGGAAAGTGGTCTGTACAGGAGCCAAAAGTGAAGACGAGTCTCGGCTGGCAGCAAGAAAGTATGCTCGCGT GGTGCAGAAGCTGGGGTTCCCCGTCAGATTCTTCAATTTTAAAATTCAGAACATGGTTGCAAGCTGTGATGTGAAATTTCCCATCAGGCTGGAGATTTTGGCACTAACCCATCGGCAGTTCAGTAGTTATGA GCCTGAACTGTTCCCTGGCCTTATTTATAAGATGGTGAAACCGCAGGTTGTGCTGCTCATCTTTGCATCTGGAAAGGTTGTACTGACAGGTGCCAAAGAGCGTTCTGAGATCTACGAAGCATTTGAAAACA TGTATCCTATTCTAGAAAGTTTTAAGAAAGTCTGAATGGAGGAGGACATATACCTGGACCTCTTCCTGGATCCTTATACCATCCAGGATGACTTTCCTCCAGCTATGTCTCAACTGTTCAGCCCAGGAGTGCC TTTAGACATGCACTCACTTCCATCTAATCCAGAGACTGTGTTTCATCCACATCTTGGTGGAGTCAAAAAGGCATCCACTGACTTTTCATCTGTGGATCTAAGCTTCTTACCAGATGAACTTACCCAAGAAAA TAGAGACCAAACTGTCACTGGAAACAAGCTGGCAAGTGAGGAAAGCTGTAGGACTCGAGATCGACAAAGTCAGTTGCAGTTGCCCGATGAACATGGCAGTGAGCTGAACTTGAATAGCAACAGTTCAC CAGATCCCCAGTCATGCCTGTGCTTTGATGATGCTCACTCCAACCAGCCCTCTCCAGAAACACCAAACTCCAATGCCTTACCTGTGGCATTGATAGCATCCATGATGCCAATGAACCCTGTTCCAGGATTTT CTGGAATTGTGCCTCAATTACAGAATGTAGTTTCCACTGCAAATCTGGCCTGTAAATTGGATCTGAGAAAAATAGCCCTGAATGCCAAAAACACAGAATATAACCCAAAGAGGTTTGCTGCAGTAATAATG AGGATCCGAGAGCCAAGGACAACAGCTCTCATCTTTAGCTCTGGGAAAGTGGTCTGTACAGGAGCCAAAAGTGAAGAGGAGTCTCGGCTGGCAGCGAGAAAGTATGCTCGTGTGGTGCAGAAGCTCGG GTTCCCTGTCAGATTCTTCAATTTTAAAATTCAGAACATGGTTGGAAGCTGTGATGTGAAATTTCCCATCAGGCTGGAGATTTTGGCACTAACCCATCGGCAGTTCAGTAGTTATGAACCTGAACTTTTCCCC GGCCTTATTTATAAGATGGTAAAACCACAGGTTGTGTTGCTAATCTTTGCATCTGGAAAAGTTGTGTTAACAGGTGCCAAAGAGCGTTCTGAGATCTATGAAGCATTTGAAAACATGTATCCTATTCTAGAAA GTTTTAAGAAAGTCTGAATGGAGCAGGAGGAGACCTACCTGGAGCTCTACCTGGACCAGTGCGCCGCTCAGGATGGCCTTGCCCCACCCAGGTCTCCCCTGTTCAGCCCAGTTGTACCTTATGATATGTAC ATACTGAATGCATCCAATCCGGATACTGCATTTAATTCGAACCCTGAAGTCAAAGAAACATCTGGTGATTTCTCATCTGTGGATCTTAGCTTCCTACCAGATGAAGTTACCCAGGAAAATAAAGACCAGCCT GTCATTAGCAAACACGAAACTGAAGAAAATTCTGAAAGCCAAAGTCCACAAAGTAGGTTGCCATCACCCAGCGAACAGGACGTTGGGCTGGGCTTAAACAGCAGCAGTTTGTCAAATTCCCATTCACAG CTGCACCCTGGTGATACTGACTCAGTCCAGCCCTCTCCTGAGAAACCAAACTCCGACTCCTTGTCTCTGGCATCCATAACTCCCATGACACCAATGACCCCTATTTCAGAATGTTGTGGAATTGTACCTCAA CTACAGAATATAGTTTCCACTGTAAACCTGGCCTGTAAGTTGGATCTGAAGAAAATAGCTTTGCATGCAAAAAATGCAGAATATAACCCAAAGAGGTTTGCTGCTGTCATAATGAGGATCCGAGAGCCCAG GACAACAGCCCTTATATTTAGCTCTGGGAAGATGGTCTGCACGGGAGCCAAAAGTGAAGAGCAGTCTCGACTTGCAGCAAGAAAATATGCTCGTGTGGTGCAGAAGCTTGGGTTCCCTGCCAGATTCCTC GATTTTAAAATTCAGAACATGGTTGGAAGCTGTGATGTGAGATTTCCCATCAGGCTGGAAGGTTTGGTGCTAACCCATCAGCAGTTCAGTAGTTACGAGCCTGAACTGTTTCCTGGTCTTATTTATAGAATG GTAAAACCACGAATTGTGTTGCTTATCTTTGTATCTGGAAAAGTTGTGTTGACAGGTGCCAAAGAACGTTCTGAGATCTATGAAGCATTTGAAAACATCTATCCTATTCTAAAAGGTTTTAAAAAAGCCTGA GAAGTCCCCTGGGTAACTTCCAGGCAGCTTCATTTCTGAAGAGTCCAAACTGCAGCATAGAGGACTTATGAAAAACTGTAAAAAATTGGTTTTAAGTGTTCCATTAAACCCAAAGAAAACAGTCACACAA CAAAGCCAGACACAGAAAATTAGGGTGACATGTTTCCTGTCATATGTGGAGCCTAGAGAACATAGAGATGATGTGAAAGCAGAAGGAGCTATCAAGAAAAAGGAAAGCAGATGGGGCAGCAGATCCATG GGAATACTGGCAGAACTGTATAATGGAAGAATGTCGTATGCACATATGAACATGTCATAATGAAACCTAGTATTTTGTACAGTTAATATGGACTAGACAATAGCACAAAGAAATTAGAGATTAGTCTAGCTAT ATGAAGAGGCTACATCAAAGATCACTCCTTTTTGATGGACAAATTTAATTCCTTATAACTGTAGAGCTGAGATATTCACTTGCTTGTCAGACATTAAATGTATCCCACTCTTAGGGTCTAGAAGTTACCCAGA CTTCTTGTACCATGGTCCCATCTATCTTCAAAGTCAGCAGTGACGACTCTGCCTTATGACAAGGTCATCTCCTGCTTTCAAATCCCTCCCAAAGAGTGGCCAATTCCTCCTTGGCTGCTCAGTCAGTAAGGG CAGGCTTGGATCCTTTCCCTTTCCTAACAATGGACTTGGAATTTTAATTACATCTTCAAAACCCAAGAGCATTTGGTTTTTTTTAGATAACTGGGAGATACATTTGGAGATAGGGATTTGGGGAGCCACCGAA ACATTCTACCTACCATAGGAAATAGTTATAAATCTATTTTACTGGCTGGAGAGATGGCCAAGCAGTTAAGAATACTTTCTGCTTTTTCAAAGGATAGAAATTCTGTTCCTAGCACCCACACTGGGCTTCTTAG TGATTCCAACTCTACAGGACCTGATGCCTCCTTCTCTCTGGCTTCCTTAGATACCAGTTTGTACTGGCACATGCATATGCACAGGAGAAGGCTCTCTCTCTCTCTCTCCCCCCCCCCCCTCTCTCTCTCTCAC ACACACACACAAGATGGTGAGATATAATTAATAAAATAAAGTAAAATTTGGATCTGTTTTAGTCAGTTTGGGATGCCATAATAAAACACCACAAACTGGGCAGTTTAAACCACAGAAATTTCCTTCATAGTT CTGAAGGCTGGAGATCTAAGATCAAGGTCCCTGCAGATTTGGTCTCTCCTGTAGCAATCCTCCATCTTTCCTTTTAGGTAGCTGCCTTAATGTTGCTCTTTTTACAGCTTTTTCTTTGTATTTCTATGAAAACA TCAGACATATTGGATTGGGGCTTCTACACATGATCTTCATGGGATAAGCAATAACCATAGTTACTGATCTGTGAGGCTGGTTCTGAGTGTGCAGCTCAGTAGGCTGTCTCATTTACAGACACTATGACATTAC ATCACACATCACTATATAAATCCCAGATTTTTCAAAAGGATCCCCCTATTTTTATTGGAATGTCTGACTCTAGTGCAGGTTATCCAAGCTCCATTCTCAGGTTCGTTTTATCCACCAAGACTGAGCAGATGAGC TGGGCACAGAGACATGATGATGAATAATTTAAATTGTTCCTTTTAAACAGTAGAATCAAGTAAGGAAGATTTAAAAATACATTTTGCAATCTCTTACATCAAAGTGTCTTCTTCTAGAACAGTTCAATACAGT TAAGCTAAGACATTTGAATTAAAGCGTTTAAGAAAGAAAAGCTTCTCTGGATATTTGGTTTTACATTAACTTCTTGAGTTGTCTGAACCCTAACTGTGGAATTTGCACAGCTGTAGGCAAATTCTCTGTAATA GGTGAAAATCTACCTGGGGTGTGAAGGTGAAGAATAATTACAGAAATATCACATCTGAATAGATGAGGGGATTCAGCGGGCAAGGGTGCTTGCCACCAAGCCTGACACTCTGGGTTTGATCCTTGTGTTTC TTCCAGAGCTGGAAGGAGAGAACCTACTCCTGAAAATTGTCTTCTGACCATAACATGAGCTCTGCACTGTGCATGTGTCCATGCACACATGCCAATGAAGATAAATCAATATTAGAAATATCACATCTAAGA ATCTGGGTATGGTGATGCTCATGCATGTTGTAACCCCAGAACTTAGGAGCTGGAGGATATACAAGTTTGTGGCTAGCCTGGACTACATGAGAAGAGAAGGGGGAAGGGAAAGAGAAGGAAAAGAAGAAA AGAAAAGGAAAAGGATAAGGATAAAGGCAGAAGAGAAAAGCATTCTTTTCTCACTTGCACAATGAGAAAACCTTATCATGCTACTCTACTGGAAGCACTAGTCTCGGCCCTCCTCTTCTTCTGGGTGCCA CCAGCTGTGTCTTGCCTGGCTCATCAACTCCTTCTCTGCTTCTCACCTGACTCCTCAGCTCATTCACAGCATCTGTGCAAGGCAGCAGAGCTGGTCCCGCCTCACTGCGTGCTCCCTGAGGCTGATAAAAG GTATCTGCTCCCACAGCCAGACTGGTACTAACAAAGCTTCTTCCACTTGCCTGGACGCTGATTCCTTTGCTTGTCCTCAGCTCTACGATGACTTTCCTCCAGCTATGTCTCAACTGTTCAGCCCAGGAGTGC CTTTAGACATGCACTCACTTCCATCTAATCCAGG Struttura dei Geni eucariotici codificanti • I geni codificanti sono quelli che vengono trascritti in mRNA. • Contengono una parte realmente codificante, che specifica la sequenza degli aminoacidi che costituiranno la proteina, ed una parte non codificante. • A monte della sequenza che verrà trascritta in mRNA vi sono le sequenze regolatrici. • La sequenza trascritta è costituita da due tipi di elementi, detti esoni ed introni. • Solo gli esoni contengono informazioni per la sintesi della proteina. Struttura del gene Sequenze regolatrici • Le sequenze regolatrici sono situate a monte del sito di inizio della trascrizione. • Svolgono un ruolo fondamentale nell'espressione del gene, permettendo l'avvio e la regolazione della trascrizione. • Le sequenze regolatrici prossimali, cioè vicine al sito di inizio della trascrizione, sono dette Promotori. • Elementi Promotori fondamentali sono il TATA box, il CAAT box e il GC box. • Altri elementi regolatori distali, cioè lontani dal sito di inizio della trascrizione, sono gli enhancers e i silencers (i primi amplificano, i secondi reprimono la trascrizione). Sequenza trascritta • La sequenza che viene trascritta in mRNA, contiene le informazioni necessarie per la sintesi proteica (regione codificante tradotta) ed altre sotto-sequenze non tradotte. • La regione codificante è formata da elementi chiamati Esoni, intervallati da elementi non codificanti chiamati Introni. Com'è fatta una sequenza codificante? • I geni sono sequenze nucleotidiche, sequenze di 4 tipi diversi di caratteri: A, C, G e T. • I geni che codificano proteine contengono schemi di lettura aperti, ORF (Open Reading Frames), costituiti da una serie di triplette di nucleotidi dette codoni. • L'informazione contenuta nel gene specifica la sequenza della proteina che dovrà essere sintetizzata, ovvero la successione degli aminoacidi della proteina, mediante una successione di codoni: ATGGGACAGCAGGGATTTAATTAA Ogni codone specifica uno ed un solo aminoacido. Come sono fatte le ORF? • Le ORF cominciano con un codone di inizio, normalmente ATG, e finiscono con un codone di stop che può essere TAA, TAG o TGA. Il DNA è formato da due filamenti complementari che sono avvolti a formare una doppia elica, conformazione a bassa energia che conferisce stabilità alla molecola. Le due estremità sono dette per convenzione 5’ e 3’. Le sequenze vengono lette sempre nell’ordine 5’ -> 3’, su entrambi i filamenti. Gli appaiamenti canonici (di Watson/Crick) sono: A-T G-C 5’- AGTAGAACGCCAAATCGAGCCTAGCATA – 3’ 3’- TCATCTTGCGGTTTAGCTCGGATCGTAT – 5’ La sequenza di un gene si trova su uno dei due filamenti: solo uno dei due filamenti contiene la sequenza da trascrivere. Come sono fatte le ORF? (2) • Ogni sequenza di DNA ha 6 possibili schemi di lettura, tre in una direzione e tre nella direzione opposta sul filamento complementare: GGT-----------------------TGG------------------------ATG-------------------------5’- ATGGTAACGCCAAATCGAGCCTAGCATA – 3’ 3’- TCATCTTGCGGTTTAGCTCGGATCGTAT – 5’ ------------------------TAT ----------------------GTA --------------------CGT • Normalmente la ORF codificante è quella più lunga. I codoni • I codoni della ORF corretta specificano la sequenza di aminoacidi della proteina corrispondente. • Il primo codone, che è di solito ATG, specifica sia l'inizio della traduzione che un particolare aminoacido, la Metionina (M). • I tre codoni di stop invece indicano solo la fine della traduzione e non codificano nessun aminoacido. 5’- GTATGAACGCCAAATCGAGCTAGCATA – 3’ Non tutti gli esoni codificano • Gli esoni sono normalmente codificanti, ad eccezione di quelli alle estremità 5' e 3' del gene. • Tali esoni prendono il nome di UTR (UnTranslated Introni Region). Esoni • In questo caso il 5' UTR è costituito da tutto il 1° esone e da parte del 2° esone (regione arancione). • La regione codificante è indicata in blu, inizia nel 2° esone e termina nell'ultimo esone. • Il 3' UTR è costituito da parte dell'ultimo esone (regione gialla). Il segnale di poliadenilazione Segnale di poliadenilazione Un gene… tante proteine Promotore Alternativo Un gene… tante proteine Splicing Alternativo Struttura dei geni procariotici • La struttura dei geni procariotici è più semplice. • Spesso, nei genomi procariotici, diversi geni vengono controllati da un'unica regione regolatrice: un tale insieme di geni viene definito operone (Es. operone formato dai geni A, B, C, D, E). • I geni dell'operone codificano determinate proteine. • Il promotore, a monte dei geni, è necessario all'inizio della trascrizione. • L'operatore, nella sequenza regolatrice, regola l'espressione dei geni. Com'è fatto un promotore? • La funzione di un promotore non è di essere trascritta e tradotta, ma di farsi riconoscere dalle proteine. • L'informazione per la funzione del promotore sta direttamente nella sua sequenza, che costituisce il segnale. • La sequenza di un promotore non deve necessariamente essere contigua e lo spazio tra due elementi distaccati può essere parte stessa del segnale.