Corso di Laurea in Chimica e Tecnologie Farmaceu4che a.a. 2011-­‐2012 Università di Catania Organizzazione ed evoluzione dei geni e dei genomi I Genomi Procario4ci ed Eucario4ci Stefano Forte Geni non codifican4 proteine nei genomi baGerici •  La porzione non codificante corrisponde in media a circa il 15% •  rRNA, tRNA •  sncRNA –  Funzione regolatoria, simile ai microRNA eucario4ci ma con molteplici funzioni StruGura secondaria dell’RNA •  Appaiamen( canonici •  A-­‐U •  G-­‐C •  Appaiamen( non canonici •  G-­‐U wobble sncRNA baGerici Elemen4 mobili nei genomi eucario4ci •  Chiama4 anche MGE (Mobile Gene4c Elements) trasposizione StruGura ed organizzazione dei genomi eucario4ci Paradosso del valore C Organizzazione in cromosomi •  Esiste una relazione tra valore C e numero di cromosomi? •  Esiste una relazione tra complessità e numero di cromosomi? •  S. cerevisiae 14 Mb e 16 cromosomi •  D. melanogaster 180 Mb e 4 cromosomi CaraGeris4che composizionali •  Minore variabilità del %GC •  Esiste una marcata asimmetria composizionale •  Uccelli e mammiferi hanno il genoma rappresentato da un mosaico di isocore di dimensioni superiori a 300 kpb I Geni eucariotici
•  Il gene è l'unità ereditaria e funzionale degli organismi
viventi.
•  La maggior parte dei geni codifica proteine, che sono
le macromolecole maggiormente coinvolte nei
processi biochimici e metabolici della cellula.
•  Altri geni non codificano proteine, ma producono RNA
non codificante, che può giocare un ruolo
fondamentale nella sintesi delle proteine e
nell'espressione genica (La trascrizione del DNA in
RNA e la traduzione dell'RNA in proteina).
•  Parte del contenuto dei geni non viene trascritto, ma
può coordinare la stessa espressione genica.
•  Tra queste regioni figurano i promotori, i terminatori e
gli introni .
Tre classi di geni
•  Buona parte dell'informazione contenuta in un gene viene
"copiata" in una molecola di RNA; il resto del gene è coinvolto
comunque nel processo di "copia" (trascrizione).
•  Alcuni tipi di RNA vengono utilizzati per la sintesi delle proteine,
altri svolgono svariati tipi di funzioni.
•  Esistono tre classi di geni, che differiscono in base al tipo di
RNA che viene prodotto con la loro espressione:
–  Geni della I classe
•  RNA ribosomiale (rRNA)
–  Geni della II classe
•  RNA messaggero (mRNA)
•  Piccoli RNA nucleari (snRNA)
•  Micro RNA (miRNA)
–  Geni della III classe
• 
• 
• 
• 
RNA transfer (tRNA)
Piccoli RNA nucleolari (snoRNA)
Piccoli RNA citoplasmatici (scRNA)
Micro RNA (miRNA)
L'RNA messaggero
•  Gli RNA Messaggeri (mRNA) sono gli unici
tipi di RNA codificante.
•  Sono i trascritti dei geni che codificano
proteine.
•  Trasportano l'informazione genica nel
citoplasma, dove tale informazione viene
impiegata per la sintesi delle proteine.
•  Costituiscono solo il 4% circa degli RNA
totali della cellula ed hanno vita breve, in
quanto vengono degradati poco dopo la
sintesi proteica.
Com'è fatto un gene?
ATGGAGGAGGACATGTACGTGGACATTTTCCTGGACCCTTATACCTTCCAGATGGAGGAGGACATGTACGTGGACATTTTCCTGGACCCTTATACCTTCCAGGATGACTTTCCTCCAGCTACGTCTCAACTAT
TCAGCCCAGGAGCGCCTTTAGATGTGCACCCACTTAATCCATCCAATCCAGAGACTGTATTTCATTCACATCTTGGTGCAGTCAAAAAGGCACCCAGTGACTTTTCATCTGTGGATCTAAGCTTCTTACCAG
ATGAACTTACCCAAGAAAATAAAGACCGAACTGTCACTGGAAACAAAGTCACAAATGAGGAAAGCTTTAGGACTCAAGATTGGCAAAGTCAGTTGCAGTTGCCTGATGAACAAGGCAGTGGGCTGAAC
TTGAATAGCAACAGTTCACCAGATACCCAGTCATGTCTGTGCTCTCATGATGCTGACTCCAACCAGCTCTCTTCAGAAACACCAAATTCCAATGCCTTACCTGTGGTATTGATATCATCCATGACACCAATGA
ACCCTGTTACAGAATGTTCTGGAATTGTGCCTCAATTACAGAATGTAGTTTCCACTGCAAATCTGGCCTGTAAATTGGATCTGAGAAAAATAGCTTTGAATGCCAAAAACACAGAATATAATCCAAAGAGGT
TTGCTGCAGTCATAATGAGGATCCGAGAGCCAAGGACCACAGCTCTTATATTTAGCTCTGGGAAAGTGGTCTGTACAGGAGCCAAAAGTGAAGACGAGTCTCGGCTGGCAGCAAGAAAGTATGCTCGCGT
GGTGCAGAAGCTGGGGTTCCCCGTCAGATTCTTCAATTTTAAAATTCAGAACATGGTTGCAAGCTGTGATGTGAAATTTCCCATCAGGCTGGAGATTTTGGCACTAACCCATCGGCAGTTCAGTAGTTATGA
GCCTGAACTGTTCCCTGGCCTTATTTATAAGATGGTGAAACCGCAGGTTGTGCTGCTCATCTTTGCATCTGGAAAGGTTGTACTGACAGGTGCCAAAGAGCGTTCTGAGATCTACGAAGCATTTGAAAACA
TGTATCCTATTCTAGAAAGTTTTAAGAAAGTCTGAATGGAGGAGGACATATACCTGGACCTCTTCCTGGATCCTTATACCATCCAGGATGACTTTCCTCCAGCTATGTCTCAACTGTTCAGCCCAGGAGTGCC
TTTAGACATGCACTCACTTCCATCTAATCCAGAGACTGTGTTTCATCCACATCTTGGTGGAGTCAAAAAGGCATCCACTGACTTTTCATCTGTGGATCTAAGCTTCTTACCAGATGAACTTACCCAAGAAAA
TAGAGACCAAACTGTCACTGGAAACAAGCTGGCAAGTGAGGAAAGCTGTAGGACTCGAGATCGACAAAGTCAGTTGCAGTTGCCCGATGAACATGGCAGTGAGCTGAACTTGAATAGCAACAGTTCAC
CAGATCCCCAGTCATGCCTGTGCTTTGATGATGCTCACTCCAACCAGCCCTCTCCAGAAACACCAAACTCCAATGCCTTACCTGTGGCATTGATAGCATCCATGATGCCAATGAACCCTGTTCCAGGATTTT
CTGGAATTGTGCCTCAATTACAGAATGTAGTTTCCACTGCAAATCTGGCCTGTAAATTGGATCTGAGAAAAATAGCCCTGAATGCCAAAAACACAGAATATAACCCAAAGAGGTTTGCTGCAGTAATAATG
AGGATCCGAGAGCCAAGGACAACAGCTCTCATCTTTAGCTCTGGGAAAGTGGTCTGTACAGGAGCCAAAAGTGAAGAGGAGTCTCGGCTGGCAGCGAGAAAGTATGCTCGTGTGGTGCAGAAGCTCGG
GTTCCCTGTCAGATTCTTCAATTTTAAAATTCAGAACATGGTTGGAAGCTGTGATGTGAAATTTCCCATCAGGCTGGAGATTTTGGCACTAACCCATCGGCAGTTCAGTAGTTATGAACCTGAACTTTTCCCC
GGCCTTATTTATAAGATGGTAAAACCACAGGTTGTGTTGCTAATCTTTGCATCTGGAAAAGTTGTGTTAACAGGTGCCAAAGAGCGTTCTGAGATCTATGAAGCATTTGAAAACATGTATCCTATTCTAGAAA
GTTTTAAGAAAGTCTGAATGGAGCAGGAGGAGACCTACCTGGAGCTCTACCTGGACCAGTGCGCCGCTCAGGATGGCCTTGCCCCACCCAGGTCTCCCCTGTTCAGCCCAGTTGTACCTTATGATATGTAC
ATACTGAATGCATCCAATCCGGATACTGCATTTAATTCGAACCCTGAAGTCAAAGAAACATCTGGTGATTTCTCATCTGTGGATCTTAGCTTCCTACCAGATGAAGTTACCCAGGAAAATAAAGACCAGCCT
GTCATTAGCAAACACGAAACTGAAGAAAATTCTGAAAGCCAAAGTCCACAAAGTAGGTTGCCATCACCCAGCGAACAGGACGTTGGGCTGGGCTTAAACAGCAGCAGTTTGTCAAATTCCCATTCACAG
CTGCACCCTGGTGATACTGACTCAGTCCAGCCCTCTCCTGAGAAACCAAACTCCGACTCCTTGTCTCTGGCATCCATAACTCCCATGACACCAATGACCCCTATTTCAGAATGTTGTGGAATTGTACCTCAA
CTACAGAATATAGTTTCCACTGTAAACCTGGCCTGTAAGTTGGATCTGAAGAAAATAGCTTTGCATGCAAAAAATGCAGAATATAACCCAAAGAGGTTTGCTGCTGTCATAATGAGGATCCGAGAGCCCAG
GACAACAGCCCTTATATTTAGCTCTGGGAAGATGGTCTGCACGGGAGCCAAAAGTGAAGAGCAGTCTCGACTTGCAGCAAGAAAATATGCTCGTGTGGTGCAGAAGCTTGGGTTCCCTGCCAGATTCCTC
GATTTTAAAATTCAGAACATGGTTGGAAGCTGTGATGTGAGATTTCCCATCAGGCTGGAAGGTTTGGTGCTAACCCATCAGCAGTTCAGTAGTTACGAGCCTGAACTGTTTCCTGGTCTTATTTATAGAATG
GTAAAACCACGAATTGTGTTGCTTATCTTTGTATCTGGAAAAGTTGTGTTGACAGGTGCCAAAGAACGTTCTGAGATCTATGAAGCATTTGAAAACATCTATCCTATTCTAAAAGGTTTTAAAAAAGCCTGA
GAAGTCCCCTGGGTAACTTCCAGGCAGCTTCATTTCTGAAGAGTCCAAACTGCAGCATAGAGGACTTATGAAAAACTGTAAAAAATTGGTTTTAAGTGTTCCATTAAACCCAAAGAAAACAGTCACACAA
CAAAGCCAGACACAGAAAATTAGGGTGACATGTTTCCTGTCATATGTGGAGCCTAGAGAACATAGAGATGATGTGAAAGCAGAAGGAGCTATCAAGAAAAAGGAAAGCAGATGGGGCAGCAGATCCATG
GGAATACTGGCAGAACTGTATAATGGAAGAATGTCGTATGCACATATGAACATGTCATAATGAAACCTAGTATTTTGTACAGTTAATATGGACTAGACAATAGCACAAAGAAATTAGAGATTAGTCTAGCTAT
ATGAAGAGGCTACATCAAAGATCACTCCTTTTTGATGGACAAATTTAATTCCTTATAACTGTAGAGCTGAGATATTCACTTGCTTGTCAGACATTAAATGTATCCCACTCTTAGGGTCTAGAAGTTACCCAGA
CTTCTTGTACCATGGTCCCATCTATCTTCAAAGTCAGCAGTGACGACTCTGCCTTATGACAAGGTCATCTCCTGCTTTCAAATCCCTCCCAAAGAGTGGCCAATTCCTCCTTGGCTGCTCAGTCAGTAAGGG
CAGGCTTGGATCCTTTCCCTTTCCTAACAATGGACTTGGAATTTTAATTACATCTTCAAAACCCAAGAGCATTTGGTTTTTTTTAGATAACTGGGAGATACATTTGGAGATAGGGATTTGGGGAGCCACCGAA
ACATTCTACCTACCATAGGAAATAGTTATAAATCTATTTTACTGGCTGGAGAGATGGCCAAGCAGTTAAGAATACTTTCTGCTTTTTCAAAGGATAGAAATTCTGTTCCTAGCACCCACACTGGGCTTCTTAG
TGATTCCAACTCTACAGGACCTGATGCCTCCTTCTCTCTGGCTTCCTTAGATACCAGTTTGTACTGGCACATGCATATGCACAGGAGAAGGCTCTCTCTCTCTCTCTCCCCCCCCCCCCTCTCTCTCTCTCAC
ACACACACACAAGATGGTGAGATATAATTAATAAAATAAAGTAAAATTTGGATCTGTTTTAGTCAGTTTGGGATGCCATAATAAAACACCACAAACTGGGCAGTTTAAACCACAGAAATTTCCTTCATAGTT
CTGAAGGCTGGAGATCTAAGATCAAGGTCCCTGCAGATTTGGTCTCTCCTGTAGCAATCCTCCATCTTTCCTTTTAGGTAGCTGCCTTAATGTTGCTCTTTTTACAGCTTTTTCTTTGTATTTCTATGAAAACA
TCAGACATATTGGATTGGGGCTTCTACACATGATCTTCATGGGATAAGCAATAACCATAGTTACTGATCTGTGAGGCTGGTTCTGAGTGTGCAGCTCAGTAGGCTGTCTCATTTACAGACACTATGACATTAC
ATG
Struttura dei Geni eucariotici
codificanti
•  I geni codificanti sono quelli che vengono
trascritti in mRNA.
•  Contengono una parte realmente
codificante, che specifica la sequenza degli
aminoacidi che costituiranno la proteina, ed
una parte non codificante.
•  A monte della sequenza che verrà trascritta
in mRNA vi sono le sequenze regolatrici.
•  La sequenza trascritta è costituita da due
tipi di elementi, detti esoni ed introni.
•  Solo gli esoni contengono informazioni per
la sintesi della proteina.
Struttura del gene
CaraGeris4che dei geni eucario4ci •  Dimensioni molto variabili, da poche decine di nucleo4di fino a migliaia di basi •  Mediamente 8-­‐9 introni (da 0 a 300) •  La maggior parte degli esoni è lunga 50/250 basi (da 6 fino a 20k) •  Una variabilità ancora maggiore per gli introni •  Numero di geni nel genoma umano? Splicing alterna4vo Ruolo degli introni nell’evoluzione Exon shuffling