Espressione ed utilizzo della informazione genetica Prof.ssa Flavia Frabetti Aa 2010-11 L’informazione genetica, contenuta nel DNA, ha lo scopo di: 1) mantenere lo stato vitale (strutture e funzioni) 2) realizzare l’adattamento (risposta ad un cambiamento) 3) determinare il differenziamento (specializzazione di strutture e funzioni) L’informazione genetica ereditata determina il manifestarsi di specifici caratteri inducendo la sintesi di certe proteine: le proteine sono l’anello di congiunzione tra informazione e la realizzazione/effettuazione di strutture ed attività. 1 ESPRESSIONE DELLA INFORMAZIONE BIOLOGICA non solo le strutture, ma anche l’architettura e la distribuzione spaziale di queste, nonché i cambiamenti temporali DNA dal progetto alla costruzione proteina Cosa studiamo? Dove è scritta l’informazione genica: DNA Cromatina / cromosomi Nucleo eucariotico Come è organizzata l’informazione genica: Genoma Geni - come concetto - “struttura del gene eucariota tipo” Come si esprime l’informazione genica: Trascrizione e Traduzione Codice genetico Meccanismi di CONTROLLO della espressione genica 2 Dove è scritta la informazione? nucleo cromosoma telomero centromero telomero proteine acide istoni DNA Come è organizzata l’informazione? Una enorme quantità di informazione dentro ad ogni singola cellula: il GENOMA Aprendo ogni libro si trovano brani così scritti: …..ATCCGAGCTTTACGTACGGTTACCGGATCGAGCATACT…… Anche la definizione di genoma è complessa! Il genoma è: - il complesso dell'informazione genetica di una cellula - la massa totale del DNA cellulare - il patrimonio ereditario dell'organismo a cui appartiene 3 COMPLESSITA’ DEL GENOMA Servono informazioni proporzionali alla complessità dell’organismo ? Proporzionalità da batteri a vermi Poi non viene mantenuta PARADOSSO DELLA NON PROPORZIONALITA’ TRA COMPLESSITA’ GENOMA E COMPLESSITA’ ORGANISMO Paradosso del valore “C” DIMENSIONI in bp (contenuto in DNA) NUMERO DEI GENI Media: Minimo: Massimo: Drosophila M. 16.321 C. Elegans 21.210 61.710 27.462 153.478 Arabidobsis T. 26.000 Homo sapiens STIMA: 22.000 (analisi computer) 4 Organizzazione generale del genoma umano Il genoma umano è distribuito in cromosomi: 22 tipi di AUTOSOMI 2 tipi di ETEROCROMOSOMI (X e Y) Corredo aploide 3.200.000.000 bp ovvero 3,2 Gbp (Cr. 1 279.000.000 bp, Cr. 21 45.000.000 bp ) Genoma mitocondriale 16.569 bp Peso (genoma diploide) Lunghezza (genoma diploide) 7 pg 2m ORGANIZZAZIONE DEL GENOMA UMANO NUCLEARE ~ 40% GENI CODIFICANTI PROTEINE E GENI PER ncRNA MITOCONDRIALE 0,5 % ~ 60% DNA EXTRAGENICO 5 ORGANIZZAZIONE DEL GENOMA UMANO NUCLEARE MITOCONDRIALE 0,5 % 1/3 GENI CODIFICANTI PROTEINE 5,3% mRNA MATURO (ESONI) 30 Mb 1,7 % DEL GENOMA 56% CODIFICANTE (CDS) 0,96 % DEL GENOMA replicazione o duplicazione DNA trascrizione della informazione RNA proteine traduzione della informazione Reintrepetazione del dogma della biologia molecolare alla luce delle nuove conoscenze sul genoma 6 Ai geni che codificano proteine si affiancano geni che specificano per RNA non codificanti utili alla regolazione della espressione genica. Stime odierne: Geni umani codificanti per proteine sono un numero di 20.000-25.000 Geni per RNA non tradotti o noncoding RNA (ncRNA, RNA non codificanti proteine), nei mammiferi rappresentano da 1/2 a 3/4 di tutti i trascritti La maggior parte del genoma dei mammiferi è trascritta Il 98% dell’output trascrizionale nei mammiferi è rappresentato da RNA che non verrà tradotto in aa Known or predicted transcribed 7Mb 100Mb 130Mb 2.6Gb 2.9Gb Human Mouse Fruitfly Worm Yeast 58% 55% 60% 59% 70% Noncoding percent of transcription 98% 98% 71% 56% 0.6% 7 La complessità del genoma si riflette sulla espressione dell’informazione genica e sulla definizione stessa di gene Geni: definizione/concetto struttura regolazione I geni sono le unità responsabili delle caratteristiche ereditarie Il gene è una regione di DNA trascritta che contiene istruzioni per la sintesi di una proteina, di un RNA o ignota 8 Il gene è una delle tante istruzioni contenute in ogni cellula FUNZIONI DEI GENI METABOLISMO INFORMAZIONE GENETICA STRUTTURA SEGNALI FUNZIONI TESSUTO-SPECIFICHE 22% 25% 21% 12% 20% GENI PER RNA NON TRADOTTI (rRNA 85%, tRNA 10%, RNA non-codificanti) Ci possono essere: 1) Geni essenziali o geni housekeeping Geni che devono essere espressi praticamente in tutti i tipi cellulari poiché codificano prodotti utili al funzionamento generale delle cellule, per es. alla sintesi proteica o alla produzione di energia 2) Geni con limitazioni spazio-temporali nella espressione: SPAZIO Espressione diversa in diversi organi e tessuti TEMPO Stadio del ciclo cellulare Specificità per tessuto, tipo cellulare Stadio dello sviluppo Singole cellule (specificità di cellula es. Ab) Stadio del differenziamento Distribuzione intracellulare Espressione inducibile 9 Gene eucariota - la struttura nasconde complessità Promotore Gene strutturale regione trascritta I geni eucarioti hanno una struttura discontinua 1977 Ibrido molecolare DNA-mRNA 10 GENE - Struttura del gene eucariota tipo Il gene ha una natura discontinua: esoni tratti del gene indicati con E introni tratti del gene indicati con I E1 E2 I1 E3 I2 +1 Tratto di DNA che viene trascritto o TRASCRITTO PRIMARIO ESONI (in giallo), intervallate da lunghi INTRONI (in grigio) DNA E1 I1 E2 E3 I2 +1 Esone 1 TRASCRITTO PRIMARIO o pre-mRNA Esone 3 AUG mRNA Proteina Esone 2 UGA AUG NH2 UGA COOH 11 Dimensione media geni 57.000 bp (57 kb) istoni 100-400 bp (0,1-0,4 kb) distrofina 2.220.000 bp (2,22 Mb) ESONI Numero medio 11 (minimo)-(massimo) 1 - 363 Dimensione media 280 bp INTRONI Dimensione media ca. 6.000 bp TTAGCACTACCGTATTTGCGCATTACCAGATTAGAGAA ATGCTAGTCGATCTATCGATCGGCTATTCGCAAAGCTG CGCGACTGCGATGCGCTAGCATGCGATTCGCGATCGCC GAGCGCTCGCGAGCGCGCTAGCGGAATACTATATAGC GCGGATCAGTCTAGATCTATGAGATCGATAGCGATCTA GAGATAGGATCGAGATCGAGGCGAGATCATATGAGCG CGGCTATTTAGGCTTAGAGGATTCGGAGATTCGGAGCT TAGGATTACAGAGAGCTTCTTAGGCGCTCCCGGTATCG CTCCCATCCCATATTAAAATCTATCGATCGAGCTCTCCA ATGCGATCGATAGGACTAGTAGCTAGCTAGCTGAGCA TGATAGGCTCGATGAGCATGAGATGCATGTACGACTG CATAGGCATGACTGATCGACTGCATCATGACGCATGAC TGCATGCATGACTGCATATGACGGACTCGCATTAGCAC TACCGTATTTGCGCATTACCAGATTAGAGAAATGCTAG TCGATCTATCGATCGGCTATTCGCAAAGCTGCGCGACT GCGATGCGCTAGCATGCGATTCGCGATCGCCGAGCGC TCGCGAGCGCGCTAGCGGAATACTATATAGCGCGGAT CAGTCTAGATCTATGAGATCGATAGCGATCTAGAGATA GGATCGAGATCGAGGCGAGATCATATGAGCGCGGCTA TTTAGGCTTAGAGGATTCGGAGATTCGGAGCTTAGGAT TACAGAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCA TCCCATATTAAAATCTATCGATCGAGCTCTCCAATGCG ATCGATAGGACTAGTAGCTAGCTAGCTGAGCATGATA GGCTCGATGAGCATGAGATGCATGTACGACTGCATAG GCATGACTGATCGACTGCATCATGACGCATGACTGCAT GCATGACTGCATATGACGGACTCGCATTAGCACTACCG TATTTGCGCATTACCAGATTAGAGAAATGCTAGTCGAT CTATCGATCGGCTATTCGCAAAGCTGCGCGACTGCGAT GCGCTAGCATGCGATTCGCGATCGCCGAGCGCTCGCG AGCGCGCTAGCGGAATACTATATAGCGCGGATCAGTC TAGATCTATGAGATCGATAGCGATCTAGAGATAGGATC GAGATCGAGGCGAGATCATATGAGCGCGGCTATTTAG GCTTAGAGGATTCGGAGATTCGGAGCTTAGGATTACA GAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCATCCC ATATTAAAATCTATCGATCGAGCTCTCCAATGCGATCG ATAGGACTAGTAGCTAGCTAGCTGAGCATGATAGGCT CGATGAGCATGAGATGCATGTACGACTGCATAGGCAT GACTGATCGACTGCATCATGACGCATGACTGCATGCAT GACTGCATATGACGGACTCGCA GENE Nella realtà gli INTRONI sono molto più lunghi degli esoni mRNA maturo (in media) Dimensione 3.000 basi Sequenza codificante 1.600 basi (56%) Proteina 540 AA TTAGCACTACCGTATTTGCGCATTACCAGATTAGAGAA ATGCTAGTCGATCTATCGATCGGCTATTCGCAAAGCTG CGCGACTGCGATGCGCTAGCATGCGATTCGCGATCGCC GAGCGCTCGCGAGCGCGCTAGCGGAATACTATATAGC GCGGATCAGTCTAGATCTATGAGATCGATAGCGATCTA GAGATAGGATCGAGATCGAGGCGAGATCATATGAGCG CGGCTATTTAGGCTTAGAGGATTCGGAGATTCGGAGCT TAGGATTACAGAGAGCTTCTTAGGCGCTCCCGGTATCG CTCCCATCCCATATTAAAATCTATCGATCGAGCTCTCCA ATGCGATCGATAGGACTAGTAGCTAGCTAGCTGAGCA TGATAGGCTCGATGAGCATGAGATGCATGTACGACTG CATAGGCATGACTGATCGACTGCATCATGACGCATGAC TGCATGCATGACTGCATATGACGGACTCGCATTAGCAC TACCGTATTTGCGCATTACCAGATTAGAGAAATGCTAG TCGATCTATCGATCGGCTATTCGCAAAGCTGCGCGACT GCGATGCGCTAGCATGCGATTCGCGATCGCCGAGCGC TCGCGAGCGCGCTAGCGGAATACTATATAGCGCGGAT CAGTCTAGATCTATGAGATCGATAGCGATCTAGAGATA GGATCGAGATCGAGGCGAGATCATATGAGCGCGGCTA TTTAGGCTTAGAGGATTCGGAGATTCGGAGCTTAGGAT TACAGAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCA TCCCATATTAAAATCTATCGATCGAGCTCTCCAATGCG ATCGATAGGACTAGTAGCTAGCTAGCTGAGCATGATA GGCTCGATGAGCATGAGATGCATGTACGACTGCATAG GCATGACTGATCGACTGCATCATGACGCATGACTGCAT GCATGACTGCATATGACGGACTCGCATTAGCACTACCG TATTTGCGCATTACCAGATTAGAGAAATGCTAGTCGAT CTATCGATCGGCTATTCGCAAAGCTGCGCGACTGCGAT GCGCTAGCATGCGATTCGCGATCGCCGAGCGCTCGCG AGCGCGCTAGCGGAATACTATATAGCGCGGATCAGTC TAGATCTATGAGATCGATAGCGATCTAGAGATAGGAT CGAGATCGAGGCGAGATCATATGAGCGCGGCTATTTA GGCTTAGAGGATTCGGAGATTCGGAGCTTAGGATTAC AGAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCATCC CATATTAAAATCTATCGATCGAGCTCTCCAATGCGATC GATAGGACTAGTAGCTAGCTAGCTGAGCATGATAGGC TCGATGAGCATGAGATGCATGTACGACTGCATAGGCA TGACTGATCGACTGCATCATGACGCATGACTGCATGCA TGACTGCATATGACGGACTCGCA Nel “libro” DNA, le pagine sono scritte in codice/i 12 TTAGCACTACCGTATTTGCGCATTACCAGATTAGAGAA ATGCTAGTCGATCTATCGATCGGCTATTCGCAAAGCTG CGCGACTGCGATGCGCTAGCATGCGATTCGCGATCGCC GAGCGCTCGCGAGCGCGCTAGCGGAATACTATATAGC GCGGATCAGTCTAGATCTATGAGATCGATAGCGATCTA GAGATAGGATCGAGATCGAGGCGAGATCATATGAGCG CGGCTATTTAGGCTTAGAGGATTCGGAGATTCGGAGCT TAGGATTACAGAGAGCTTCTTAGGCGCTCCCGGTATCG CTCCCATCCCATATTAAAATCTATCGATCGAGCTCTCCA ATGCGATCGATAGGACTAGTAGCTAGCTAGCTGAGCA TGATAGGCTCGATGAGCATGAGATGCATGTACGACTG CATAGGCATGACTGATCGACTGCATCATGACGCATGAC TGCATGCATGACTGCATATGACGGACTCGCATTAGCAC TACCGTATTTGCGCATTACCAGATTAGAGAAATGCTAG TCGATCTATCGATCGGCTATTCGCAAAGCTGCGCGACT GCGATGCGCTAGCATGCGATTCGCGATCGCCGAGCGC TCGCGAGCGCGCTAGCGGAATACTATATAGCGCGGAT CAGTCTAGATCTATGAGATCGATAGCGATCTAGAGATA GGATCGAGATCGAGGCGAGATCATATGAGCGCGGCTA TTTAGGCTTAGAGGATTCGGAGATTCGGAGCTTAGGAT TACAGAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCA TCCCATATTAAAATCTATCGATCGAGCTCTCCAATGCG ATCGATAGGACTAGTAGCTAGCTAGCTGAGCATGATA GGCTCGATGAGCATGAGATGCATGTACGACTGCATAG GCATGACTGATCGACTGCATCATGACGCATGACTGCAT GCATGACTGCATATGACGGACTCGCATTAGCACTACCG TATTTGCGCATTACCAGATTAGAGAAATGCTAGTCGAT CTATCGATCGGCTATTCGCAAAGCTGCGCGACTGCGAT GCGCTAGCATGCGATTCGCGATCGCCGAGCGCTCGCG AGCGCGCTAGCGGAATACTATATAGCGCGGATCAGTC TAGATCTATGAGATCGATAGCGATCTAGAGATAGGATC GAGATCGAGGCGAGATCATATGAGCGCGGCTATTTAG GCTTAGAGGATTCGGAGATTCGGAGCTTAGGATTACA GAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCATCCC ATATTAAAATCTATCGATCGAGCTCTCCAATGCGATCG ATAGGACTAGTAGCTAGCTAGCTGAGCATGATAGGCT CGATGAGCATGAGATGCATGTACGACTGCATAGGCAT GACTGATCGACTGCATCATGACGCATGACTGCATGCAT GACTGCATATGACGGACTCGCA GENE 1 TTAGCACTACCGTATTTGCGCATTACCAGATTAGAGAA ATGCTAGTCGATCTATCGATCGGCTATTCGCAAAGCTG CGCGACTGCGATGCGCTAGCATGCGATTCGCGATCGCC GAGCGCTCGCGAGCGCGCTAGCGGAATACTATATAGC GCGGATCAGTCTAGATCTATGAGATCGATAGCGATCTA GAGATAGGATCGAGATCGAGGCGAGATCATATGAGCG CGGCTATTTAGGCTTAGAGGATTCGGAGATTCGGAGCT TAGGATTACAGAGAGCTTCTTAGGCGCTCCCGGTATCG CTCCCATCCCATATTAAAATCTATCGATCGAGCTCTCCA ATGCGATCGATAGGACTAGTAGCTAGCTAGCTGAGCA TGATAGGCTCGATGAGCATGAGATGCATGTACGACTG CATAGGCATGACTGATCGACTGCATCATGACGCATGAC TGCATGCATGACTGCATATGACGGACTCGCATTAGCAC TACCGTATTTGCGCATTACCAGATTAGAGAAATGCTAG TCGATCTATCGATCGGCTATTCGCAAAGCTGCGCGACT GCGATGCGCTAGCATGCGATTCGCGATCGCCGAGCGC TCGCGAGCGCGCTAGCGGAATACTATATAGCGCGGAT CAGTCTAGATCTATGAGATCGATAGCGATCTAGAGATA GGATCGAGATCGAGGCGAGATCATATGAGCGCGGCTA TTTAGGCTTAGAGGATTCGGAGATTCGGAGCTTAGGAT TACAGAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCA TCCCATATTAAAATCTATCGATCGAGCTCTCCAATGCG ATCGATAGGACTAGTAGCTAGCTAGCTGAGCATGATA GGCTCGATGAGCATGAGATGCATGTACGACTGCATAG GCATGACTGATCGACTGCATCATGACGCATGACTGCAT GCATGACTGCATATGACGGACTCGCATTAGCACTACCG TATTTGCGCATTACCAGATTAGAGAAATGCTAGTCGAT CTATCGATCGGCTATTCGCAAAGCTGCGCGACTGCGAT GCGCTAGCATGCGATTCGCGATCGCCGAGCGCTCGCG AGCGCGCTAGCGGAATACTATATAGCGCGGATCAGTC TAGATCTATGAGATCGATAGCGATCTAGAGATAGGAT CGAGATCGAGGCGAGATCATATGAGCGCGGCTATTTA GGCTTAGAGGATTCGGAGATTCGGAGCTTAGGATTAC AGAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCATCC CATATTAAAATCTATCGATCGAGCTCTCCAATGCGATC GATAGGACTAGTAGCTAGCTAGCTGAGCATGATAGGC TCGATGAGCATGAGATGCATGTACGACTGCATAGGCA TGACTGATCGACTGCATCATGACGCATGACTGCATGCA TGACTGCATATGACGGACTCGCA ccctgtggag ccacacccta gggttggcca atctactccc aggagcaggg agggcaggag 61 ccagggctgg gcataaaagt cagggcagag ccatctattg cttacatttg cttctgacac 121 aactgtgttc actagcaacc tcaaacagac accATGgtgc acctgactcc tgaggagaag 181 tctgccgtta ctgccctgtg gggcaaggtg aacgtggatg aagttggtgg tgaggccctg 241 ggcaggttgg tatcaaggtt acaagacagg tttaaggaga ccaatagaaa ctgggcatgt 301 ggagacagag aagactcttg ggtttctgat aggcactgac tctctctgcc tattggtcta 361 ttttcccacc cttaggctgc tggtggtcta cccttggacc cagaggttct ttgagtcctt 421 tggggatctg tccactcctg atgctgttat gggcaaccct aaggtgaagg ctcatggcaa 481 gaaagtgctc ggtgccttta gtgatggcct ggctcacctg gacaacctca agggcacctt 541 tgccacactg agtgagctgc actgtgacaa gctgcacgtg gatcctgaga acttcagggt 601 gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa gttcatgtca 661 taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa tgattgcatc 721 agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa caattgtttt 781 cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact attatactta 841 atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa gtaacttaaa 901 aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg tgcttatttg 961 catattcata atctccctac tttattttct tttattttta attgatacat aatcattata Cromosoma 12 1021 catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac caaatcaggg 1081 taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt ttttgtttat 1141 cttatttcta atactttccc taatctcttt ctttcagggc aataatgata caatgtatca 1201 tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag gcaatagcaa 1261 tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag gtttcatatt 1321 gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg ggataaggct 1381 ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct cttatcttcc 1441 tcccacagct cctgggcaac gtgctggtct gtgtgctggc ccatcacttt ggcaaagaat 1501 tcaccccacc agtgcaggct gcctatcaga aagtggtggc tggtgtggct aatgccctgg 1561 cccacaagta tcacTAAgct cgctttcttg ctgtccaatt tctattaaag gttcctttgt 1621 tccctaagtc caactactaa actgggggat attatgaagg gccttgagca tctggattct 1681 gcctaataaa aaacatttat tttcattgca atgatgtatt taaattattt ctgaatattt 1741 tactaaaaag ggaatgtggg aggtcagtgc atttaaaaca taaagaaatg atgagctgtt 1801 caaaccttgg gaaaatacac tatatcttaa actccatgaa agaaggtgag gctgcaacca 1861 gctaatgcac attggcaaca gcccctgatg cctatgcctt attcatccct cagaaaagga 1921 ttcttgtaga ggcttgattt gcaggttaaa gttttgctat gctgtatttt acattactta 1981 ttgttttagc tgtcctcatg aatgtctttt cactacccat ttgcttatcc tgcatctctc 2041 tcagccttga ct Gene della beta-globina (Homo sapiens) da 1 a 2052 nucleotidi Sequenza GenBank n. NM_000518 DNA a filamento doppio (l’altro si ricava per complementarità) 13 acatttg cttctgacac aactgtgttc actagcaacc tcaaacagac accATGgtgc acctgactcc tgaggagaag tctgccgtta ctgccctgtg gggcaaggtg aacgtggatg aagttggtgg tgaggccctg ggcaggctgc tggtggtcta cccttggacc cagaggttct ttgagtcctt tggggatctg mRNA maturo per la beta-globina tccactcctg atgctgttat gggcaaccct aaggtgaagg ctcatggcaa gaaagtgctc ggtgccttta gtgatggcct ggctcacctg gacaacctca agggcacctt tgccacactg agtgagctgc actgtgacaa gctgcacgtg gatcctgaga ctcctgggca acgtgctggt ctgtgtgctg gcccatcact ttggcaaaga attcacccca ccagtgcagg ctgcctatca gaaagtggtg gctggtgtgg ctaatgccct ggcccacaag tatcacTAAg ctcgctttct tgctgtccaa tttctattaa aggttccttt gttccctaag tccaactact aaactggggg atattatgaa gggccttgag catctggatt ctgcctaata aaaaacattt at proteina beta-globina, catena beta della emoglobina e mioglobina Gene e sua funzione: Cosa fa accendere il gene? A “sfumare l’oggetto” gene e renderlo più un “CONCETTO” sta la parte regolatrice del gene SEQUENZE TRASCRIVIBILI GENE PROMOTORE SEQUENZE REGOLATRICI INTENSIFICATORI SILENZIATORI UNITA’ DI TRASCRIZIONE Tratto di DNA che codifica per una molecola di RNA e delle sequenze necessarie per la sua trascrizione 14 Gene networks - un gene può esprimere le proprie informazioni solo nel contesto dell’intero genoma della cellula DNA Promot 1 gene1 Promot 2 gene2 Promot 3 - gene3 Promot 4 gene4 + FATTORI DI TRASCRIZIONE RNA proteine Come si esprime l’informazione? Per i geni classici vedremo: I meccanismi di Trascrizione e Traduzione Cosa è il Codice genetico I principali meccanismi di CONTROLLO della espressione genica 15 "DNA makes RNA, RNA makes protein, and proteins make us." Francis Crick replicazione o duplicazione DNA trascrizione della informazione RNA proteine traduzione della informazione Criteri: tempestività economia ovvero sintetizzare le proteine giuste al momento giusto e nella giusta quantità 1. Trascrizione tRNA rRNA 2. Traduzione mRNA Sintesi delle proteine 16 TRASCRIZIONE (eucarioti) “assemblaggio catalizzato” Nella trascrizione l’informazione genetica contenuta nel DNA viene trascritta in una sequenza di RNA in base al principio della complementarietà delle basi è un processo controllato, regolato poiché le necessità sono: 1- riconoscimento del gene da esprimere 2- individuazione di inizio e termine del gene specifico 3- trascrizione nella giusta quantità del gene 4- alto grado di fedeltà, cioè accuratezza 17 La trascrizione genera diversi tipi di RNA: rRNA o RNA ribosomiale gene tRNA o RNA transfer o RNA di trasporto proteina in crescita mRNA o RNA messaggero ribosomi HnRNA o RNA eterogeneo nucleare o pre-RNA snRNA o piccoli RNA non codificanti aa legato al tRNA Il processo è realizzato da enzimi chiamati RNA polimerasi DNA-dipendenti l’enzima si lega ad una sequenza sul DNA detta promotore Negli eucarioti: RNA polimerasi I rRNA : 28 S, 18 S, 5.8 S RNA polimerasi II precursori degli mRNA, ncRNA, diversi snRNA RNA polimerasi III tRNA e rRNA 5 S e alcuni snRNA 18 TRASCRIZIONE PROMOTORE Promotore RNA polimerasi Direzione della trascrizione RNA polimerasi TRASCRIZIONE: fasi iniziazione allungamento terminazione RNA polimerasi 19 ORIENTAMENTO DELLE UNITA’ filamento CODING o SENSO 3' 5' 5' 3' 3' 5' RNA POLIMERASI filamento STAMPO o TEMPLATE o ANTI SENSO VELOCITA’ ca. 40 nucleotidi al secondo Es. gene distrofina lungo ca. 2.200.000 bp??? Quante ore per trascriverlo? 17 ore! Complementarietà delle basi filamento non-senso serve da stampo 5' basi 5' 3' filamento senso Entrambi i filamenti del DNA possono costituire stampo per la sintesi dell’RNA, in funzione del gene, saranno sempre letti in direzione 3'- 5', poiché la crescita del filamento di RNA di neosintesi è in direzione 5'-3' 20 Meccanismo della trascrizione: sintesi di RNA sulla base di uno stampo di DNA 5' Enzima: RNA polimerasi 5' Trascrizione: lo stampo di DNA è letto da 3' a 5', l’RNA è sintetizzato da 5' a 3' 3' 3' 2° nucleotide Uscita del pirofosfato Formazione legame fosfodiesterico 1° nucleotide 1° nucleotide 5' CODICE GENETICO o Codice di traduzione (1964) Definizioni Codice = sistema di segnali, o segni, o simboli, che, per convenzione, è destinato a rappresentare una informazione tra la fonte dei segnali e il punto di destinazione. Es. comunicare in codice/ c. linguistico, formato da suoni/ c.grafico, c.fiscale, c. a barre, c.morse, ecc. Codice genetico sequenza di codoni contenenti le informazioni genetiche del gene e determinanti la sequenza degli aa che origina la proteina in base alla lettura dei codoni stessi 21 Codice genetico è un codice a triplette di nucleotidi, detti codoni codice genetico anni ‘60 I codoni specificano per gli aa. In totale 43=64 codoni. Caratteristiche del codice genetico • il codice è ridondante • il codice non è ambiguo • il codice non ha punteggiatura ovvero interruzioni • il codice è letto senza sovrapposizioni • per interpretarlo è fondamentale la cornice di lettura o quadro di lettura (reading frame) • il codice è universale (ad eccezione di quello dei mitocondri) Cornice di lettura ACCAAACCG DNA UGGUUUGGC mRNA Trp Phe Gly proteina 22 TRADUZIONE “assemblaggio codificato” TRASCRIZIONE TRADUZIONE Nella traduzione l’informazione genetica contenuta nella sequenza di codoni lungo l’mRNA viene decodificata o tradotta in una sequenza di aa costituenti la proteina, uniti in una sequenza precisa determinata dalla sequenza dei codoni Protagonisti principali di questo processo: porta nel citoplasma il messaggio genetico sotto forma di una specifica sequenza di codoni mRNA tRNA ribosomi sono gli interpreti del linguaggio facilitano l’appaiamento specifico tra gli anticodoni del tRNA e i codoni dell’mRNA 23 Ribosomi (60% rRNA con azione catalizzante+proteine) subunità minore mRNA subunità maggiore 1. Hanno un sito di legame per l’mRNA. 2. Un sito P (peptidil-tRNA) che ospita il tRNA che porta la catena aminoacidica in allungamento. 3. Un sito A (aminoacil-tRNA) che ospita il tRNA a cui è legato il successivo aa da aggiungere. 4. Un sito E di uscita del tRNA scarico di aa. tRNA sito di attacco per gli aa (sempre CCA) legami H tra basi complementari anticodone 24 Attacco dell’aa specifico in 3'OH del tRNA Aminoacil-tRNA sintetasi L’enzima riconosce l’anticodone e lega l’aa opportuno L’aminoacil-tRNA ha un aa “attivato” Riconoscimento codone-anticodone aminoacido ANTICODONE tRNA = adattatore U G A CODONE tripletta di nucleotidi codificante per 1 aa 25 Met Inizio sintesi proteica Per individuare il sito di INIZIO della TRADUZIONE: Sequenza consenso di M.Kozak: R--AUGG, R sta per una purina A o G 5’ Met Ser AUG 3’ mRNA Allungamento sintesi proteica Met- Ser Pro Met- Ser-Pro-Thr 5’ 3’ mRNA Terminazione sintesi proteica NH3 COO- Met- Ser-Pro-Thr-...-...-...- STOP! UGA 5’ 3’ mRNA Destino proteico: l’mRNA può essere tradotto da ribosomi liberi o ribosomi legati al RER m.p. vescicole secretorie lisosomi RIBOSOMI LIBERI nucleo citoplasma RIBOSOMI SUL RETICOLO ENDOPLASMATICO mitocondri cloroplasti 26 Le proteine ed i loro segnali di smistamento Proteina non ripiegata Proteina ripiegata sequenza segnale zona segnale Ad ogni segnale deve corrispondere un recettore proteico complementare REGOLAZIONE ESPRESSIONE GENICA eucarioti 27 Controllo o regolazione della espressione genica negli EUCARIOTI Scopo: differenziamento cellulare, ovvero espressione coordinata nel tempo di geni diversi in cellule diverse. Geni costitutivi cioè trascritti e tradotti in tutte le cellule Geni specifici attivati selettivamente da meccanismi di regolazione genica L’espressione genica è modulabile anche da segnali esterni che possono “accendere” o “spegnere” geni specifici. Livelli di controllo sulla espressione genica DNA 1.pre-trascrizionale o cromatinico 2. trascrizionale trascritto primario di RNA (HnRNA) 3. post-trascrizionale mRNA 4. traduzionale proteina 5. post-traduzionale proteina attiva o inattiva controllo sull’attività della proteina 28 1 DNA gene scelto nel nucleo Livello di controllo pre-trascrizionale o cromatinico (sul DNA) - già nell’organizzazione della cromatina (eucromatina/eterocromatina) - in alcuni casi il silenziamento può essere invertito e i geni venire attivati attraverso processi che rendono la cromatina meno compatta modificazioni strutturali della cromatina operate da COMPLESSI PROTEICI di rimodellamento ed enzimi che modificano gli istoni: modulazione della espressione genica DNA 2 pre-mRNA o HnRNA nel nucleo Livello di controllo trascrizionale (da DNA a pre m-RNA): il controllo si esercita sulla attività della RNA polimerasi. - sul suo riconoscimento ed aggancio al promotore - sulla sua efficienza nel trascrivere regolazione su quale gene trascrivere e su quanto pre-RNA produrre 29 Gene: Cosa fa accendere il gene? PROMOTORE SEQUENZE REGOLATRICI GENE INTENSIFICATORI SILENZIATORI SEQUENZE TRASCRIVIBILI PROMOTORE Sequenza nel DNA di almeno 40 nucleotidi, natura modulare con affinità più o meno elevata per la RNA polimerasi, di solito posta a monte del gene. Hanno: siti di riconoscimento (es. TATA box) sito di legame stabile sito di inizio della trascrizione siti di regolazione (simili a intensificatori e/o silenziatori) Risposta: NECESSITA’ DI SEQUENZE SEGNALE Il PROMOTORE Sequenza data dalla combinazioni di corti elementi solitamente collocati nella regione immediatamente a monte del gene, spesso entro 200 bp dal sito di inizio della trascrizione. I PROMOTORI HANNO NATURA MODULARE! 30 SITI DI REGOLAZIONE, anche a grande distanza! Si tratta di corte SEQUENZE di DNA Enhancer ovvero intensificatori = aumentano la capacità di iniziare la trascrizione, intensificano la trascrizione Silenziatori = spengono o reprimono la trascrizione Sequenze tessuto-specifiche= in grado di attivare/inattivare trascrizione in rapporto alla trasduzione di segnali recepiti dall’esterno La trascrizione ovvero la attività della RNA polimerasi sarà dovuta ad un bilancio complessivo tra fattori che la favoriscono o la inibiscono. SEQUENZE di DNA riconosciute da specifiche proteine dette FATTORI DI TRASCRIZIONE “Dialogo” tra sequenze regolatrici di DNA e proteine 31 Nella regolazione della trascrizione, ad attivare o reprimere la RNA polimerasi, intervengono proteine di 2 tipi: FATTORI GENERALI o BASALI di trascrizione PROTEINE REGOLATRICI SPECIFICHE Inizio della trascrizione FATTORI GENERALI di trascrizione RNA polimerasi II TFIID TFIIB TATA box gene X DNA promotore Questi fattori sono richiesti per l’inizio della trascrizione e sono simili per tutti i geni trascritti dalla RNApolimerasi II 32 PROTEINE REGOLATRICI SPECIFICHE DNA RNA polimerasi II gene X TFIID TFIIB TATA box promotore trascritto di RNA Sequenze regolatrici Le proteine specifiche si possono Integrazione al PROMOTORE di: legare a sequenze specifiche, anche - RNA pol lontane sia a valle che a monte del gene. - fattori generali di trascrizione - serie multiple di proteine regolatrici Il ripiegamento del DNA le porta poi vicine al promotore per influenzare la polimerasi. Come agiscono i fattori di trascrizione o proteine regolatrici? EFFETTO COMBINATORIO Un singolo promotore può essere regolato da molte sequenze regolatrici sparse lungo il DNA e riconosciute da più proteine regolatrici proteine regolatrici + + - + sinergia trascrizionale 33 EFFETTO DI COORDINAZIONE Una singola proteina regolatrice/fattore di trascrizione può regolare e quindi coordinare l’espressione genica di parecchi geni diversi proteina regolatrice Gene networks - un gene può esprimere le proprie informazioni solo nel contesto dell’intero genoma della cellula DNA Promot 1 gene1 Promot 2 gene2 Promot 3 - gene3 Promot 4 gene4 + FATTORI DI TRASCRIZIONE RNA proteine 34 pre-mRNA o HnRNA 3 nel nucleo mRNA (maturo) 4 Livello di controllo post-trascrizionale (da pre m-RNA a mRNA): -controllo sulla elaborazione dell’mRNA, la maturazione comporta 3 tipi fondamentali di modificazioni chimiche del trascritto primario a ottenere mRNA maturo - controllo del trasporto dell’mRNA al citoplasma e sulla sua stabilità nel citoplasma (importante il 3’UTR) Eventi post-trascrizionali: dal preRNA all’mRNA 1- aggiunta del CAP (m7G) aggiunta in 5’ di una 7metil-guanosina: preserva il trascritto dalla degradazione ed è segnale di aggancio per il ribosoma 2- poli-adenilazione in 3’OH aggiunta di una coda di poliA (200-250): aiuta il passaggo al citoplasma, influenza la stabilità dell’mRNA 3- splicing processo di taglia e cuci per eliminare gli introni 35 Da pre-mRNA a mRNA maturo!!! PROMOTORE DNA E1 TATA -25 I1 E3 I2 +1 Esone 1 Trascritto Primario o pre-mRNA mRNA E2 Esone 3 Esone 2 AUG CAP UGA AUG aaaaaaaaa UGA 5’ 3’ SPLICING= TAGLIA E CUCI degli introni/esoni 36 Spliceosoma = complesso ribonucleoproteico 150 proteine, 5 RNA snRNA (50-200 nucleotidi): U1, U2, U4, U5, U6 Dimensioni simili ad un ribosoma Proteine snRNA small nuclear RNA snRNPs SPLICING ALTERNATIVO: lo splicing mostra una notevole flessibilità Aggiunta di un esone Aggiunta di un tratto intronico 1 2 1 2 Esclusione a vicenda di esoni 1 2 Sito di splicing interno 1 2 37 Splicing alternativo può produrre forme diverse di mRNA e dunque di una proteina dallo stesso gene Calcitonina= ormone che riduce la concentrazione del Ca2+nel plasma prodotto dalla tiroide CGRP= peptide correlato alla calicitonina, potente vasodilatatore che può intervenire nella trasmissione del dolore su sistema nervoso periferico e centrale Variazioni al modello standard di gene: un gene un mRNA una proteina un LOCUS più prodotti genici alternativi Un singolo gene è un genoma in miniatura 38 DOPO MATURAZIONE mRNA MATURO SEQUENZA CODIFICANTE 5’ CAP AUG CDS 5’UTR STOP UAA UGA UAG 3’ AAAAA 3’UTR TRADUZIONE C N PROTEINA L’mRNA al termine della maturazione presenta: - Regione non tradotta in 5´, 5´ UTR o leader - Regione codificante, CDS (coding sequence) - Regione non tradotta in 3´, 3´ UTR o trailer Funzione delle regioni dell'mRNA 5´UTR Efficienza della traduzione CDS Traduzione (1%) 3´UTR Stabilità (velocità di degradazione; concetto di emivita da pochi minuti a 20-30 ore) 39 mRNA (maturo) nel citoplasma 5 proteina 6 proteina attiva 5. Livello di controllo traduzionale (da m-RNA a proteina): Operato da fattori proteici che possono influire sull’inizio della traduzione e quindi modularla, legandosi alla regione 5´UTR e magari “mascherandola” al ribosoma 6. Livello di controllo post-traduzionale (sulla proteina): - controllo sulla modificazione delle proteine sintetizzate -controllo del ripiegamento (aiutato da proteine chaperon) e trasporto nella cellula al sito di funzione Livello di controllo post-traduzionale (sulla proteina): modificazione delle proteine sintetizzate che risultano essenziali perché la proteina possa funzionare Fosforilazione in TIROSINA TREONINA SERINA 40 A modulare la espressione genica delle proteine cellulari intervengono anche i geni non codificanti proteine o ncRNA (non coding RNA) Il nuovo “dogma” microRNA ncRNA Ipotesi ncRNA non sono semplice “rumore trascrizionale”, ma più probabilmente svolgono un ruolo regolatorio e sono coinvolti in numerosi processi cellulari e biologici, in particolare durante lo sviluppo e il differenziamento 41 ncRNA - generalità Sempre di più nei database internazionali Gruppo eteogeneo per dimensioni e funzione: difficile classificazione Caratterizzati spesso da una alta densità di codoni di STOP e quindi dalla assenza di ORF (cornici di lettura aperte) estese La loro trascrizione ed elaborazione è sottoposta a controllo Possono formarsi dalle zone introniche di geni coding o da vere e proprie unità geniche Grande importanza per il ruolo da protagonisti nella REGOLAZIONE GENICA ncRNA - meccanismi Dinamica della struttura della cromatina (regolatori epigenetici) Modulazione della trascrizione (interazioni a triplice elica) Silenziamento genico post-trascrizionale: stabilità mRNA Attraverso meccanismi di “Interferenza da RNA” Regolazione espressione genica Cambiamenti nei livelli di espressione degli ncRNA sono associati con forme diverse di cancro e patologie neurodegenerative 42 ~20-300 nt 2- small RNA snoRNA 3-Medium e large RNAs ~300->10.000 nt 1- microRNA siRNA ncRNAs ~18-25 nt alcuni non noti F.F. Costa “Non-coding RNAs: lost in translation?” Gene 386 (2007) 1-10 Studi funzionali Nuovi ncRNAs funzionali ~20- 300 nt - modificazioni in RNA - regolazione trascrizionale - ruolo strutturale 2- small RNA snoRNA, 3-Medium e large RNAs ~300 - >10000 nt 1- microRNA siRNA ~18-25 nt - silenziamento genico posttrascrizionale (interferenza da RNA) ncRNAs - inattivazione X - regolazione trascrizionale alcuni non noti 43 miRNA micro-RNA Regolazione post-trascrizionale sequenza-specifica dell’espressione genica; associata a differenziamento e sviluppo embrionale Come si formano? Da precursori più lunghi (70nt) ripiegati a forcina Questa sorta di trascritti primari sono tagliati da un complesso enzimatico “Dicer” I miRNA (20-22nt) sono così trasportati al proprio bersaglio molecolare dal complesso proteico RISC miRNA+ RISC miRNA micro-RNA: meccanismi di azione Regolazione post-trascrizionale: 1. Degradazione mRNA 1 2. Blocco della traduzione dsRNA Quasi perfetta complementarietà al bersaglio (20-22 basi) 2 Brevi tratti di complementarietà al bersaglio (6-8 basi) 44 miRNA Curiosità e spunti: • la maggioranza di quelli specificamente espressi in cellule staminali embrionali umane sono down-regolati durante il proseguo dello sviluppo embrionale • molti specificamente implicati nello sviluppo del cervello come dimostrato in diversi lavori sul modello murino • altri legati a sviluppo di cancro: agirebbero come oncogeni od onco-soppressori (es. miR-21, let-7, miR122a) Nature, feb. 1998 “Potent and specific genetic interference by doublestranded RNA (dsRNA) in Caenorhabditis elegans” Andrew Fire, 47 anni Stanford California Craig Mello, 46 anni Massachusetts Medical School Premio Nobel per la medicina 2006 45 Cosa si intende per RNA interference (RNAi) Sistema di silenziamento genico basato su RNA RNAi è un processo mediante il quale RNA a doppio filamento (double strand RNA o dsRNA) silenzia, in modo sequenza-specifico, l’espressione di geni omologhi per sequenza attraverso l’appaiamento con l’mRNA bersaglio, seguito dalla sua degradazione; quindi: silenziamento post-trascrizionale. E’ un meccanismo conservato a livello evolutivo di degradazione specifica di mRNA bersaglio che avviene in 2 stadi: 1°stadio-iniziale. I dsRNAs sono processati da un enzima dimerico, DICER (RNasiIII). Si generano i siRNAs. 2°stadio-effettore. siRNAs o small interfering RNA (< 22nt), vengono incorporati in un secondo complesso enzimatico (endonucleasico), RISC (complesso di silenziamento indotto da RNA) che degrada uno dei due filamenti e usa l’altro per riconoscere, in base all’appaiamento delle basi, il substrato da degradare attraverso l’azione in base alla complementarietà delle basi. dsRNA siRNA 46 Modello degli stadi dell’RNAi: i siRNAs DICER siRNA RNAsi ATP-dip. + RISC (elicasi ATP-dip.) Riconoscimento dell’mRNA bersaglio DNA +/AAAA HnRNA _ ncRNA AAAA mRNA proteina X Fattore di trascrizione proteina nucleare 47 INTERATTOMA COMPLESSO fondamentale nella regolazione della espressione genica Proteoma Trascrittoma Tutte le molecole di RNA trascritte a partire da un genoma ANCHE GLI ncRNAs Tutte le proteine codificate dal genoma ANCHE QUELLE A LOCALIZZAZIONE NUCLEARE Immagine mentale della attivazione dei geni lungo il DNAi geni lungo il DNA sono come “luci di Natale” lungo la matassa dei fili: si accendono e si spengono ad intermittenza e con una intensità che va da MASSIMA luminosità a MINIMA luminosità e può essere modulata cioè regolata sia nella qualità che nelle quantità. 48