“Sperimenta il BioLab” DNA e Computer: conoscenze molecolari propedeutiche all'analisi bioinformatica Università degli Studi di Milano Settore Didattico, via Celoria 20, Milano Laboratorio 105 Indice 1. La doppia elica 2. Come è organizzato il DNA? 3. Caratteristiche strutturali dei cromosomi degli eucarioti 3.1 Le mappe cromosomiche e i bandeggi 4. Replicazione del DNA 5. Il concetto di gene 5.1 Il dogma centrale della biologia 5.2 Il genoma umano 6. Il gene eucariotico 7. RNA e trascrizione 7.1 RNA polimerasi eucariotiche 7.2 Promotori e fattori di trascrizione 7.3 Modificazioni post-trascrizionali dell’mRNA 7.4 Lo splicing 8. Il codice genetico e la traduzione 8.1 La sintesi proteica 9. Le mutazioni 9.1 Mutazioni genomiche 9.2 Mutazioni cromosomiche 9.3 Mutazioni geniche o puntiformi pag. 2 pag. 3 pag. 4 pag. 5 pag. 6 pag. 7 pag. 7 pag. 8 pag. 9 pag. 10 pag. 11 pag. 11 pag. 13 pag. 13 pag. 15 pag. 16 pag. 19 pag. 19 pag. 19 pag. 20 10. Domande di autovalutazione 11. Glossario pag. 22 pag. 29 1 1. LA DOPPIA ELICA Una domanda cruciale che ci si poneva agli inizi degli anni ’50 era come il DNA (sigla dell'acido desossiribonucleico) svolgesse la sua funzione. Per trovare la risposta a questo quesito era indispensabile determinarne la struttura chimica. Nel 1953 James Watson e Francis Crick riuscirono a decifrarla (Fig.1.1), determinando l’inizio di una nuova era della biologia, quella della biologia molecolare. Oggi sappiamo che il DNA è un polimero, ossia un insieme di tanti monomeri: i nucleotidi. Ogni nucleotide è co-stituito da tre componenti (Fig. 1.2): uno zucchero (il desossiribosio) a cui sono legati un gruppo fosfato e una base azotata (adenina, A; guanina, G; timina, T; citosina, C). Adenina e Guanina sono basi puriniche, Timina e Citosina sono basi pirimidiniche. Gli atomi di carbonio del deossiribosio vengono numerati da 1’ a 5’ (per distinguerli da quelli della base Fig. 1.1 Struttura a doppio filamento di un breve segmento azotata). La posizione 5’ è legata al gruppo di DNA. I montanti della scala sono costituiti da molecole di fosfato mentre l’ossidrile (OH) nella posizione zucchero alternate a gruppi fosfato. La distanza tra i due 3’ è libero per formare il legame con il gruppo montanti misura 2 nm. La distanza tra due basi azotate successive lungo il filamento è di 0,34 nm. Le basi si fosfato del nucleotide successivo. La molecola incontrano sull’asse centrale dell’elica. Il passo dell’elica è di di DNA è formata 3,4 nm (10 coppie di basi). da due catene polinucleotidiche avvolte l’una intorno all’altra con andamento destrorso. Le due catene sono antiparallele (Fig. 1.3), ossia i due singoli filamenti sono orientati in direzioni opposte. Gli Fig. 1.2 Un nucleotide è formato da un gruppo scheletri zucchero– fosfato, da uno zucchero a cinque atomi di carbonio e da una base azotata. In questo caso è mostrato un fosfato si trovano desossiribonucleoside monofosfato, il monomero all’esterno mentre le del DNA. basi azotate sono rivolte verso interno. Le basi delle due catene sono unite tra loro mediante legami idrogeno e si appaiano secondo una regola di complementarietà precisa: adenina con timina A=T (con formazione di due legami a idrogeno) citosina con guanina G≡C (con formazione di tre legami a idrogeno). Ne consegue che il legame A=T è più debole di quello G≡C. L’appaiamento di una base purinica (più grande) con una pirimidinica (più piccola) consente di mantenere costante il diametro dell’elica del DNA (2nm). In base alle regole di complementarietà delle basi, conoscendo la sequenza di uno dei due filamenti di una Fig. 1.3 Schema di una molecola di DNA. I due filamenti hanno orientamento 5’→3’ molecola di DNA è quindi possibile prevedere esattamente opposto. L’ordine delle basi azotate lungo un quella del filamento complementare. Inoltre, in una molecola di filamento determina l’ordine delle basi lungo il DNA a doppio filamento, la frequenza con cui compare filamento complementare. Tra Adenina e Timina sono presenti due legami a idrogeno; tra l’Adenina sarà sempre uguale a quella con cui compare la Guanina e Citosina sono presenti tre legami a Timina e anche la frequenza Citosina e Guanina saranno uguali. idrogeno. 2 2. COM’È ORGANIZZATO IL DNA? L’intero DNA genomico di una cellula eucariotica è contenuto nel nucleo. Dal momento che la lunghezza totale del genoma umano, se potessimo distendere e allineare tutti i cromosomi, sarebbe di circa 2 metri e il diametro medio del nucleo è di soli 5-10 µm, il DNA deve compattarsi di almeno 100.000 volte, attraverso diversi livelli di avvolgimento. Il compattamento avviene attraverso l’interazione del DNA con proteine (cromatina) (Fig. 2.1). Il livello più semplice di avvolgimento è il nucleosoma, costituito dalla doppia elica del DNA avvolta attorno a un nucleo di 8 proteine basiche, gli istoni (il DNA è acido per la presenza dei gruppi fosfato) che si assemblano a formare un ottamero. Questa struttura è chiamata anche “collana di perle” dove le perle sono i nucleosomi e il filo della collana sono i tratti di DNA fra un nucleosoma e l’altro (chiamati anche DNA linker). Questa struttura viene resa ancora più compatta con un ulteriore avvolgimento della collana di perle su se stessa a formare una struttura a solenoide, una fibra di 30 nm. Questa fibra, per aumentare ulteriormente l’impacchettamento, è ancorata su una struttura di proteine acide, chiamata matrice o scaffold, a formare vere e proprie anse. Il maggior grado di compattazione del DNA si ottiene durante la mitosi. Alla metafase i singoli cromosomi risultano visibili anche al microscopio ottico come formazioni bastoncellari. a) b) Fig. 2.1 I livelli di organizzazione della cromatina che danno origine ad un cromosoma euariotico. a) Doppia elica di DNA c) d) e) f) 3 b) “Collana di perle” di nucleosomi c) Fibre di nucleosomi addensati a forma di solenoide d) Domini ad anse e) Spirali condensate f) Cromosoma metafasico 3. CARATTERISTICHE STRUTTURALI DEI CROMOSOMI DEGLI EUCARIOTI Il cromosoma degli eucarioti è costituito da cromatina, un complesso di DNA, proteine cromosomiche e RNA, che può presentarsi sotto forma di: • Eucromatina che si colora debolmente perché despiralizzata; è geneticamente attiva; • Eterocromatina che si colora bene perché condensata; è per lo più considerata come geneticamente inattiva; replica nella fase S (Sintesi) del ciclo cellulare dopo l’eucromatina e può, a sua volta, essere suddivisa in costitutiva (sempre spiralizzata) e facoltativa (potenzialmente despiralizzabile). Le proteine cromosomiche possono essere suddivise in: • Proteine istoniche: hanno una carica positiva che facilita il loro legame col DNA. Ci sono 5 tipi di istoni: H1 che sigilla il nucleosoma (Fig. 3.1), H2A, H2B, H3, H4 che formano gli ottameri. Le sequenze amminoacidiche degli introni indicano un elevato grado di conservazione tra specie filogeneticamente distanti; • Proteine non istoniche: alcune hanno un ruolo strutturale, altre sono implicati in diversi aspetti del metabolismo del DNA, quali replicazione, trascrizione, riparazione e ricombinazione. Core costituito da 8 istoni Istone H1 Fig. 3.1 Struttura dei nucleosomi Nei cromosomi mitotici il centromero corrisponde al punto di collegamento dei due cromatidi (Fig. 3.2). Da essi dipende il comportamento dei cromosomi alla mitosi ed alla meiosi. Se i centromeri non funzionano correttamente avviene una non-disgiunzione dei cromosomi. La regione del centromero contiene il cinetocoro al quale si attaccano le fibre del fuso durante la divisione. Per l’attacco dei microtubuli ad un centromero sono necessarie proteine che interagiscono con il DNA centromerico. Alle estremità dei cromosomi si trovano delle strutture speciali, i telomeri, costituiti da una corta sequenza di nucleotidi ripetuta migliaia di volte; nell’uomo la sequenza è TTAGGG. I telomeri hanno la funzione di proteggere le estremità dei cromosomi ed aiutano i sistemi di riparazione del DNA a distinguere le normali estremità dei cromosomi da quelle generate dalla rottura della doppia elica. Sono essenziali per impedire riarrangiamenti cromosomici che Fig.3.2 Struttura del possono essere deleteri per la cellula. cromosoma La localizzazione del centromero è una caratteristica costante dei singoli cromosomi. In base alla posizione del centromero i cromosomi vengono classificati: • se il centromero ha una posizione centrale, il cromosoma è definito metacentrico (Fig. 3.3A); • se è localizzato non esattamente in posizione mediana, il cromosoma è definito submetacentrico (Fig. 3.3B); • se infine il centromero è localizzato all’estremità del cromosoma, questo è definito acrocentrico (Fig. 3.3C). 4 Alcuni cromosomi possono presentare, oltre a quella del centromero, un’ulteriore strozzatura detta costrizione secondaria. La porzione di cromosoma che sporge viene denominata satellite e nelle preparazioni citologiche è visibile sotto forma di una masserella globoide di cromatina separata dal resto del cromosoma per mezzo di un sottile filamento cromatinico. Nei cromosomi umani, la costrizione secondaria si trova sul braccio corto di tutti i cromosomi acrocentrici. 3.1 Le mappe cromosomiche e i bandeggi Fig. 3.3 Diversi tipi morfologici di cromosoma (p, braccio corto; q, braccio lungo; c, centromero; c.s., costrizione secondaria; s, satellite). Una differenza fondamentale tra procarioti ed eucarioti risiede nel fatto che i procarioti hanno un singolo cromosoma, mentre la maggior parte degli eucarioti ha un numero diploide di cromosomi (ogni cromosoma è presente in due copie) in quasi tutte le cellule somatiche ed è quindi necessario poterli riconoscere e classificare. L’insieme completo di tutti i cromosomi metafasici di una cellula è definito cariotipo; il cariotipo è speciespecifico; quello umano normale diploide è costituito da 46 cromosomi (22 paia di autosomi e un paio di cromosomi del sesso o eterocromosomi: XX nella femmina, XY nel maschio). La ricostruzione del cariotipo o mappa cromosomica viene effettuata attraverso la costruzione del cariogramma (Fig. 3.1.1), ottenuto appaiando i cromosomi metafasici omologhi e ordinandoli secondo un sistema di classificazione Fig. 3.1.1. Cariogramma dei cromosomi metafasici dell’uomo. internazionale. L’identificazione inequivocabile di ogni cromosoma del cariotipo si ottiene con tecniche di colorazione di specifiche regioni cromosomiche, chiamate bandeggi (Fig. 3.1.2). Esistono diversi tipi di bandeggi e i principali sono: • Bande Q ottenute mediante l’impiego di un colorante fluorescente, la quinacrina: le bande più luminose corrispondono alle zone ricche in Adenina e Timina; • Bande G ottenute col colorante Giemsa: le bande più scure corrispondono alle zone ricche in Adenina e Timina e risultano quindi corrispondenti alle bande Q; • Bande R ottenute mediante denaturazione al calore e opportuna colorazione: risultano complementari alle Q e G perché la colorazione ha affinità per le basi Citosina e Guanina. Il bandeggio dei cromosomi serve per l’analisi citogenetica e per disporre di punti di riferimento per la mappatura dei geni. a Fig. 3.1.2. Differenti esempi di tecniche di bandeggio di cromosomi umani: a) Le bande Q si ottengono con la tecnica di bandeggio con quinacrina; b) Le bande G si ottengono con la tecnica di bandeggio Giemsa. 5 b 4. REPLICAZIONE DEL DNA Caratteristica peculiare del DNA è la sua capacità di autoreplicarsi, che rappresenta il fondamento della trasmissione dell’informazione genetica. La modalità di duplicazione del DNA era già stata intuita da Watson e Crick nel 1953, come conseguenza della struttura della molecola stessa. Il processo di duplicazione del DNA avviene nella fase S (sintesi) del ciclo cellulare (Fig. 4.1) e deve essere completo perché la cellula possa andare incontro alla divisione cellulare. G0 Ad ogni ciclo di divisione cellulare, ciascun cromosoma deve essere fedelmente duplicato in modo che ciascuna delle due cellule figlie ne possa ricevere una copia identica. La replicazione del DNA in tutte le cellule viventi, dai batteri all’uomo, è un processo complesso, che richiede l’intervento di più di una dozzina di enzimi diversi. La replicazione inizia in corrispondenza di siti detti origini di replicazione (Fig. 4.2) presenti ad intervalli lungo i cromosomi. In questi siti, alcune proteine enzimatiche (ad Fig. 4.1 Le quattro fasi principali del ciclo cellulare, G1, S, esempio la DNA elicasi) srotolano la doppia G2 e mitosi. elica di DNA, rompendo i legami a idrogeno tra le basi dei due filamenti complementari. Questo processo porta alla formazione delle bolle di replicazione, ciascuna con due forcelle replicative in cui la replicazione del DNA procede in senso opposto. I cromosomi eucariotici si duplicano rapidamente poichè la sintesi inizia a partire da molte origini di replicazione presenti nel genoma. La velocità di sintesi della DNA polimerasi eucariotica è di 50 basi al secondo: se in un cromosoma eucariotico fosse presente una sola origine di replicazione, il cromosoma impiegherebbe 35 giorni per completare la sua replicazione! Negli eucarioti è detto replicone o unità di replicazione la porzione di DNA che va dall′origine della replicazione ai due punti di terminazione della stessa, ovvero dove due forcelle di replicazione di due bolle adiacenti si incontrano. Fig. 4.2 L’immagine al microscopio elettronico mostra il DNA che si replica. Le particelle visibili lungo il filamento sono i nucleosomi. 1, 2 e 3 sono disegni dello stesso tratto di DNA come apparirebbero in stadi successivi di replicazione, con in evidenza l’origine della replicazione e le forcelle di replicazione; le linee gialle sono il filamento di DNA di partenza, mentre le linee rosse sono il DNA di nuova sintesi. 6 La polimerizzazione di una nuova catena di DNA (Fig. 4.3) si realizza grazie all’appaiamento successivo di nucleotidi complementari alla catena "stampo“ che vengono uniti tramite legami fosfodiesterici ad opera dell’enzima DNA polimerasi. La DNA polimerasi, per iniziare il processo, ha anche bisogno di un innesco, detto primer, a cui attaccarsi per procedere con la polimerizzazione. Durante la replicazione del DNA, il primer è costituito da una corta sequenza specializzata di RNA (sintetizzata ad opera di una RNA polimerasi, chiamata DNA primasi). Poichè la polimerizzazione avviene solo in direzione 5‘→ 3‘ la sintesi dei nuovi filamenti può avvenire senza interruzione solo nella direzione di avanzamento della forcella di replicazione (filamento guida), mentre nella direzione opposta (filamento in ritardo) avviene attraverso l’assemblaggio di corti frammenti di 100-2000 nucleotidi, detti frammenti di Okazaki, da parte della DNA ligasi. La replicazione è semiconservativa: ogni emielica (singolo filamento) della molecola madre serve da stampo per la sintesi di un nuovo filamento, per cui ogni doppia elica figlia sarà costituita da un filamento vecchio e da un filamento nuovo (Fig. 4.3). Le molecole risultanti sono copie esatte dell’originale quindi, da una doppia elica madre derivano due doppie eliche figlie uguali tra loro e Fig. 4.3 Rappresentazione grafica della replicazione del DNA, con la formazione dei due uguali alla molecola nuovi filamenti complementari ai filamenti “stampo” della molecola originaria. madre. 5. IL CONCETTO DI GENE La molecola del DNA, in quanto portatrice di informazioni, svolge un’importantissima funzione nella riproduzione, nello sviluppo e nel normale funzionamento degli esseri viventi; essa contiene infatti le informazioni per la sintesi delle proteine, le quali svolgono negli esseri viventi i più svariati compiti. Queste informazioni sono codificate da unità funzionali chiamate geni: ogni gene corrisponde ad un tratto di una molecola di DNA ed è caratterizzato da una particolare sequenza di basi azotate. L’ordine con cui le basi azotate si succedono lungo un gene specifica la proteina codificata dal gene stesso. 5.1 Il dogma centrale della biologia Il dogma centrale della biologia è basato sul principio che l'informazione genetica fluisca dal DNA verso l'RNA e che dall'RNA sia poi tradotta in PROTEINE (Fig. 5.1). Il DNA serve come stampo per la propria duplicazione e per la sintesi di una molecola intermedia, detta RNA messaggero (mRNA), che contiene le informazioni necessarie per la sintesi delle proteine. Questo processo è articolato in due tempi: nel primo, detto trascrizione, il DNA serve come stampo per la sintesi di un filamento di RNA complementare; nel secondo, detto traduzione, la sequenza di basi dell'mRNA è convertita in una sequenza di amminoacidi e dà luogo alla sintesi della proteina. Inizialmente si pensava che le informazioni contenute nel DNA fossero trasferite unidirezionalmente dal DNA all’RNA, ma nel 1970 la scoperta da parte di David Baltimore e Howard Temin di un enzima, chiamato trascrittasi inversa, in grado di sintetizzare DNA su stampo di RNA, ha rivoluzionato il dogma centrale, evidenziando come in realtà le informazioni possano essere trasferite anche da RNA a DNA. Tuttavia non tutti i 7 geni codificano proteine; esistono alcuni geni il cui unico prodotto è una molecola di RNA ( ad esempio i geni per gli RNA ribosomiali, per i tRNA, ecc). Fig. 5.1 Il flusso dell’informazione genetica. 5.2 Il genoma umano Genoma è il termine utilizzato per descrivere l’insieme delle informazioni genetiche contenute nel DNA delle cellule. In realtà i genomi delle cellule animali sono due: un genoma nucleare, che comprende circa il 99,9995% dell’informazione genetica totale e un piccolo genoma mitocondriale, che copre il rimanente 0,0005% . Nell’uomo il genoma nucleare (Fig. 5.1.1) è costituito da 3.300 Mb, a sua volta suddivisibile in un 25% che costituisce i geni e le sequenze correlate ai geni e in un 75% di DNA extragenico. Del 25% di geni e sequenze correlate, il 10% è DNA codificante, mentre il 90% è costituito da DNA non codificante. Il DNA non codificante è costituito da pseudogeni, frammenti genici, introni, sequenze non tradotte. Il DNA extragenico (il 75% del genoma nucleare) è costituito per il 40% da sequenze mediamente o altamente ripetute (ripetizioni in tandem, raggruppate o interperse) e per il 60% da sequenze uniche o con un basso numero di copie. Fig. 5.1.1 Organizzazione del genoma umano nucleare. 8 6. IL GENE EUCARIOTICO I geni eucariotici codificanti per la produzione di proteine, presentano una differenza sostanziale rispetto a quelli dei procarioti; essi hanno infatti una struttura “discontinua”, vale a dire che sono costituiti da regioni codificanti chiamate esoni, intervallate da tratti non codificanti, denominati introni (Fig.6.1). Il trascritto primario (o pre-mRNA chiamato anche hn-RNA, RNA eterogeneo nucleare) negli eucarioti viene sintetizzato come molecola precursore contenente esoni e introni, e deve subire una serie di modificazioni a livello nucleare prima di poter essere esportato nel citoplasma (come mRNA) dove verrà tradotto in proteine. Fig.6.1 Schema della struttura di un gene nelle cellule eucariotiche con la presenza di introni ed esoni alternati. Gli introni sono una costante in quasi tutti i geni degli eucarioti. Sono porzioni di gene che vengono copiate nel trascritto primario di RNA, ma vengono eliminate durante il processo di maturazione del mRNA. Gli introni si alternano con gli esoni che sono le porzioni di gene che vengono mantenute nella molecola di un RNA maturo che esce dal nucleo per venire tradotta. Il numero delle sequenze introniche e la loro lunghezza è molto variabile, ma hanno tutte come basi d’inizio la coppia GT e come fine la coppia AG. Gli introni rimossi dal pre-mRNA (Fig. 6.2), vengono trattenuti nel nucleo e degradati in sede intranucleare. Gli esoni sono i tratti di pre-mRNA che vengono mantenuti e che sono esportati dal nucleo sotto forma di mRNA maturo. Il processo maturativo che prevede la rimozione degli introni dal pre-mRNA è chiamato “splicing”. Più recentemente si è scoperto che esistono anche esoni “non codificanti” e quindi una definizione più moderna di esone può essere questa: un tratto del trascritto primario che entra a far parte della molecola di RNA maturo. Trascrizione Trascritto primario (pre-mRNA) Splicing mRNA maturo Traduzione Fig. 6.2 Schema riassuntivo delle fasi di maturazione di una molecola di mRNA trascritta da un gene strutturale di un organismo eucariotico, prima di essere tradotta in proteina (CDS = sequenza codificante). 9 7. RNA E TRASCRIZIONE Chimicamente l’RNA è molto simile al DNA: anch’esso è un polimero di nucleotidi composto da quattro tipi di monomeri (Fig. 7.1). Una delle differenze è rappresentata dallo zucchero, che è il ribosio in luogo del desossiribosio (Fig.7.2). La seconda differenza è costituita da una delle basi, che è l’uracile (U) al posto della timina. In questo caso è l’uracile a legarsi all’adenina, mentre la guanina si lega sempre alla citosina. La terza differenza consiste nel fatto che, nella maggior parte dei casi, l’RNA esiste come catena singola e non a doppio filamento. Fig. 7.1 Fig. 7.2 Differenze tra i costituenti molecolari dell’RNA e del DNA. Confronto fra la struttura del DNA e dell’RNA. Le molecole di RNA vengono sintetizzate attraverso un processo, conosciuto come trascrizione del DNA, dove un filamento di DNA funziona da stampo per la sintesi di un filamento di RNA complementare. La trascrizione presenta alcune similitudini con la duplicazione del DNA: una delle due catene del DNA funge da stampo, mentre i ribonucleotidi, legati per azione dell’enzima RNA-polimerasi, si allineano appaiando le proprie basi a quelle esposte del DNA (Fig. 7.3). Il processo può essere diviso in tre fasi: • Fase di inizio: l’RNA-polimerasi si lega al sito promotore del DNA per mezzo dei fattori trascrizionali. A seguito della formazione del complesso di inizio della trascrizione i due filamenti del DNA si separano localmente in modo da esporre una delle due catene alla copiatura. Il sito di inzio della trascrizione generalmente corrisponde ad una base purinica. • Fase di allungamento: l’RNA-polimerasi aggiunge altri nucleotidi al primo, e si forma un tratto di catena ibrida DNA-RNA in corrispondenza del DNA a singola elica. L’RNA-polimerasi si muove lungo il DNA, despiralizzando via via nuovi segmenti di DNA. A monte dell’enzima la doppia catena di DNA si riforma lasciando libero il filamento di RNA neoformato. • Fase di terminazione: riconoscimento del punto di fine della sintesi dell’RNA, cioè del sito terminatore. Quando l’ultima base è stata aggiunta alla catena di RNA, la RNA polimerasi e la molecola di RNA si distaccano dallo stampo e la doppia catena di DNA si riavvolge. 10 RNA RNA polimerasi RNA RNA Fig.7.3 a) Rappresentazione schematica della trascrizione dell’RNA in cui è mostrato sopra il filamento stampo che viene copiato durante la trascrizione e sotto il filamento complementare che ha la stessa sequenza della molecola di mRNA trascritto, salvo la U al posto della T. b) Lungo una molecola di DNA alcuni geni vengono trascritti utilizzando come stampo un’elica, altri utilizzando l’elica complementare. 7.1 RNA polimerasi eucariotiche Negli eucarioti sono presenti tre RNA polimerasi, che sintetizzano RNA per diversi tipi di geni; quella per i geni codificanti le proteine è la RNA polimerasi II. La tabella 1 illustra le differenti funzioni delle tre RNA polimerasi. Posizione nella cellula Geni trascritti RNA pol I nucleolo rRNA 18S, 28S, 5,8S RNA pol II nucleo mRNA RNA pol III nucleo tRNA, rRNA 5S, sn RNA Tab 1: rRNA=RNA ribosomale; tRNA=RNA transfer; mRNA=RNA messaggero; snRNA= small nuclear RNA. Gli RNA ribosomali (rRNA) vengono classificati in base alla loro velocità di sedimentazione misurata in Svedberg (S). Le unità Svedberg sono unità di misura della velocità di sedimentazione di particelle in sospensione sottoposte a centrifugazione. 7.2 Promotori e fattori di trascrizione In un gene, la regione a monte del sito di inizio della trascrizione (cioè il punto da cui la RNA polimerasi inizia a “copiare” uno dei due filamenti del gene in una molecola di RNA) viene chiamata promotore. Questa regione contiene i siti di legame per le RNA polimerasi e per numerosi fattori trascrizionali “generali” che facilitano il legame delle polimerasi al DNA (Fig. 7.2.1). Il promotore dei geni degli eucarioti contiene una sequenza specifica che viene riconosciuta dall’RNA polimerasi II; tale sequenza è la TATA box (dove box sta per contenitore, T è la timina e A l’adenina) che si trova a circa 30 coppie di basi a monte del sito di inizio della trascrizione. La presenza di una regione ricca di basi Adenina e Timina vicina al sito d’inizio della trascrizione facilita l’apertura della doppia elica, dal momento che A e T sono unite da 11 due legami idrogeno (mentre la coppia C e G è stabilizzata da 3 legami idrogeno) e sono quindi più facilmente separabili. L’integrità della TATA-box è essenziale affinché la RNA polimerasi possa iniziare correttamente la trascrizione. La TATA-box è tipica dei promotori degli eucarioti, ma anche nei procarioti è presente una sequenza molto simile con le stesse proprietà, la TATAAT-box. Prima che l’RNA polimerasi possa legarsi al promotore è necessario che un fattore di trascrizione, chiamato TFIID, si leghi al DNA in corrispondenza della TATA-box; a questo primo fattore se ne legano in successione altri che formano il complesso di inizio della trascrizione. Un'altra sequenza importante del promotore è la CAAT-box (a una distanza di circa 80 coppie di basi dal sito di inizio della trascrizione) la quale è un altro sito di riconoscimento per la RNA polimerasi. Mutazioni della sequenza CAAT causano la riduzione della trascrizione. Inoltre nei promotori dei geni eucariotici sono presenti molte altre sequenze regolatrici in grado di legare fattori trascrizionali “specifici”, che modulano l’espressione di uno specifico gene sia in senso positivo (aumentandola) che in senso negativo (diminuendola). Alcune di queste sequenze regolatrici dei promotori sono comuni a molti geni, mentre altre sono specifiche solo di alcuni geni e riconosciute da fattori di trascrizione presenti solo in alcuni tessuti; in questo modo è possibile ottenere una trascrizione selettiva, importante nel differenziamento cellulare. Fig. 7.2.1 Reclutamento di fattori trascrizionali su sequenze di regolazione del gene. 12 7.3 Modificazioni post trascrizionali dell’mRNA Mentre nei procarioti l’mRNA trascritto viene immediatamente tradotto, negli eucarioti il pre-mRNA subisce una serie di modificazioni all’interno del nucleo (Fig.7.3.1). Il processo di maturazione del premRNA prevede l’aggiunta di una struttura in posizione 5’ chiamata “cap”, di una sequenza “poli-A” in posizione 3’e la rimozione degli introni. Il cap è costituito da un nucleotide metilato della guanina, la 7-metil guanosina, legato mediante tre gruppi fosfato al primo nucleotide dell’mRNA. Esso viene aggiunto alla Fig. 7.3.1 Modificazioni delle estremità del pre-mRNA eucariotico; il molecola di RNA poco dopo l’inizio cappuccio G e la coda di poli-A sono importanti per il corretto della sua sintesi, quando il filamento funzionamento dell’mRNA. ha raggiunto la lunghezza di 20-30 nucleotidi. Il cap ha la funzione di stabilizzare la molecola di RNA e di favorirne l’associazione con i ribosomi. Si è notato che le molecole di RNA prive di cap vengono degradate velocemente. Dopo il cap si trova una sequenza di basi, di lunghezza variabile, detta 5’UTR (UnTranslated Region), regione che non viene tradotta, a cui fa seguito la regione codificante. A valle del codone di stop si trova invece la 3’UTR, una sequenza di lunghezza variabile che rappresenta l’ultima parte del trascritto, a valle del codone di fine trascrizione (codone di stop) e contenente la coda di poli-A. La sequenza di poli-A viene aggiunta dopo la completa trascrizione dell’RNA a quasi tutti gli mRNA (con l’eccezione degli mRNA codificanti per le proteine istoniche) con una serie di fasi che prevedono il distacco degli ultimi 10–30 nucleotidi del trascritto, mediante taglio enzimatico ad opera di una endoribonucleasi, e l’aggiunta di una serie di 100-250 nucleotidi di adenina all’estremità del filamento. Il riconoscimento della posizione precisa dove aggiungere il poli-A è determinato dalla presenza di una sequenza specifica (normalmente AATAAA) chiamata segnale di poliadenilazione. Il poli-A partecipa al trasferimento dell’mRNA nel citoplasma, alla traduzione e serve a stabilizzare la molecola di mRNA; la sua lunghezza diminuisce con l’invecchiamento dell’RNA. Inoltre il poli-A è risultato essere costituito da un numero maggiore o minore di nucleotidi a seconda della proteina da produrre; per esempio, la sintesi di un ormone richiede un mRNA poco degradabile, e quindi con una lunga coda di poli-A, mentre un fattore di crescita dovrà essere sintetizzato da un RNA rapidamente degradabile e quindi con un corto poli-A. Infine è importante ricordare che sia l’hnRNA (o pre-mRNA) che l’mRNA maturo sono associati a ribonucleoproteine che li proteggono dalla degradazione e ne determinano una relativa stabilità, come nel caso degli RNA presenti nella cellula uovo che devono essere stabili perché si attivano solo dopo la fecondazione. 7.4 Lo splicing Il processo di eliminazione degli introni e di saldatura degli esoni, o processo di splicing, è essenziale per produrre una molecola di mRNA da cui tradurre una proteina con una sequenza amminoacidica corretta. Un gene umano medio contiene 8/9 esoni, però esistono anche geni di 363 esoni; un esone è lungo mediamente 150 bp mentre la lunghezza di un introne va da 3000 bp a 800.000 bp. Il meccanismo di rimozione degli introni, nella maggior parte dei premRNA nucleari, prevede l’intervento di piccole molecole di RNA chiamate snRNA (small 13 nuclear RNA) associate a catene polipeptidiche per formare un complesso denominato snRNP (particelle ribonucleoproteiche nucleari piccole, si pronuncia snurp). Una di queste snRNP, detta U1, riconosce un segnale specifico al confine esone-introne, sul lato 5’ dell’introne, a cui si lega per complementarietà delle basi; una seconda snRNP, detta U2, si lega all’estremità 3’ della sequenza intronica. Dopo le prime due, altre snRNP si legano al complesso che prende il nome di spliceosoma; le proteine avvicinano le due estremità dell’introne formando un’ansa a livello della quale vengono operati dei tagli che portano all’eliminazione degli introni a cui segue la saldatura degli esoni. Per circa la metà dei geni presenti nel genoma umano è possibile operare uno splicing alternativo, eliminando, insieme agli introni, anche un esone. In questo modo, dallo stesso trascritto primario, è possibile ottenere più mRNA maturi che porteranno alla formazione di proteine differenti ( Fig. 7.4.1). Siti di poliadenilazione Fig. 7.4.1 Trascrizione e maturazione alternative tramite la scelta di vari siti di splicing e vari siti di poliadenilazione. Il gene in questione codifica per la tropomiosina che è una proteina che regola la contrazione nelle cellule muscolari. L’inserimento nel trascritto maturo di alcuni esoni e non di altri dà come risultato messaggeri che codificano per proteine diverse. Lo schema di splicing alternativo costituisce un importante possibilità di regolazione dell’espressione genica, in tessuti diversi. Un ulteriore vantaggio dello splicing alternativo consiste nel notevole aumento del contenuto informativo del genoma: nell’uomo da cira 20.000 geni possono essere prodotte più di 80.000 proteine diverse. Una volta terminato il processo di maturazione, gli mRNA passano nel citoplasma per svolgere la loro funzione nella sintesi proteica. 14 8. IL CODICE GENETICO E LA TRADUZIONE Una volta identificato l’mRNA come molecola deputata a trasferire l’informazione dal DNA alle proteine (Fig.8.1), resta da comprendere come i 4 nucleotidi di cui sono composti gli acidi nucleici possano specificare la sequenza delle proteine, che sono costituite da 20 amminoacidi diversi. • Se ogni nucleotide “codificasse” per un amminoacido, le quattro basi potrebbero determinare solo quattro amminoacidi. Se un amminoacido corrispondesse a due nucleotidi, vi sarebbero un massimo di 16 possibili combinazioni (42) , mentre se si fanno corrispondere a un amminoacido tre Fig.8.1 L’informazione genetica passa dal DNA all’RNA per essere nucleotidi in sequenza (ovvero un utilizzata per dirigere la sintesi proteica nel citoplasma. “codone”), il numero delle combinazioni possibili (43 = 64) è sufficiente e addirittura ridondante, per codificare 20 amminoacidi diversi. Il codice a triplette (Fig.8.2) fu universalmente accettato come ipotesi di lavoro, e decifrato, negli anni ’70, molti anni dopo la scoperta della struttura del DNA, da Marshall Nirenberg e Heinrich Matthaei. • Delle 64 possibili combinazioni di triplette 61 codificano per amminoacidi e tre sono segnali di arresto della sintesi proteica. Essendoci 61 combinazioni codificanti per 20 amminoacidi è chiaro che devono esserci più codoni per ogni amminoacido (si dice che il codice è ridondante). • Insieme alla decifrazione del codice, si arrivò alla elencazione delle sue più importanti proprietà generali: - è composto da triplette nucleotidiche: ogni codone è composto da tre nucleotidi; - non è sovrapposto: ogni nucleotide dell’mRNA appartiene soltanto ad un codone; - è privo di virgole: durante la traduzione, i codoni sono letti consecutivamente, non ci sono né virgole né altre forme di punteggiatura all’interno delle regioni codificanti le molecole dell’ mRNA; - è degenerato: tutti gli amminoacidi, eccetto due (metionina, met e triptofano, trp), sono specificati da più di un codone; - è ordinato: i molteplici codoni specifici per un amminoacido e quelli codificanti amminoacidi con proprietà chimiche simili, risultano essere correlati, differendo di solito per un singolo nucleotide; - contiene codoni di inizio e di termine; - è quasi universale: con poche eccezioni (ad esempio, il DNA mitocondriale e quello dei cloroplasti), i codoni hanno lo stesso significato in tutti gli organismi viventi. 15 Fig. 8.2 Il codice genetico formato dalle 64 possibili triplette (codoni) e, a fianco, i corrispondenti amminoacidi indicati con l’abbreviazione inglese a tre lettere. 8.1 La sintesi proteica Una volta decifrato il codice genetico ci si può chiedere come l’informazione codificata dal DNA e trascritta nell’mRNA possa specificare la sintesi di una determinata catena polipeptidica contenente una sequenza definita di amminoacidi. Questo processo viene chiamato traduzione (Fig. 8.1.1). I princìpi base della sintesi proteica sono comuni alle cellule procariotiche ed eucariotiche, anche se esistono alcune differenze notevoli che saranno meglio evidenziate al termine di questa trattazione. La sintesi delle proteine richiede oltre all’mRNA anche altri due tipi di RNA: l’RNA ribosomale (rRNA) e l’RNA di trasferimento (tRNA). Queste molecole differiscono dall’mRNA sia per la struttura che per la funzione. Vengono trascritte da geni presenti in copie multiple nel DNA della cellula; come l’mRNA, subiscono maturazione nel nucleo e vengono esportate nel citoplasma. I ribosomi, il macchinario molecolare deputato alla sintesi proteica, sono dei complessi macromolecolari costituiti da proteine e da rRNA, presenti sia nelle cellule eucariotiche che procariotiche. Sebbene i ribosomi eucariotici siano più grandi di quelli procariotici, la loro struttura generale è Fig. 8.1.1 La sintesi proteica: rappresentazione schematica di una la stessa. Ogni ribosoma risulta infatti molecola di mRNA percorsa da un ribosoma. La traduzione della costituito da una subunità maggiore ed una sequenza nucleotidica in una sequenza amminoacidica avviene tramite l’appaiamento tra i codoni dell’mRNA e gli anticodoni portati dai tRNA subunità minore. Le dimensioni delle che a loro volta recano uno specifico amminoacido legato all’estremità 3’. subunità ribosomiali e delle molecole di 16 rRNA che le compongono vengono in genere espresse in unità Svedberg (S). Negli eucarioti i ribosomi (80S) sono costituiti da una subunità maggiore di 60S e una minore di 40S (si noti che le unità Svedberg non sono additive). La subunità minore (40S) contiene una singola molecola di rRNA (18S), mentre quella maggiore (60S) contiene tre rRNA (28S, 5,8S e 5S). La struttura dei ribosomi procariotici è più semplice comprendendo solo tre rRNA, un rRNA (16S) per la subunità minore (30S) e due rRNA (23S e 5S) per la subunità maggiore (50S). Le subunità ribosomiali negli eucarioti si assemblano all’interno del nucleolo, dove avviene la sintesi degli rRNA, e poi passano nel citoplasma attraverso i pori nucleari. Le due subunità si associano a formare il ribosoma funzionante solo in presenza di molecole di mRNA e di tRNA Fig. 8.1.2 Struttura di una molecola di tRNA. iniziatore. I tRNA (Fig.8.1.2) sono molecole relativamente piccole, costituite da circa 80 nucleotidi legati insieme in un’unica catena con una caratteristica configurazione a trifoglio dovuta a legami idrogeno che tengono uniti alcuni nucleotidi. La catena termina sempre con la tripletta CCA all’estremità 3’; a questa estremità avviene il legame con l’amminoacido portato dallo specifico tRNA. Un secondo sito d’attacco è costituito dai tre nucleotidi che formano l’anticodone, il quale è complementare a uno specifico codone dell’mRNA. Una terza regione della molecola funziona come sito di riconoscimento per l’enzima amminoacil-tRNA-sintetasi, che catalizza l’attacco di uno specifico amminoacido alla corrispondente molecola di tRNA, in modo che l’amminoacido sia pronto per essere inserito in un punto preciso della catena polipeptidica in via di formazione. Le cellule contengono più di 20 tipi diversi di molecole di tRNA, almeno uno per ciascun amminoacido. La traduzione si svolge in tre fasi: inizio, allungamento e terminazione. La fase d’inizio comincia quando la subunità ribosomale minore si attacca all’estremita 5’ del filamento di mRNA e lo percorre in direzione 3’ fino ad incontrare il primo codone di inizio. Questo codone è, in genere, 5’-AUG3’ ed è complementare all’anticodone 3’UAC-5’ del t-RNA che porta la metionina, detto tRNA iniziatore. Nei procarioti questo tRNA porta con sè una forma modificata dell’amminoacido metionina, la formilmetionina (fMet), che sarà perciò il primo amminoacido della catena polipeptidica in via di formazione. Generalmente, tuttavia, completata la traduzione questo amminoacido viene rimosso dal polipeptide. L’unione fra la subunità ribosomale minore, l’mRNA e il tRNA d’inizio costituisce il complesso d’inizio. Una volta formatosi il complesso d’inizio, la subunità maggiore del ribosoma si unisce alla minore e il tRNA d’inizio con la fMet si trova ad occupare il sito peptidilico (sito P) della subunità maggiore che è uno dei due siti di legame con il t-RNA. Nella fase di allungamento sul secondo codone dell’mRNA che è esposto nel sito amminoacilico (sito A) della subunità maggiore del ribosoma si lega un tRNA con un anticodone complementare che porta l’amminoacido corrispondente. Si forma 17 successivamente un legame peptidico tra i due amminoacidi, con l’attacco della fMet al secondo residuo della proteina nascente. Il primo tRNA viene liberato, il ribosoma si sposta in avanti di un codone lungo la catena di mRNA e, di conseguenza, il secondo tRNA a cui sono attaccati fMet e il secondo amminoacido passa dalla posizione A alla posizione P; un terzo complesso amminoacidotRNAsi inserisce nella posizione A, adesso libera, di fronte al terzo codone dell’mRNA, e l’operazione si ripete. A mano a mano che il ribosoma si sposta lungo la catena di mRNA, la parte iniziale del messaggero rimane libera e un altro ribosoma può formare con essa un complesso d’inizio, formando strutture chiamate polisomi (o poliribosomi), cioè un gruppo di ribosomi che avanzano in fila indiana lungo una stessa molecola di mRNA. La fase di termine si verifica quando sul sito A del ribosoma si affaccia uno dei tre codoni che hanno la funzione di terminare la traduzione (UAA, UAG e UGA). Non esistono tRNA con anticodoni corrispondenti a questi codoni e, di conseguenza, nel sito A non entrerà più alcun tRNA. Quando si giunge a un codone di terminazione, la traduzione cessa, la catena polipeptidica viene liberata e le due subunità ribosomali si separano. Lo schema descritto è quello della sintesi proteica nei procarioti. Le differenze più importanti nei processi di trascrizione-traduzione che si osservano negli eucarioti rispetto ai procarioti sono: Negli eucarioti il primo amminoacido inserito è la metionina, portata da un tRNA iniziatore che ha affinità per il sito P. Esiste un secondo tRNA per la metionina che, come tutti gli altri tRNA, ha affinità per il sito A e consente l’inserimento delle metionine interne alle proteine; i geni procariotici sono raggruppati in operoni (gruppi di geni strutturali che vengono trascritti in un’unica molecola di mRNA); negli eucarioti trascrizione e traduzione sono separate nello spazio (nucleo e citoplasma) e nel tempo; di conseguenza, negli eucarioti la regolazione dell’espressione genica per ottenere specifici prodotti può avvenire a molti livelli differenti: a livello di trascrizione, durante la maturazione dell’mRNA, nella fase di trasporto dell’mRNA, nella fase di traduzione dell’mRNA in proteine e a livello del controllo dell’attività proteica. Il percorso che va dal DNA alle proteine ha molte tappe (Fig. 8.1.3), ognuna delle quali è regolabile; una cellula può regolare le proteine da sintetizzare controllando quando trascrivere un certo gene e con quale frequenza, controllando come modificare un trascritto primario di RNA nello splicing o in altre fasi della sua maturazione, selezionando gli mRNA da tradurre sui ribosomi, attivando o inattivando selettivamente proteine già sintetizzate. Pur esistendo tutti questi meccanismi regolativi, per la maggior parte dei geni il controllo della trascrizione è il meccanismo di regolazione prevalente. In questo modo non si formano molecole intermedie inutili. DNA Fig. 8.1.3 L’espressione dei geni eucariotici può essere regolata a diversi livelli. 18 9. LE MUTAZIONI Le mutazioni sono alterazioni del corredo genetico (genoma) di un individuo. Spesso derivano da errori nella replicazione del genoma. Le mutazioni possono essere spontanee o indotte. L'induzione di mutazioni si ottiene con mutageni fisici, chimici o biologici. I fattori fisici più comuni nella mutagenesi sono le radiazioni UV, X e gamma. I raggi UV inducono la formazione di un legame covalente tra due pirimidine adiacenti, bloccando così replicazione e trascrizione del DNA; invece le altre radiazioni (dette ionizzanti) rimuovono elettroni dalle molecole biologiche generando prodotti intermedi molto reattivi che causano diversi tipi di danni DNA. I mutageni chimici agiscono sul DNA già esistente oppure provocano errori nella sintesi del nuovo DNA. Non sempre l'azione di agenti mutageni causa una mutazione perchè il DNA non è l'unico potenziale bersaglio. In alcuni casi, possono esserlo anche l’RNA o le proteine con conseguenze meno rilevanti nella cellula. Inoltre, l'effetto mutageno è in relazione con la dose e con l'efficacia dei meccanismi di riparazione pre-replicativa e post-replicativa di cui la cellula dispone. I prodotti genici che si ottengono dopo mutazione, quando questa non li renda del tutto privi di senso o letali per la cellula, sono di solito inattivi o meno attivi di quelli originari oppure, sebbene molto raramente, provvisti di attività maggiore o diversa. Le mutazioni possono essere a carico delle cellule somatiche o germinali. Quelle a carico delle cellule somatiche provocano danni all’individuo che le porta, invece quelle a carico delle cellule germinali, cioè le cellule riproduttive, vengono trasmesse alla progenie. Le mutazioni possono essere di tre tipi: genomiche, cromosomiche e geniche o puntiformi 9.1 Mutazioni genomiche Consistono in una variazione del numero di cromosomi dovuta a perdita o aggiunta di interi cromosomi. Si distinguono in: • • Aneuploidie: sono molto gravi e si verificano quando ad un organismo diploide (2n) viene a mancare (2n-1) oppure viene aggiunto (2n+1), un particolare cromosoma (es. trisomia 21 o sindrome di Down, trisomia 13 o sindrome di Patau, trisomia 18 o sindrome di Edwards, sindrome di Turner XO). Poliploidie: compaiono quando si aggiungono uno o più corredi cromosomici completi. In questo modo un individuo si trova a possedere, all'interno dei nuclei delle sue cellule, un corredo cromosomico triplo (3n) o quadruplo (4n). 9.2 Mutazioni cromosomiche Le mutazioni cromosomiche sono dovute a eliminazione di interi pezzi di cromosomi o quando pezzi di cromosoma si fondono con altri già presenti o si duplicano cambiando la struttura del cromosoma e influenzando la regolazione dell’attività dei geni in quanto questa dipende, in parte, dalla localizzazione dei geni nel genoma. Le mutazioni cromosomiche fortunatamente sono piuttosto rare. Si evidenziano i seguenti tipi di mutazioni cromosomiche (Fig.9.2.1): • • Delezioni e duplicazioni: portano alla perdita di piccoli segmenti durante la meiosi. Questi s’inseriscono nel cromosoma omologo che viene quindi a possedere un tratto del DNA duplicato. Dei due cromosomi omologhi, uno perde geni, mentre l’altro ne acquista una quantità maggiore. Traslocazioni: scambio di materiale cromosomico tra due cromosomi non omologhi. 19 • • • Inversioni: sono dovute a pezzi di cromosoma che si staccano e s’inseriscono in posizione capovolta. Fusione centrica: fusione di due cromosomi con perdita di un centromero Dissociazione centrica: fenomeno inverso alla fusione; in questo caso da un cromosoma se ne ottengono due con formazione di un nuovo centromero. delezione Basi perse traslocazione inversione Fig.9.2.1 Mutazioni cromosomiche 9.3 Mutazioni geniche o puntiformi Le mutazioni geniche o puntiformi consistono in cambiamenti nella sequenza delle basi del DNA. Le mutazioni puntiformi comprendono: le sostituzioni, le inserzioni e le delezioni. Nello schema seguente sono mostrati diversi tipi di mutazioni puntiformi: GAC-AAA-GGA-TGA-CTG SEQUENZA ORIGINALE GAC-AAA-CGA-TGA-CTG SOSTITUZIONE DI G CON C GAC-AAA-TGG-ATG-ACT-G GAC-AA~G-GAT-GAC-TG INSERZIONE DI T DELEZIONE DI A La sostituzione di una base azotata puo’ provocare: a) Una mutazione “sinonima” se la tripletta codifica per lo stesso amminoacido. Questo puo’ avvenire perche’ il codice genetico e’ degenerato, cioe’ ridondante e uno stesso amminoacido può essere codificato da diverse triplette. b) Una mutazione "missense" se l’effetto è quello di formare una tripletta che codifica per un amminoacido diverso da quello iniziale. La proteina che incorporerà quell’amminoacido può perdere o modificare la sua attività. c) Una mutazione "non sense" se si forma una tripletta che non codifica per alcun amminoacido (tripletta di stop o di arresto). Questo comporta l’arresto prematuro della sintesi proteica a livello ribosomale. d) Una mutazione di “allungamento” se una tripletta di stop viene sostituita da una tripletta codificante. La delezione o l’inserzione di basi determina uno slittamento (frameshift) nella lettura del codice genetico che, come si usa dire, e’ un codice privo di punteggiatura. Quindi se in un 20 gene si inserisce o si perde una base, le triplette da quel punto in poi cambiano con conseguente produzione di una catena polipeptidica completamente alterata. E’ importante osservare che le mutazioni puntiformi dovute a sostituzioni di basi azotate possono essere silenti, cioe’ non avere alcun effetto fenotipico. Questo puo’ avvenire per diverse ragioni: • la mutazione avviene in un gene che controlla la sintesi di una proteina non indispensabile; • La sequenza mutata non si esprime (zone introniche); • la mutazione forma una tripletta che codifica per lo stesso amminoacido della tripletta originaria; • la mutazione viene soppressa da un’altra mutazione; • la mutazione è una mutazione missense che inserisce un amminoacido funzionalmente simile a quello originale e che quindi non altera la funzionalita’ della proteina. 21 10. DOMANDE DI AUTOVALUTAZIONE 1) I cromosomi sono costituiti da: a) DNA e proteine b) RNA e proteine c) solo RNA d) DNA e RNA e) solo DNA 2) Le diverse forme di un gene ad un dato “locus” sono dette: a) caratteri b) cariotipi c) alleli d) genotipi e) fenotipi 3) Negli eucarioti superiori i cromosomi sessuali sono presenti: a) solo nelle cellule diploidi b) in tutte le cellule c) solo nelle cellule somatiche d) solo nelle cellule sessuali e) solo nei gameti 4) Le aneuploidie cromosomiche possono consistere: a) nella presenza di un autosoma in più b) nella presenza di un cromosoma sessuale in più c) nell’assenza di un cromosoma sessuale d) nell’assenza di un autosoma e) tutte le risposte sono corrette 5) Quale tra le seguenti è una coppia complementare di basi nel DNA? a) adenina e citosina b) guanina e adenina c) timina e guanina d) timina e adenina e) tutte le risposte sono corrette 6) Nel DNA quali componenti sono rivolte verso l’esterno della doppia elica? a) zuccheri b) basi azotate c) gruppi fosfato d) zuccheri e basi azotate e) zuccheri e gruppi fosfato 7) Grazie all’enzima DNA polimerasi: a) i nucleotidi si legano tra loro b) si formano legami ad idrogeno c) si rompono legami ad idrogeno d) si uniscono basi complementari e) il DNA viene trascritto in mRNA 8) Le informazioni contenute in un gene determinano la produzione di: a) un lipide b) un nucleotide c) una proteina 22 d) e) un acido nucleico uno zucchero 9) Nel codice genetico: a) il linguaggio è lo stesso per tutti gli esseri viventi b) non esiste “punteggiatura” c) un amminoacido può essere codificato da più triplette d) l’unità di codice è la tripletta e) tutte le risposte sono esatte 10) Quale delle seguenti molecole non interviene nel processo di traduzione? a) DNA b) mRNA c) rRNA d) amminoacil-tRNA-sintetasi e) tRNA 11) Una mutazione nella quale un frammento di DNA viene spostato su un altro cromosoma viene detta: a) traslocazione b) duplicazione c) delezione d) sostituzione e) clonazione 12) Quale dei seguenti è un esempio di mutazione genica? a) uno scambio di frammenti tra cromosomi b) la perdita di un frammento di cromosoma c) la trisomia del cromosoma 21 d) la mancanza di un intero cromosoma e) la sostituzione di un nucleotide 13) Quale dei seguenti codifica per un polipeptide? a) un nucleotide b) una tripletta c) un gene d) un telomero e) un introne 14) Quale di queste affermazioni sul codice genetico è corretta? a) si basa sulla combinazione di tre nucleotidi b) a ogni amminoacido corrisponde una sola tripletta c) ad ogni tripletta corrisponde un solo amminoacido d) sia a che b e) sia a che c 15) Fra le molecole/strutture indicate, quale non partecipa direttamente alla sintesi di polipeptidi? a) tRNA b) mRNA c) DNA d) la subunità minore del ribosoma e) la subunità maggiore del ribosoma 23 16) Qual è la sequenza di RNA complementare alla sequenza 3’ACAGT5’? a) 5’AUAUA3’ b) 5’ACUGU3’ c) 5’UCUGA3’ d) 5’GCGCU3’ e) 5’UGUCA3’ 17) Quale delle seguenti affermazioni in merito alle mutazioni è errata? a) possono avvenire spontaneamente b) si possono provocare c) non sono ereditabili d) non sempre sono letali e) possono avvenire solo nelle cellule germinali 18) Come si definisce una mutazione che causa questa variazione nucleotidica? AATCGC --> AATTGC a) inserzione b) delezione c) sostituzione d) inversione e) mutazione frameshift 19) Una mutazione che consiste nell’aggiunta di un nucleotide alla sequenza di DNA è detta: a) sostituzione b) traslocazione c) inversione d) inserzione e) delezione 20) Quando le cellule contengono tre copie di un cromosoma si parla di: a) delezione cromosomica b) trisomia c) traslocazione cromosomica d) poliploidia e) allele multiplo 21) La sostituzione della timina con l’adenina in un gene è un esempio di: a) inversione b) mutazione cromosomica c) mutazione puntiforme d) traslocazione e) mutazione dell’RNA 22) La poliploidia è un esempio di: a) mutazione cromosomica b) mutazione genica c) mutazione puntiforme d) traslocazione e) mutazione genomica 23) La sequenza di basi azotate del DNA specifica: a) la struttura del nucleo b) l’attività dei ribosomi c) la sequenza degli amminoacidi di una proteina d) il cariotipo 24 e) la struttura del cromosoma 24) L’informazione genetica del DNA è determinata: a) dai 20 amminoacidi delle proteine b) dalla sequenza di basi azotate c) dall’alternanza di zuccheri e gruppi fosfato d) dal numero di cromosomi e) dal numero di geni 25) Che cos’è la cromatina? a) un filamento di DNA che funge da stampo nella duplicazione del DNA b) il centro organizzativo dei microtubuli di una cellula c) il complesso di DNA e proteine presenti nel nucleo d) i filamenti proteici che formano il fuso mitotico e) il componente fondamentale dei ribosomi 26) Quanti cromosomi sono presenti nel nucleo di una cellula tetraploide, se il numero diploide di cromosomi è 32? a) 90 b) 16 c) 32 d) 48 e) 64 27) Che cosa si intende per aneuploidia? a) un’alterazione nella struttura di un cromosoma b) la condizione per cui si hanno cromosomi in più o in meno rispetto al normale corredo cromosomico diploide c) la mancanza di un tratto di cromosoma d) l’inversione di un tratto di cromosoma e) la presenza di un numero doppio di cromosomi rispetto al corredo diploide 28) Quando una porzione di cromosoma si stacca e si reinserisce capovolta si ha una: a) inversione b) delezione c) poliploidia d) traslocazione e) duplicazione 29) Le due basi complementari di ogni coppia di basi azotate della doppia elica di DNA sono legate una all’altra mediante legami: a) fosfato b) idrogeno c) carbonio-carbonio d) ionici e) covalenti 30) La funzione della DNA polimerasi è: a) rinforzare i legami tra le basi azotate b) sintetizzare molecole di DNA c) sintetizzare molecole di RNA d) trasportare il DNA dal nucleo al citoplasma e) inserire mutazioni nel DNA 31) Una mutazione puntiforme: 25 a) b) c) d) e) interessa un’unica cellula interessa una sola via metabolica determina la perdita di un cromosoma è sempre letale comporta una variazione di uno o pochi nucleotidi 32) Le mutazioni che avvengono nelle cellule somatiche: a) non sono trasmesse alla progenie b) sono trasmesse alla progenie c) non sono mai dannose d) sono sempre dannose e) sono sempre spontanee 33) Il codice genetico è uguale: a) in tutti gli organismi, eccetto le piante b) in quasi tutti gli organismi c) in tutti gli organismi eccetto i batteri d) in tutti gli organismi eccetto gli esseri umani e) in tutti gli organismi eccetto i virus 34) Che cos’è un codone? a) un tratto di cromosoma che codifica per un mRNA b) una tripletta di mRNA che codifica per un amminoacido c) una sequenza di tre amminoacidi in una proteina d) una sequenza del DNA che funge da stampo per l’RNA polimerasi e) un enzima coinvolto nella sintesi proteica 35) Quale o quali dei seguenti processi avviene/avvengono nel nucleo? a) solo la duplicazione del DNA b) solo la trascrizione del DNA c) la trascrizione e la traduzione del DNA d) la duplicazione e la trascrizione del DNA e) la duplicazione, la trascrizione e la traduzione del DNA 36) Individua i due completamenti corretti. Le proteine sono: a) grandi monomeri b) raggruppamenti di amminoacidi e acidi nucleici c) molecole costituite da monomeri identici ripetuti d) catene costituite da mattoni caratterizzati da specifici gruppi funzionali e) polimeri di amminoacidi 37) Individua il completamento corretto. L’emoglobina è costituita da quattro subunità a) uguali b) uguali a due a due c) tutte diverse tra loro d) completamente indipendenti e) sono corrette le risposte c e d 38) Quali fra questi gruppi funzionali non sono presenti nella molecola di un generico amminoacido? a) un gruppo amminico b) il gruppo alcolico c) il gruppo variabile R 26 d) e) il gruppo carbossilico il gruppo aldeidico 39) Per denaturazione di una proteina si intende: a) un’alterazione della sua configurazione tridimensionale specifica b) l’eliminazione di alcuni tratti della catena polipeptidica c) un processo mediante cui la proteina diventa solubile in acqua d) la possibilità per una proteina di trasformarsi in un altro composto organico e) l’effetto di una mutazione 40) L’esatta sequenza del passaggio d’informazione genica nella cellula è: a) DNA, traduzione, t-RNA, trascrizione, proteine b) DNA, trascrizione , m-RNA, traduzione, proteine c) m-RNA, trascrizione, , t-RNA, traduzione , proteine d) RNA, trascrizione, DNA, traduzione, proteine e) DNA, m-RNA , traduzione, trascrizione, proteine 41) Individua il completamento corretto. In ogni ribosoma, i siti di legame per gli RNA di trasporto: a) ospitano una coppia di amminoacidi attaccandoli con un legame peptidico b) sono tre come i nucleotidi che compongono i codoni c) si trovano nella subunità maggiore d) sono i siti in cui si posiziona l’m-RNA che deve essere trascritto e) facilitano il diretto legame tra gli amminoacidi e i codoni dell’mRNA 42) Individua il completamento corretto. Senza le molecole di t-RNA una cellula non potrebbe: a) trasportare nel citoplasma le molecole presenti nel nucleo indispensabili alla sintesi proteica b) copiare il messaggio contenuto nel filamento di DNA c) separare i due filamenti che compongono la doppia elica del DNA d) tradurre l’informazione genica contenuta nell’mRNA e) sintetizzare molecole di mRNA 43) Il numero di codoni possibili in una cellula procariotica è a) 4 b) 3 c) infinito d) 64 e) tante quante sono le proteine 44) Nel DNA di una data specie, l’adenina costituisce il 28% in peso; in quale percentuale è presente la guanina? a) 72% b) 28% c) 22% d) 50% e) non si può determinare 45) Che cosa è un gene? a) un cromosoma b) una sequenza di amminoacidi c) una sequenza di nucleotidi che può essere trascritta in RNA d) una struttura costituita da due cromatidi contenuta nel nucleo di una cellula e) un segmento di cromosoma che viene trascritto in DNA o in RNA 27 46) La fase S del ciclo cellulare si verifica: a) dopo la fase G2 b) prima della fase G1 c) fra la fase G1 e la fase G2 d) subito dopo la citodieresi e) solo nel ciclo meiotico 47) Per quali aspetti differiscono il DNA e l’RNA? a) per il fatto di essere costituiti da nucleotidi b) perché solo il DNA contiene un gruppo fosfato c) per la presenza di una diversa base azotata d) perché solo l’RNA contiene uno zucchero pentoso e) per la presenza di legami fosfodiesterici 48) Indicare il corretto ordine decrescente di dimensioni: a) gene, cromosoma, nucleotide, codone b) cromosoma, gene, codone, nucleotide c) nucleotide, cromosoma, gene, codone d) cromosoma, nucleotide, gene, codone e) gene, cromosoma, codone, nucleotide 49) In un nucleotide del DNA: a) il gruppo fosfato è legato allo zucchero ribosio b) è presente solo una delle quattro basi azotate c) vi è un atomo di ossigeno in più rispetto al corrispondente nucleotide dell’RNA d) lo zucchero è un esoso e) vi possono essere differenti tipi di gruppo fosfato 50) La replicazione del DNA: a) richiede l’intervento di pochi enzimi e proteine b) avviene in seguito alla rottura dei legami covalenti che uniscono tra di loro i nucleotidi di un filamento c) assicura la formazione di due molecole figlie identiche d) è un processo molto lento e) si verifica solo nelle cellule degli eucarioti 28 11. GLOSSARIO Sequenza guida (leader) presente all’estremità 5’ della molecola di 5’UTR mRNA maturo; tale sequenza non viene tradotta e varia in lunghezza tra gli mRNA dei diversi geni Una delle possibili forme alternative che un gene, localizzato in uno Allele specifico sito cromosomico, può assumere Molecola contenente un gruppo amminico (NH2) ed un gruppo Amminoacido carbossilico (COOH) Annealing Formazione di molecole ibride di acidi nucleici basata sulla (appaiamento) complementarietà delle basi Aploide Cellula o individuo con una sola copia (n) di ciascun cromosoma Indica una implementazione di un insieme di dati riguardanti uno stesso argomento, o più argomenti correlati tra loro, strutturata in modo tale da Banca dati consentire che i dati possano venire utilizzati per diverse applicazioni e possano essere aggiornati Colorazione con cui si possono distinguere lungo il cromosoma alternanze di aree chiare o scure. In seguito a colorazione specifica, ogni Bandeggio cromosoma umano può essere identificato attraverso il suo specifico bandeggio Molecole costituenti il filamento del DNA insieme allo zucchero Basi azotate deossiribosio e al gruppo fosfato. Sono quattro e si classificano in basi puriniche (A e G) e pirimidiniche (T e C) Approccio multidisciplinare al problema della gestione e della elaborazione delle informazioni biologiche che combina competenze di tipo computazionale, quali l’informatica, la matematica e la statistica con conoscenze di tipo biomolecolare, quali la genomica, la proteomica, la Bioinformatica filogenetica, la biologia strutturale. L’obiettivo fondamentale della bioinformatica è estrarre dalla sequenza del genoma degli organismi viventi informazioni utili per la comprensione dei fenomeni biologici e per lo sviluppo di nuove strategie biomediche e biotecnologiche per la cura e la prevenzione delle malattie Bolla di Struttura in cui entrambi i filamenti dell’elica del DNA sono separati uno replicazione dall’altro e servono da stampo per la sintesi del nuovo DNA La più piccola unità di costruzione di un organismo pluricellulare ed essa Cellula stessa, come unità singola, un organismo elementare Cellula germinale Cellula deputata alla riproduzione (cellula uovo e spermatozoo) Cellula destinata alla formazione del corpo (in greco “soma” ) Cellula somatica dell’organismo e contrapposta a quella della linea germinale, deputata alla riproduzione La costrizione primaria di un cromosoma che separa il braccio corto dal Centromero braccio lungo. Costituisce anche il punto di attacco delle fibre del fuso per separare i cromosomi durante la divisione cellulare Una tripletta nucleotidica che specifica un amminoacido o un segnale di Codone termine della traduzione Dalla fine della fase S del ciclo cellulare fino all’anafase della divisione cellulare, un cromosoma è costituito da due cromatidi fratelli identici. Cromatidio Ciascuno contiene una doppia elica completa ed è una esatta copia dell’altro Complesso di DNA, istoni e proteine non istoniche presenti nel nucleo di Cromatina una cellula eucariotica Struttura formata da DNA e proteine dove sono localizzati in successione Cromosoma lineare i geni, osservabile nella cellula in divisione Cromosomi I membri di un paio di cromosomi, identici nella disposizione dei geni 29 omologhi Denaturazione Diploide DNA DNA complementare (cDNA) DNA polimerasi Elettroforesi Enzima Enzimi di restrizione Esone Fenotipo Gene Geni omologhi Geni ortologhi Geni paraloghi Genoma Genotipo Introne Istoni Locus Mappa cromosomica Mutageno Mutazione presenti e nella loro struttura Perdita della configurazione originale di una macromolecola, dovuta ad es. all’aumento di temperatura, a cambiamenti estremi di pH, a trattamenti chimici o altro; generalmente è accompagnata da una perdita dell’attività biologica. Nel caso del DNA, la denaturazione consiste nella separazione dei due filamenti della doppia elica, per rottura dei legami a idrogeno tra le basi azotate Organismo o cellula con due assetti cromosomici (2n) o due genomi Abbreviazione di acido deossiribonucleico. Il DNA costituisce il materiale genetico di tutti gli organismi e ha per lo più struttura a doppia elica DNA sintetizzato usando come stampo l'RNA messaggero e utilizzando l’enzima trascrittasi inversa. La sequenza del DNA risulta pertanto complementare a quella dell'RNA stampo Enzima che sintetizza DNA unendo insieme nucleotidi e usando un filamento di DNA come stampo Tecnica che consente di separare molecole caricate elettricamente mediante la migrazione in un campo elettrico Proteina che accelera o catalizza una specifica reazione chimica in un sistema vivente Chiamati anche endonucleasi di restrizione, sono enzimi che tagliano il DNA a doppia elica in corrispondenza di specifiche sequenze nucleotidiche, dette siti di restrizione. La loro presenza all'interno delle cellule è importante perché consente di degradare molecole di DNA estraneo DNA codificante che separa due introni vicini all’interno di un gene eucariotico. Durante l’espressione genica gli esoni, come gli introni, vengono trascritti in RNA, ma solo le sequenze esoniche vengono mantenute nel trascritto maturo. Caratteristiche osservabili in un organismo che risultano dall’interazione tra genotipo e ambiente Unità funzionale di eredità che corrisponde di solito al segmento di DNA che codifica una proteina Due o più geni le cui sequenze siano significativamente correlate a causa di una stretta parentela evolutiva Due o più geni le cui sequenze siano significativamente correlate a causa di una stretta parentela evolutiva tra specie diverse Due o più geni le cui sequenze siano significativamente correlate a causa di una stretta parentela evolutiva all’interno della stessa specie Quantità totale di materiale genetico di una cellula; negli eucarioti indica anche l’assetto aploide dei cromosomi di una specie Costituzione genetica di un organismo DNA non codificante che separa due esoni vicini all’interno di un gene eucariotico. Durante l’espressione genica gli introni, come gli esoni, vengono trascritti in RNA, ma le sequenze introniche trascritte vengono successivamente rimosse mediante lo splicing dell’RNA Proteine basiche ricche in arginina e lisina che partecipano alla formazione dei nucleosomi nei cromosomi eucariotici Posizione fissa su un cromosoma occupata da un dato gene Costituzione cromosomica di una cellula o di un individuo. Cromosomi ordinati in base alla lunghezza e alla posizione del centromero Agente ambientale, fisico o chimico, in grado di indurre mutazioni Cambiamento del DNA in un particolare locus di un organismo; può verificarsi spontaneamente oppure essere indotta da agenti chimici o 30 fisici Subunità sferica della cromatina eucariotica costituita da una parte Nucleosoma centrale ottamerica di istoni e da 146 coppie di basi non associate a proteine (DNA linker) Unità base del DNA e dell'RNA, formato da gruppo fosfato, zucchero Nucleotide pentoso e base azotata Corta molecola di DNA (o RNA) a singolo filamento, costituita da poche Oligonucleotide decine di basi Sequenza di 50/250 adenine aggiunte come modificazione postPoli (A) trascrizionale alla estremità 3’ della maggior parte degli mRNA eucariotici Esistenza di forme diverse di: alleli (polimorfismo allelico), proteine Polimorfismo (polimorfismo proteico), DNA (polimorfismo del DNA) Polinucleotide Molecola costituita da più nucleotidi uniti da legami fosfodiesterici Aumento del numero cromosomico per aggiunta di uno o più corredi cromosomici completi. Ad esempio un individuo può possedere, Poliploidia all'interno dei nuclei delle sue cellule, un corredo cromosomico triplo (3n) o quadruplo (4n) Specifica regione del DNA che contiene il sito a cui si lega la RNAPromotore polimerasi per avviare la trascrizione del gene Sequenze del DNA che regolano l'espressione di un gene. La loro Regioni di presenza è pertanto necessaria per la corretta e efficace espressione del controllo gene Replicone DNA replicato a partire dall’origine di replicazione Enzima che catalizza la sintesi di molecole di RNA da uno stampo di RNA polimerasi DNA, nel processo detto trascrizione RNA ribosomale Molecole di RNA che, insieme alle proteine ribosomiali, compongono i rRNA ribosomi di procarioti ed eucarioti Molecola di RNA coinvolta nella sintesi proteica; questa molecola porta RNA transfer gli amminoacidi al ribosoma dove vengono fatti corrispondere al (tRNA) messaggio trascritto sull’mRNA RNA-messaggero RNA che trasporta ai ribosomi l'informazione genetica. A livello dei (m-RNA) ribosomi avviene la sintesi della proteina specifica (traduzione) Sequenza di basi ben determinata riconosciuta e tagliata da un enzima di Sito di restrizione restrizione Una struttura specializzata all’estremità dei cromosomi; consiste in una Telomero serie di corte ripetizioni in tandem, che proteggono le estremità del cromosoma Enzima ricavato dai retrovirus, una classe di virus che utilizzano come materiale genetico RNA. L'enzima catalizza la sintesi di DNA utilizzando come stampo la molecola di RNA genomico (attività DNA sintetasi–RNA dipendente). Queste molecole, inizialmente a singolo Trascrittasi filamento, verranno trasformate a doppia elica (DNA copia o DNA inversa complementare o c-DNA) sempre ad opera della stessa trascrittasi inversa (attività DNA sintetasi–DNA dipendente). I retrovirus posseggono la trascrittasi inversa in quanto, per potersi replicare, devono prima convertire il loro RNA in DNA e integrarsi nel genoma della cellula ospite Trascritto RNA prodotto dalla trascrizione del DNA 31