LA GENETICA MOLECOLARE Obiettivi del corso Studio del genoma Genomica strutturale Genomica funzionale Genomica comparata Studio del trascrittoma Analisi dei profili di espressione Studio del proteoma Proteomica di espressione Proteomica funzionale L’era delle ‘omiche’ Genomica DNA (Geni) CGTCCAACTGACGTCTACAA GTTCCTAAGCT Trascrittomica Trascrizione RNA Traduzione Genomica funzionale Proteomica PROTEINE Reazioni enzimatiche Metabolomica METABOLITI Un pò di nomenclatura… Gen Trascritt Prote Metabol Gen Prote ~oma = ~omica = L’insieme di Studio e analisi di Geni Trascritti Proteine Metaboliti Genoma Proteoma Genoma Il corredo genetico di ogni individuo Ogni cellula può essere vista come una macchina complessa che esegue delle istruzioni scritte e memorizzate nel proprio genoma Trascrittoma Completo set di trascritti e loro relativi livelli di espressione in particolari cellule o tessuti sotto definite condizioni fisiologiche e/o patologiche e/o in seguito a trattamento (chimico e/o fisico) Proteoma Il proteoma rappresenta l’insieme di tutti i possibili prodotti genici, all’interno di ogni cellula. Non tutti i geni sono espressi in tutte le cellule Varia nelle diverse cellule, nei diversi tessuti all’interno dello stesso organismo e nei differenti stadi di crescita (il proteoma è variabile, il genoma è costante) E’ condizionato da fattori ambientali, malattie, farmaci, stress, condizioni di crescita (il proteoma è dinamico, il genoma è statico) Le proteine sono la ‘chiave’ per comprendere la funzione biologica Genome Transcriptome Proteom: The protein complement of genome P Transcription DNA mRNA ~30,000 Genes Processing Translation Proteins >1,000,000 Proteins Modified proteins Each protein associated to ≥1 function(s) Perchè abbiamo bisogno del proteoma se già conosciamo il genoma? GENOMA: Definisce ciò che può accadere TRASCRITTOMA: Definisce ciò che sta per accadere Biological function PROTEOMA: Definisce ciò che sta accadendo Bioinformatica - potenza elaborativa - facilità d’uso - creazione di specifici software di analisi, applicazioni ad hoc per risolvere specifici problemi biologici - accesso on-line attraverso il World-Wide Web Il Genoma umano Struttura fisica e contenuto genico Cos’é il Genoma?? Il genoma è l'intero patrimonio genetico di un organismo vivente. Si può paragonare ad un'enorme enciclopedia in cui sono contenute le istruzioni che regolano lo sviluppo e il funzionamento dell'organismo. Il genoma è "scritto" in un composto chimico chiamato DNA (DeoxyriboNucleic Acid, acido desossiribonucleico) Il DNA è identico per tutte le cellule di un individuo ed è contenuto nel nucleo La scoperta del materiale genetico Qual’ è la sostanza responsabile dell’ereditarietà dei “caratteri”? Quali devono essere le sue caratteristiche fondamentali? 1. Possedere l’informazione 2. Replicare autonomamente 3. Andare incontro a variazione LA STRUTTURA DI DNA ED RNA Sia il DNA che l’RNA sono polimeri I monomeri sono i nucleotidi Il pentoso è uno zucchero a 5 atomi di carbonio LA STRUTTURA DI DNA ED RNA Catena polinucleotidica di DNA. Legame fosfodiesterico 5’-3’ Nucleotidi del DNA e dell’RNA. Le basi sono legate al’atomo di C 1’ del pentoso da un legame covalente. Nucleotide = pentoso + base azotata + gruppo fosfato Nucleoside = pentoso + base azotata LA STRUTTURA DI DNA ED RNA Due fonti di informazione: 1. Gli studi di Erwin Chargaff sulla composizione in basi del DNA • Indicavano che la molecola di DNA a doppia elica è costituita dal 50% di purine (A, G) e dal 50% di pirimidine (C, T) • Quantità di A = quantità di T e quantità di G = quantità di C (regole di Chargaff) • % GC varia nei diversi organismi Esempio: %A %T %G %C %GC Homo sapiens Zea mays Drosophila Escherichia coli 31.0 25.6 27.3 26,1 31.5 25.3 27.6 23,9 19.1 24.5 22.5 24.9 18.4 24.6 22.5 25,1 1.67 1.04 1.22 1,00 LA STRUTTURA DI DNA ED RNA Due fonti di informazione: 2. Gli studi sulla diffrazione dei raggi X di Rosalind Franklin e Maurice H. F. Wilkins Il DNA è una struttura ad elica con 2 periodicità distintive: 0.34 nm e 3.4 nm IL MODELLO TRIDIMENSIONALE • La molecola di DNA è costituita da due catene polinucleotidiche avvolte l’una intorno all’altra; doppia elica destrorsa; • Le due catene sono antiparallele; • Lo scheletro zucchero-fosfato si trova all’esterno della doppia elica, mentre le basi sono orientate verso l’interno; •Le basi complementari dei due filamenti opposti sono legate insime da legami deboli (A-T) 2 legami H, (G-C) 3 legami H secondo le regole di Chargaff; •Le coppie di basi sono distanziate 0,34 nm, mentre un intero giro dell’elica richiede 3,4 nm. •Le impalcature zucchero-fosfato della doppia elica non sono ugualmente distanziate tra loro, ciò determina la formazione di un solco maggiore e di un solco minore. IL MODELLO TRIDIMENSIONALE IL MODELLO TRIDIMENSIONALE Il DNA può esistere in diverse forme, A, B, e Z DNA-A Destrorsa DNA-B Destrorsa DNA-Z Sinistrorsa 1962: Premio Nobel in Medicina e Fisiologia James D. Watson Francis H. Crick Maurice H. F. Wilkins Watson, Crick e Wilkins ricevettero il Premio Nobel per la Medicina nel 1962 per la scoperta della struttura del DNA. L'esclusione della Franklin dal premio è dovuto alla sua morte di cancro nel 1958, probabilmente a causa delle radiazioni a cui i suoi studi la avevano lungamente sottoposta. Nell'immaginario comune, la scoperta della struttura del DNA è legata ai soli Watson e Crick. Nella comunità scientifica è opinione diffusa che i motivi di ciò siano legati alla scarsa reputazione di Wilkins (che secondo molti era solo "alla ricerca di pubblicità") e, soprattutto, alla morte della Franklin. Rosalind Franklin L’ORGANIZZAZIONE DEL DNA NEI CROMOSOMI Il genoma negli organismi eucarioti e procarioti è organizzato in cromosomi Nelle cellule il DNA è associato a proteine formando un complesso denominato cromosoma Le modalità di compattamento sono differenti in cellule procariote ed eucariote: Il compattamento oltre a rendere più stabile il DNA ne favorisce la trasmissione più efficiente alle cellule figlie L’ORGANIZZAZIONE DEL DNA NEI CROMOSOMI Genoma = cromosoma o set di cromosomi che contiene tutto il DNA di un organismo (o particella virale) Cromosomi virali - DNA o RNA a singolo o a doppio filamento; - circolare o lineare; - circondato da proteine. TMV T2 batteriofago λ batteriofago Cromosomi procarioti - La maggior parte dei procarioti contiene un singola molecola di DNA a doppio filamento ciircolare, organizzata in una regione densa della cellula detta nucleoide. L’ORGANIZZAZIONE DEL DNA NEI CROMOSOMI Problema: Se misurato linearmente, il genoma di E. coli (4.6 Mb) sarebbe 1.000 volte più grande della sua cellula. Il genoma umano se venisse stirato (3.4 Gb) sarebbe lungo 2.3 m. Soluzioni: 1. Superavvolgimento: La doppia elica del DNA è avvolta nello spazio intorno al suo asse (topoisomerasi) 2. Il DNA è organizzato in domini ad ansa. STRUTTURA DEI CROMOSOMI EUCARIOTI Cromatina Complesso di DNA e proteine (quantità circa doppia rispetto a quella del DNA) Due fondamentali tipi di proteine: Istoni: abbondanti, proteine basiche , cariche positivamente che legano il DNA; 5 tipi principali: H1, H2A, H2B, H3, H4; ruolo cruciale nell’impacchettamento del DNA; quantità e proporzioni conservate in tutte le cellule eucariote; evolutivamente conservate. Non-istoni: tutte le altre proteine associate al DNA; meno abbondanti degli istoni; marcate differenze in tipo e quantità. STRUTTURA DEI CROMOSOMI EUCARIOTI Impacchettamento del DNA nei cromosomi: Livello 1 Il DNA si avvolge intorno agli istoni per creare la struttura dei nucleosomi; Livello 2 I nucleosomi si connettono mediante tratti di “DNA linker” (147 pb). Struttura “a filo di perle”; Livello 3 Impacchettamento dei nucleosomi nella fibra cromatinica da 30-nm (H1); Livello 4 Formazione dei domini ad ansa. proteine non-istone: “scaffold” cromosomico DNA a doppia elica STRUTTURA DEI CROMOSOMI EUCARIOTI Schema di una sezione di un cromosoma metafasico Struttura “a filo di perle” Cromosomi impacchettati, “fibre 30-nm” Componenti non-istoniche dell’impalcatura Sezione cromosomica estesa Sezione cromosomica condensata Cromosomi metafasici Impalcatura cromosomica Ansa del DNA La grandezza totale del genoma umano aploide è di 3.400.000.000 basi La quantità di DNA contenuta nel genoma aploide è una caratteristica propria di ciascuna specie vivente ed è definita come valore C La quantità nei diversi organismi varia in maniera considerevole e non mostra una relazione diretta con la complessità di struttura e l’organizzazione di un organismo: paradosso del valore C Esempi: Virus e fagi λ T4 HIV-1 Batteri Escherichia coli Eucarioti Lilium formosanum (giglio) Zea mays (mais) Amoeba proteus (ameba) Drosophila melanogaster (moscerino della frutta) Mus musculus (topo) Canis familiaris (cane) Equus caballus (cavallo) Homo sapiens (uomo) valore C (bp) 48,502 168,900 9,750 4,639,221 36,000,000,000 5,000,000,000 290,000,000,000 180,000,000 3,454,200,000 3,355,500,000 3,311,000,000 3,400,000,000 Nell’uomo, il numero di geni è molto inferiore all’atteso - Solo ~ il 3% del genoma è costituito da sequenze codificanti -Il genoma umano contiene 30.000-40.000 geni -~60% dei geni hanno splicing alternativo - Nel ~70% dei casi, lo splicing genera sequenze aa diverse, quindi il proteoma è costituito da ~ 1.000.000 proteine Non è il numero di geni che fa la differenza!!!!! La somiglianza tra il genoma dell’uomo e quello dello chimpanzé è del 99%!! Drospophila ha 13.600 geni e C.elegans 18.500, la pianta Arabidnosis ne ha 25.000. E’ evidente che le funzioni e le interazioni fra gruppi di geni simili possono dare risultati molto diversi Il corredo di enzimi metabolici non è sostanzialmente diverso da quello degli altri eucarioti ma il numero dei geni coinvolti in funzioni di regolazione come la trascrizione, la traduzione del segnale e la segnalazione intercellulare è aumentato in proporzione all’aumento di dimensioni dell’intero genoma Quanti sono i geni essenziali? - Non tutti i geni sono essenziali. Nel lievito e nella mosca <50% dei geni hanno un effetto evidente - Alcuni geni sono ridondanti Non si sa perché sopravvivano nel genoma geni la cui funzione è apparentemente ridondante