Università degli Studi di PERUGIA EPIGENETICA Giuseppe Servillo Dip. Di Medicina Clinica e Sperimentale Università di Perugia EPIGENETICA Definizioni: La branca della biologia che studia le interazioni causali fra i geni e il loro prodotto cellulare per determinare il fenotipo. C.H.Waddington(1942) Studio dei cambiamenti ereditabili nell'espressione genica che si manifestano indipendentemente dai cambiamenti nella sequenza del DNA EPIGENETICA Comporta modificazioni a livello della cromatina che: Non modificano la struttura primaria del DNA Possono essere ereditabili Influenzano l'accessibilità del DNA, regolando l'attivazione e l'inibizione di determinati geni Le cellule staminali embrionali (ES) sono capaci di differenziarsi in tutti i tipi cellulari (totipotenza) Regolazione genica negli eucarioti Differenzazione cellulare Epigenetica e Differenti Aspetti della Vita • Sviluppo di organismi multicellulari • Interazioni Ambiente-organismo Per esempio: Nutrizione e ambiente (eventi fisici, biologici e chimici) • Patogenesi di malattia IMPRINTING L’espressione di una piccola minoranza di geni, nei mammiferi, è determinata dalla propria origine parentale L'imprinting è un meccanismo genetico importante per: trasferimento di sostanze nutritive dalla madre al feto crescita nel grembo materno e comportamento dopo la nascita imprinting aberrante causa svariate sindromi IMPRINTING Durante il ciclo vitale di un organismo l'imprinting varia passando per tre fasi: Cancellazione Impianto Manutenzione EPIGENETICA vs LAMARCK DARWIN CROMATINA Eucromatina, trascrizionalmente attiva Eterocromatina Costitutiva, trascrizionalmente inattiva Facoltativa, trascritta in alcune fasi della vita dell'organismo CROMATINA Le differenze strutturali tra i due stati della cromatina sono dovuti: Diversa interazione tra DNA linker e istone H1 Diverso stato di acetilazione degli istoni Metilazione degli istoni Ubiquitinazione Sumolazione NUCLEOSOMI Il nucleosoma è l'unità fondamentale della cromatina, costituito da un core di istoni intorno al quale si avvolge il DNA, tra due nucleosomi vi è un tratto di DNA denominato DNA linker Nucleosomi • Otto molecole istoniche formano un ottamero – 2 molecole di H2A – 2 molecole di H2B – 2 molecole di H3 – 2 molecole di H4 • 146 bp di DNA arrotolate intorno all'ottamero • Istone H1 – Stabilizza il DNA negli e tra gli ottameri ISTONI Sono utilizzate proteine per basiche compattare il DNA, vengono suddivise in due classi: H2A, H2B, H3 E H4, formano strutture ottameriche H1, stabilizza il nucleosoma ESPRESSIONE GENICA Processo attraverso il quale l’informazione codificata da un particolare gene è decodificata in proteina La regolazione dell'espressione genica serve per: Sviluppo embrionale Differenziamento cellulare e tessutale CpG ISLAND o Regioni di DNA di 0,5-5 kb o Ricche di GC (60%) o Localizzate a livello del promotore (50% dei geni) Dinamicità della cromatina Nonostante la stabilità del nucleosoma e dell’alto grado di compattezza nel nucleo la cromatina è sorprendentemente dinamica. Esistono vari modi di modificare la cromatina e rispondere alle necessità della cellula di regolare i processi biologici dall’espressione genica, alla riparazione del DNA, alla replicazione e ricombinazione. Modificazioni epigenetiche degli istoni: acetilazione, metilazione ed altre. Uso di sistemi di rimodellamento che cambiano la stabilità e/o la posizione del nucleosoma. Uso di varianti istoniche, in particolare varianti di H2A e H3. MECCANISMI EPIGENETICI Tipi di modificazione istoniche •Acetilazione: implicata nella regolazione dell’espressione genica. Interessa le LISINE (K). •Metilazione: associata a differenti funzioni cromatiniche e alla regolazione della trascrizione. Interessa le ARGININE e le LISINE (R e K). •Fosforilazione: coinvolta nella regolazione della trascrizione, nei processi di riparo del DNA e nella condensazione cromosomica durante la mitosi. Interessa le SERINE (S). •Ubiquitinazione: critica per i processi di mitosi e di meiosi. Interessa le LISINE (K). •poli(ADP)Ribosilazione:associata a varie funzioni cromatiniche (condensazione e decondensazione), principalmente al rilevamento di danni al DNA, ma anche ad altre funzioni genomiche. Interessa le GLUTAMINE (E). Conseguenze funzionali delle modificazioni istoniche •Le modificazioni non influenzano la stabilità del core nucleosomale, ma alterano solamente la carica elettrostatica delle code N-terminali. Ciò modifica le proprietà strutturali dell’istone o il suo legame al DNA. •Si crea un meccanismo che altera la struttura della cromatina, la cui conseguenza è una modificazione dello stato trascrizionale (“on-off”) oppure la definizione di strutture cromosomali di ordine superiore. •Modificazioni transitorie e quindi reversibili. Modificazioni covalenti delle code ammino-terminali H3 R2 H4 S1 K4 R3 K9 S10 K5 K8 K14 K12 R17 K18 K16 K23 R26 K27 S28 K79 K20 H2A K5 K9 K119 H2B S1 E3 Metilazione Ubiquitinazione K12 K15 Acetilazione K20 K24 Fosforilazione K120 METILAZIONE DEL DNA Effettuata da DNA-metiltrasferasi DNMT: • De novo: DNMT3a, DMNT3b; • Di mantenimento: DNMT1; Il donatore di metili è S-adenosil metionina SAM METILAZIONE DEL DNA Avviene soprattutto nei CpG: CpG island; CpG island shore; Esoni; Sequenze ripetute. Riconosciuta da proteine MBD. Azione variabile: Silenziamento; Efficienza della trascrizione; Stabilità cromosomica. MODIFICAZIONE DEGLI ISTONI Gli istoni più interessati sono H3 e H4; Possono essere modificati da: o Acetiltrasferasi HAT e deacetilasi HDAC = gruppo acetile o Metiltrasferasi = gruppi metile o Chinasi = gruppi fosfato MODIFICAZIONE DEGLI ISTONI L’acetilazione degli istoni regola la trascrizione genica; La metilazione è variamente associata a: • Eterocromatina, es H3 K9me; • Eucromatina, es H3 K4me. CODICE ISTONICO RIMODELLAMENTO DELLA CROMATINA Effettuato da complessi con attività ATPasica: SWI/SNF; ISWI; CHD; INO80. Permettono scivolamento e rimozione dei nucleosomi. CROSS-TALK I meccanismi epigenetici funzionano in maniera coordinata, esempi: • Metilazione degli istoni e metilazione del DNA; • Metilazione del DNA e acetilazione degli istoni; • Reclutamento dei complessi di rimodellamento della cromatina. PROGETTO EPIGENOMA Scopo: Produrre mappe dettagliate di: • Metilazione del DNA, • Modificazione degli istoni, • Posizione dei nucleosomi; Identificare marker di cellule sane e malate; Rendere i dati disponibili gratuitamente; Migliorare le tecnologie e abbassarne i costi. Five kingdom system (Haeckel, 1879) mammals vertebrates animals invertebrates plants fungi protists monera protozoa Page 516 Tree of life from David Hillis’ lab (based on ~3000 rRNAs) animals you are here plants protists fungi bacteria archaea http://www.zo.utexas.edu/faculty/antisense/Download.html Tree of life from David Hillis’ lab (based on ~3000 rRNAs) Noi Siamo quì http://www.zo.utexas.edu/faculty/antisense/Download.html Cos'è il genoma? • Il genoma è l'intero patrimonio genetico di un organismo vivente. Si può paragonare ad un'enorme enciclopedia in cui sono contenute le istruzioni che regolano lo sviluppo e il funzionamento dell'organismo • Il genoma è "scritto" in un composto chimico chiamato DNA (DeoxyriboNucleic Acid, acido desossiribonucleico) • Il DNA è identico per tutte le cellule di un individuo ed è contenuto nel nucleo Chronology of genome sequencing projects 1976: first viral genome Fiers et al. sequence bacteriophage MS2 (3,569 base pairs, Accession NC_001417). 1977: Sanger et al. sequence bacteriophage φX174. This virus is 5,386 base pairs (encoding 11 genes). See accession J02482; NC_001422. Chronology of genome sequencing projects 1981 Human mitochondrial genome 16,500 base pairs (encodes 13 proteins, 2 rRNA, 22 tRNA) Today (10/09), over 1800 mitochondrial genomes sequenced 1986 Chloroplast genome 156,000 base pairs (most are 120 kb to 200 kb) Chronology of genome sequencing projects 1995: first genome of a free-living organism, the bacterium Haemophilus influenzae Chronology of genome sequencing projects 1996: first eukaryotic genome The complete genome sequence of the budding yeast Saccharomyces cerevisiae was reported. We will describe this genome soon. Also in 1996, TIGR reported the sequence of the first archaeal genome, Methanococcus jannaschii. Chronology of genome sequencing projects 1997: More bacteria and archaea Escherichia coli 4.6 megabases, 4200 proteins (38% of unknown function) 1998: first multicellular organism Nematode Caenorhabditis elegans 97 Mb; 19,000 genes. 1999: first human chromosome Chromosome 22 (49 Mb, 673 genes) Chronology of genome sequencing projects 2000: Fruitfly Drosophila melanogaster (13,000 genes) Plant Arabidopsis thaliana Human chromosome 21 2001: draft sequence of the human genome (public consortium and Celera Genomics) 1999: Human chromosome 22 sequenced 1999: Human chromosome 22 sequenced 49 MB 701 genes Timeline of largelarge-scale genomic analyses • La grandezza totale del genoma umano aploide è di 3.070.000.000 basi di cui 2.843.000.000 sono di eucromatina 1 245,203,898 218,712,898 2 243,315,028 237,043,673 3 199,411,731 193,607,218 4 191,610,523 186,580,523 5 180,967,295 177,524,972 6 170,740,541 166,880,540 7 158,431,299 154,546,299 8 145,908,738 141,694,337 9 134,505,819 115,187,714 10 135,480,874 130,710,865 11 134,978,784 130,709,420 12 133,464,434 129,328,332 13 114,151,656 95,511,656 14 105,311,216 87,191,216 15 100,114,055 81,117,055 16 89,995,999 79,890,791 17 81,691,216 77,480,855 18 77,753,510 74,534,531 19 63,790,860 55,780,860 20 63,644,868 59,424,990 21 46,976,537 33,924,742 22 49,476,972 34,352,051 X 152,634,166 147,686,664 Y 50,961,097 22,761,097 Human Genome Genes (exons) 1.5-2 % CNCs 1-3% 95.0% sea3093 CNC= conserved non coding sequences Il metodo Sanger Nel sequenziamento a terminazione di catena nella reazione serve: • uno stampo a singola elica • un innesco specifico della reazione di sequenza (primer) • la sintesi della catena con un dNTP* marcato, di solito con 35S • miscela di ddNTP (A,C,G,T), uno per ogni reazione di sequenza Sintesi del filamento marcato PRIMER DNA Polimerasi 5’-A T C T T T T A G A G T A C C 3’-T A G A A A A T C T C A T G G A C T C T C T A C T A T C T A C A T G T A -5’ PRIMER DNA Polimerasi 5’-A T C T T T T A G A G T A C C T G A G*A G A T G A T A G*A 3’-T A G A A A A T C T C A T G G A C T C T C T A C T A T C T A C A T G T A -5’ Terminazione della catena La sintesi del filamento complementare, tuttavia non prosegue indefinitamente, perché la miscela di reazione contiene, in quattro distinte reazioni piccole quantità di specifici dideossi nucleotidi trifosfati, ddATP, ddTTP, ddCTP e ddGTP, che bloccano l’allungamento perché posseggono un solo atomo di idrogeno al posto del gruppo -OH in 3’ PRIMER 5’-A T C T T T T A G A G T A C C T G A G A G A T G A T A G A 3’-T A G A A A A T C T C A T G G A C T C T C T A C T A T C T A C A T G T A -5’ DNA Polimerasi + ddNTP ( per es. ddATP) STOP 5’-A T C T T T T A G A G T A C C T G A G A G A T G A T A G A T G T ddA 3’-T A G A A A A T C T C A T G G A C T C T C T A C T A T C T A C A T G T A -5’ Il risultato è una serie di frammenti interrotti ciascuno in corrispondenza di ogni dATP ddATP ddATP ddATP ddATP ddATP ddATP Schema di sequenziamento a terminazione di catena DNA stampo a singola elica 3’-GGCTAAC Ibridazione con 5’ 3’ Il primer 3’-GGCTAAC + [35S]dATP+dCTP,dGTP,dTTP(dNTP)+Sequenasi ddATP, dNTP -CCG ddA -CCGATT ddG -CCGAT ddT -CCGA ddT -CCG ddA -CC ddG -C ddC -ddC ddCTP, dNTP -ddC -C ddC A C ddGTP, dNTP ddTTP, dNTP -CC ddG -CCGATT ddG G -CCGA ddT -CCGAT ddT T G T T A G C C Sequenza: 5’-CCGATTG Direzione di lettura Sequenziamento automatico 4 Coloranti - 1 Corsia Unica reazione ed unica corsa; Ad ogni nucleotide è associata una diversa colorazione: ddATP ddTTP ddGTP ddCTP Questo sistema aumenta la produttività ed elimina la variabilità di corsa Il sequenziamento automatizzato con marcatori fluorescenti Coniugando a ciascun ddNTP un diverso marcatore fluorescente, è possibile effettuare le quattro reazioni di sequenziamento in un unico tubo da saggio e caricare il tutto in un solo pozzetto di gel ddA ddT ddC ddG Sequenziamento automatico Metodi di Marcatura Marcatura dei Primers primers progettati con “tag” colorati a: Fluorescenza UV Fluorescenza IR minore Background maggiore Sensibilità Marcatura dei Terminatori ddNTPs marcati con fluorofori o differenti coloranti Sequenziamento automatico Terminatori BigDye Sistemi a trasferimento di energia a singola molecola, costituiti da accettore e donatore legati da un linker Vantaggi: Segnale omogeneo, basso rumore di fondo, luminosità maggiore, facilità interpretativa per A e G attigue D A Dalla cycle sequencing all’elettroferogramma... Le emissioni fluorescenti vengono captate da un rilevatore e le informazioni vengono integrate e trasformate in picchi di colore diverso, con aree proporzionali all’intensità di emissione. OMICS is a general term for a broad discipline of science and engineering for analyzing the interactions of biological information objects in various omes. The Proteome is the totality of proteins (expressed genes) in an organism, tissue type or cell, and proteomics is now well-established as a term for studying the proteome. Interactome is the study of molecular interactions in a holistic fashion. The Glycome is the total list of sugar (carbohydrate) molecules in an organism, and glycomics (sometimes glycobiology) has become an established term. Ligandome is the whole set of ligands in biological cells, tissues or species. The Transcriptome is the mRNA complement of an entire organism, tissue type, or cell; the associated field is Transcriptomics; The Metabolome is the totality of metabolites in an organism; the associated field is metabolomics; The Lipidome is the totality of lipids; the associated field is Lipidomics; * The Localizome. The whole set of localization information of protein domains and proteins. The Spliceome (see spliceosome) is the totality of the alternative splicing protein isoforms; the associated field is spliceomics. Textome: The body of scientific literature which can be analysed by text mining. Textomics: The study of the textome. Kinome: The totality of protein kinases in a cell. Kinomics: The study of the kinome. Publications exist. * Glycosilome: Related to glycosylation. Glycosilomics: The associated field of study. Physiome: Related to physiology. Physiomics: The associated field of study. Metabolome Neurome: The complete neural makeup of an organism. Something a neurobiologist might be heard to say in the future. Neuromics: The study of the neurome. See Neurome.ORG Patentome (Patentomics): The whole set of sequences and structured patented. Predictome: A complete set of predictions. Reactionome : The complete set of biological reactions in cells, biological tissues or organisms. Reactome: A Knowledgebase of Biological Processes. Sociome and sociomics: a proposed new name for sociology. Econome: an economy (see economics). Epigenomics: Splicing miRNA RNA PROTEINA DNA Trascrizione Traduzione Modificazioni post-traduzionali • • • • • • • • Acetilazione, Metilazione Fosforilazione Glicosilazione (enzimatica) Glicazione (non enzimatica) Nitrazione/denitrazione Cleavage Tagging Proteomica & Genomica Funzionale La Proteomica classica concentra il suo interesse sullo studio dei proteomi completi, mentre la proteomica funzionale studia gruppi più limitati di proteine. Le tre domande più importanti della proteomica sono: 1) Quali proteine sono presenti in una cellula o in un tessuto? 2) Con quali altre proteine interagisce la mia proteina di interesse (network)? 3) Come appare una particolare proteina (struttura)? SCOPO DELL’APPROCCIO PROTEOMICO • Valutazione di marcatori diagnostici in fluidi corporei • Studi di farmacologia quali identificazione e/o validazione di nuovi target proteici per trattamenti farmacologici e “drug profiling” • Studi di tossicità • Glicosilazioni, fosforilazioni o processamenti proteici • Analisi tissutali in situazioni patologiche Tools of proteomics Database Mass spectrometry Softwares Analytical protein-separation technology TECNOLOGIA LEGATA ALLA PROTEOMICA • Elettroforesi bidimensionale • Rilevazione degli “spot” proteici • Analisi di immagine • Excisione degli “spot” proteici • Digestione enzimatica • Spettrometria di massa • Bioinformatica