Chronology of genome sequencing projects

Università degli Studi di PERUGIA
EPIGENETICA
Giuseppe Servillo
Dip. Di Medicina Clinica e Sperimentale
Università di Perugia
EPIGENETICA
Definizioni:
La branca della biologia che
studia le interazioni causali fra i
geni e il loro prodotto cellulare per
determinare il fenotipo.
C.H.Waddington(1942)
Studio dei cambiamenti
ereditabili nell'espressione genica
che si manifestano
indipendentemente dai
cambiamenti nella sequenza del
DNA
EPIGENETICA
Comporta modificazioni a livello della cromatina che:
Non modificano la struttura primaria del DNA
Possono essere ereditabili
Influenzano l'accessibilità del DNA, regolando
l'attivazione e l'inibizione di determinati geni
Le cellule staminali embrionali
(ES) sono capaci di differenziarsi
in tutti i tipi cellulari (totipotenza)
Regolazione genica negli eucarioti
Differenzazione cellulare
Epigenetica e
Differenti Aspetti della Vita
• Sviluppo di organismi multicellulari
• Interazioni Ambiente-organismo
Per esempio: Nutrizione e ambiente (eventi fisici,
biologici e chimici)
• Patogenesi di malattia
IMPRINTING
L’espressione di una piccola
minoranza di geni, nei
mammiferi, è determinata dalla
propria origine parentale
L'imprinting è un meccanismo
genetico importante per:
trasferimento di sostanze
nutritive dalla madre al feto
crescita nel grembo materno e
comportamento dopo la
nascita
imprinting aberrante causa
svariate sindromi
IMPRINTING
Durante il ciclo vitale di un
organismo l'imprinting varia
passando per tre fasi:
Cancellazione
Impianto
Manutenzione
EPIGENETICA
vs
LAMARCK
DARWIN
CROMATINA
Eucromatina, trascrizionalmente attiva
Eterocromatina
Costitutiva, trascrizionalmente inattiva
Facoltativa, trascritta in alcune fasi della vita
dell'organismo
CROMATINA
Le differenze strutturali tra i due stati della cromatina
sono dovuti:
Diversa interazione tra DNA linker e istone H1
Diverso stato di acetilazione degli istoni
Metilazione degli istoni
Ubiquitinazione
Sumolazione
NUCLEOSOMI
Il nucleosoma è l'unità fondamentale della cromatina,
costituito da un core di istoni intorno al quale si avvolge
il DNA, tra due nucleosomi vi è un tratto di DNA
denominato DNA linker
Nucleosomi
• Otto molecole istoniche
formano un ottamero
– 2 molecole di H2A
– 2 molecole di H2B
– 2 molecole di H3
– 2 molecole di H4
• 146 bp di DNA
arrotolate intorno
all'ottamero
• Istone H1
– Stabilizza il DNA
negli e tra gli
ottameri
ISTONI
Sono
utilizzate
proteine
per
basiche
compattare
il
DNA, vengono suddivise in due
classi:
H2A, H2B, H3 E H4,
formano strutture
ottameriche
H1, stabilizza il nucleosoma
ESPRESSIONE
GENICA
Processo attraverso il quale
l’informazione codificata da un
particolare gene è decodificata in proteina
La regolazione dell'espressione
genica serve per:
Sviluppo embrionale
Differenziamento cellulare e
tessutale
CpG ISLAND
o Regioni di DNA di 0,5-5 kb
o Ricche di GC (60%)
o Localizzate a livello del promotore (50% dei geni)
Dinamicità della cromatina
Nonostante la stabilità del nucleosoma e dell’alto grado di
compattezza nel nucleo la cromatina è sorprendentemente
dinamica.
Esistono vari modi di modificare la cromatina e rispondere alle
necessità della cellula di regolare i processi biologici
dall’espressione genica, alla riparazione del DNA, alla replicazione e
ricombinazione.
Modificazioni epigenetiche degli istoni: acetilazione,
metilazione ed altre.
Uso di sistemi di rimodellamento che cambiano la stabilità e/o la
posizione del nucleosoma.
Uso di varianti istoniche, in particolare varianti di H2A e H3.
MECCANISMI EPIGENETICI
Tipi di modificazione istoniche
•Acetilazione: implicata nella regolazione dell’espressione genica.
Interessa le LISINE (K).
•Metilazione: associata a differenti funzioni cromatiniche e alla
regolazione della trascrizione. Interessa le ARGININE e le LISINE (R
e K).
•Fosforilazione: coinvolta nella regolazione della trascrizione, nei
processi di riparo del DNA e nella condensazione cromosomica
durante la mitosi. Interessa le SERINE (S).
•Ubiquitinazione: critica per i processi di mitosi e di meiosi. Interessa
le LISINE (K).
•poli(ADP)Ribosilazione:associata a varie funzioni cromatiniche
(condensazione e decondensazione), principalmente al rilevamento di
danni al DNA, ma anche ad altre funzioni genomiche. Interessa le
GLUTAMINE (E).
Conseguenze funzionali delle modificazioni istoniche
•Le modificazioni non influenzano la stabilità del core
nucleosomale, ma alterano solamente la carica elettrostatica delle
code N-terminali. Ciò modifica le proprietà strutturali dell’istone o
il suo legame al DNA.
•Si crea un meccanismo che altera la struttura della cromatina, la
cui conseguenza è una modificazione dello stato trascrizionale
(“on-off”) oppure la definizione di strutture cromosomali di ordine
superiore.
•Modificazioni transitorie e quindi reversibili.
Modificazioni covalenti delle code ammino-terminali
H3
R2
H4
S1
K4
R3
K9 S10
K5
K8
K14
K12
R17 K18
K16
K23
R26 K27 S28 K79
K20
H2A
K5
K9
K119
H2B
S1 E3
Metilazione
Ubiquitinazione
K12
K15
Acetilazione
K20
K24
Fosforilazione
K120
METILAZIONE DEL DNA
Effettuata da DNA-metiltrasferasi DNMT:
• De novo: DNMT3a, DMNT3b;
• Di mantenimento: DNMT1;
Il donatore di metili è S-adenosil metionina
SAM
METILAZIONE DEL DNA
Avviene soprattutto nei CpG:
CpG island;
CpG island shore;
Esoni;
Sequenze ripetute.
Riconosciuta da proteine MBD.
Azione variabile:
Silenziamento;
Efficienza della trascrizione;
Stabilità cromosomica.
MODIFICAZIONE DEGLI
ISTONI
Gli istoni più interessati sono H3 e H4;
Possono essere modificati da:
o Acetiltrasferasi HAT e deacetilasi HDAC = gruppo acetile
o Metiltrasferasi = gruppi metile
o Chinasi = gruppi fosfato
MODIFICAZIONE DEGLI
ISTONI
L’acetilazione degli istoni regola la
trascrizione genica;
La metilazione è variamente associata a:
• Eterocromatina, es H3 K9me;
• Eucromatina, es H3 K4me.
CODICE ISTONICO
RIMODELLAMENTO DELLA
CROMATINA
Effettuato da complessi con attività
ATPasica:
SWI/SNF;
ISWI;
CHD;
INO80.
Permettono scivolamento e rimozione
dei nucleosomi.
CROSS-TALK
I meccanismi epigenetici funzionano in maniera coordinata,
esempi:
• Metilazione degli istoni e metilazione del DNA;
• Metilazione del DNA e acetilazione degli istoni;
• Reclutamento dei complessi di rimodellamento della
cromatina.
PROGETTO EPIGENOMA
Scopo:
Produrre mappe dettagliate
di:
• Metilazione del DNA,
• Modificazione degli
istoni,
• Posizione dei
nucleosomi;
Identificare marker di cellule
sane e malate;
Rendere i dati disponibili
gratuitamente;
Migliorare le tecnologie e
abbassarne i costi.
Five kingdom
system
(Haeckel, 1879)
mammals
vertebrates
animals
invertebrates
plants
fungi
protists
monera
protozoa
Page 516
Tree of life from David Hillis’ lab (based on ~3000 rRNAs)
animals
you are here
plants
protists
fungi
bacteria
archaea
http://www.zo.utexas.edu/faculty/antisense/Download.html
Tree of life from David Hillis’ lab (based on ~3000 rRNAs)
Noi Siamo quì
http://www.zo.utexas.edu/faculty/antisense/Download.html
Cos'è il genoma?
• Il genoma è l'intero patrimonio genetico di un organismo vivente.
Si può paragonare ad un'enorme enciclopedia in cui sono
contenute le istruzioni che regolano lo sviluppo e il
funzionamento dell'organismo
• Il genoma è "scritto" in un composto chimico chiamato DNA
(DeoxyriboNucleic Acid, acido desossiribonucleico)
• Il DNA è identico per tutte le cellule di un individuo ed è contenuto
nel nucleo
Chronology of genome sequencing projects
1976: first viral genome
Fiers et al. sequence bacteriophage MS2 (3,569 base pairs,
Accession NC_001417).
1977:
Sanger et al. sequence bacteriophage φX174.
This virus is 5,386 base pairs (encoding 11 genes).
See accession J02482; NC_001422.
Chronology of genome sequencing projects
1981
Human mitochondrial genome
16,500 base pairs (encodes 13 proteins, 2 rRNA, 22 tRNA)
Today (10/09), over 1800 mitochondrial genomes sequenced
1986
Chloroplast genome
156,000 base pairs (most are 120 kb to 200 kb)
Chronology of genome sequencing projects
1995: first genome of a free-living organism,
the bacterium Haemophilus influenzae
Chronology of genome sequencing projects
1996: first eukaryotic genome
The complete genome sequence of the budding yeast
Saccharomyces cerevisiae was reported. We will
describe this genome soon.
Also in 1996, TIGR reported the sequence of the first
archaeal genome, Methanococcus jannaschii.
Chronology of genome sequencing projects
1997:
More bacteria and archaea
Escherichia coli
4.6 megabases, 4200 proteins (38% of unknown function)
1998: first multicellular organism
Nematode Caenorhabditis elegans
97 Mb; 19,000 genes.
1999: first human chromosome
Chromosome 22 (49 Mb, 673 genes)
Chronology of genome sequencing projects
2000:
Fruitfly Drosophila melanogaster (13,000 genes)
Plant Arabidopsis thaliana
Human chromosome 21
2001: draft sequence of the human genome
(public consortium and Celera Genomics)
1999: Human chromosome 22 sequenced
1999: Human chromosome 22 sequenced
49 MB
701 genes
Timeline of largelarge-scale genomic analyses
• La grandezza totale del genoma
umano aploide è di 3.070.000.000
basi di cui 2.843.000.000 sono di
eucromatina
1
245,203,898
218,712,898
2
243,315,028
237,043,673
3
199,411,731
193,607,218
4
191,610,523
186,580,523
5
180,967,295
177,524,972
6
170,740,541
166,880,540
7
158,431,299
154,546,299
8
145,908,738
141,694,337
9
134,505,819
115,187,714
10
135,480,874
130,710,865
11
134,978,784
130,709,420
12
133,464,434
129,328,332
13
114,151,656
95,511,656
14
105,311,216
87,191,216
15
100,114,055
81,117,055
16
89,995,999
79,890,791
17
81,691,216
77,480,855
18
77,753,510
74,534,531
19
63,790,860
55,780,860
20
63,644,868
59,424,990
21
46,976,537
33,924,742
22
49,476,972
34,352,051
X
152,634,166
147,686,664
Y
50,961,097
22,761,097
Human Genome
Genes
(exons)
1.5-2 %
CNCs
1-3%
95.0%
sea3093
CNC= conserved non coding sequences
Il metodo Sanger
Nel sequenziamento a terminazione di catena nella reazione serve:
• uno stampo a singola elica
• un innesco specifico della reazione di sequenza (primer)
• la sintesi della catena con un dNTP* marcato, di solito con
35S
• miscela di ddNTP (A,C,G,T), uno per ogni reazione di sequenza
Sintesi del filamento marcato
PRIMER
DNA Polimerasi
5’-A T C T T T T A G A G T A C C
3’-T A G A A A A T C T C A T G G A C T C T C T A C T A T C T A C A T G T A -5’
PRIMER
DNA Polimerasi
5’-A T C T T T T A G A G T A C C T G A G*A G A T G A T A G*A
3’-T A G A A A A T C T C A T G G A C T C T C T A C T A T C T A C A T G T A -5’
Terminazione della catena
La sintesi del filamento complementare, tuttavia non prosegue
indefinitamente, perché la miscela di reazione contiene, in quattro
distinte reazioni piccole quantità di specifici dideossi nucleotidi
trifosfati, ddATP, ddTTP, ddCTP e ddGTP, che bloccano l’allungamento
perché posseggono un solo atomo di idrogeno al posto del gruppo -OH in 3’
PRIMER
5’-A T C T T T T A G A G T A C C T G A G A G A T G A T A G A
3’-T A G A A A A T C T C A T G G A C T C T C T A C T A T C T A C A T G T A -5’
DNA Polimerasi
+ ddNTP ( per es. ddATP)
STOP
5’-A T C T T T T A G A G T A C C T G A G A G A T G A T A G A T G T ddA
3’-T A G A A A A T C T C A T G G A C T C T C T A C T A T C T A C A T G T A -5’
Il risultato è una serie di frammenti interrotti ciascuno
in corrispondenza di ogni dATP
ddATP
ddATP
ddATP
ddATP
ddATP
ddATP
Schema di sequenziamento a terminazione di catena
DNA stampo a
singola elica
3’-GGCTAAC
Ibridazione con
5’
3’
Il primer
3’-GGCTAAC
+
[35S]dATP+dCTP,dGTP,dTTP(dNTP)+Sequenasi
ddATP, dNTP
-CCG ddA
-CCGATT ddG
-CCGAT ddT
-CCGA ddT
-CCG ddA
-CC ddG
-C ddC
-ddC
ddCTP, dNTP
-ddC
-C ddC
A C
ddGTP, dNTP
ddTTP, dNTP
-CC ddG
-CCGATT ddG
G
-CCGA ddT
-CCGAT ddT
T
G
T
T
A
G
C
C
Sequenza: 5’-CCGATTG
Direzione di
lettura
Sequenziamento automatico
4 Coloranti - 1 Corsia
Unica reazione ed unica corsa;
Ad ogni nucleotide è associata una diversa
colorazione:
ddATP
ddTTP
ddGTP
ddCTP
Questo sistema aumenta la produttività ed elimina la variabilità
di corsa
Il sequenziamento automatizzato con marcatori fluorescenti
Coniugando a ciascun ddNTP
un diverso marcatore fluorescente, è
possibile effettuare le quattro reazioni di
sequenziamento in un unico tubo da saggio
e caricare il tutto in un solo pozzetto di gel
ddA
ddT
ddC
ddG
Sequenziamento automatico
Metodi di Marcatura
Marcatura dei Primers
primers progettati con “tag” colorati a:
Fluorescenza UV
Fluorescenza IR
minore Background
maggiore Sensibilità
Marcatura dei Terminatori
ddNTPs marcati con fluorofori o differenti coloranti
Sequenziamento automatico
Terminatori BigDye
Sistemi a trasferimento di energia a singola molecola, costituiti da
accettore e donatore legati da un linker
Vantaggi:
Segnale omogeneo, basso rumore
di fondo, luminosità maggiore,
facilità interpretativa per A e G
attigue
D
A
Dalla cycle sequencing
all’elettroferogramma...
Le emissioni fluorescenti vengono captate da un rilevatore e le
informazioni vengono integrate e trasformate in picchi di colore
diverso, con aree proporzionali all’intensità di emissione.
OMICS is a general term for a broad
discipline of science and engineering for
analyzing the interactions of biological
information objects in various omes.
The Proteome is the totality of proteins (expressed genes) in an organism, tissue type or cell, and proteomics is
now well-established as a term for studying the proteome.
Interactome is the study of molecular interactions in a holistic fashion.
The Glycome is the total list of sugar (carbohydrate) molecules in an organism, and glycomics (sometimes
glycobiology) has become an established term.
Ligandome is the whole set of ligands in biological cells, tissues or species.
The Transcriptome is the mRNA complement of an entire organism, tissue type, or cell; the associated field is
Transcriptomics;
The Metabolome is the totality of metabolites in an organism; the associated field is metabolomics;
The Lipidome is the totality of lipids; the associated field is Lipidomics; *
The Localizome. The whole set of localization information of protein domains and proteins.
The Spliceome (see spliceosome) is the totality of the alternative splicing protein isoforms; the associated field is
spliceomics.
Textome: The body of scientific literature which can be analysed by text mining. Textomics: The study of the
textome.
Kinome: The totality of protein kinases in a cell. Kinomics: The study of the kinome. Publications exist. *
Glycosilome: Related to glycosylation. Glycosilomics: The associated field of study.
Physiome: Related to physiology. Physiomics: The associated field of study.
Metabolome
Neurome: The complete neural makeup of an organism. Something a neurobiologist might be heard to say in the
future. Neuromics: The study of the neurome. See Neurome.ORG
Patentome (Patentomics): The whole set of sequences and structured patented.
Predictome: A complete set of predictions.
Reactionome : The complete set of biological reactions in cells, biological tissues or organisms.
Reactome: A Knowledgebase of Biological Processes.
Sociome and sociomics: a proposed new name for sociology.
Econome: an economy (see economics).
Epigenomics:
Splicing
miRNA
RNA
PROTEINA
DNA
Trascrizione
Traduzione
Modificazioni post-traduzionali
•
•
•
•
•
•
•
•
Acetilazione,
Metilazione
Fosforilazione
Glicosilazione (enzimatica)
Glicazione (non enzimatica)
Nitrazione/denitrazione
Cleavage
Tagging
Proteomica & Genomica Funzionale
La Proteomica classica concentra il suo interesse sullo
studio dei proteomi completi, mentre la proteomica
funzionale studia gruppi più limitati di proteine.
Le tre domande più importanti della proteomica sono:
1) Quali proteine sono presenti in una cellula o in un
tessuto?
2) Con quali altre proteine interagisce la mia proteina di
interesse (network)?
3) Come appare una particolare proteina (struttura)?
SCOPO DELL’APPROCCIO PROTEOMICO
•
Valutazione di marcatori diagnostici in fluidi corporei
•
Studi di farmacologia quali identificazione e/o validazione
di nuovi target proteici per trattamenti farmacologici e
“drug profiling”
•
Studi di tossicità
•
Glicosilazioni, fosforilazioni o processamenti proteici
•
Analisi tissutali in situazioni patologiche
Tools of proteomics
Database
Mass spectrometry
Softwares
Analytical protein-separation technology
TECNOLOGIA LEGATA ALLA PROTEOMICA
•
Elettroforesi bidimensionale
•
Rilevazione degli “spot” proteici
•
Analisi di immagine
•
Excisione degli “spot” proteici
•
Digestione enzimatica
•
Spettrometria di massa
•
Bioinformatica