CORSO DI LAUREA SPECIALISTICA IN BIOTECNOLOGIE DEL FARMACO
Adriana Maggi
BASI MOLECOLARI DELL’AZIONE DEL FARMACO
BIOTECNOLOGIE FARMACOLOGICHE
LEZIONE 4
http://users.unimi.it/mpl/lezioni.html
STUDIO DELLA FUNZIONE GENICA
ARRAY
MACROARRAY
MICROARRAY
DNA microarray (o gene/genome chip,
DNA chip, o gene array) è una collezione di
depositi puntiformi di DNA, ciascun punto
rapresentante un singolo gene
immobilizzati su un supporto (vetro,
plastica o silicone) mediante legami di tipo
irreversibile.
Esempio di microarray con 40.000 oligo immobilizzati su
supporto solido e ibridati con cDNA
APPLICAZIONI DI ARRAY:
• SNP detection arrays – per identificare Single nucleotide
polymorphism nel genoma di diverse popolazioni
• comparative genomic hybridization (Array CGH) – per
identificare riarragiamenti coinvolgenti un numero
significtativo di basi
• mRNA or gene expression profiling – per studiare I livelli
di espressione di migliaia di geni simultaneamente
• Chromatin immunoprecipitation (chIP) studies – per
determinare il legame di specifche proteine in porzioni
specifiche del DNA (ChIP-on-chip technology)
Siti polimorfici per singola sostituzione
di base (SNP)
polimorfismo a singolo nucleotide
•di base
Nel genoma umano ci sono 200.000 SNP
all’interno di sequenze codificanti, alcuni
di questi possono essere marcatori di
patologia
http://www.ncbi.nlm.nih.gov/About/primer/snps.html
Siti polimorfici per singola sostituzione di base (SNP)
Individuo 1
Individuo 2
Gli SNP sono la causa di circa il 90% della variabilità
genetica umana ed in genere si trova uno SNP ogni 100300 pb. 2/3 SNP vedono sostituita la C con T.
Perchè una variazione possa essere considerata un SNP
deve essere presente in almeno l’1% della popolazione
Metodi di identificazione di SNP
IBRIDAZIONE ALLELE-SPECIFICA
REAZIONE DI ELONGAZIONE DI PRIMER
FISSATO SU SUPPORTO SOLIDO
3’
AC
AT CG
TAGC
DNA is denatured and mixed with oligonudeotides and ligase. The ligase joins
pairs of oligonudeotides annealed head to tail if they are correctly base-paired at
the junction. Radioactively labeled oligonudeotides (*) are immobilized and
detected by autoradiography only if ligated to biotinylated oligonucleotides (B)
that can be bound to streptavidin on a solid support.
LANDEGREN, et al. Science 1998
Michiel J. T. van Eijk*, et al. NAR 2004
BANCHE DATI E IDENTIFICAZIONE DI SNP
dbSNP sono presenti (“annotati”) in diverse banche dati
quali:
PubMed,
genome project sequences,
GenBank records,
the Entrez Gene database, and
the dbSTS database of sequence tagged sites.
mRNA or gene expression profiling
Genes x Cells
Drugs x Cells
Clustered Image Maps
Genes x Drugs
Database Microarray Experiment
Sets Sample Profiles
Genomics and bioinformatics
group NCI and NIH
Studio di proteine che interagiscono con DNA
ChIP-on-chip (o ChIP-chip) è una tecnica che combina la
immunoprecipitazione di cromatina (chromatin
immunoprecipitation "ChIP” con la tecnologia del micro
array(microarray technology “chip").
read-out
Normalizzazione dei dati
e analisi esplorativa dei dati
Sito DNA
“estrazione delle informazioni”
arricchimento proteina di interesse
Le prime analisi si sono focalizzate sulle differenze tra animali in Proestro e Metestro, per vedere se la
differenza dei livelli di Estradiolo circolante avesse degli effetti sull’espressione genica.
Come atteso, gli animali LID non mostrano nessuna significativa differenza nell’espressione genica nelle
due fasi del ciclo, come se quest’ultimo fosse appiattito.
Gli animali WT, al contrario, mostrano deboli ma rilevabili differenze nelle due fasi; tuttavia, il quadro
osservato e’ totalmente inatteso, in quanto i geni differenzialmente espressi sono tutti geni
MAGGIORMENTE espressi nella fase di metestro o, guardando all’inverso, downregolati nella fase di
Proestro. Considerando cio’ che abbiamo sempre osservato, vale a dire un’attivazione del recettore degli
estrogeni in fase di proestro, questo stupisce.
Upregulated in M
WT M vs WT P
WT P vs WT M
SEM Analysis
Downregulated in P
GO Term Analysis
Una volta identificati i trascritti differenzialmente espressi nei due gruppi (t test & SAM analysis, tenendo
in considerazione solo quelli con Fold Indution >=1,5), si cerca di capire se questi geni sono implicati in
determinati ‘Biological Process’ o hanno particolari ‘Molecular Function’ o interferiscono in un
determinato ‘Pathway’.
Questa analisi si puo’ fare a diversi “livelli”, i risultati riportati si riferiscono ad un livello piuttosto
superficiale, ma per questo piu’ generale e credo indicativo.
Riporto:
- BP = Biological Process
- MF = Molecular Function
- Pathway
L’analisi e’ stata fatta principalmente con DAVID
http://david.abcc.ncifcrf.gov/summary.jsp
piu’ molti altri software e websites (le risorse sono infinite)
Biological Process - WTall vs LIDall
Considerando tutti i trascritti differentemente espressi, sia upregolati che downregolati.
Term
BP00019:Lipid, fatty acid and steroid metabolism
BP00076:Electron transport
BP00020:Fatty acid metabolism
BP00013:Amino acid metabolism
BP00180:Detoxification
BP00064:Protein phosphorylation
BP00148:Immunity and defense
BP00150:MHCI-mediated immunity
BP00001:Carbohydrate metabolism
BP00143:Cation transport
BP00295:Steroid metabolism
BP00063:Protein modification
BP00271:Other homeostasis activities
BP00273:Chromatin packaging and remodeling
BP00069:Protein disulfide-isomerase reaction
BP00267:Homeostasis
BP00147:Other transport
BP00044:mRNA transcription regulation
BP00008:Tricarboxylic acid pathway
BP00151:MHCII-mediated immunity
BP00289:Other metabolism
BP00156:Interferon-mediated immunity
Count
%
PValue
40
25
17
9
11
31
25
27
11
42
10
32
4
13
9
5
4
87
5
15
30
3
20.00%
12.50%
8.50%
4.50%
5.50%
15.50%
12.50%
13.50%
5.50%
21.00%
5.00%
16.00%
2.00%
6.50%
4.50%
2.50%
2.00%
43.50%
2.50%
7.50%
15.00%
1.50%
1.57E-19
1.96E-08
9.20E-04
9.33E-04
1.92E-03
1.98E-03
4.40E-03
7.00E-03
7.97E-03
9.66E-03
1.21E-02
1.52E-02
2.77E-02
3.04E-02
3.12E-02
3.63E-02
4.27E-02
4.74E-02
4.83E-02
6.80E-02
7.38E-02
8.79E-02
I geni per ogni categoria sono nel file Excel ‘Panther_BP_WTall_vs_LIDAll.xls’
Molecular Function - WTall vs LIDall
Term
MF00123:Oxidoreductase
MF00124:Oxygenase
MF00140:Other transferase
MF00087:Transfer/carrier protein
MF00099:Small GTPase
MF00082:Transporter
MF00212:Other G-protein modulator
MF00131:Transferase
MF00007:Interferon receptor
MF00254:Actin and actin related protein
MF00174:Complement component
MF00042:Nucleic acid binding
MF00126:Dehydrogenase
MF00005:Cytokine receptor
MF00224:KRAB box transcription factor
MF00074:Translation release factor
MF00063:Histone
MF00213:Non-receptor serine/threonine protein kinase
MF00033:Voltage-gated calcium channel
MF00211:Kinase activator
MF00118:Synthase and synthetase
MF00242:RNA helicase
MF00217:Other proteases
Count
33
26
12
12
29
13
36
27
4
13
6
74
9
6
52
4
5
43
12
11
4
16
7
I geni per ogni categoria sono nel file Excel ‘Panther_MF_WTAll_vs_LIDAll.xls’
%
16.50%
13.00%
6.00%
6.00%
14.50%
6.50%
18.00%
13.50%
2.00%
6.50%
3.00%
37.00%
4.50%
3.00%
26.00%
2.00%
2.50%
21.50%
6.00%
5.50%
2.00%
8.00%
3.50%
PValue
1.69E-16
4.86E-13
2.09E-04
9.62E-04
2.01E-03
3.45E-03
3.71E-03
6.35E-03
6.86E-03
1.72E-02
1.91E-02
2.68E-02
3.83E-02
5.09E-02
5.62E-02
6.44E-02
7.09E-02
7.30E-02
7.52E-02
8.12E-02
9.05E-02
9.49E-02
9.83E-02
Gene Ontology
http://www.geneontology.org/index.shtml
Un progetto atto a costruire un vocabolario per descrivere geni e prodotti
genici attribuibili a ogni organismo
Questo vocabolario serve per dare un unico nome a un specifico prodotto
in modo che questi così compaia nelle diverse banche dati e possa venire
rapidamente ritrovato
Ogni gene/proteina si contraddistingue per un numero identificativo unico
(GO:nnnnnnn) e un nome (es: cellula, fibroblasto, fattore di crescita,
trasduttore del segnale). Ogni termine viene assegnato a una delle tre
suddivisioni della banca (ontology):
1. Funzioni molecolari
2. Componenti cellulari
3. Componenti I processi biologici
The three organizing principles of GO are cellular component, biological
process and molecular function.
A gene product might be associated with or located in one or more cellular
components; it is active in one or more biological processes, during which it
performs one or more molecular functions.
For example, the gene product cytochrome c can be described by
the molecular function term oxidoreductase activity,
the biological process terms oxidative phosphorylation and induction of
cell death, and
the cellular component terms mitochondrial matrix and mitochondrial inner
membrane.
Topology
The ontologies are structured as directed acyclic graphs, which are similar to
hierarchies but differ in that a more specialized term (child) can be related to
more than one less specialized term (parent).
For example, the biological process term
hexose biosynthetic process
has two parents, hexose metabolic process and monosaccharide
biosynthetic process.
This is because biosynthetic process is a type of metabolic process and a
hexose is a type of monosaccharide. When any gene involved in hexose
biosynthetic process is annotated to this term, it is automatically annotated to
both hexose metabolic process and monosaccharide biosynthetic process.
I LIMITI DELLA ANALISI GENOMICA:
RIPRODUCIBILITA’
ANALISI NON QUANTITATIVA
I mRNA NON RIFLETTONO ESATTAMENTE
LE PROTEINE PRESENTI NELLA CELLULA
proteomica
Il fine della proteomica consiste nella completa
identificazione delle proteine e della loro
espressione in determinati cellule o tessuti La
metodologia su cui si basa la proteomica comprende:
gel elettroforesi bidimensionale; HPLC e
spettrometria di massa
• (20,000 to 25,000 genes vs. > 500,000
proteins).
• E’ stato calcolato che il corpo umano puo’
esprimere fino a 2 milioni di proteine, ciascuna
con differenti funzioni
I metodi della proteomica
dagli anni ‘70: gel elettroforesi bidimensionale
Limiti di definizione e riproducibilità
•Anni ’90 spettrometria di massa
con metodi di ionizzazione alternativi (electrospray o
MALDI Matrix Assisted Laser Desorption Ionization )
Non si amplificano le proteine: dimensione campioni
Identificazione dei peptidi da miscele complesse
Rapidità
Analisi quantitativa
Limiti nelle conoscenze di genomi da diversi organismi
Disponibilità di strumentazione
electrospray ionization
liquid chromatography
mass spectrometry
John Bennett Fenn ha ricevuto il premio
Nobel per la chimica nel 2002 per lo
sviluppo della tecnica di elettrospray per
l’analisi di macromolecole biologiche
Stable isotope labeling with amino
acids in cell culture (SILAC) per
analisi proteomica quantitativa
Functional and quantitative
proteomics using SILAC
SILAC (Stable isotope labelling with
amino acids in cell culture)
Mann Nature Reviews Molecular Cell Biology 7, 952–958 (December 2006) | doi:10.1038/nrm2067
Proteomica e trascrittomica a confronto
Uno studio in cui si sono comparati i dati di analisi di cellule MCF-7
Su un totale di 7278 geni identificati in modo univoco
come messaggi o proteine
55% provengono da analisi proteomica
77% provengono da microarray
LE PROSPETTIVE DELLA PROTEOMICA:
• continuo progresso della tecnologia per
misure sempre più su larga scala e rapide
• costruzione di banche dati
•
protomica interviene in cellule dove mRNA
non è informativo (es cellule ematiche)
•
La misura proteomica fornisce l’end point,
il microarray va verificato con qPCR e da
western
•
La proteomica permette di studiare la
presenza di modificazioni post-traduzionali,
di interazioni proteina-proteina
INTERATTOMICA
analisi del trascrittoma, del proteoma e
dell’interattoma comparati per arrivare
a definire le funzioni fisiologiche di
ciascun gene
L’INTERATTOMA
O BIOLOGIA DEI SISTEMI
(system biology)
L’interattoma rappresenta interazioni molecolari
con un sistema digrafico
Per grafico intendiamo un
insieme di punti, nodi o
vertici che sono tra loro
collegati non in modo
unidirezionale.
Nel digrafico la direzionalità
o bidirezionalità dell’evento
è segnata
‘OMICS
APPLICAZIONI MEDICHE
Test genetici
Terapia genica
Farmacogenomica
Informazioni sulla malattia