Metodi per lo studio dell’espressione genica
su larga scala:
 ESTs
 SAGE
 Microarray
EST
SAGE
MICROARRAY
Computational analysis of data by
statistical methods
ESPRESSIONE DEL GENOMA UMANO NELLE
CELLULE DIFFERENZIATE
• Tutte le cellule di un organismo hanno lo stesso
corredo genomico
• L’espressione genica tessuto specifica determina il
fenotipo morfo-funzionale dei tipi cellulari e tissutali
• In ogni cellula differenziata ed in ogni particolare
momento dello sviluppo e’ attivo solo un sottoinsieme
di geni
REGOLAZIONE DELL’ESPRESSIONE GENICA
• Puo’ agire su ciascuno dei livelli che caratterizzano il
passare dell’informazione genica dal DNA alle proteine
• Negli Eucarioti superiori la regolazione dell’espressione
genica si svolge principalmente come controllo della
trascrizione
• Principali tipi di regolazione:
Controllo epigenetico
Controllo trascrizionale
Controllo post-trascrizionale
“One-gene approach”
Il gene di interesse e’ espresso in un tessuto o in un dato momento dello
sviluppo ? Quanto e’ attivo dal punto di vista trascrizionale ?
Real Time PCR
PCR semiquantitativa
Ibridazione DNA genico o cDNA con RNA
totale o poly(A)+RNA (Northern blot)
Ibridazione in situ
“Large-scale approach”
Quali geni sono espressi in un tessuto ed in un dato momento dello sviluppo ?
Quanto ciascuno di essi e’ attivo dal punto di vista trascrizionale ?
Profilo d’espressione del genoma
(TRASCRITTOMA)
METODI PER LO STUDIO SU LARGA SCALA
DELL’ESPRESSIONE GENICA
 Sequenziamento sistematico di ESTs da librerie di
cDNA
 SAGE (Serial Analysis of Gene Expression)
 cDNA microarrays
EST SEQUENCING
mRNA of different genes
cDNA LIBRARY
EST
UniGene Human Release Statistics
Total sequences in clusters:
3115711
Total number of clusters sets:
95928
22094
sets contain at least one known gene
94710
20876
sets contain at least one EST
sets contain both genes and ESTs
EST
ESTIMATE OF THE LEVEL OF EXPRESSION
OF A GIVEN GENE
Sample of 12919 ESTs corresponding to 4460
genes/trascripts
eg. Rhodopsin:
65 retina ESTs  65 / 12919 = 0.503%
EST
EST
SAGE Serial Analysis of Gene Expression
SAGE
SAGE è un metodo sperimentale ideato per utilizzare i vantaggi
del sequenziamento su larga scala per avere informazioni
quantitative di espressione genica (Velculescu et al. 1995, Zhang
et al, 1997)
Con questa tecnica e’ possibile stimare il livello d’espressione di
ciascun gene, attraverso la misura del numero di volte in cui la
TAG che lo rappresenta compare in un campione abbastanza
grande di TAGs sequenziate a partire dal messaggero del tessuto
in analisi
Tag to Gene mapping  Gene to Tag mapping
Consiste nel sequenziamento da messaggeri cellulari di brevi
oligonucleotidi, che fungono da etichette di sequenza (TAG)
SAGE
Isolamento delle “tag”
Ligazione
Sequenziamento
Livello di
espressione
Livello di
espressione
Quantificazione di ciascuna
“tag” e determinazione del
pattern di espressione
GENE
GENE
Normale
Normale
GENE
GENE
Alterato
Alterato
 una sequenza di 9 paia di basi
permette di identificare 49
(262144) diversi trascritti (una
"tag" viene ottenuta da una
posizione specifica di ogni
trascritto).
 le "tag" possono essere unite
insieme in serie, a costituire
lunghe molecole di DNA, che
vengono clonate e sequenziate.
 il numero di volte in cui una
singola "tag" viene osservata
permette di quantificare
l'abbondanza del messaggero
identificato nella popolazione dei
messaggeri e, indirettamente, il
livello di espressione del gene
corrispondente.
MICROARRAY
Esperimenti di Microarray
Permettono l’analisi
dell’espressione di
migliaia di geni
simultaneamente
MICROARRAY
GeneChip Affymetrix
Ibridizzazione della sonda marcata
Scansione del GeneChip con scanner laser
MICROARRAY
Analisi dell’immagine
• Identificazione della posizione
degli spot
• Costruzione di un’area locale
intorno ad ogni spot
• Calcolo dell’intensità di ogni
singolo spot
• Calcolo del background locale
MICROARRAY
Elaborazione dei dati
EST
SAGE
MICROARRAY
Matrice dei risultati con più condizioni sperimentali
Cond. 1
Cond. 2
…
Cond. m
Gene 1
x11
x12
…
x1m
Gene 2
x21
x22
…
x2m
…
…
…
…
xn1
xn2
…
xnm
…
Gene n
• Quali geni sono differenzialmente espressi ?
• Quali e quanti geni sono coespressi?
Obiettivi dell’analisi saranno…
Identificazione geni differenzialmente espressi
Identificazione pattern di espressione comuni
Identificazione di geni coespressi con geni di
funzione nota
CLUSTER ANALISI
Identificazione di gruppi di geni con profili di
espressione simili
Simili rispetto a cosa ?
Definizione di distanza
I geni sono punti nello spazio:
punti vicini nello spazio sono raggruppati insieme
CLUSTER ANALISI
DUE STEPS:
Misura di similarita’
•
•
Diverse misure
Standardizzazione dei dati
Linking method
•
•
criterio per stabilire i gruppi
Metodi gerarchici e non gerarchici