Microarrays
La tecnica microarray si basa sulla ibridazione
cDNA (sonda) su supporti – chips o vetrini - sui
quali sono fissate porzioni di sequenze nucleotidiche
(cDNA o sequenze ologonucleotidiche sintetiche)
rappresentative del genoma considerato: su un
singolo microarray sono infatti presenti migliaia di
spots.
La sonda viene marcata con coloranti fluorescenti in
modo da permettere l’analisi delle intensità del
segnale con uno scanner. Si ibrida selettivamente alle
molecole complementari presenti sugli spots: solo i
campioni ibridati daranno fluorescenza, e possono
quindi essere identificati.
Sul vetrino ci sono spot di sequenza nucleotidica nota
(il gene), e conseguentemente in base a presenza ed
intensità di segnale si può vedere quale gene è
espresso e a che livello.
Chips e vetrini
diverso metodo utilizzato per l’adesione delle
sequenze nucleotidiche al supporto:
1.
sintetizzate in situ nei chips (afflimetrix)
2.
“spottate” (procedure robotizzate) su
vetrini trattati per favorire l’adesione degli oligo
o cDNA (es polilisina).
In oligonucleotide microarrays, the probes are
short sequences matching parts of the protein
encoding sequence, produced either by
spotting the pre-synthesized oligos on the
array surface, or by in situ synthesis by lightdirected process as those produced by
Affymetrix, Nimblegen or Combimatrix.
Microarray Technology
• Affymetrix microarrays
• oligonucleotide array
• photolithography
• 25 mer
• high density (100,000 features/1.26 cm2)
A
T
A
• Spotted Array
• cDNA or oligo array
• pin based / inkjet technology
sequential deposition of cDNA (PCR product) or
oligos (up to 80 mer)
• Moderately high density
(25,000 features/glass slide)
A
T C
C C G
A
T
G
A
T
G
T
A
A G
C
A
G
C
C
G
T A A
G
C
A
T
G
A
T
C
Analisi
comparativa
• da campioni di due categorie
viene estratto RNA
• l’mRNA di ciascuna categoria
viene marcato con un colorante
diverso (rosso e verde)
• quantità uguali dei due RNA
marcati vengono ibridate su uno
stesso vetrino.
Diversi tessuti sono formati da cellule che si
comportano in modo diverso
Cellula
animale
Ogni cellula contiene una esatta copia del
genoma (l’intera sequenza del DNA
dell’organismo)
All’interno del nucleo della cellula il DNA è
organizzato in cromosomi:
autosomi in numero variabile a seconda della
specie
due cromosomi sessuali XY
Nei cromosomi si possono individuare porzioni
di DNA codificante chiamati geni
Che cosa le rende differenti ?
•
Ogni cellula contiene una copia dell’intero genoma
•
Le cellule sono di diversi tipi (cellule muscolari, cellule
epiteliali, cellule del sangue, gameti…)
Espressione Differenziale
•
Espressione genica differenziale, i.e., quando, dove,
e in che quantità ogni gene è espresso.
•
circa il 10% dei geni sono tessuto specifici. Non tutti i
geni sono espressi contemporaneamente
Espressione Differenziale
• Ogni cellula contiene una copia dell’intero genoma
• Le cellule sono di diversi tipi (cellule muscolari, cellule
cardiache, cellule della pelle, cellule del sangue …)
• Che cosa le rende differenti ?
Espressione genica differenziale, i.e., quando, dove, e
in che quantità ogni gene è espresso.
• Ad un determinato istante circa il 40% dei geni sono
espressi e circa il 10% dei geni sono tessuto specifici.
Dogma Centrale
L’ espressione dell’informazione genetica raccolta nelle
molecole di DNA, avviene in due stadi:
–(i) trascrizione, durante la quale il DNA è trascritto in
mRNA
–(ii) traduzione, durante la quale l’ mRNA è tradotto per
produrre la proteina associata
DNA
mRNA
protein
(RT)
Multiple Levels of
Protein Strucure
( Protein folding)
RNA
• Ribonucleic acid o RNA è una molecola simile al DNA
ma:
– è singola, non ha la doppia elica;
– l’ uracile (U) sostituisce la timina (T).
• RNA gioca un ruolo importante sia nella sintesi proteica
che in altre attività biochimiche della cellula.
Using Amplified RNA for Microarray Analysis
-A comparison of microarray using total RNA and aRNA
Direct labeling(Cy-dye incorpeartion) 15-20ug of total RNA
Indirect labeling(after transcript labeling) >10ug
Genesphere labeling
aRNA labeling
>1-5ug
<1ug
AAAAAA
Total RNA
TTTTTTT—T7
T7Oligo(dT) primer
First strand cDNA synthesis
T7
2nd strand
dscDNA
cDNA purification
In vitro transcription(amplification)
TTTTTT
TTTTTT
TTTTTTAntisense RNA(aRNA)
TTTTTT
aRNA purification
Labeling with Cy3 or Cy5 by reverse transcription
Come è fatto l’array
I singoli nucleotidi sul microarray
(spots) sono organizzati in gruppi
(array), e ogni vetrino porta qualche
decina di arrays.
Il numero di spots dipende dalla
metodica
impiegata
per
la
preparazione:
• Afflimetrix
permette
una
concentrazione di spots più elevata,
• Vetrini: concentrazione spots /
unità di superficie più ridotta.
cDNA library
Amplification of
cDNA fragments
Spotting of cDNA microarrays
General strategy
for
hybridisation and
microarray gene
expression
analysis
Hybridisation and detection
Sequencing of differentially expressed cDNAs
Esempio analisi comparativa
Sul vetrino ibridato:
spot solo rossi (espressi in una categoria)
solo verdi (espressi nell’altra)
gialli (espressi in entrambe)
non fluorescenti (non espressi nelle due
categorie).
Le sonde si ibridizzano ai singoli spots in base alle
identità di sequenza formando degli eteroduplex, in
modo più o meno efficiente in relazione all’identità
della sequenza, e dando quindi un segnale. L’intensità
del segnale dipende dalla quantità di trascritto
presente
Analisi differenze
espressione genica
L’informazione per codificare le proteine, presente nel
DNA, trascritta in mRNA, viene tradotta in proteine.
I microarrays analizzano i cambiamenti negli acidi
nucleici che si possono ripercuotere nella sintesi
proteica.
Espressione genica-2
Si ibridizzano campioni provenienti da animali con
diverse caratteristiche (a differente attitudine, sani
o malati, esposti o meno a uno specifico trattamento)
per
identificare
geni
espressi
in
maniera
differenziale in una specifica condizione.
Espressione genica-3
I
geni
differenzialmente
espressi
sono
potenzialmente coinvolti in processi metabolici
correlati con la condizione in esame.
L’espressione genica è variabile nei vari tessuti e nei
vari organi, nonché dipendente dalle condizioni
dell’animale (età, ormoni, metabolismo etc): il cDNA
va retrotrascritto partendo da RNA estratto da
tessuti dello stesso tipo e condizioni.
Microarray Overview
Campione da
analizzare
Campione di
riferimento
Isolate RNA
120
110
50
100
45
90
40
80
35
30
25
40
Fluorescence
60
50
Fluorescence
70
20
30
15
20
10
10
24
29
34
39
44
49
54
59
64
69
18S
0
19
19
Time (seconds)
Cy5
labeling
(probe)
Cy3
24
29
34
39
44
Time (seconds)
28S
18S
28S
5
0
49
54
59
64
69
Microarray Overview
Biology
Data Analysis
Mix
Hybridize
Scan “Chip”
Sul vetrino ibridato:
Le sonde si ibridano ai singoli spots in base
alle identità di sequenza formando degli
eteroduplex, in modo più o meno efficiente
in relazione all’identità della sequenza.
L’intensità del segnale dopo eccitazione con
laser dipende dalla quantità di trascritto
presente
Spot sul vetrino ibridato:
•rossi (espressi in una
categoria)
•verdi (espressi nell’altra)
•gialli (espressi in
entrambe)
•non fluorescenti (non
espressi nelle categorie).
Programmazione esperimenti
Vanno programmati accuratamente:
elevati.
costi piuttosto
Fare un numero di campioni e di vetrini sufficiente per
una analisi statistica e limitando le ripetizioni.
Ripetizioni
Servono più campioni individuali per escludere
polimorfismi non associati al fenomeno in esame:
loop design, reference design
dye swap:
fluorofori.
differenze
nell’efficienza
dei
singoli
ripetizioni
errori sperimentali
•preparazione vetrino (errori spottaggio, ad esempio scivolamento o
cattiva aderenza in alcune zone del vetrino)
•estrazione dell’RNA: prodotti non ottimali o degradazione prima
della retrotrascrizione.
•retrotrascrizione: problemi dovuti per esempio ai reagenti (diversa
efficienza).
•Fluorofori: differente efficienza per problemi di conservazione dei
fluorofori stessi o del vetrino; si possono legare selettivamente a
particolari nucleotidi.
•Durante l’ibridazione, per condizioni di ibridazione poco stringenti ,
incorporazione differenziale di uno dei due fluorofori, precipitazioni
o bolle d’aria nel buffer di ibridazione
estrazione di RNA
RNA totale
Spettrofotometro: rapporto OD 260/280 tra 1.9 e 2.1.
gel di agarosio denaturante: due bande nette (subumità
ribosomali), la banda 28S è circa doppia di quella 18S.
Non devono esserci contaminazioni da DNA genomico, che
se presenti richiedono un trattamento con DNasi ed una
completa
inattivazione
di
queste
ultime
prima
dell’ibridazione (ad esempio con fenolo cloroformio o
passaggio in colonnine qiagen).
Il vetrino
prelavaggio in gradienti di SSC (2X SSC, 2,2X SSC e
acqua distillata) prima dell’ibridazione per rimuovere sali
e detriti che possono essersi depositati sulla superficie
degli array, in modo da ridurre il background.
L’invecchiamento del vetrino può portare a difetti di
ibridazione, riducendo il segnale specifico ed alzando il
background, soprattutto nel canale verde (Cy3).
Anche le soluzioni utilizzate per i lavaggi possono
contribuire alla formazione di background, per cui è
consigliabile controllare periodicamente le soluzioni
utilizzate e preparare volta per volta delle diluizioni
nuove.
Esperimento
Pool RNA sani
cDNA
Pool RNA malati
cDNA
SNP microarray
utilizza polimorfismi nei singoli
nucleotidi (SNPs). Approccio
utilizzato originariamente
in studi medici (predisposizioni
allo sviluppo di tumori o
differenti suscettibilità a farmaci) ed ora utilizzato per
l’analisi di SNPs in taxa il cui genoma è conosciuto in
dettaglio.
usa microarrays nei quali sono presenti sonde allelespecifiche che si differenziano per un singolo nucleotide
in base all’ibridazione dei campioni sui vari spots è
possibile ricostruirne il genotipo
Analisi di genotipi
utilizza polimorfismi nei singoli nucleotidi (SNPs).
approccio utilizzato inizialmente in studi medici
(predisposizioni allo sviluppo di tumori o differenti
suscettibilità a farmaci); ora di largo uso in studi di
popolazione, anche in animali.
usa microarrays nei quali sono presenti copie di
determinate sequenze che si differenziano per un
singolo nucleotide, ed in base all’ibridazione dei
campioni sui vari spots è possibile ricostruirne il
genotipo
nimblegen
CombiMatrix’s core technology is a
modified semiconductor adapted for
biological applications, containing
arrays of microelectrodes
individually addressable using
embedded logic circuitry on the
chip.
Placed in a specially designed
fluidic chamber, the chip digitally
directs the molecular assembly of
biopolymers in response to a digital
command.
Each microelectrode is addressed
to selectively generate, by an
electrochemical reaction, chemical
reagents that facilitate the in situ
synthesis of DNA oligonucleotides.
Combimatrix
Lab-on-a-Chip
Arrays of individually
addressable microelectrodes
permit synthesis of hundreds or
thousands of different molecules
in parallel.
Porous Reaction Layer (PRL)
Biocompatible layer that
supports the attachment of
synthesized molecules.
Virtual Flask
A process that confines
chemical reagents within a
virtual flask over each
microelectrode.
DNA Microarrays
Arrays of oligonucleotides
capture molecules synthesized
on the chip for use in genomic
and proteomic applications.
SNP-Genotyping Arrays
Affymetrix
(10K, 100K, 500K, 5.0, 1M)
affymetrix.com
Illumina
(100K,320K, 230S, 550K,650K, 1M)
illumina.com
Affymetrix Genotyping
Affymetrix Microarray Overview
Procedures for Target Preparation
Cells
Biotin-labeled transcripts
IVT
AAAA
(Biotin-UTP
Biotin-CTP)
B
B
B
B
RNA
T7-dT
cDNA
Fragment
(heat, Mg2+)
Hybridize
Scan
Wash & Stain
(16 hours)
B
B
B
B
Fragmented cRNA
Illumina Genotyping
Infinium (7,600-1 Million SNPs)
GoldenGate (96-1,536 SNPs)
Agriculture
bovino
Dye Bias
• Cy3 e Cy5 possono falsare i risultati legandosi a
particolari spots.
• Inserire un dye-swap di ciascun array può far
individuare ed eliminare il problema.
• Raddoppia il numero di microarrays richiesti.
Cy3
Cy5
Pools
Utilizzando pools di RNA (più individui appartenenti a
ciascuna categoria analizzata) si può raggiungere la
quantità di RNA necessario per una buona ibridazione e il
cDNA viene retrotrascritto in un’unica reazione, livellando
la variabilità sperimentale. Questo può permettere inoltre
di preparare cDNA sufficiente all’ibridazione di più
vetrini, limitando quindi anche le differenze tra le
ripetizioni necessarie per la validazione stesso
esperimento.
Ibridazione
Lettura dati
La lettura ottica viene effettuata con uno scanner alle due lunghezze
d’onda corrispondenti ai due fluorocromi utilizzati.
Le intensità del segnale per ciascuno spot alle due lunghezze d’onda
vengono registrate.
I dati vengono analizzati
statisticamente per
identificare pattern di
espressione simili
(cluster analisis) e poi
valutati con test di
significatività per
valutare la differenza di
espressione tra i
campioni.
Analisi dell’immagine
• Identificazione della
posizione degli spot
• Costruzione di un’area
locale intorno ad ogni
spot
• Calcolo dell’intensità di
ogni singolo spot
• Calcolo del background
locale
Risultati attesi
differenza di
espressione nel
tessuto di
animali (ex.sani e
malati)
identificazione
dei geni
coinvolti nel
carattere
analizzato
plants
viruses and bacteria
invertebrates
vertebrates
human
rodents
livestock
20%
16%
8%
3%
35%
17%
3%
Ma se non si lavora coi topi?
1. Microarray di specie affini
2. Analisi High throughput di mRNA senza
microarrays (SAGE; MPSS)
3. Deep cDNA sequencing (GS-FLX
Pyrosequencing)
Oppure….
4. GENERARE CUSTOM
MICROARRAY USANDO LE
SEQUENZE DISPONIBILI NEI
DATABASE PUBBLICI
Expressed sequence tags (EST)
Sequenze pubbliche(generalemnte lunghe 200 -500 nucleotidi)
generate da sequenziamento random di librerie di cDNA.
Rappresentano i geni espressi in cellule, tessuti, organi di diversi
organismi. Disponibili in NCBI dbEST.
A pipeline to rapidly
generate custom
microarrays from sequence
databases
dbEST
Redundancy
filter
Hybridization
annotation
oligo
design
In situ
generation
un microarray per Ovis aries
The microarray efficiency was assessed by performing
pilot experiments using RNA of two sheep breeds and
achieving very good technical outcomes, such as in
slide replicates coefficient of variation <0.25 for
differentially expressed genes with P<0.01.
Aristaeus chip 1.0
 Oligonucleotides 40 mer designed using the
GoArrays software
 in situ generated using the Combimatrix
equipment.
 21,737 non-redundant features in quadruplicate
 73.4% fully annotated (10,190 genes)
We conclude that the method is very efficient
and can be easily extended to other species of
which genetic sequences are present in public
databases. With this procedure, even a
microarray in single copy can be generated with
a moderate cost. Therefore, we believe that this
method allows the study of species so far
neglected with advanced devices like
microarrays. As a perspective, the approach can
be applied also to species of which no
sequences are available to date, by using highthroughput deep sequencing methods.
Chip bovino
 43768 sonde lunghe 40 nucleotidi
 Ciascuna rappresenta un singolo trascritto bovino
 Sintetizzate in duplicato su 90K chip Combimatrix
Identificazione di geni responsabili
della tenerezza della carne