Microarrays di DNA, cDNA e oligonucleotidi
Tecnologia degli “array” di DNA
Un array di DNA è una grande collezione di frammenti di DNA disposti in file ordinate
su un supporto solido chiamato “chip”.
I chip sono formati da moltissime molecole di DNA (detti sonde) depositate in una
posizione nota su un supporto a formare una griglia (da cui il nome array) che consente
di identificarle in MODO UNIVOCO.
Il supporto, di solito, è un vetrino da microscopio che ha le dimensioni, più o meno, di un
francobollo.
Ogni sonda è costituita DNA a singola elica che può corrispondere al cDNA di un
gene, ad una sequenza genomica oppure ad un oligonucleotide (cDNA o genomico).
Per costruire un array si possono:
•
usare cloni di cDNA prelevati direttamente da micropozzetti
•
produrre frammenti di DNA per PCR che saranno poi depositate in posizioni
specifiche su un supporto solido usandone microscopiche gocce
•
sintetizzare oligonucleotidi direttamente su un supporto solido che corrispondono
a porzioni di geni specifici
3 tipi diversi di array
macroarray
microarray
array di oligonucleotidi
Macroarray
Dopo la creazione di una genoteca di cDNA, una macchina
equipaggiata con molteplici punte raccoglie il cDNA da micropozzetti
e lo deposita su una membrana di nylon o su altri tipi di supporto
formando un “array”. Per costruire un macroarray si possono così
depositare fino a 20000 cloni da una genoteca
La miscela di cDNA che deve essere analizzata è marcata
RADIOATTIVAMENTE e quindi il segnale d’ibridazione è visibile
per autoradiografia.
Microarrays o DNA Chips
Un DNA microarray è una GRIGLIA ORDINATA di molecole di DNA a sequenza nota, fissate in
posizioni note su un substrato solido che può essere un microchip di silice, vetro oppure una
membrana di nylon (meno frequente).
Ci sono due tipi di tecnologie per produrre DNA microarrays:
1)
la microdeposizione
2)
la sintesi diretta di oligonucleotidi su supporto
MICRODEPOSIZIONE
La MICRODEPOSIZIONE è stata sviluppata alla Stanford University -> le molecole di DNA
preconfezionate (cloni di DNA genomico, di cDNA, prodotti di PCR oppure oligonucleotidi) sono
depositati sul vetro usando strumenti meccanici per la deposizione. Il DNA è caricato per capillarità su
un ago e piccole quantità di DNA sono rilasciate sulla superficie del vetro quando l’ago tocca la
superficie. L’ago è lavato, carica il DNA successivo e lo deposita in posizione adiacente. La produzione
veloce di microarray è resa possibile da una testa motorizzata robottizzata con molti aghi. I microarray
possono contenere 10000-100000 molecole di DNA in un’area piccolissima di 3,6 cm2.
Gli
aghi
depositano
una goccia
del DNA sul
supporto
vetrino
Gli aghi si
spostano in
un ’
altra
posizione,
dopo
il
lavaggio
Microarrays di oligonucleotidi
Questo tipo di array si ottiene sia per microdeposizione di gocce di
oligonucleotidi sul supporto, sia con la sintesi diretta di
oligonucleotidi sul supporto; si può raggiungere una densità di
100.000 oligonucleotidi/per vetrino (da 20 a 60 basi).
Offrono vantaggi rispetto ai microarray di cDNA oppure di DNA
genomico perché sono in grado di svelare SNPs e di distinguere
quindi tra sequenze molto simili tra loro
DNA Chips o microarrays di oligonucleotidi: metodo
sviluppato dalla Affymetrix Inc.
Il sistema della sintesi diretta degli oligonucleotidi sul chip è stato sviluppato dalla Affymetrix Inc.:
Gli oligonucleotidi sono sintetizzati in situ sul substrato in posizioni definite. I Gene Chips che si
ottengono hanno dimensioni di un francobollo (1,6 cm2) con una densità di circa 106 oligo per cm2. Le
sequenze di un set di oligonucleotidi di DNA lunghi fino a 25 basi sono determinate in base
all’esperimento.
Un algoritmo di calcolo disegna delle maschere litografiche da utilizzare per sintetizzare la serie di
oligo sui chips. Gli array sono costruiti in base ad un procedimento chimico diretto dalla luce
(http://affymetrix.com)
Fonte luminosa
MASCHERA
LITOGRAFICA
SUPPORTO
Metodo della Affymetrix
MASCHERA
LITOGRAFICA
Fonte luminosa
Per
costruire
un
microarray
di
oligonucleotidi lunghi 20 basi, dovranno
essere prodotte 80 maschere litografiche
(4 nucleotidi per ognuna delle 20
posizioni dell’oligo)
SUPPORTO
Luce -> DEPROTEZIONE
MASCHERA
LITOGRAFICA
Nuovo gruppo di
protezione fotolabile
Accoppiamento
chimico T-
SUBSTRATO
Luce -> DEPROTEZIONE
MASCHERA
LITOGRAFICA
C-
SUBSTRATO
Il procedimento è
ripetuto
Schema di esperimento basato sui microarray
Un tipico esperimento che utilizzi i microarray comprende cinque fasi principali:
1.
deposizione delle sonde sul supporto rigido; ogni singolo vetrino può contenere
da 5000 a 40000 prodotti di amplificazione o cDNA oppure OLIGONUCLEOTIDI.
2.
preparazione del materiale genetico da analizzare per esempio una miscela di cDNA che
viene marcata con molecole fluorescenti (fluorocromi)
3.
ibridazione dei campioni fluorescenti sul microarray
4.
lettura dei valori di fluorescenza, effettuata tramite apposito scanner; si valuta il
quadro
di fluorescenza e i risultati sono elaborati da un computer. Il livello di
fluorescenza in ogni singola goccia di DNA è proporzionale ai livelli di espressione
genica. Si possono usare sullo STESSO MICROARRAY due cDNA preparati da cellule
diverse e marcati con coloranti fluorescenti diversi.
Si ottiene come risposta una mappa a colori che definisce un profilo di espressione, che
consente di confrontare i quadri di espressione genica in tessuti diversi o nello stesso
tessuto in differenti condizioni oppure in cellule a stadi diversi di sviluppo
Profili di espressione genica durante la sporulazione del lievito
La SPORULAZIONE nel lievito è un processo-chiave nel ciclo vitale di lievito S. cerevisiae. Inizia quando le condizioni
ambientali sfavorevoli inducono la cellula diploide ad andare in meiosi e produrre delle spore aploidi di tipo coniugativo
diverso. Dopo la germinazione, ogni spora può fondersi per produrre nuovamente una cellula diploide
Campione
di controllo
Campione
da saggiare
Estrazione dell’ RNA
Geni + espressi nel test
Geni + espressi nel controllo
Geni ugualmente espressi
nei due campioni
mRNA
Cy3
Sintesi del cDNA
mediante trascrizione
inversa e marcatura
con
coloranti
fluorescenti diversi
Cy5
IBRIDAZIONE
Sul vetrino c’è il DNA che corrisponde
ai circa 6200 geni del lievito (2400
ancora a funzione non nota)
L ’ approccio
con
i
microarray ha portato ad
una
descrizione
più
dettagliata dell’espressione
dei vari geni coinvolti nelle
varie fasi della sporulazione
Esempio di microarray di oligonucleotidi per analisi
differenziale dei trascritti tra popolazioni cellulari differenti
1 cm
Supporto
in
vetro, silicio o
fibre ottiche
cDNAottenuto da
RNA da tessuto
sano, marcato con
CY3
cDNA ottenuto
da RNA da
tessuto tumorale,
marcato con CY5
Segnale VERDE se un gene è espresso per esempio solo nel
tessuto sano, ROSSO se un gene è espresso solo nel tessuto
tumorale e diverse gradazioni di GIALLO (rosso + verde) se un
gene è espresso in entrambi i tessuti.
Un nuovo approccio per i microarray di
nucleotidi viene dalla tecnologia delle fibre
ottiche, è possibile creare 50000 pozzetti
all’estremità di una fibra ottica di 1 mm di
diametro.
Gli strumenti correnti usano 96 fibre
ottiche e quindi si possono analizzare
contemporaneamente più di 5.000.000
di “situazioni diverse” ad ogni esperimento!
Uso di un microarray di oligonucleotidi per identificare SNPs
Il gene BRCA1 è coivolto nello sviluppo del tumore al seno e alle ovaie
Nel 1994 è stato clonato il gene BRCA1, un gene oncosoppressore situato sul cromosoma 17
Una serie di mutazioni in questo gene sono state riscontrate prevalentemente in soggetti
affetti da carcinoma mammario od ovarico, di tipo familiare
Il BRCA1 risulta essere implicato in una serie di funzioni cellulari di primaria importanza come la
riparazione del DNA, la regolazione della trascrizione, il controllo del ciclo cellulare e
l’ubiquitinazione
Nei soggetti portatori di questo tipo di mutazione il rischio di sviluppare un carcinoma mammario
nell’arco della vita è compreso tra il 50 e l’85%; per il carcinoma ovarico il rischio è del 15-60%
Le mutazioni identificate sono più di 600 e quasi tutte comportano la produzione di una proteina
tronca alcune di esse sono più frequenti di altre all’interno di una popolazione
Una donna su 500-800 è portatrice di una mutazione del BRCA1. È stato messo a
punto un test di screening per identificare mutazioni (SNPs) in qualsiasi posizione
del del cDNA di BRCA1, anche se al momento abbastanza costoso.
Analisi per ASO multipla su microarray per identificare
SNPs nel gene BRCA 1
Il cDNA per BRCA 1 è lungo 5500 bp.
Per identificare una mutazione posta in una qualsiasi delle posizioni nella sequenza, si disegnano 4 ASO
di sequenza identica per OGNI POSIZIONE NUCLEOTIDICA (con un cambio nel PRIMO nucleotide
della sequenza) -> 22000 oligonucleotidi in tutto
Gli oligo così ottenuti sono fissati ad un supporto, in modo permanente -> MICROARRAY
Analisi per ASO multipla su larga scala per identificare
SNPs nel gene BRCA 1
Il cDNA per BRCA 1 è lungo 5500 bp.
Per identificare una mutazione posta in una qualsiasi delle posizioni nella sequenza, si disegnano 4 ASO
di sequenza identica per OGNI POSIZIONE NUCLEOTIDICA -> 22000 oligonucleotidi in tutto
Gli oligo così ottenuti sono fissati ad un supporto, in modo permanente -> MICROARRAY
Le sonde (gli oligonucleotidi) sono attaccate al supporto e costituiscono il microarray ed è il DNA da
saggiare ad essere marcato.
1.
Si amplifica il cDNA dal soggetto in esame mediante PCR
2.
Si marca l’amplificato con un colorante fluorescente
3.
Si ibrida al microarray, usando condizioni che permettono l’ibridazione di piccole sequenze (gli
oligo) perfettamente complementari
4.
Si analizza il risultato dell’ibridazione mediante analisi computerizzata per identificare eventuali
differenze rispetto ad un campione amplificato da un individuo omozigote per l’allele normale del
gene BRCA 1
Confronto di due microarray tra la posizione 2420 e 2440 del gene
BRCA 1 con DNA da individui con genotipo che differisce per un
singolo nucleotide in posizione 2431
Individuo OMOZIGOTE per l’allele normale di BRCA 1
T
G
C
A
C
2420
A
G
T
A
T
T
T
C
A
T
T
G
G
T
A
C
C
T
G
G
2440
Il DNA AMPLIFICATO e MARCATO ottenuto, può essere complementare con tutte le sue basi
SOLO ad un ASO presente in ogni colonna del microarray.
Individuo ETEROZIGOTE per l’allele normale di BRCA 1 e un allele con SNP in posizione 2430
T
G
C
A
C
2420
A
G
T
A
T
T
T
C
A
T
C
T
G
G
T
A
C
C
T
G
G
2440
Identificazione di geni candidati nella regione individuata
Dopo aver localizzato un gene responsabile di una malattia vicino ad un “marcatore polimorfico
del DNA” si può pensare ad una strategia per identificare e poi clonare il gene responsabile
Catalogazione di tutti i geni della regione: quando il locus del gene di una malattia è stato
localizzato in una regione, i ricercatori cercano, all'interno di questa regione, tutte LE
SEQUENZE CODIFICANTI.
Diversi modi per identificare le regioni codificanti in una serie di cloni genomici:
1.
Si possono usare analisi bioinformatiche :
-si possono rivelare regioni codificanti cercando schemi di lettura aperti, o usando
programmi che riconoscono la struttura dei siti di splicing;
-si può verificare se la sequenza genomica compare in uno o più cloni EST
ottenuti da diversi tessuti umani
2.
Si può analizzare la sequenza mediante ZOO blot: le sequenze codificanti degli
esseri umani hanno quasi sempre una sequenza conservata nei mammiferi e spesso le
due sequenze ibridano tra loro; questa ricerca si fa per Southern
3.
Si può usare la tecnica definita dell’ ”exon trapping” (questa tecnica è stata
usata nell‘identificazione del gene della Corea di Huntington, dopo avere associato
la malattia ad un polimorfismo)
Descrizione dell’ “exon trapping”
Si clonano tutti i frammenti genomici della regione di interesse in un vettore di questo tipo:
VETTORE
P1
P2
Esone 1Introne Esone 2
mcs
Esone 1
Esone A
TRASFEZIONE e
TRASCRIZIONE
AAAAAAAA
Trascritto PRIMARIO
TRASFEZIONE e
TRASCRIZIONE
Trascritto PRIMARIO
AAAAAAAA
SPLICING
Trascritto MATURO
AAAAAAAA
P1
AMPLIFICAZIONE
Esone 2
SPLICING
AAAAAAAA
Trascritto MATURO
P1
AMPLIFICAZIONE
AAAAAAAA
P2
PRODOTTO DI PCR
P2
PRODOTTO DI PCR
Se nel SITO MULTIPLO DI CLONAGGIO del vettore si è inserito un frammento
che possiede un ESONE, il prodotto di amplificazione risulterà più grande di
quello del vettore in cui sia entrato un frammento contenente una regione non
CLONAGGIO POSIZIONALE
La capacità di identificare ed isolare geni sulla base di informazioni riguardanti la
loro localizzazione cromosomica è stato uno dei maggiori contributi della
genomica: questo approccio è detto CLONAGGIO POSIZIONALE (un esempio
è dato dal clonaggio del gene della Corea di Huntington)
Il CLONAGGIO POSIZIONALE dipende dalla disponibilità di mappe dettagliate
della regione cromosomica in cui sono localizzati i geni di interesse.
È possibile fare un'analisi di associazione con centinaia di “MARCATORI
ANONIMI (come ad esempio gli SNP o i MICROSATELLITI) ed il locus della
malattia a cui si è interessati.
Se si dimostra un'associazione tra la malattia ed 1 o più marcatori del DNA,
mappati in precedenza, allora il gene responsabile è mappato nella regione dove
questo "marcatore" è localizzato; ciò facilita il suo CLONAGGIO
Primi 40 nucleotidi del gene
1
10
20
30
40
AGTCCGGTGCATAAATTGCA ATTTGGCATACGATCCGCAT
T
TGTCCGGTGCATAAATTGCA
G
GGTCCGGTGCATAAATTGCA
C
CGTCCGGTGCATAAATTGCA
A
AGTCCGGTGCATAAATTGCA
T
G
C
A
PRIMO GRUPPO DI 4 OLIGONUCLEOTIDI
TCCGGTGCATAAATTGCAAA
GTCCGGTGCATAAATTGCAA
SECONDO GRUPPO DI 4 OLIGONUCLEOTIDI
CTCCGGTGCATAAATTGCAA
ATCCGGTGCATAAATTGCAA
ecc.