Microarrays di DNA, cDNA e oligonucleotidi Tecnologia degli “array” di DNA Un array di DNA è una grande collezione di frammenti di DNA disposti in file ordinate su un supporto solido chiamato “chip”. I chip sono formati da moltissime molecole di DNA (detti sonde) depositate in una posizione nota su un supporto a formare una griglia (da cui il nome array) che consente di identificarle in MODO UNIVOCO. Il supporto, di solito, è un vetrino da microscopio che ha le dimensioni, più o meno, di un francobollo. Ogni sonda è costituita DNA a singola elica che può corrispondere al cDNA di un gene, ad una sequenza genomica oppure ad un oligonucleotide (cDNA o genomico). Per costruire un array si possono: • usare cloni di cDNA prelevati direttamente da micropozzetti • produrre frammenti di DNA per PCR che saranno poi depositate in posizioni specifiche su un supporto solido usandone microscopiche gocce • sintetizzare oligonucleotidi direttamente su un supporto solido che corrispondono a porzioni di geni specifici 3 tipi diversi di array macroarray microarray array di oligonucleotidi Macroarray Dopo la creazione di una genoteca di cDNA, una macchina equipaggiata con molteplici punte raccoglie il cDNA da micropozzetti e lo deposita su una membrana di nylon o su altri tipi di supporto formando un “array”. Per costruire un macroarray si possono così depositare fino a 20000 cloni da una genoteca La miscela di cDNA che deve essere analizzata è marcata RADIOATTIVAMENTE e quindi il segnale d’ibridazione è visibile per autoradiografia. Microarrays o DNA Chips Un DNA microarray è una GRIGLIA ORDINATA di molecole di DNA a sequenza nota, fissate in posizioni note su un substrato solido che può essere un microchip di silice, vetro oppure una membrana di nylon (meno frequente). Ci sono due tipi di tecnologie per produrre DNA microarrays: 1) la microdeposizione 2) la sintesi diretta di oligonucleotidi su supporto MICRODEPOSIZIONE La MICRODEPOSIZIONE è stata sviluppata alla Stanford University -> le molecole di DNA preconfezionate (cloni di DNA genomico, di cDNA, prodotti di PCR oppure oligonucleotidi) sono depositati sul vetro usando strumenti meccanici per la deposizione. Il DNA è caricato per capillarità su un ago e piccole quantità di DNA sono rilasciate sulla superficie del vetro quando l’ago tocca la superficie. L’ago è lavato, carica il DNA successivo e lo deposita in posizione adiacente. La produzione veloce di microarray è resa possibile da una testa motorizzata robottizzata con molti aghi. I microarray possono contenere 10000-100000 molecole di DNA in un’area piccolissima di 3,6 cm2. Gli aghi depositano una goccia del DNA sul supporto vetrino Gli aghi si spostano in un ’ altra posizione, dopo il lavaggio Microarrays di oligonucleotidi Questo tipo di array si ottiene sia per microdeposizione di gocce di oligonucleotidi sul supporto, sia con la sintesi diretta di oligonucleotidi sul supporto; si può raggiungere una densità di 100.000 oligonucleotidi/per vetrino (da 20 a 60 basi). Offrono vantaggi rispetto ai microarray di cDNA oppure di DNA genomico perché sono in grado di svelare SNPs e di distinguere quindi tra sequenze molto simili tra loro DNA Chips o microarrays di oligonucleotidi: metodo sviluppato dalla Affymetrix Inc. Il sistema della sintesi diretta degli oligonucleotidi sul chip è stato sviluppato dalla Affymetrix Inc.: Gli oligonucleotidi sono sintetizzati in situ sul substrato in posizioni definite. I Gene Chips che si ottengono hanno dimensioni di un francobollo (1,6 cm2) con una densità di circa 106 oligo per cm2. Le sequenze di un set di oligonucleotidi di DNA lunghi fino a 25 basi sono determinate in base all’esperimento. Un algoritmo di calcolo disegna delle maschere litografiche da utilizzare per sintetizzare la serie di oligo sui chips. Gli array sono costruiti in base ad un procedimento chimico diretto dalla luce (http://affymetrix.com) Fonte luminosa MASCHERA LITOGRAFICA SUPPORTO Metodo della Affymetrix MASCHERA LITOGRAFICA Fonte luminosa Per costruire un microarray di oligonucleotidi lunghi 20 basi, dovranno essere prodotte 80 maschere litografiche (4 nucleotidi per ognuna delle 20 posizioni dell’oligo) SUPPORTO Luce -> DEPROTEZIONE MASCHERA LITOGRAFICA Nuovo gruppo di protezione fotolabile Accoppiamento chimico T- SUBSTRATO Luce -> DEPROTEZIONE MASCHERA LITOGRAFICA C- SUBSTRATO Il procedimento è ripetuto Schema di esperimento basato sui microarray Un tipico esperimento che utilizzi i microarray comprende cinque fasi principali: 1. deposizione delle sonde sul supporto rigido; ogni singolo vetrino può contenere da 5000 a 40000 prodotti di amplificazione o cDNA oppure OLIGONUCLEOTIDI. 2. preparazione del materiale genetico da analizzare per esempio una miscela di cDNA che viene marcata con molecole fluorescenti (fluorocromi) 3. ibridazione dei campioni fluorescenti sul microarray 4. lettura dei valori di fluorescenza, effettuata tramite apposito scanner; si valuta il quadro di fluorescenza e i risultati sono elaborati da un computer. Il livello di fluorescenza in ogni singola goccia di DNA è proporzionale ai livelli di espressione genica. Si possono usare sullo STESSO MICROARRAY due cDNA preparati da cellule diverse e marcati con coloranti fluorescenti diversi. Si ottiene come risposta una mappa a colori che definisce un profilo di espressione, che consente di confrontare i quadri di espressione genica in tessuti diversi o nello stesso tessuto in differenti condizioni oppure in cellule a stadi diversi di sviluppo Profili di espressione genica durante la sporulazione del lievito La SPORULAZIONE nel lievito è un processo-chiave nel ciclo vitale di lievito S. cerevisiae. Inizia quando le condizioni ambientali sfavorevoli inducono la cellula diploide ad andare in meiosi e produrre delle spore aploidi di tipo coniugativo diverso. Dopo la germinazione, ogni spora può fondersi per produrre nuovamente una cellula diploide Campione di controllo Campione da saggiare Estrazione dell’ RNA Geni + espressi nel test Geni + espressi nel controllo Geni ugualmente espressi nei due campioni mRNA Cy3 Sintesi del cDNA mediante trascrizione inversa e marcatura con coloranti fluorescenti diversi Cy5 IBRIDAZIONE Sul vetrino c’è il DNA che corrisponde ai circa 6200 geni del lievito (2400 ancora a funzione non nota) L ’ approccio con i microarray ha portato ad una descrizione più dettagliata dell’espressione dei vari geni coinvolti nelle varie fasi della sporulazione Esempio di microarray di oligonucleotidi per analisi differenziale dei trascritti tra popolazioni cellulari differenti 1 cm Supporto in vetro, silicio o fibre ottiche cDNAottenuto da RNA da tessuto sano, marcato con CY3 cDNA ottenuto da RNA da tessuto tumorale, marcato con CY5 Segnale VERDE se un gene è espresso per esempio solo nel tessuto sano, ROSSO se un gene è espresso solo nel tessuto tumorale e diverse gradazioni di GIALLO (rosso + verde) se un gene è espresso in entrambi i tessuti. Un nuovo approccio per i microarray di nucleotidi viene dalla tecnologia delle fibre ottiche, è possibile creare 50000 pozzetti all’estremità di una fibra ottica di 1 mm di diametro. Gli strumenti correnti usano 96 fibre ottiche e quindi si possono analizzare contemporaneamente più di 5.000.000 di “situazioni diverse” ad ogni esperimento! Uso di un microarray di oligonucleotidi per identificare SNPs Il gene BRCA1 è coivolto nello sviluppo del tumore al seno e alle ovaie Nel 1994 è stato clonato il gene BRCA1, un gene oncosoppressore situato sul cromosoma 17 Una serie di mutazioni in questo gene sono state riscontrate prevalentemente in soggetti affetti da carcinoma mammario od ovarico, di tipo familiare Il BRCA1 risulta essere implicato in una serie di funzioni cellulari di primaria importanza come la riparazione del DNA, la regolazione della trascrizione, il controllo del ciclo cellulare e l’ubiquitinazione Nei soggetti portatori di questo tipo di mutazione il rischio di sviluppare un carcinoma mammario nell’arco della vita è compreso tra il 50 e l’85%; per il carcinoma ovarico il rischio è del 15-60% Le mutazioni identificate sono più di 600 e quasi tutte comportano la produzione di una proteina tronca alcune di esse sono più frequenti di altre all’interno di una popolazione Una donna su 500-800 è portatrice di una mutazione del BRCA1. È stato messo a punto un test di screening per identificare mutazioni (SNPs) in qualsiasi posizione del del cDNA di BRCA1, anche se al momento abbastanza costoso. Analisi per ASO multipla su microarray per identificare SNPs nel gene BRCA 1 Il cDNA per BRCA 1 è lungo 5500 bp. Per identificare una mutazione posta in una qualsiasi delle posizioni nella sequenza, si disegnano 4 ASO di sequenza identica per OGNI POSIZIONE NUCLEOTIDICA (con un cambio nel PRIMO nucleotide della sequenza) -> 22000 oligonucleotidi in tutto Gli oligo così ottenuti sono fissati ad un supporto, in modo permanente -> MICROARRAY Analisi per ASO multipla su larga scala per identificare SNPs nel gene BRCA 1 Il cDNA per BRCA 1 è lungo 5500 bp. Per identificare una mutazione posta in una qualsiasi delle posizioni nella sequenza, si disegnano 4 ASO di sequenza identica per OGNI POSIZIONE NUCLEOTIDICA -> 22000 oligonucleotidi in tutto Gli oligo così ottenuti sono fissati ad un supporto, in modo permanente -> MICROARRAY Le sonde (gli oligonucleotidi) sono attaccate al supporto e costituiscono il microarray ed è il DNA da saggiare ad essere marcato. 1. Si amplifica il cDNA dal soggetto in esame mediante PCR 2. Si marca l’amplificato con un colorante fluorescente 3. Si ibrida al microarray, usando condizioni che permettono l’ibridazione di piccole sequenze (gli oligo) perfettamente complementari 4. Si analizza il risultato dell’ibridazione mediante analisi computerizzata per identificare eventuali differenze rispetto ad un campione amplificato da un individuo omozigote per l’allele normale del gene BRCA 1 Confronto di due microarray tra la posizione 2420 e 2440 del gene BRCA 1 con DNA da individui con genotipo che differisce per un singolo nucleotide in posizione 2431 Individuo OMOZIGOTE per l’allele normale di BRCA 1 T G C A C 2420 A G T A T T T C A T T G G T A C C T G G 2440 Il DNA AMPLIFICATO e MARCATO ottenuto, può essere complementare con tutte le sue basi SOLO ad un ASO presente in ogni colonna del microarray. Individuo ETEROZIGOTE per l’allele normale di BRCA 1 e un allele con SNP in posizione 2430 T G C A C 2420 A G T A T T T C A T C T G G T A C C T G G 2440 Identificazione di geni candidati nella regione individuata Dopo aver localizzato un gene responsabile di una malattia vicino ad un “marcatore polimorfico del DNA” si può pensare ad una strategia per identificare e poi clonare il gene responsabile Catalogazione di tutti i geni della regione: quando il locus del gene di una malattia è stato localizzato in una regione, i ricercatori cercano, all'interno di questa regione, tutte LE SEQUENZE CODIFICANTI. Diversi modi per identificare le regioni codificanti in una serie di cloni genomici: 1. Si possono usare analisi bioinformatiche : -si possono rivelare regioni codificanti cercando schemi di lettura aperti, o usando programmi che riconoscono la struttura dei siti di splicing; -si può verificare se la sequenza genomica compare in uno o più cloni EST ottenuti da diversi tessuti umani 2. Si può analizzare la sequenza mediante ZOO blot: le sequenze codificanti degli esseri umani hanno quasi sempre una sequenza conservata nei mammiferi e spesso le due sequenze ibridano tra loro; questa ricerca si fa per Southern 3. Si può usare la tecnica definita dell’ ”exon trapping” (questa tecnica è stata usata nell‘identificazione del gene della Corea di Huntington, dopo avere associato la malattia ad un polimorfismo) Descrizione dell’ “exon trapping” Si clonano tutti i frammenti genomici della regione di interesse in un vettore di questo tipo: VETTORE P1 P2 Esone 1Introne Esone 2 mcs Esone 1 Esone A TRASFEZIONE e TRASCRIZIONE AAAAAAAA Trascritto PRIMARIO TRASFEZIONE e TRASCRIZIONE Trascritto PRIMARIO AAAAAAAA SPLICING Trascritto MATURO AAAAAAAA P1 AMPLIFICAZIONE Esone 2 SPLICING AAAAAAAA Trascritto MATURO P1 AMPLIFICAZIONE AAAAAAAA P2 PRODOTTO DI PCR P2 PRODOTTO DI PCR Se nel SITO MULTIPLO DI CLONAGGIO del vettore si è inserito un frammento che possiede un ESONE, il prodotto di amplificazione risulterà più grande di quello del vettore in cui sia entrato un frammento contenente una regione non CLONAGGIO POSIZIONALE La capacità di identificare ed isolare geni sulla base di informazioni riguardanti la loro localizzazione cromosomica è stato uno dei maggiori contributi della genomica: questo approccio è detto CLONAGGIO POSIZIONALE (un esempio è dato dal clonaggio del gene della Corea di Huntington) Il CLONAGGIO POSIZIONALE dipende dalla disponibilità di mappe dettagliate della regione cromosomica in cui sono localizzati i geni di interesse. È possibile fare un'analisi di associazione con centinaia di “MARCATORI ANONIMI (come ad esempio gli SNP o i MICROSATELLITI) ed il locus della malattia a cui si è interessati. Se si dimostra un'associazione tra la malattia ed 1 o più marcatori del DNA, mappati in precedenza, allora il gene responsabile è mappato nella regione dove questo "marcatore" è localizzato; ciò facilita il suo CLONAGGIO Primi 40 nucleotidi del gene 1 10 20 30 40 AGTCCGGTGCATAAATTGCA ATTTGGCATACGATCCGCAT T TGTCCGGTGCATAAATTGCA G GGTCCGGTGCATAAATTGCA C CGTCCGGTGCATAAATTGCA A AGTCCGGTGCATAAATTGCA T G C A PRIMO GRUPPO DI 4 OLIGONUCLEOTIDI TCCGGTGCATAAATTGCAAA GTCCGGTGCATAAATTGCAA SECONDO GRUPPO DI 4 OLIGONUCLEOTIDI CTCCGGTGCATAAATTGCAA ATCCGGTGCATAAATTGCAA ecc.