Microarrays La tecnica microarray si basa sulla ibridazione cDNA (sonda) su supporti – chips o vetrini - sui quali sono fissate porzioni di sequenze nucleotidiche (cDNA o sequenze ologonucleotidiche sintetiche) rappresentative del genoma considerato: su un singolo microarray sono infatti presenti migliaia di spots. La sonda viene marcata con coloranti fluorescenti in modo da permettere l’analisi delle intensità del segnale con uno scanner. Si ibrida selettivamente alle molecole complementari presenti sugli spots: solo i campioni ibridati daranno fluorescenza, e possono quindi essere identificati. Sul vetrino ci sono spot di sequenza nucleotidica nota (il gene), e conseguentemente in base a presenza ed intensità di segnale si può vedere quale gene è espresso e a che livello. Chips e vetrini diverso metodo utilizzato per l’adesione delle sequenze nucleotidiche al supporto: 1. sintetizzate in situ nei chips (afflimetrix) 2. “spottate” (procedure robotizzate) su vetrini trattati per favorire l’adesione degli oligo o cDNA (es polilisina). In oligonucleotide microarrays, the probes are short sequences matching parts of the protein encoding sequence, produced either by spotting the pre-synthesized oligos on the array surface, or by in situ synthesis by lightdirected process as those produced by Affymetrix, Nimblegen or Combimatrix. Microarray Technology • Affymetrix microarrays • oligonucleotide array • photolithography • 25 mer • high density (100,000 features/1.26 cm2) A T A • Spotted Array • cDNA or oligo array • pin based / inkjet technology sequential deposition of cDNA (PCR product) or oligos (up to 80 mer) • Moderately high density (25,000 features/glass slide) A T C C C G A T G A T G T A A G C A G C C G T A A G C A T G A T C Analisi comparativa • da campioni di due categorie viene estratto RNA • l’mRNA di ciascuna categoria viene marcato con un colorante diverso (rosso e verde) • quantità uguali dei due RNA marcati vengono ibridate su uno stesso vetrino. Diversi tessuti sono formati da cellule che si comportano in modo diverso Cellula animale Ogni cellula contiene una esatta copia del genoma (l’intera sequenza del DNA dell’organismo) All’interno del nucleo della cellula il DNA è organizzato in cromosomi: autosomi in numero variabile a seconda della specie due cromosomi sessuali XY Nei cromosomi si possono individuare porzioni di DNA codificante chiamati geni Che cosa le rende differenti ? • Ogni cellula contiene una copia dell’intero genoma • Le cellule sono di diversi tipi (cellule muscolari, cellule epiteliali, cellule del sangue, gameti…) Espressione Differenziale • Espressione genica differenziale, i.e., quando, dove, e in che quantità ogni gene è espresso. • circa il 10% dei geni sono tessuto specifici. Non tutti i geni sono espressi contemporaneamente Espressione Differenziale • Ogni cellula contiene una copia dell’intero genoma • Le cellule sono di diversi tipi (cellule muscolari, cellule cardiache, cellule della pelle, cellule del sangue …) • Che cosa le rende differenti ? Espressione genica differenziale, i.e., quando, dove, e in che quantità ogni gene è espresso. • Ad un determinato istante circa il 40% dei geni sono espressi e circa il 10% dei geni sono tessuto specifici. Dogma Centrale L’ espressione dell’informazione genetica raccolta nelle molecole di DNA, avviene in due stadi: –(i) trascrizione, durante la quale il DNA è trascritto in mRNA –(ii) traduzione, durante la quale l’ mRNA è tradotto per produrre la proteina associata DNA mRNA protein (RT) Multiple Levels of Protein Strucure ( Protein folding) RNA • Ribonucleic acid o RNA è una molecola simile al DNA ma: – è singola, non ha la doppia elica; – l’ uracile (U) sostituisce la timina (T). • RNA gioca un ruolo importante sia nella sintesi proteica che in altre attività biochimiche della cellula. Using Amplified RNA for Microarray Analysis -A comparison of microarray using total RNA and aRNA Direct labeling(Cy-dye incorpeartion) 15-20ug of total RNA Indirect labeling(after transcript labeling) >10ug Genesphere labeling aRNA labeling >1-5ug <1ug AAAAAA Total RNA TTTTTTT—T7 T7Oligo(dT) primer First strand cDNA synthesis T7 2nd strand dscDNA cDNA purification In vitro transcription(amplification) TTTTTT TTTTTT TTTTTTAntisense RNA(aRNA) TTTTTT aRNA purification Labeling with Cy3 or Cy5 by reverse transcription Come è fatto l’array I singoli nucleotidi sul microarray (spots) sono organizzati in gruppi (array), e ogni vetrino porta qualche decina di arrays. Il numero di spots dipende dalla metodica impiegata per la preparazione: • Afflimetrix permette una concentrazione di spots più elevata, • Vetrini: concentrazione spots / unità di superficie più ridotta. cDNA library Amplification of cDNA fragments Spotting of cDNA microarrays General strategy for hybridisation and microarray gene expression analysis Hybridisation and detection Sequencing of differentially expressed cDNAs Esempio analisi comparativa Sul vetrino ibridato: spot solo rossi (espressi in una categoria) solo verdi (espressi nell’altra) gialli (espressi in entrambe) non fluorescenti (non espressi nelle due categorie). Le sonde si ibridizzano ai singoli spots in base alle identità di sequenza formando degli eteroduplex, in modo più o meno efficiente in relazione all’identità della sequenza, e dando quindi un segnale. L’intensità del segnale dipende dalla quantità di trascritto presente Analisi differenze espressione genica L’informazione per codificare le proteine, presente nel DNA, trascritta in mRNA, viene tradotta in proteine. I microarrays analizzano i cambiamenti negli acidi nucleici che si possono ripercuotere nella sintesi proteica. Espressione genica-2 Si ibridizzano campioni provenienti da animali con diverse caratteristiche (a differente attitudine, sani o malati, esposti o meno a uno specifico trattamento) per identificare geni espressi in maniera differenziale in una specifica condizione. Espressione genica-3 I geni differenzialmente espressi sono potenzialmente coinvolti in processi metabolici correlati con la condizione in esame. L’espressione genica è variabile nei vari tessuti e nei vari organi, nonché dipendente dalle condizioni dell’animale (età, ormoni, metabolismo etc): il cDNA va retrotrascritto partendo da RNA estratto da tessuti dello stesso tipo e condizioni. Microarray Overview Campione da analizzare Campione di riferimento Isolate RNA 120 110 50 100 45 90 40 80 35 30 25 40 Fluorescence 60 50 Fluorescence 70 20 30 15 20 10 10 24 29 34 39 44 49 54 59 64 69 18S 0 19 19 Time (seconds) Cy5 labeling (probe) Cy3 24 29 34 39 44 Time (seconds) 28S 18S 28S 5 0 49 54 59 64 69 Microarray Overview Biology Data Analysis Mix Hybridize Scan “Chip” Sul vetrino ibridato: Le sonde si ibridano ai singoli spots in base alle identità di sequenza formando degli eteroduplex, in modo più o meno efficiente in relazione all’identità della sequenza. L’intensità del segnale dopo eccitazione con laser dipende dalla quantità di trascritto presente Spot sul vetrino ibridato: •rossi (espressi in una categoria) •verdi (espressi nell’altra) •gialli (espressi in entrambe) •non fluorescenti (non espressi nelle categorie). Programmazione esperimenti Vanno programmati accuratamente: elevati. costi piuttosto Fare un numero di campioni e di vetrini sufficiente per una analisi statistica e limitando le ripetizioni. Ripetizioni Servono più campioni individuali per escludere polimorfismi non associati al fenomeno in esame: loop design, reference design dye swap: fluorofori. differenze nell’efficienza dei singoli ripetizioni errori sperimentali •preparazione vetrino (errori spottaggio, ad esempio scivolamento o cattiva aderenza in alcune zone del vetrino) •estrazione dell’RNA: prodotti non ottimali o degradazione prima della retrotrascrizione. •retrotrascrizione: problemi dovuti per esempio ai reagenti (diversa efficienza). •Fluorofori: differente efficienza per problemi di conservazione dei fluorofori stessi o del vetrino; si possono legare selettivamente a particolari nucleotidi. •Durante l’ibridazione, per condizioni di ibridazione poco stringenti , incorporazione differenziale di uno dei due fluorofori, precipitazioni o bolle d’aria nel buffer di ibridazione estrazione di RNA RNA totale Spettrofotometro: rapporto OD 260/280 tra 1.9 e 2.1. gel di agarosio denaturante: due bande nette (subumità ribosomali), la banda 28S è circa doppia di quella 18S. Non devono esserci contaminazioni da DNA genomico, che se presenti richiedono un trattamento con DNasi ed una completa inattivazione di queste ultime prima dell’ibridazione (ad esempio con fenolo cloroformio o passaggio in colonnine qiagen). Il vetrino prelavaggio in gradienti di SSC (2X SSC, 2,2X SSC e acqua distillata) prima dell’ibridazione per rimuovere sali e detriti che possono essersi depositati sulla superficie degli array, in modo da ridurre il background. L’invecchiamento del vetrino può portare a difetti di ibridazione, riducendo il segnale specifico ed alzando il background, soprattutto nel canale verde (Cy3). Anche le soluzioni utilizzate per i lavaggi possono contribuire alla formazione di background, per cui è consigliabile controllare periodicamente le soluzioni utilizzate e preparare volta per volta delle diluizioni nuove. Esperimento Pool RNA sani cDNA Pool RNA malati cDNA SNP microarray utilizza polimorfismi nei singoli nucleotidi (SNPs). Approccio utilizzato originariamente in studi medici (predisposizioni allo sviluppo di tumori o differenti suscettibilità a farmaci) ed ora utilizzato per l’analisi di SNPs in taxa il cui genoma è conosciuto in dettaglio. usa microarrays nei quali sono presenti sonde allelespecifiche che si differenziano per un singolo nucleotide in base all’ibridazione dei campioni sui vari spots è possibile ricostruirne il genotipo Analisi di genotipi utilizza polimorfismi nei singoli nucleotidi (SNPs). approccio utilizzato inizialmente in studi medici (predisposizioni allo sviluppo di tumori o differenti suscettibilità a farmaci); ora di largo uso in studi di popolazione, anche in animali. usa microarrays nei quali sono presenti copie di determinate sequenze che si differenziano per un singolo nucleotide, ed in base all’ibridazione dei campioni sui vari spots è possibile ricostruirne il genotipo nimblegen CombiMatrix’s core technology is a modified semiconductor adapted for biological applications, containing arrays of microelectrodes individually addressable using embedded logic circuitry on the chip. Placed in a specially designed fluidic chamber, the chip digitally directs the molecular assembly of biopolymers in response to a digital command. Each microelectrode is addressed to selectively generate, by an electrochemical reaction, chemical reagents that facilitate the in situ synthesis of DNA oligonucleotides. Combimatrix Lab-on-a-Chip Arrays of individually addressable microelectrodes permit synthesis of hundreds or thousands of different molecules in parallel. Porous Reaction Layer (PRL) Biocompatible layer that supports the attachment of synthesized molecules. Virtual Flask A process that confines chemical reagents within a virtual flask over each microelectrode. DNA Microarrays Arrays of oligonucleotides capture molecules synthesized on the chip for use in genomic and proteomic applications. SNP-Genotyping Arrays Affymetrix (10K, 100K, 500K, 5.0, 1M) affymetrix.com Illumina (100K,320K, 230S, 550K,650K, 1M) illumina.com Affymetrix Genotyping Affymetrix Microarray Overview Procedures for Target Preparation Cells Biotin-labeled transcripts IVT AAAA (Biotin-UTP Biotin-CTP) B B B B RNA T7-dT cDNA Fragment (heat, Mg2+) Hybridize Scan Wash & Stain (16 hours) B B B B Fragmented cRNA Illumina Genotyping Infinium (7,600-1 Million SNPs) GoldenGate (96-1,536 SNPs) Agriculture bovino Dye Bias • Cy3 e Cy5 possono falsare i risultati legandosi a particolari spots. • Inserire un dye-swap di ciascun array può far individuare ed eliminare il problema. • Raddoppia il numero di microarrays richiesti. Cy3 Cy5 Pools Utilizzando pools di RNA (più individui appartenenti a ciascuna categoria analizzata) si può raggiungere la quantità di RNA necessario per una buona ibridazione e il cDNA viene retrotrascritto in un’unica reazione, livellando la variabilità sperimentale. Questo può permettere inoltre di preparare cDNA sufficiente all’ibridazione di più vetrini, limitando quindi anche le differenze tra le ripetizioni necessarie per la validazione stesso esperimento. Ibridazione Lettura dati La lettura ottica viene effettuata con uno scanner alle due lunghezze d’onda corrispondenti ai due fluorocromi utilizzati. Le intensità del segnale per ciascuno spot alle due lunghezze d’onda vengono registrate. I dati vengono analizzati statisticamente per identificare pattern di espressione simili (cluster analisis) e poi valutati con test di significatività per valutare la differenza di espressione tra i campioni. Analisi dell’immagine • Identificazione della posizione degli spot • Costruzione di un’area locale intorno ad ogni spot • Calcolo dell’intensità di ogni singolo spot • Calcolo del background locale Risultati attesi differenza di espressione nel tessuto di animali (ex.sani e malati) identificazione dei geni coinvolti nel carattere analizzato plants viruses and bacteria invertebrates vertebrates human rodents livestock 20% 16% 8% 3% 35% 17% 3% Ma se non si lavora coi topi? 1. Microarray di specie affini 2. Analisi High throughput di mRNA senza microarrays (SAGE; MPSS) 3. Deep cDNA sequencing (GS-FLX Pyrosequencing) Oppure…. 4. GENERARE CUSTOM MICROARRAY USANDO LE SEQUENZE DISPONIBILI NEI DATABASE PUBBLICI Expressed sequence tags (EST) Sequenze pubbliche(generalemnte lunghe 200 -500 nucleotidi) generate da sequenziamento random di librerie di cDNA. Rappresentano i geni espressi in cellule, tessuti, organi di diversi organismi. Disponibili in NCBI dbEST. A pipeline to rapidly generate custom microarrays from sequence databases dbEST Redundancy filter Hybridization annotation oligo design In situ generation un microarray per Ovis aries The microarray efficiency was assessed by performing pilot experiments using RNA of two sheep breeds and achieving very good technical outcomes, such as in slide replicates coefficient of variation <0.25 for differentially expressed genes with P<0.01. Aristaeus chip 1.0 Oligonucleotides 40 mer designed using the GoArrays software in situ generated using the Combimatrix equipment. 21,737 non-redundant features in quadruplicate 73.4% fully annotated (10,190 genes) We conclude that the method is very efficient and can be easily extended to other species of which genetic sequences are present in public databases. With this procedure, even a microarray in single copy can be generated with a moderate cost. Therefore, we believe that this method allows the study of species so far neglected with advanced devices like microarrays. As a perspective, the approach can be applied also to species of which no sequences are available to date, by using highthroughput deep sequencing methods. Chip bovino 43768 sonde lunghe 40 nucleotidi Ciascuna rappresenta un singolo trascritto bovino Sintetizzate in duplicato su 90K chip Combimatrix Identificazione di geni responsabili della tenerezza della carne