ANALISI DELL’RNA Northen blot E’ un metodo simile a quello di traferimento e di ibridizzazione del DNA (Southern blot) e si usa per sondare molecole di RNA. Gli mRNA sono molecole brevi, in genere meno di 5 kb, per cui non c’è necessità di digerirli con un enzima prima della separazione elettroforetica. Separazione elettroforetica trasferimento a nitrocellulosa ibridizzazione con sonda marcata rivelazione. Il metodo è utile per studiare l’espressione di geni specifici. Tuttavia, non è una tecnica molto sensibile. Northern Blot Ibridizzazione in situ L’ibridizzazione in situ permette di osservare la posizione precisa di un RNA all’interno di una cellula. Le sonde per l’ibridizzazione possono essere radiomarcate con 3H, coniugate ad un fluoroforo (sonde fluorescenti) od a cui è coniugato un antigene. Saggio di protezione dalla Rnasi (RPA) La RPA è un metodo sensibile per rivelare e quantificare trascritti specifici di mRNA in una miscela complessa di RNA totale o di molecole di mRNA. L’ibridizzazione di una sonda marcata di RNA con un trascritto protegge parte della sonda dalla digestione con una Rnasi che degrada specificamente RNA a singolo filamento. La quantità della sonda protetta dal trascritto è proporzionale alla concentrazione del trascritto metodo quantitativo. Saggio di protezione dalla Rnasi (RPA) La RPA è almeno 10 volte più sensibile del Northen blot ed è più accurata e diretta dell RTPCR. Inoltre, permette di ottenere informazioni che non possono essere ottenute in modo accurato con gli altri metodi. Per esempio, permette di identificare i siti di inizio della trascrizione, di studiare le giunzioni introni-esoni, e di rivelare differenze molto piccole tra trascritti correlati. Espressione Genica E’ un processo molto complesso e finemente regolato che permette ad una cellula di rispondere dinamicamente sia agli stimoli ambientali che alle sue stesse necessità di cambiament0. DNA RNA Proteine In ogni istante della propria vita ogni cellula umana contiene: • 20.000 geni • 10-15.000 mRNA diversi • > 100.000 proteine diverse Misurare l’espressione di un gene significa.... Dare una valutazione quantitativa della presenza di trascritti (molecole di mRNA) o delle proteine codificate da quel gene nelle cellule in esame Genoma: l’insieme di tutte le molecole di DNA presenti nel nucleo di ogni cellula. Trascrittoma: l’insieme degli RNA messaggeri che la cellula sta esprimendo in un dato momento. Proteoma: la collezione completa delle proteine che la cellula sta esprimendo in un dato momento. Analisi del trascrittoma analisi dei profili globali di espressione genica a livello di mRNA Espressione genica differenziale: valuta le differenze nell’espressione genica tra due trascrittomi. cellule trattate con un composto esogeno (ad es. un farmaco) a confronto con cellule non trattate. un tessuto tumorale a confronto con uno sano Tecnologia dei microarray Sfrutta la capacità di una data molecola di mRNA di ibridizzare con il DNA stampo da cui è stata generata. Un microarray consiste in un supporto di vetro o di silicio su cui sono stati depositati (“spotted”) in maniera ordinata numerosi campioni di DNA di sequenza nota, corrispondenti a diversi geni. Durante l’ibridazione questi legheranno specificamente le sequenze complementari che troveranno in soluzione. I campioni da depositare in maniera ordinata sui microarray possono essere ottenuti in vari modi: a) cDNA clonati e purificati; b) frammenti genici amplificati mediante PCR; c) oligonucleotidi sintetizzati chimicamente e poi depositati sul microarray; d) oligonucleotidi sintetizzati direttamente sul supporto (Affimetrix). Agilent Microarrays Materiale da analizzare: RNA estratto dalle cellule o dal tessuto e marcato con fluoroforo; Per aumentare l’efficienza la preparazione di RNA viene usata come stampo per una RT-PCR sintesi di cDNA dallo stampo di RNA medinate trascrittasi inversa amplificazione mediante PCR in presenza di precursori fluorescenti per la marcatura delle molecole. DNA microarray DNA microarray Cianine DNA microarray Acquisizione dell’immagine mediante laser scanner Cy3 Cy5 Scanner a due laser – Lunghezze d’onda di eccitazione dei fluorocromi • 635 nm - Red • 532 nm - Green • Canali separati in acquisizione – formazione di due immagini • Codifica su 16 bit – 2^16 = 65536 livelli di colore • Occupazione di memoria – 130 MB c.a. Analisi dei dati Quantizzazione dei dati • “Gridding” dell’immagine GAL file. • Segmentazione: spaziale; per intensità; • Estrazione dell’intensità di segnale e di background: media del pixel; mediana dei pixel. segnale background Pre-trattamento dei dati • Correzione del background: “spotting” scorretto; legami aspecifici del campione con il supporto; fluorescenza propria dei reagenti. • Sottrazione dal segnale utile dal suo valore calcolato: su un intorno ristretto dello spot; su una sezione dell’array; su un intorno largo dello spot; su spot dedicati. • Applicazione di indicatori di qualità agli spot per la selezione dei geni giudicati idonei per la successiva normalizzazione. SNR = Mediana del segnale / SD del rumore Normalizzazione • Disomogeneità nel processo di deposizione delle sonde; • Quantità iniziali diverse di RNA; • Diversa efficienza di incorporazione dei due fluorocromi; • Disomogeneità di ibridizzazione sul vetrino; • Diversa efficienza di emissione dei due fluorocromi; • Diversa efficienza dello scanner nel leggere i due canali. Variabili che possono influenzare i risultati di un esperimento di microarray: Determinazione di un fold change scorretto Fold Change gene X = Valore di intensità del Trattato / Valore di intensità del Controllo Espressione differenziale del gene X nel campione trattato rispetto al campione di controllo Normalizzazione E’ necessario che la normalizzazione tenga conto del disegno dell’esperimento (confronto realizzato): • Normalizzazione within array Normalizzazione between arrays La normalizzazione va applicata ad un gruppo di geni appositamente scelti: • Tutti i geni sull’array • Geni espressi in maniera costante (housekeeping) • Controlli positivi (spiked) e serie di diluizioni (titration). Normalizzazione Per correggere le variabili (sistematiche) che possono influenzare i risultati di un esperimento di microarray. A =½ log (R*G) M = log (R/G) Estrazione dei dati di espressione genica Metodi empirici -selezione di una soglia empirica sulla distribuzione dei rapporti delle intensità (log [Trattato/Controllo]) Metodi statistici - t-test, ANOVA, B-statistic Clustering - raggruppamenti sulla base di somiglianze Microarray ad oligonucleotidi Agilent Whole Genome Human 44k 60meri sintetizzati sul vetrino mediante inkjetting 41000 trascritti Rat 44k 60meri 41000 trascritti Yeast (S. cerevisiae) 2x44k 60meri 6256 trascritti L’intensità della fluorescenza è proporzionale alla quantità di molecola target nella soluzione e, quindi, costituisce una stima della quantità di RNA espresso dalla cellula. Affimetrix microarray Applicazioni in ricerca e medicina del DNA microarray Valutazione di eventuali alterazioni dell’espressione genica. Evidenziazione di polimorfismi a singolo nucleotide (SNP). Evidenziazione di aberrazioni nei profili di metilazione. Valutazione di variazioni nel numero di copie geniche. Evidenziazione di “splicing” alternativi del mRNA. Valutazione di cambiamenti dell’attività funzionale di fattori di trascrizione. Identificazione della presenza di patogeni. Molte di queste applicazioni si trovano ancora in una fase di sviluppo e validazione, l’analisi dei profili di espressione genica ha subito un processo di profonda ottimizzazione della metodologia, che può oggi avvalersi di array di alta qualità, standardizzazione dei protocolli di ibridazione, tecnologie di analisi delle immagini accurate e approcci computazionali robusti, diventando uno strumento molto potente e relativamente semplice per correlare condizioni fisiologiche e patologiche a profili distintivi di espressione genica, conosciuti come “gene expression signatures” (van’t Veer L.J. et al., 2008). Ad oggi, l’analisi sistematica di profili di espressione genica di campioni tumorali rappresenta l’applicazione del microarray più usata e standardizzata in campo oncologico, che ha concretamente contribuito ad una più accurata valutazione di molte patologie tumorali attraverso l’identificazione di profili definiti di espressione di gruppi di geni associati con specifiche caratteristiche tumorali. Tumore Applicazione Referenza Carcinoma mammario diagnosi/prognosi efficacia terapeutica Sotiriou et al. ,2003 Foekens et al., 2008 Leucemia diagnosi diagnosi prognosi efficacia terapeutica Kohlmann et al., 2008 Alizadeh et al., 2000 Rosenwald et al.,2002 Ge et al ., 2008 Melanoma prognosi diagnosi efficacia terapeutica Winnepenninckx et al., 2006 Talantov et al., 2005 Critchley-Thorne et al., 2007 Epatocarcinoma prognosi prognosi efficacia terapeutica Lee J.S. et al., 2004 Budhu A.S. et al., 2005 Zhu X.D. et al., 2008 Neuroblastoma prognosi efficacia terapeutica Chen Q.R. et al., 2008 Schulte J.H. et al., 2003 Carcinoma renale prognosi diagnosi/prognosi efficacia terapeutica Yao M. et al., 2008 Jones, Pantuck, 2008 Pantuck, 2007 Carcinoma prostatico prognosi diagnosi efficacia terapeutica Zhang et al., 2008 Fromont et al., 2008 Lerner et al., 2008