CORSO INTEGRATO DI GENETICA a.a. 2015-2016 Genetica molecolare in medicina: Analisi di Mutazioni Cristina Bombieri 10 novembre 2015 APPLICAZIONI DEI POLIMORFISMI DEL DNA MARCATORI GENETICI e ANALISI LINKAGE Identificazione indiretta di alleli malattia (diagnosi indiretta) Mappaggio genetico: ordinamento loci (geni o marker) su cromosomi – (M. fisico determina distanza fisica tra loci) IDENTIFICATORI INDIVIDUALITA’ Controllo relazioni parentali in fam. con m. mendeliane Genetica di popolazione Indagini di paternità Indagini criminalistiche Controllo chimerismo Mola idatiforme Perché la diagnosi molecolare? Diagnosi di una malattia è un atto clinico Analisi mutazioni serve a: • Confermare diagnosi clinica • Determinare le mutazioni specifiche per successive analisi nei familiari – Diagnosi Pre-Natale – Identificazione dei portatori • Migliorare conoscenze rapporto genotipo/fenotipo e patofisiologia della malattia Le tappe dell'analisi molecolare per le malattie genetiche 1. Identificare e sequenziare il gene malattia 2. Cercare le mutazioni nel gene 3. Stabilire quali mutazioni sono patologiche 4. Determinare se esiste una distribuzione geografica/etnica delle mutazioni 5. Disegnare pannelli popolazione specifici 6. Selezionare i metodi di analisi più adatti alla ricerca delle mutazioni di interesse 1. MAPPAGGIO E IDENTIFICAZIONE GENI (per caratteri mendeliani) a) Mappare il locus o i loci di interesse e ordinarli sul cromosoma Polimorfismi DNA; Mappe genetiche e fisiche; Linkage e LD b)Identificare gene contenuto nella regione candidata Clonaggio funzionale e posizionale; Human Genome Project c) Determinare la sequenza del gene d) Confermare il gene candidato: identificare mutazioni patologiche e) Dimostrare che il gene candidato è legato alla malattia f) Determinare sequenza e struttura del prodotto genico e collegare funzione del gene alla malattia MAPPAGGIO E IDENTIFICAZIONE GENI (caratteri mendeliani) a) Mappare il locus o i loci di interesse e ordinarli sul cromosoma Polimorfismi DNA Mappe genetiche e fisiche Linkage e LD VEDI LEZIONE PRECEDENTE: ANALISI DI LINKAGE MAPPAGGIO E IDENTIFICAZIONE GENI (caratteri mendeliani) b) Clonaggio e identificazione del gene malattia MAPPAGGIO E IDENTIFICAZIONE GENI (caratteri mendeliani) Clonaggio funzionale Identificare il gene attraverso la sequenza, anche parziale, della proteina codificata (limite: richiede conoscenza proteina alterata!!!) confrontare al computer la sequenza della proteina con le sequenze di tutti i geni depositati nella bancadati del progetto Genoma Umano (HGP) (cocktail di oligonucleotidi che codificano la sequenza proteica di interesse, da usare come sonde per screenare librerie di tutti i cDNA umani) MAPPAGGIO E IDENTIFICAZIONE GENI (caratteri mendeliani) Clonaggio posizionale Identificare gene conoscendo solo la sua posizione cromosomica approssimativa. Enorme lavoro: clonare tutto il genoma in apposite “librerie genomiche” e screenarle nei soggetti affetti per identificare tutti i possibili geni contenuti nella regione candidata (> regione candidata, > difficoltà!!) - analisi dell'omologo umano di un gene animale che produce un fenotipo malattia-simile 1987-1995: clonati ca50 geni malattia 1987: gene DMD (Distrofia di Duchenne) 1989 gene CFTR (Fibrosi cistica) MAPPAGGIO E IDENTIFICAZIONE GENI (caratteri mendeliani) Identificazione di geni responsabili di malattie mendeliane IERI OGGI HGP (Human Genome Project) & Exome sequencing (ri-sequenziamento regioni (es. Talassemie) (es. Fibrosi Cistica) (Gelehrter, Collins, Ginsburg; Genetica Medica; Masson 1999) codificanti) MAPPAGGIO E IDENTIFICAZIONE GENI (caratteri mendeliani) Usare un Genome Browser per ottenere la lista di geni contenuti in una regione candidata cr.6 Schermata del UCSC genome browser (http://www.genome.ucsc.edu/) che mostra i geni inclusi in una regione di 500kb della banda 6p21.1 (esoni = barre verticali; frecce indicano direzione di trascrizione) Next Generation Sequencing Sequenza di tutto il genoma Limite: Complesso e costoso Sequenza degli esoni Limite: Identifica solo le mutazioni presenti nella porzione codificante dei geni WES WGS Sequenza specifica delle sole regioni (geni) target di interesse Next Generation Sequencing Procedura complessa; grande mole di dati da analizzare MAPPAGGIO E IDENTIFICAZIONE GENI (caratteri mendeliani) c) Confermare il gene candidato... - Identificare mutazioni causali, cioè mutazioni che verosimilmente possono alterare la funzione o l'espressione genica - Tali mutazioni devono essere frequenti nei pazienti e rare nei sani - Studi funzionali in vitro o in modelli animali possono confermare la patogenicità delle mutazioni identificate d) Determinare la sequenza del gene candidato... Determinare la sequenza in basi e la struttura in esoni e introni del gene candidato. Identificare una sequenza normale di riferimento STRUTTURA GENI EUCARIOTI MAPPAGGIO E IDENTIFICAZIONE GENI (caratteri mendeliani) e/f) Collegare il gene e il suo prodotto alla malattia - Pattern espressione del gene consistente con la malattia: espressione almeno nei tessuti colpiti dalla patologia e precedentemente o nel momento in cui la patologia si manifesta - Dimostrare per il gene una appropriata funzione, correlata alla malattia, (non è sempre cosa ovvia!): Talvolta la funzione del gene è chiaramente collegabile alla malattia: – Rodopsina e retinite pigmentosa – Fibrillina e S. Marfan (difetto tessuto connettivo) Altre volte gene nuovo => riconoscimento di motivi proteici comuni, come domini transmembrana o d. tirosin-kinasici, aiuta a predire la possibile funzione della proteina Nuova funzione deve essere correlata a difetto malattia – Canale ionico e sordità (noto che trasporto ionico nell'orecchio interno è critico per udito) – Altre volte occorre uno sforzo immaginativo (vedi CF.....) Le tappe dell'analisi molecolare per le malattie genetiche 1. Identificare e sequenziare il gene malattia 2. Cercare le mutazioni nel gene 3. Stabilire quali mutazioni sono patologiche 4. Determinare se esiste una distribuzione geografica/etnica delle mutazioni 5. Disegnare pannelli popolazione specifici 6. Selezionare i metodi di analisi più adatti alla ricerca delle mutazioni di interesse Metodi per l’identificazione di mutazioni: Applicazioni possibili 1) Ricerca diretta di mutazioni: 1a) Ricerca aspecifica di mutazione, ignota o nota: significato funzionale non necessariamente noto -> identificazione nuove mutazioni, screening genetici di popolazioni numerose, (diagnosi di malattia) 1b) Analisi specifica di una mutazione nota: mutazioni patologiche -> diagnosi di malattia; polimorfismi, marcatori DNA -> identificazione individuale (medicina forense, trapianti midollo, …) 2) Analisi di Linkage: identificazione nuovi geni, diagnosi indiretta di malattia 2. Identificazione di mutazioni: le dimensioni del problema Genoma umano (aploide): Cromosoma medio: Gene medio: Mutazione minima: 3.000.000.000 bp 120.000.000 bp 20.000 bp 1 bp Metodi per l’identificazione di mutazioni Ricerca ASPECIFICA di mutazione (ignota o nota) Sequenziamento del DNA Screening del gene (DGGE, DHPLC ...) Malattie Mendeliane: eccezioni nuovo meccanismo mutazionale (es espansione triplette) mutazioni regioni regolazione lontane dal gene (FHDS; lattasi) imprinting eredità digenica eredità triallelica un gene per malattie diverse: LMN: laminopatie (8 malattie diverse) RET: MTC, MEN2A, MEN2B, Hirschprung Fonti DNA Il DNA può essere ottenuto da qualsiasi cellula nucleata dell'organismo VILLI CORIALI AMNIOCITI SALIVA SANGUE DNA CAPELLI COLTURE CELLULARI ALTRI TESSUTI MIDOLLO OSSEO PCR – Reazione a Catena della Polimerasi DNA stampo dATP, dCTP, dGTP, dTTP Taq polymerase, Mg++ Nuovo filamento DNA polimerasi Primer DNA stampo Primer Nuovo filamento Analisi della Sequenza del DNA Sequenza Normale (esone 12, gene CFTR) c.1885G>T; GAA>TAA Glu > Stop Mutazione: p.Glu585* Basic workflow for NGS experiments Jason M. Rizzo, and Michael J. Buck Cancer Prev Res 2012;5:887-900 La MUTAZIONE a livello genomico ... M. PUNTIFORMI: coinvolgono uno o pochi nucleotidi M. di RIPETIZIONE: ripetizione in serie di una sequenza di basi (da 2 a molte basi) un numero variabile di volte – (VNTR; CNV, Triplette espanse) RIARRANGIAMENTI GENICI: coinvolgono regioni estese dentro un gene M. CROMOSOMICHE: riguardano grosse porzioni del genoma fino a interi cromosomi NOMENCLATURA MUTAZIONI SEQUENZA DI RIFERIMENTO Il nome della mutazione deve contenere il tipo di variazione avvenuta e la posizione nella quale è avvenuta. Per indicare rispetto a quale sequenza viene riferita la numerazione si fa precedere il nome della mutazione da: g. => se la numerazione è riferita alla posizione genomica (posiz 1= inizio seq cromosoma nella banca dati) c. => se la numerazione è riferita alla regione codificante del gene (posiz 1 = A dell'ATG) p. => se la numerazione è riferita alla sequenza proteica (posizione 1 = primo aminoacido della proteina tradotta) m. => se la mutazione è localizzata nel genoma mitocondriale - Guidelines of Human Gene Variation Society (http://www.hgvs.org/mutnomen/) - Human Genome Organisation (HuGO; http://www.hugo-international.org/) HuGO Gene Nomenclature Committee (HGNC; www.genenames.org/) (Progetto Genoma Umano) Start traduzione Example nucleotide numbering reference DNA sequence For a coding DNA reference sequence the basic recommendation is that it should represent the major and largest transcript of the gene. HGVS guidelines; den Dunnen JT and Antonarakis SE (2000). Hum.Mutat.15: 7-12 NOMENCLATURA MUTAZIONI SOSTITUZIONI NUCLEOTIDICHE IN REGIONI NON CODIFICANTI Si indica la posizione della mutazione seguita dal cambiamento nucleotidico: mutazione dentro un gene: si usa la numerazione della regione codificante. Es. c.1162G>A: mut. Silente Mutazione dentro l'introne: si indica la distanza nucleotidica rispetto al più vicino esone (precedente o successivo). Es. c.621+1G>T: mut. Splicing. SOSTITUZIONI NUCLEOTIDICHE IN REGIONI CODIFICANTI Sostituzioni aminoacidiche: Si indicano nell'ordine: aminoacido wt – posizione sulla catena proteica - nuovo aminoacido (o stop). Es. p.R117H o Arg117His; p.G542X o Gly542* DELEZIONI E INSERZIONI Secondo i casi si indicheranno gli aminoacidi o i nucleotidi deleti o inseriti p.F508del: delez. che comporta perdita dell'a.a. fenilalanina in posiz. 508 c.232_236del o c.232_236delATA: delezione di 3 nucl. da posiz 232 a 236 g.409_410insC: inserzione di una C tra i nucleotidi 409 e 410 MITOCONDRI m.8993T>C oppure ATP6:p.Leu156Pro (es. ATP syntase 6 – si indica la proteina mutata per evitare confusioni) Human Gene Nomenclature Committee Le tappe dell'analisi molecolare per le malattie genetiche 1) Identificare e sequenziare il gene malattia 2) Cercare le mutazioni nel gene 3) Stabilire quali mutazioni sono patologiche 4) Determinare se esiste una distribuzione geografica/etnica delle mutazioni 5) Disegnare pannelli popolazione specifici 6) Selezionare i metodi di analisi più adatti alla ricerca delle mutazioni di interesse Principali criteri per classificare una mutazione come causa di malattia: Correlazione con il fenotipo: la mutazione è presente negli affetti, molto rara o assente nella popolazione generale Studi funzionali, in-vitro o in-vivo, dimostrano che la mutazione causa alterazione o assenza della funzione codificata dal gene La mutazione causa una grave alterazione della struttura proteica (delezioni, inserzioni, stop, frameshift, alterazioni di splicing…) Le tappe dell'analisi molecolare per le malattie genetiche 1) Identificare e sequenziare il gene malattia 2) Cercare le mutazioni nel gene 3) Identificare quali mutazioni sono patologiche 4) Determinare se esiste una distribuzione geografica/etnica delle mutazioni 5) Disegnare pannelli di mutazioni popolazione-specifici 6) Selezionare i metodi di analisi più adatti alla ricerca delle mutazioni di interesse Analisi della frequenza e della distribuzione geografica delle mutazioni Ricerca aspecifica delle mutazioni nei geni di almeno 100-200 pazienti Analisi di pazienti appartenenti a popolazioni/gruppi etnici diversi Selezionare le mutazioni causa di malattia tra tutte quelle identificate Stabilire il pannello di mutazioni da analizzare in modo da coprire la maggior percentuale possibile di alleli patologici in ogni popolazione/gruppo etnico Pannello Mutazioni CF per Veneto e Sardegna Mutazione F508del R1162X T338I G542X 2183AA/G N1303K G1244E 711+5G/A 1717-1G/A altre TOT Sardegna n. % Veneto n % 81 20 9 9 5 3 1 18 52 13 6 6 3 2 1 11 107 22 21 6 9 6 5 27 48 10 9 3 4 3 3 10 146/156 94 203/225 90 Pannello Mutazioni CF per Veneto e Trentino AA: analisi gene CFTR in 180 pazienti (360 geni) Mutazione Frequenza % Freq. Cumulativa % F508del 47,6 47,6 R1162X 9,8 57,3 2183AA->G 9,3 66,7 N1303K 4,0 70,7 G542X, 711+5G->A 2,7 76,0 1717-1G->A 2,2 78,2 G85E, R553X, altre2 1,3 83,6 0,9 e 0,4 86,7 Altre 5 Totale (16 mutazioni) 86,7 Hum. Genet. 1995; 95:397 Le tappe dell'analisi molecolare per le malattie genetiche 1) Identificare e sequenziare il gene malattia 2) Cercare le mutazioni nel gene 3) Identificare quali mutazioni sono patologiche 4) Determinare se esiste una distribuzione geografica/etnica delle mutazioni 5) Disegnare pannelli popolazione specifici 6) Selezionare i metodi di analisi più adatti alla ricerca delle mutazioni di interesse Metodi per l’identificazione di mutazioni Analisi SPECIFICA di una mutazione nota Restrizione Enzimatica OLA RDB/ASO Metodi Analisi SPECIFICA di una mutazione nota Kit commerciali / metodi “homemade” uso di metodi Validati e Standardizzati Uso controlli positivi e negativi (soprattutto di quelli difficili da determinare) conoscere bene i limiti dei singoli metodi PCR: problema falsi positivi da contaminazione Metodi per l’identificazione di mutazioni: Applicazioni possibili 1) Ricerca diretta di mutazioni: 1a) Ricerca aspecifica di mutazione, ignota o nota: significato funzionale non necessariamente noto -> identificazione nuove mutazioni, screening genetici di popolazioni numerose, (diagnosi di malattia) 1b) Analisi specifica di una mutazione nota: mutazioni patologiche -> diagnosi di malattia; polimorfismi, marcatori DNA -> identificazione individuale (medicina forense, trapianti midollo, …) 2) Analisi di Linkage: identificazione nuovi geni, diagnosi indiretta di malattia Analisi di Restrizione (RE) ALLELE T (esempio, NORMALE) ALLELE G (esempio, MUTATO) EcoR I EcoR I TACGTAGAGAATTCTCATCG TACGTAGAG TACGTAGAGAAGTCTCATCG AATTCTCATCG omozigote omozigote TT eterozigote TG GG ++ +- – +- ++ +- +- ++ ++ REVERSE DOT BLOT: ibridazione inversa degli acidi nucleici DNA N (normale) sonda N DNA M (mutato) sonda M 1 sonda N sonda M 2 N a C g t G c a T g t A c M sonda N 3 sonda M omozigote MM eterzigote NM omozigote NN RDB MULTIPLO analisi mutazioni Fibrosi Cistica (gene CFTR) STRIP A Normale F508del G542X 394delTT eteroz. R117H S1251N 1 2 3 4 STRIP B sonde mutate sonde mutate sonde normali sonde normali Test di legame degli oligonucleotidi (OLA, Oligonucleotide Ligation Assay) sonda mutata Marcatore fluorescente A C sonda comune sonda normale G T DNA mutato DNA normale sonda comune sonda normale sonda mutata sonda comune DNA mutato DNA normale DNA-Ligasi Prodotto OLA normale DNA-Ligasi Prodotto OLA normale Prodotto OLA mutato Prodotto OLA mutato normale dimensioni crescenti eterozigote dimensioni crescenti mutato dimensioni crescenti OLA: analisi multipla mutazioni Fibrosi Cistica omozigote CFTR:p.[F508del];[F508del] eterozigote composto p.[Gly85Glu(;)Trp1282*] p.[Gly85Glu];[Trp1282*] PER INTRODURRE UN TEST GENETICO NELLA PRATICA CLINICA STABILIRE ASSOCIAZIONE: MALATTIA, GENE E MUTAZIONI/MARKER DNA STUDI DI POPOLAZIONE PER ACCERTARE: FREQUENZA MUTAZIONI RISCHI/BENEFICI DEL TEST VALIDITA' CLINICA (accuratezza nel predire clinical outcome) Utilità del metodo SENSIBILITA' (NO falsi -) = grado di capacità di identificare i mutati SPECIFICITA' (NO falsi +) = capacità di identificare i veri mutanti RIPRODUCIBILITÀ PPV (valore predittivo +: % di veri positivi identificati come tali) CRITERI DI SCELTA Malattia in oggetto Mutazioni causali della patologia in questione Affidabilità del metodo o del kit commerciale – specificità, sensibilità, accuratezza, riproducibilità Tipo di test richiesto (prenatale, portatore, ecc) Strumentazione disponibile nel laboratorio Rapporto costi/benefici – test economico Rapidità, laboriosità, semplicità Validità clinica del test (capacità di predire clinical outcome: dipende da sensibilità test, Copertura del pannello mutazioni, penetranza mutazioni) Test specifici o aspecifici? Nuove tecnologie… Automatizzabile /uso strumentazione costosa Adattabile a molte mutazioni, possibilità di multiplex A ciascuno il suo test: Livelli di analisi molecolare I LIVELLO Screening di un pannello specifico di mutazioni aventi conseguenze cliniche note e adattato alla popolazione di origine del soggetto II LIVELLO Screening di tutto il gene malattia (individua anche mutazioni con significato clinico poco chiaro o ignoto) III LIVELLO Analisi di riarrangiamenti, analisi RNA, analisi introni. (ANALISI LINKAGE: famiglie dove non sono state identificate entrambe le mutazioni causali) ANALISI DI I LIVELLO Screening di un pannello specifico di mutazioni aventi conseguenze cliniche note e adattato alla popolazione di origine del soggetto Metodi per Ricerca SPECIFICA di mutazioni note ANALISI DI II LIVELLO Screening di tutto il gene malattia (individua anche mutazioni con significato clinico poco chiaro o ignoto) Metodi per Ricerca ASPECIFICA ANALISI DI III LIVELLO Analisi di riarrangiamenti, analisi RNA, analisi introni (individua mutazioni con strutture molecolari non evidenziabili dai metodi standard) 1 23 4 5 FONTI DI ERRORE Errore dell’operatore Scambi di campioni Falsa paternità… Presenza di altre mutazioni/polimorfismi nell’amplificato esaminato Poca specificità del metodo Condizioni di analisi poco specifiche Regioni omologhe, pseudogeni… Nuove mutazioni Eterogeneità genetica Scelta mutazioni da analizzare Diagnosi di malattie genetiche mediante analisi del DNA a) Analisi di mutazioni note nel soggetto (RE; RDB/ASO; OLA): Analisi diretta/specifica delle mutazioni Deve essere nota la sequenza del gene Devono essere nota l’alterazione molecolare delle mutazioni da analizzare Deve essere noto quali mutazioni geniche sono causa di malattia Caratteristiche di un buon sistema di analisi: rapido, economico, multiplo b) Ricerca di mutazioni in un gene (Sequenziamento del DNA): Deve essere nota la sequenza del gene Identifica sia mutazioni nuove che note; patologiche che non patologiche Solo il sequenziamento consente di caratterizzare il difetto molecolare Consentono analisi più rapida di un gene quando si hanno molti individui in esame Screening di popolazione: identifica quali e quante mutazioni sono presenti c) Analisi di Linkage (identificazione nuovi geni, diagnosi indiretta di malattia) Deve essere nota la localizzazione cromosomica del gene Deve essere disponibile la famiglia del probando e il DNA di almeno un familiare prossimo che sia affetto Devono essere disponibili marcatori informativi molto vicini al gene interessat o