MAPPAGGIO E IDENTIFICAZIONE GENI

CORSO INTEGRATO DI GENETICA
a.a. 2015-2016
Genetica molecolare in medicina:
Analisi di Mutazioni
Cristina Bombieri
10 novembre 2015
APPLICAZIONI DEI POLIMORFISMI DEL DNA
MARCATORI GENETICI e ANALISI LINKAGE
 Identificazione indiretta di alleli malattia (diagnosi indiretta)
 Mappaggio genetico: ordinamento loci (geni o marker) su cromosomi
– (M. fisico determina distanza fisica tra loci)
IDENTIFICATORI INDIVIDUALITA’






Controllo relazioni parentali in fam. con m. mendeliane
Genetica di popolazione
Indagini di paternità
Indagini criminalistiche
Controllo chimerismo
Mola idatiforme
Perché la diagnosi molecolare?
Diagnosi di una malattia è un atto clinico
Analisi mutazioni serve a:
•
Confermare diagnosi clinica
•
Determinare le mutazioni specifiche per successive analisi
nei familiari
– Diagnosi Pre-Natale
– Identificazione dei portatori
•
Migliorare conoscenze rapporto genotipo/fenotipo e patofisiologia della malattia
Le tappe dell'analisi molecolare
per le malattie genetiche
1. Identificare e sequenziare il gene malattia
2. Cercare le mutazioni nel gene
3. Stabilire quali mutazioni sono patologiche
4. Determinare se esiste una distribuzione geografica/etnica delle mutazioni
5. Disegnare pannelli popolazione specifici
6. Selezionare i metodi di analisi più adatti alla ricerca delle
mutazioni di interesse
1. MAPPAGGIO E IDENTIFICAZIONE GENI
(per caratteri mendeliani)
a) Mappare il locus o i loci di interesse e ordinarli sul cromosoma

Polimorfismi DNA; Mappe genetiche e fisiche; Linkage e LD
b)Identificare gene contenuto nella regione candidata

Clonaggio funzionale e posizionale; Human Genome Project
c) Determinare la sequenza del gene
d) Confermare il gene candidato: identificare mutazioni patologiche
e) Dimostrare che il gene candidato è legato alla malattia
f) Determinare sequenza e struttura del prodotto genico e collegare
funzione del gene alla malattia
MAPPAGGIO E IDENTIFICAZIONE GENI (caratteri mendeliani)
a) Mappare il locus o i loci di interesse e ordinarli sul
cromosoma
Polimorfismi DNA
Mappe genetiche e fisiche
Linkage e LD
VEDI LEZIONE PRECEDENTE: ANALISI DI LINKAGE
MAPPAGGIO E IDENTIFICAZIONE GENI (caratteri mendeliani)
b) Clonaggio e identificazione del gene malattia
MAPPAGGIO E IDENTIFICAZIONE GENI (caratteri mendeliani)
Clonaggio funzionale
Identificare il gene attraverso la
sequenza, anche parziale, della
proteina codificata (limite: richiede
conoscenza proteina alterata!!!)
confrontare
al
computer
la
sequenza della proteina con le
sequenze di tutti i geni depositati
nella bancadati del progetto Genoma
Umano (HGP)

(cocktail di oligonucleotidi che
codificano la sequenza proteica di
interesse, da usare come sonde per
screenare librerie di tutti i cDNA
umani)

MAPPAGGIO E IDENTIFICAZIONE GENI (caratteri mendeliani)
Clonaggio posizionale
Identificare gene conoscendo solo la sua
posizione cromosomica approssimativa.
Enorme lavoro: clonare tutto il genoma in
apposite “librerie genomiche” e screenarle
nei soggetti affetti per identificare tutti i
possibili geni contenuti nella regione
candidata (> regione candidata, >
difficoltà!!) - analisi dell'omologo umano
di un gene animale che produce un
fenotipo malattia-simile
1987-1995: clonati ca50 geni malattia
1987: gene DMD (Distrofia di Duchenne)
1989 gene CFTR (Fibrosi cistica)
MAPPAGGIO E IDENTIFICAZIONE GENI (caratteri mendeliani)
Identificazione di geni responsabili
di malattie mendeliane
IERI
OGGI
HGP
(Human Genome Project)
&
Exome sequencing
(ri-sequenziamento regioni
(es. Talassemie)
(es. Fibrosi Cistica)
(Gelehrter, Collins, Ginsburg; Genetica Medica; Masson 1999)
codificanti)
MAPPAGGIO E IDENTIFICAZIONE GENI (caratteri mendeliani)
Usare un Genome Browser per ottenere la lista di
geni contenuti in una regione candidata
cr.6
Schermata del UCSC genome browser (http://www.genome.ucsc.edu/)
che mostra i geni inclusi in una regione di 500kb della banda 6p21.1
(esoni = barre verticali; frecce indicano direzione di trascrizione)
Next Generation Sequencing
Sequenza di tutto il genoma
Limite: Complesso e costoso
Sequenza degli esoni
Limite: Identifica solo le
mutazioni presenti nella
porzione codificante dei geni
WES
WGS
Sequenza specifica
delle sole regioni
(geni) target di
interesse
Next Generation Sequencing
Procedura complessa; grande mole di dati da analizzare
MAPPAGGIO E IDENTIFICAZIONE GENI (caratteri mendeliani)
c) Confermare il gene candidato...
- Identificare mutazioni causali, cioè mutazioni che verosimilmente
possono alterare la funzione o l'espressione genica
- Tali mutazioni devono essere frequenti nei pazienti e rare nei sani
- Studi funzionali in vitro o in modelli animali possono confermare la
patogenicità delle mutazioni identificate
d) Determinare la sequenza del gene candidato...
Determinare la sequenza in basi e la struttura in esoni e introni del gene
candidato. Identificare una sequenza normale di riferimento
STRUTTURA
GENI EUCARIOTI
MAPPAGGIO E IDENTIFICAZIONE GENI (caratteri mendeliani)
e/f) Collegare il gene e il suo prodotto alla malattia
- Pattern espressione del gene consistente con la malattia: espressione
almeno nei tessuti colpiti dalla patologia e precedentemente o nel
momento in cui la patologia si manifesta
- Dimostrare per il gene una appropriata funzione, correlata alla malattia,
(non è sempre cosa ovvia!):

Talvolta la funzione del gene è chiaramente collegabile alla malattia:
– Rodopsina e retinite pigmentosa
– Fibrillina e S. Marfan (difetto tessuto connettivo)

Altre volte gene nuovo => riconoscimento di motivi proteici comuni,
come domini transmembrana o d. tirosin-kinasici, aiuta a predire la
possibile funzione della proteina

Nuova funzione deve essere correlata a difetto malattia
– Canale ionico e sordità (noto che trasporto ionico
nell'orecchio interno è critico per udito)
– Altre volte occorre uno sforzo immaginativo (vedi CF.....)
Le tappe dell'analisi molecolare
per le malattie genetiche
1. Identificare e sequenziare il gene malattia
2. Cercare le mutazioni nel gene
3. Stabilire quali mutazioni sono patologiche
4. Determinare se esiste una distribuzione geografica/etnica delle mutazioni
5. Disegnare pannelli popolazione specifici
6. Selezionare i metodi di analisi più adatti alla ricerca delle
mutazioni di interesse
Metodi per l’identificazione di mutazioni:
Applicazioni possibili
1) Ricerca diretta di mutazioni:
1a) Ricerca aspecifica di mutazione, ignota o nota:
significato funzionale non necessariamente noto -> identificazione
nuove mutazioni, screening genetici di popolazioni numerose,
(diagnosi di malattia)
1b) Analisi specifica di una mutazione nota:
mutazioni patologiche -> diagnosi di malattia;
polimorfismi, marcatori DNA -> identificazione individuale (medicina
forense, trapianti midollo, …)
2) Analisi di Linkage:
identificazione nuovi geni, diagnosi indiretta di malattia
2. Identificazione di mutazioni:
le dimensioni del problema
Genoma umano (aploide):
Cromosoma medio:
Gene medio:
Mutazione minima:
3.000.000.000 bp
120.000.000 bp
20.000 bp
1 bp
Metodi per l’identificazione di mutazioni
Ricerca ASPECIFICA di mutazione (ignota o nota)
Sequenziamento del DNA
Screening del gene
(DGGE, DHPLC ...)
Malattie Mendeliane: eccezioni


nuovo meccanismo mutazionale (es espansione triplette)
mutazioni regioni regolazione lontane dal gene (FHDS;
lattasi)

imprinting

eredità digenica

eredità triallelica

un gene per malattie diverse:

LMN: laminopatie (8 malattie diverse)

RET: MTC, MEN2A, MEN2B, Hirschprung
Fonti DNA
Il DNA può essere ottenuto
da qualsiasi cellula nucleata
dell'organismo
VILLI
CORIALI
AMNIOCITI
SALIVA
SANGUE
DNA
CAPELLI
COLTURE
CELLULARI
ALTRI
TESSUTI
MIDOLLO
OSSEO
PCR – Reazione a Catena della Polimerasi
DNA stampo
dATP, dCTP, dGTP, dTTP
Taq polymerase, Mg++
Nuovo filamento
DNA polimerasi
Primer
DNA stampo
Primer
Nuovo filamento
Analisi della Sequenza del DNA
Sequenza Normale
(esone 12, gene CFTR)
c.1885G>T; GAA>TAA
Glu > Stop
Mutazione: p.Glu585*
Basic
workflow for
NGS
experiments
Jason M. Rizzo, and Michael J. Buck
Cancer Prev Res 2012;5:887-900
La MUTAZIONE a livello genomico ...


M. PUNTIFORMI: coinvolgono uno o pochi nucleotidi
M. di RIPETIZIONE: ripetizione in serie di una sequenza di
basi (da 2 a molte basi) un numero variabile di volte
–


(VNTR; CNV, Triplette espanse)
RIARRANGIAMENTI GENICI: coinvolgono regioni estese
dentro un gene
M. CROMOSOMICHE: riguardano grosse porzioni del
genoma fino a interi cromosomi
NOMENCLATURA
MUTAZIONI
SEQUENZA DI RIFERIMENTO
Il nome della mutazione deve contenere il tipo di variazione avvenuta e la
posizione nella quale è avvenuta.
Per indicare rispetto a quale sequenza viene riferita la numerazione si fa
precedere il nome della mutazione da:
g. => se la numerazione è riferita alla posizione genomica (posiz 1= inizio
seq cromosoma nella banca dati)
c. => se la numerazione è riferita alla regione codificante del gene (posiz 1 =
A dell'ATG)
p. => se la numerazione è riferita alla sequenza proteica (posizione 1 = primo
aminoacido della proteina tradotta)
m. => se la mutazione è localizzata nel genoma mitocondriale
- Guidelines of Human Gene Variation Society (http://www.hgvs.org/mutnomen/)
- Human Genome Organisation (HuGO; http://www.hugo-international.org/)
HuGO Gene Nomenclature Committee (HGNC; www.genenames.org/)
(Progetto
Genoma Umano)
Start traduzione
Example nucleotide numbering reference DNA sequence
For a coding DNA reference sequence the basic recommendation is that it should represent the
major and largest transcript of the gene.
HGVS guidelines; den Dunnen JT and Antonarakis SE (2000). Hum.Mutat.15: 7-12
NOMENCLATURA MUTAZIONI
SOSTITUZIONI NUCLEOTIDICHE IN REGIONI NON CODIFICANTI
Si indica la posizione della mutazione seguita dal cambiamento nucleotidico:
mutazione dentro un gene: si usa la numerazione della regione codificante.
Es. c.1162G>A: mut. Silente
Mutazione dentro l'introne: si indica la distanza nucleotidica rispetto al più
vicino esone (precedente o successivo). Es. c.621+1G>T: mut. Splicing.
SOSTITUZIONI NUCLEOTIDICHE IN REGIONI CODIFICANTI
Sostituzioni aminoacidiche: Si indicano nell'ordine: aminoacido wt – posizione
sulla catena proteica - nuovo aminoacido (o stop).
Es. p.R117H o Arg117His; p.G542X o Gly542*
DELEZIONI E INSERZIONI
Secondo i casi si indicheranno gli aminoacidi o i nucleotidi deleti o inseriti
p.F508del: delez. che comporta perdita dell'a.a. fenilalanina in posiz. 508
c.232_236del o c.232_236delATA: delezione di 3 nucl. da posiz 232 a 236
g.409_410insC: inserzione di una C tra i nucleotidi 409 e 410
MITOCONDRI
m.8993T>C oppure ATP6:p.Leu156Pro (es. ATP syntase 6 – si indica la
proteina mutata per evitare confusioni)
Human Gene Nomenclature Committee
Le tappe dell'analisi molecolare
per le malattie genetiche
1) Identificare e sequenziare il gene malattia
2) Cercare le mutazioni nel gene
3) Stabilire quali mutazioni sono patologiche
4) Determinare se esiste una distribuzione geografica/etnica delle mutazioni
5) Disegnare pannelli popolazione specifici
6) Selezionare i metodi di analisi più adatti alla ricerca delle mutazioni di interesse
Principali criteri per classificare una
mutazione come causa di malattia:



Correlazione con il fenotipo: la mutazione è presente negli
affetti, molto rara o assente nella popolazione generale
Studi funzionali, in-vitro o in-vivo, dimostrano che la
mutazione causa alterazione o assenza della funzione
codificata dal gene
La mutazione causa una grave alterazione della struttura
proteica (delezioni, inserzioni, stop, frameshift, alterazioni di
splicing…)
Le tappe dell'analisi molecolare
per le malattie genetiche
1) Identificare e sequenziare il gene malattia
2) Cercare le mutazioni nel gene
3) Identificare quali mutazioni sono patologiche
4) Determinare se esiste una distribuzione
geografica/etnica delle mutazioni
5) Disegnare pannelli di mutazioni popolazione-specifici
6) Selezionare i metodi di analisi più adatti alla ricerca delle mutazioni di
interesse
Analisi della frequenza e della distribuzione
geografica delle mutazioni




Ricerca aspecifica delle mutazioni nei geni
di almeno 100-200 pazienti
Analisi di pazienti appartenenti a popolazioni/gruppi etnici
diversi
Selezionare le mutazioni causa di malattia tra tutte quelle
identificate
Stabilire il pannello di mutazioni da analizzare in modo da
coprire la maggior percentuale possibile di alleli patologici in
ogni popolazione/gruppo etnico
Pannello Mutazioni CF per Veneto e Sardegna
Mutazione
F508del
R1162X
T338I
G542X
2183AA/G
N1303K
G1244E
711+5G/A
1717-1G/A
altre
TOT
Sardegna
n.
%
Veneto
n
%
81
20
9
9
5
3
1
18
52
13
6
6
3
2
1
11
107
22
21
6
9
6
5
27
48
10
9
3
4
3
3
10
146/156
94
203/225
90
Pannello Mutazioni CF per Veneto e Trentino AA:
analisi gene CFTR in 180 pazienti (360 geni)
Mutazione
Frequenza %
Freq. Cumulativa %
F508del
47,6
47,6
R1162X
9,8
57,3
2183AA->G
9,3
66,7
N1303K
4,0
70,7
G542X, 711+5G->A
2,7
76,0
1717-1G->A
2,2
78,2
G85E, R553X, altre2
1,3
83,6
0,9 e 0,4
86,7
Altre 5
Totale (16 mutazioni)
86,7
Hum. Genet. 1995; 95:397
Le tappe dell'analisi molecolare
per le malattie genetiche
1) Identificare e sequenziare il gene malattia
2) Cercare le mutazioni nel gene
3) Identificare quali mutazioni sono patologiche
4) Determinare se esiste una distribuzione geografica/etnica delle mutazioni
5) Disegnare pannelli popolazione specifici
6) Selezionare i metodi di analisi più adatti
alla ricerca delle mutazioni di interesse
Metodi per l’identificazione di mutazioni
Analisi SPECIFICA di una mutazione nota
Restrizione Enzimatica
OLA
RDB/ASO
Metodi
Analisi SPECIFICA di una mutazione nota

Kit commerciali / metodi “homemade”

uso di metodi Validati e Standardizzati

Uso controlli positivi e negativi (soprattutto di quelli difficili da
determinare)

conoscere bene i limiti dei singoli metodi

PCR: problema falsi positivi da contaminazione
Metodi per l’identificazione di mutazioni:
Applicazioni possibili
1) Ricerca diretta di mutazioni:
1a) Ricerca aspecifica di mutazione, ignota o nota:
significato funzionale non necessariamente noto -> identificazione
nuove mutazioni, screening genetici di popolazioni numerose,
(diagnosi di malattia)
1b) Analisi specifica di una mutazione nota:
mutazioni patologiche -> diagnosi di malattia;
polimorfismi, marcatori DNA -> identificazione individuale (medicina
forense, trapianti midollo, …)
2) Analisi di Linkage:
identificazione nuovi geni, diagnosi indiretta di malattia
Analisi di Restrizione (RE)
ALLELE T (esempio, NORMALE)
ALLELE G (esempio, MUTATO)
EcoR I
EcoR I
TACGTAGAGAATTCTCATCG
TACGTAGAG
TACGTAGAGAAGTCTCATCG
AATTCTCATCG
omozigote
omozigote
TT
eterozigote
TG
GG
++ +- –
+- ++
+-
+-
++
++
REVERSE DOT BLOT:
ibridazione inversa degli acidi nucleici
DNA N (normale)
sonda
N
DNA M (mutato)
sonda
M
1
sonda
N
sonda
M
2
N
a
C
g
t
G
c
a
T
g
t
A
c
M
sonda
N
3
sonda
M
omozigote
MM
eterzigote
NM
omozigote
NN
RDB MULTIPLO
analisi mutazioni Fibrosi Cistica (gene CFTR)
STRIP A
Normale F508del G542X 394delTT
eteroz. R117H S1251N
1
2
3
4
STRIP B
sonde
mutate
sonde
mutate
sonde
normali
sonde
normali
Test di legame degli oligonucleotidi
(OLA, Oligonucleotide Ligation Assay)
sonda mutata
Marcatore
fluorescente
A
C
sonda comune
sonda normale
G
T
DNA mutato
DNA normale
sonda comune
sonda normale
sonda mutata
sonda comune
DNA mutato
DNA normale
DNA-Ligasi
Prodotto OLA normale
DNA-Ligasi
Prodotto OLA normale
Prodotto OLA mutato
Prodotto OLA mutato
normale
dimensioni crescenti
eterozigote
dimensioni crescenti
mutato
dimensioni crescenti
OLA: analisi multipla mutazioni Fibrosi Cistica
omozigote
CFTR:p.[F508del];[F508del]
eterozigote composto
p.[Gly85Glu(;)Trp1282*]
p.[Gly85Glu];[Trp1282*]
PER INTRODURRE UN TEST GENETICO
NELLA PRATICA CLINICA


STABILIRE ASSOCIAZIONE: MALATTIA, GENE E MUTAZIONI/MARKER
DNA
STUDI DI POPOLAZIONE PER ACCERTARE:

FREQUENZA MUTAZIONI

RISCHI/BENEFICI DEL TEST

VALIDITA' CLINICA (accuratezza nel predire clinical outcome)





Utilità del metodo
SENSIBILITA' (NO falsi -) = grado di capacità di identificare i mutati
SPECIFICITA' (NO falsi +) = capacità di identificare i veri mutanti
RIPRODUCIBILITÀ
PPV (valore predittivo +: % di veri positivi identificati come tali)
CRITERI DI SCELTA












Malattia in oggetto
Mutazioni causali della patologia in questione
Affidabilità del metodo o del kit commerciale – specificità,
sensibilità, accuratezza, riproducibilità
Tipo di test richiesto (prenatale, portatore, ecc)
Strumentazione disponibile nel laboratorio
Rapporto costi/benefici – test economico
Rapidità, laboriosità, semplicità
Validità clinica del test (capacità di predire clinical outcome:
dipende da sensibilità test, Copertura del pannello mutazioni,
penetranza mutazioni)
Test specifici o aspecifici?
Nuove tecnologie…
Automatizzabile /uso strumentazione costosa
Adattabile a molte mutazioni, possibilità di multiplex
A ciascuno il suo test:
Livelli di analisi molecolare
I LIVELLO
Screening
di un pannello specifico di mutazioni aventi conseguenze
cliniche note e adattato alla popolazione di origine del soggetto
II LIVELLO
Screening
di tutto il gene malattia (individua anche mutazioni con
significato clinico poco chiaro o ignoto)
III LIVELLO
Analisi
di riarrangiamenti, analisi RNA, analisi introni.
(ANALISI LINKAGE: famiglie dove non sono state identificate
entrambe le mutazioni causali)
ANALISI DI I LIVELLO
Screening di un pannello specifico di mutazioni aventi
conseguenze cliniche note e adattato alla popolazione di
origine del soggetto
Metodi per Ricerca SPECIFICA di mutazioni note
ANALISI DI II LIVELLO
Screening di tutto il gene malattia (individua anche
mutazioni con significato clinico poco chiaro o ignoto)
Metodi per Ricerca ASPECIFICA
ANALISI DI III LIVELLO
Analisi di riarrangiamenti, analisi RNA, analisi introni
(individua mutazioni con strutture molecolari non
evidenziabili dai metodi standard)
1 23
4
5
FONTI DI ERRORE

Errore dell’operatore

Scambi di campioni

Falsa paternità…

Presenza di altre mutazioni/polimorfismi nell’amplificato
esaminato

Poca specificità del metodo

Condizioni di analisi poco specifiche

Regioni omologhe, pseudogeni…

Nuove mutazioni

Eterogeneità genetica

Scelta mutazioni da analizzare
Diagnosi di malattie genetiche mediante analisi del DNA
a) Analisi di mutazioni note nel soggetto (RE; RDB/ASO; OLA):
Analisi diretta/specifica delle mutazioni
Deve essere nota la sequenza del gene
Devono essere nota l’alterazione molecolare delle mutazioni da analizzare
Deve essere noto quali mutazioni geniche sono causa di malattia
Caratteristiche di un buon sistema di analisi: rapido, economico, multiplo
b) Ricerca di mutazioni in un gene (Sequenziamento del DNA):
Deve essere nota la sequenza del gene
Identifica sia mutazioni nuove che note; patologiche che non patologiche
Solo il sequenziamento consente di caratterizzare il difetto molecolare
Consentono analisi più rapida di un gene quando si hanno molti individui in esame
Screening di popolazione: identifica quali e quante mutazioni sono presenti
c) Analisi di Linkage (identificazione nuovi geni, diagnosi indiretta di malattia)
Deve essere nota la localizzazione cromosomica del gene
Deve essere disponibile la famiglia del probando e il DNA di almeno un familiare
prossimo che sia affetto
Devono essere disponibili marcatori informativi molto vicini al gene interessat o