Dipartimento di Biologia
Universita’ degli Studi di Padova
Mappaggio di geni malattia mediante
analisi di linkage: l’esempio della
Paraparesi Spastica Ereditaria
Analisi di linkage
PARAMETRICA
NON PARAMETRICA
- Caratteri mendeliani
- Caratteri complessi
- Preciso modello genetico
- No modello genetico
•
modalità di eredità
•
frequenze geniche
•
penetranza di ciscun genotipo
ASP: Affected Sib Pairs
APM: Affected Pedigree Member
Calcolo dei lod score
(Morton 1955)
Lod score
- A 2 punti: probabilità di linkage tra 2 loci (MLINK)
Lod score Z= log10
probabilità che i due loci siano associati
0<<0.5
probabilità che i due loci non siano associati  = 0.5
•Valori soglia
Z> +3 accettare il linkage
Z< -2 escludere il linkage
- A più punti: localizzazione del gene malattia rispetto ad una batteria
di marcatori (LINKMAP, GENEHUNTER)
Paraparesi Spastica Ereditaria (HSP)
• Malattia neurodegenerativa
• Esordio variabile (II- IV decade di vita)
• Progressiva spasticita' degli arti inferiori
• Aumento dei riflessi tendinei
•Patogenesi: degenerazione assonale
tratti corticospinali e
colonna dorsale
Forme non complicate
clinica
Forme complicate
ETEROGENEITA’
AD-HSP
genetica
AR-HSP
X-linked HSP
SPG 3
SPG 4
SPG 6
SPG 8
SPG 9
SPG 10
SPG 12
SPG 13
SPG 5
SPG 7
SPG 11
SPG 14
SPG 1
SPG 2
SPG15
Spastina
Paraplegina
L1CAM
PLP
Paraplegina
Spastina
(Casari 1998)
(Hazan 1999)
• SPG7 AR-HSP
Locus
(De Michele 1998)
• SPG4 AD-HSP
(Hazan 1994)
localizzazione
• nucleo
• ATPasi
funzione biochimica
• ATPasi
• AAA,
peptidasi M41
domini caratteristici
• AAA (ATPases
• mitocondrio
Associated with
various cellular
Activities)
Famiglia con HSP complicata
I
1
2
II
1
III
2
3
1
4
2
IV
1
V
2
2
3
2
4
2
3
5
6
3
3
7
2
8
9
2
10
11
12
2
CARATTERISTICHE CLINICHE:
• Diagnosi: Paraparesi Spastica Ereditaria
• Esordio:  30 anni
• Altre caratteristiche: - piede cavo bilaterale
- neuropatia motoria distale evidenziata da MCV nervo SPE 
- disturbi cognitivi
Esclusione dei loci noti per la HSP a trasmissione
autosomica recessiva
Frequenza di ricombinazione
Locus
Marker
0.00
0.01
0.05
0.10
0.20
0.30
0.40
-5.720
-0.761
-0.146
0.049
0.138
0.110
0.053
-6.317
-2.134
-0.879
-0.430
-0.097
0.002
0.009
-5.698
-1.561
-0.872
-0.576
-0.276
-0.111
0.023
-18.262
-4.380
-2.204
-1.298
-0.520
-0.189
-0.042
D16S303
-5.696
-1.833
-1.106
-0.754
-0.365
-0.151
0.038
D15S1007
-2.20
-0.58
0.02
0.21
0.28
0.19
0.06
D15S1012
-
-2.58
-1.24
-0.72
-0.27
-0.09
-0.02
D8S260
SPG5
(8p12-q13) D8S285
D16S520
SPG7
D16S3023
(16q24.3)
SPG11
(15q13-15)

Simulazione di linkage
Calcolo del lod score potenziale mediante i programmi SLINK e MSIM
1. Pedigree file
2. Parameter file
1
1
1
1
1
2
3
4
0
0
1
1
0 1 1 2
0 2 2 1
2 1 2 3
2 2 1 2
3
4
4
4
1
3
2
4
Modello di eredità: autosomica recessiva
Frequenza dell’allele malattia: 1:10.000
Penetranza: 100%
Alleli del marcatore simulato: 5 alleli equifrequenti
Max lod score potenziale
Zmax = 2.82 a  = 0.0
Metodo: Genomewide Search
Caratteristiche dei marcatori
• ABI PRISM Linkage Mapping set version 2 (PE Applied Biosystems)
- 400 microsatelliti (CA repeats) distribuiti in 28 pannelli
- Range di lunghezza: 69-395 basi
- Elevata informatività (eterozigosità media: 0.8)
- Distribuiti lungo il genoma con una distanza media di 10 cM
- Marcati con molecole fluorescenti: FAM blu , HEX verde, NED giallo
Metodica utilizzata
Amplificazione in
piastre da 96 pozzetti
Pool di marcatori per
un individuo
Elettroforesi su
sequenziatore ABI 373
Genescan Collection
Collection
file
Genescan analysis 3.0
Results file
Geotyper 1.1.1
Lettura alleli
MLINK
Lod score
Genescan Analysis 3.0 file
Genotyper 1.1.1 file
Linkage Reporter
menu
genome report
exclusion lod score
family data
-1,2
linkage parameters
penetrance 1,00
AR
• % di esclusione per ogni
cromosoma
markers analyzed
excluded
length cM
recalc chromosome 1
chromosome 2
chromosome 3
chromosome 4
chromosome 5
chromosome 6
chromosome 7
chromosome 8
chromosome 9
chromosome 10
chromosome 11
chromosome 12
chromosome 13
chromosome 14
chromosome 15
chromosome 16
chromosome 17
chromosome 18
chromosome 19
chromosome 20
chromosome 21
recalcul chromosome 22
41%
67%
29%
77%
77%
85%
95%
84%
76%
89%
81%
83%
95%
78%
74%
85%
88%
91%
69%
66%
44%
52%
298
245
237
216
224
182
194
180
160
168
157
184
132
128
117
131
130
130
117
112
72
82
total autosomes
73%
3596
• % di Esclusione del
genoma
Regioni di positività
Lod score a =
Cromosoma 1
D1S206
D1S2726
D1S252
0.00
0.01
0.05
0.10
0.20
0.30
0.40
-4.53
1.43
-0.28
-0.39
1.41
-0.26
0.87
1.29
-0.20
0.89
1.14
-0.14
0.67
0.82
-0.07
0.36
0.50
-0.03
0.10
0.20
-0.01
Lod score a =
Cromosoma 3
D3S1580
D3S1601
D3S1311
0.00
0.01
0.05
0.10
0.20
0.30
0.40
-
2.70
0.00
0.75
2.64
0.00
1.23
2.42
0.00
1.25
2.13
0.00
0.90
1.55
0.00
0.59
0.95
0.00
0.19
0.37
0.00
Lod score a =
Cromosoma 9
D9S175
D9S1677
D9S283
0.00
0.01
0.05
0.10
0.20
0.30
0.40
-
-
-
-2.52
0.74
-0.94
-0.67
1.19
0.21
-0.07
1.18
0.51
0.22
0.87
0.52
0.17
0.47
0.30
0.05
0.13
0.08
Report del cromosoma 3
29% excluded
D3S1297 - 10
D3S1304 - 23
total chromosome
exclusion lod score:
237
-1,2
cM
family data:
linkage parameters
D3S1263 - 34
penetrance 1,00
AR
D3S2338 - 41
D3S1266 - 50
D3S1277 - 60
D3S1289 - 71
two-point lod score at theta
D3S1300 - 78
marker
place
0,00
0,01
0,05
0,1
0,2
0,3
0,4
excl.
D3S1297
D3S1304
D3S1263
D3S2338
D3S1266
D3S1277
D3S1289
D3S1300
D3S1285
D3S1566
D3S3681
D3S1271
D3S1278
D3S1267
D3S1292
D3S1569
D3S1279
D3S1614
D3S1565
D3S1262
D3S1580
D3S1601
D3S1311
10
23
34
41
50
60
71
78
94
101
119
122
135
144
153
167
176
183
191
207
208
210
230
-0,33
-
-
-
-
-
-
-
0,69
-
-2,02
-8,77
0,00
-1,07
0,00
0,00
-9,15
0,00
-2,23
-8,87
-
2,70
0,00
-0,31
-3,44
-1,14
-1,96
-3,44
-2,40
-3,61
-1,64
0,68
-3,03
-0,42
-1,16
0,00
0,38
0,00
0,00
-0,56
0,00
-0,70
-1,26
0,75
2,64
0,00
-0,25
-1,49
0,04
-0,68
-1,47
-1,02
-1,56
-0,40
0,64
-1,10
0,17
-0,03
0,00
0,87
0,00
0,00
0,23
0,00
-0,09
-0,06
1,23
2,42
0,00
-0,19
-0,75
0,37
-0,23
-0,74
-0,48
-0,78
0,00
0,58
-0,42
0,34
0,39
0,00
0,90
0,00
0,00
0,44
0,00
0,09
0,29
1,25
2,13
0,00
-0,10
-0,17
0,44
-0,03
-0,18
-0,08
-0,18
0,18
0,43
0,02
0,36
0,48
0,00
0,67
0,00
0,00
0,48
0,00
0,15
0,39
0,90
1,55
0,00
-0,04
0,00
0,28
0,06
-0,01
0,01
0,00
0,14
0,25
0,09
0,24
0,32
0,00
0,33
0,00
0,00
0,30
0,00
0,08
0,24
0,59
0,95
0,00
-0,01
0,01
0,09
0,02
-0,01
0,01
0,01
0,04
0,08
0,04
0,08
0,11
0,00
0,04
0,00
0,00
0,12
0,00
0,04
0,06
0,19
0,37
0,00
0
7
0
3
7
4
7
2
0
5
0
0
0
0
0
0
0
0
0
1
0
0
0
D3S1285 - 94
D3S1566 - 101
D3S3681 - 119
D3S1271 - 122
D3S1278 - 135
D3S1267 - 144
D3S1292 - 153
D3S1569 - 167
D3S1279 - 176
D3S1614 - 183
D3S1565 - 191
D3S1580 - 208
D3S1262 - 207
D3S1601 - 210
D3S1311 - 230
Analisi della regione candidata 3q27-q28
• selezione di ulteriori 15 marcatori microsatelliti localizzati nella regione di
interesse dalla mappa di UDB: Unified DataBase for Human Genome Mapping
http://bioinformatics.weizmann.ac.il/udb/
Marcatore
D3S1262
D3S3651
D3S1580
D3S3530
D3S1294
D3S2747
D3S1601
D3S3663
D3S3669
D3S2305
D3S1305
D3S1265
0.00
-
-
-
2.70
2.71
2.71
2.70
1.28
-
0.99
-
0.99
0.01
-1.20
-1.20
0.75
2.64
2.65
2.65
2.65
1.26
0.96
0.97
-1.03
0.97
LOD SCORE a  =
0.05
0.10
0.20
-0.01
0.34
0.42
-0.02
0.30
0.37
1.23
1.25
0.99
2.40
2.10
1.49
2.41
2.11
1.50
2.41
2.11
1.50
2.42
2.14
1.55
1.16
1.02
0.75
1.44
1.47
1.19
0.89
0.79
0.57
-0.39
-0.17
-0.01
0.89
0.79
0.57
0.30
0.26
0.20
0.59
0.89
0.90
0.90
0.95
0.46
0.77
0.35
0.03
0.35
0.40
0.06
0.04
0.20
0.34
0.34
0.34
0.37
0.18
0.32
0.14
0.02
0.14
Zmax
0.42
0.37
1.25
2.7
2.71
2.71
2.70
1.28
1.47
0.99
0.03
0.99
max
0.2
0.2
0.1
0
0
0
0
0
0.1
0
0.3
0
Ricostruzione e analisi degli aplotipi
cM
I
D3S1262
D3S3651
D3S1580
D3S3530
D3S1294
D3S2747
D3S1601
D3S3663
D3S3669
D3S2305
D3S1305
D3S1265
SPG14
(4.5cM)
2
3
1
1
3
3
2
1
1
2
2
2
3
2
2
3
1
1
3
2
2
2
2
1
1
2
2
3
2
3
1
1
3
2
2
2
2
1
1
1
1
2
2
2
1
2
3
1
1
1
II
1
3
2
2
1
3
3
2
1
1
2
2
2
2
1
1
2
3
1
1
3
2
2
2
2
1
3
2
2
3
1
1
3
2
2
2
2
1
3
2
3
2
3
1
1
3
2
2
2
2
1
2
2
2
3
1
1
3
2
2
2
2
1
4
1
1
1
2
2
2
1
2
3
1
1
1
2
3
1
1
3
3
2
1
1
2
2
2
5
2
3
2
3
1
1
3
2
2
2
2
1
2
3
1
1
3
3
2
1
1
2
2
2
6
1
1
1
2
2
2
1
2
3
1
1
1
3
2
2
3
1
1
3
2
2
2
2
1
7
1
1
2
3
1
1
3
2
2
2
2
1
8
3
2
2
3
1
1
3
2
2
2
2
1
9
2
3
2
3
1
1
3
2
2
2
1
1
3
2
2
3
1
1
3
2
2
2
2
1
10
1
1
1
2
2
2
1
2
2
2
2
1
2
3
1
1
3
3
2
1
1
2
2
1
1
1
1
2
2
2
1
2
3
1
1
1
11
2
3
1
1
3
3
2
1
1
2
2
2
1
1
1
2
2
2
1
2
3
1
1
1
12
2
3
1
1
3
3
2
1
1
2
2
2
2
3
2
3
1
1
1
2
3
1
1
1
Lod score
MULTIPOINT
(Genehunter 1.3)
Zmax = 3.9 per D3S1601
Z > 3.00 tra D3S1580 e D3S3669
Analisi di linkage
Regione
cromosomica
candidata
Gene malattia
(mutazioni
patogene)
Clonaggio posizionale
Costruzione di mappe
genetiche e fisiche ad alta
risoluzione
Costruzione di contigui di cloni
Identificazione e
sequenziamento dei trascritti
Ricerca di mutazioni
patogene in pazienti
• Mappaggio EST
• sequenziamento e ricerca di ORF
• screening di librerie di cDNA
• “exon trapping”
• ricerca di isole CpG ipometilate
Limiti del clonaggio posizionale
• Dimensioni della regione
• N° di geni presenti
Progetto Genoma Umano
Mb
Sviluppo di databases
95
96
97
98
99
Clonaggio posizionale-candidato
(candidate positional cloning)
Analisi della regione candidata mediante
consultazione di DATABASE
Individuazione dei geni noti
Selezione dei geni candidati
Ricerca di mutazioni
patogene in pazienti
• Espressione
• Funzione
• omologia con altri geni umani
• omologia con geni in organismi
modello (Topo, Drosophila...)
Regione candidata
geni noti
GENI NON NOTI
Programmi di
predizione genica
• Ricerca di sequenze codificanti simili
• Ricerca di esoni (Genscan, Grail)
Pacchetti di software (NIX)
Database con previsioni
(GENOME BROWSER, ENSEMBL)
Analisi della proteina putativa
(SMART, PFAM)
• Ricerca di omologie
• Ricerca di domini
• Sequenze segnale
Databases
Analisi della regione critica
3q27-q28
• 70% sequenziato
• 47 cloni
• 6 Gap  0.1 Mb
3q27
Hs.98859
Hs.63920
Hs.91453
LPP: lim domain-containing preferred
translocation partner in lipoma
8 Geni noti
Hs.42824
TP63: tumor protein
FLJ10718
CLDN1: claudin 1
CLDN16: claudin 16
Hs.119567
Hs. 298964
PRO1446
IL1RAP: interleukin 1 receptor accessory protein
13 UniGene Clusters
(376 ESTs)
Hs.25028
Hs.10198
Hs.55098
FGF12/FGF12B: fibroblast growth factor 12
3q28
Hs.275127
Hs.34779
Hs.12251
Hs.152466
Analisi dei geni noti
LPP: lim domain-containing preferred
translocation partner in lipoma
TP63: tumor protein
Espressione
FLJ10718
Funzione
CLDN1: claudin 1
Localizzazione
CLDN16: claudin 16
Omologie con altri geni
PRO1446
IL1RAP: interleukin 1 receptor
accessory protein
FGF12/FGF12B: fibroblast growth
factor 12
FGF12
• Espressione:  SN
• Altamente conservato (100% omologia nel topo)
• Funzione: implicato nello sviluppo e funzionamento del SN (Smallwood et al.1996)
Ex 1A
Ex 1B
FGF12 gene
FGF12
mRNA
(A)n 3’
5’
FGF12B 5’
mRNA
IL1RAP
(A)n 3’
• Funzione: trasduzione del segnale IL1- IL1RI
• Simile a IL1RAPL mutata in forme di ritardo mentale e disturbi
cognitivi (Carrie et al. 1999)
IL1RAP gene
sIL1RAP mRNA
mIL1RAP mRNA
5’
5’
(A)n
3’
(A)n 3’
Risultati
Sequenziamento
FGF12 e IL1RAP
• esclusione sequenze codificanti
• siti di splicing
• regioni 5’ e 3’ UTR
Prospettive
•Valutazione delle regioni regolative per FGF12 e IL1RAP
•Valutazione di nuovi geni identificati nella regione critica
•Analisi delle ESTs e dei trscritti parziali
Giovanni Vazza
Francesca Boaretto
Michela Zortea
Andrea Bozzato
M. L. Mostacciuolo
Progetto finanziato dall’Universita’
degli Studi di Padova
V. Sartori
G.F. Micaglio