CORSO INTEGRATO di
Genetica e Biologia Molecolare
GENETICA
a.a. 2015-2016
03/11/2015
Lezioni 23 e 24
Analisi di linkage
Elisabetta Trabetti
LINKAGE
Geni in loci vicini sullo stesso cromosoma – concatenati
(loci sintenici)
Tendenza di loci (geni e/o marcatori)
vicini su un singolo cromosoma ad essere
trasmessi assieme, come una unità,
attraverso la meiosi
[Genetica - B.A. Pierce. Zanichelli 2005]
Gameti parentali e ricombinanti
Analisi di Linkage
Analisi di associazione o di concatenazione
Co-segregazione di alleli a 2 o più siti polimorfici
all’interno di una famiglia
Probabilità dei marcatori di essere associati
rispetto alla probabilità di essere indipendenti
2 loci polimorfici in chr diversi: 50% probabilità un
allele al primo locus segreghi con un allele al secondo
locus
A1A2 B1B2
A1B1 50%
2 loci sintenici: probabilità di co-segregazione correla
con la distanza tra i loci
Probabilità che avvenga un evento di ricombinazione tra
due loci
FREQUENZA o FRAZIONE DI
RICOMBINAZIONE: θ
Frazione di ricombinazione, θ
Probabilità che avvenga un evento di ricombinazione
tra due loci
θ=
q= 0,5
q=0
n° meiosi ricombinanti
n° tot meiosi
n° soggetti ricombinanti
n°tot figli
loci molto lontani o su cromosomi diversi Assort Indipend
loci molto vicini Associati
q = misura della distanza genetica
U di misura: centimorgan cM
1 cM= lunghezza genetica in cui 1% di ricombinazione (q =0,01)
NB: distanza genetica non è strettamente proporzionale alla distanza
fisica (lunghezza in nucleotidi)
MISURA DELLA DISTANZA GENETICA
q = n. figli ricombinanti/n. tot figli
= 1/8 = 0,125 = 12,5%
Distanza A-B = 12,5 cM
“Vero linkage o dovuto al caso?”
Poniamo q = 0.5 il valore che ci attendiamo per 2 loci
indipendenti
Lo spostamento del valore da 0.5 è significativo da un
punto di vista statistico?
Analisi di linkage nell'uomo utilizzano i metodi basati
sul calcolo della verosimiglianza o likelihood
Analisi di linkage nell'uomo utilizzano i metodi basati
sul calcolo della verosimiglianza o likelihood
Probabilità di un valore q in relazione al numero
di ricombinazioni osservate tra i loci
Probabilità che i loci siano associati a un dato q
LOD =Z(q) =
Probabilità che i loci non siano in linkage (q=0,5)
(q =0-0.5) Valore q con LOD score > è la frequenza di ricombinazione più
probabile tra i dati osservati nelle famiglie
Due loci sono in linkage per un q se LOD score ≥+3 (1000:1)
No linkage se LOD score ≤-2 (1:100)
COSTRUZIONE DI MAPPE GENETICHE
Frazione di ricombinazione tra i loci:
A e B = 0,06 (6cM)
B e C = 0,07
A e C = 0,10
Frazione di ricombinazione tra i loci:
A e D = 0,04
D e B = 0,08
0.08 < somma 0.04 + 0.06
Ordine 3 loci sul chr
RICOMBINAZIONE MASSIMA: 50% !
Ricombinazione semplice
Ricombinazione doppia
0.06
A
0.07
B
0.10
C
MAPPA GENETICA DEL CROMOSOMA 22
Distanza genetica e distanza fisica
Non c’è correlazione costante
< ricombinazioni maschio
mappa genetica più corta
Approssimazione: 1 cM = 1 Mb
ANALISI di LINKAGE:
applicazioni
● Mappaggio di geni malattia e di nuovi
marcatori
● Diagnosi indiretta di malattia - Deve
essere
nota
la
localizzazione
cromosomica del gene
SIMBOLI USATI PER LA COSTRUZIONE
DEI PEDIGREE
Il probando è l’individuo attraverso cui si è arrivati allo
studio di quel pedigree, viene indicato con una freccia
Ogni individuo è identificato in modo non ambiguo da una
coppia di numeri (un numero romano per la generazione
ed uno arabo per i soggetti all’interno della stessa
generazione – ordine di nascita)
Meiosi informative e non
AD
Locus marcatore A
Alleli 1 e 2
Meiosi informative = individuare i gameti
ricombinanti e non
Analisi di
segregazione degli
alleli locus
marcatore rispetto
al fenotipo
Loci associati sono
trasmessi assieme
Determinazione
della fase
Associazione degli alleli
al locus marcatore con
il locus malattia
AD
LINKAGE - ricombinazione
2 loci
Locus marcatore (1 o 2)
Locus malattia (- o +)
Segregazione di alleli al locus
marcatore e al locus malattia
P
M
1
2
F1
1
2
F2
2
1
2
F3
2
2
2
LINKAGE - ricombinazione
2 loci
Locus marcatore (1 o 2)
Locus malattia (- o +)
P
M
1
2
F1
1
2
F2
2
1
1
2
1
2
2
F3
2
2
2
Determinazione della fase
Associazione degli alleli al locus marcatore con il locus malattia
Ipotesi: allele 2 associato malattia
50% ricombinazione
Assortimento indipendente:
gene malattia NON è in linkage con il marcatore
REQUISITI
Famiglie (numerose)
Affetti
Marcatori genetici
altamente polimorfi
uniformemente distribuiti
facile individuazione e basso costo
(A) Distinguere i due cromosomi omologhi dei genitori – marcatore linked
(B) Determinare la fase = cromosoma con allele patologico
(C) Quale cromosoma e’ stato trasmesso al probando
ANALISI di LINKAGE:
applicazioni
● Mappaggio di geni malattia e di nuovi
marcatori
● Diagnosi indiretta di malattia - Deve
essere
nota
la
localizzazione
cromosomica del gene
Informatività diagnostica di un marcatore
nella analisi di linkage - AR
1/1
-/+
2/2
-/+
Famiglia non informativa
1/2
-/-
1/2
-/+
1/1
-/1/2
-/+
1/2
-/-
1/2
-/+
Famiglia pienamente informativa
1/2
-/+
Famiglia parzialmente informativa
Diagnosi prenatale CF mediante analisi
di Linkage
MetH: extragenico, ~1Mb
1-2
-/+
1-1
-/+
1-2
?/?
1-1
-/-
MWM
P
M
CF
allele 2 p
allele 1 m:?
V
C+
1-2 1-1 1-1 1-2 2-2
1-2
?/+
?
• portatore (CF carrier)
o
• sano
Diagnosi prenatale CF
Xv-2c: extragenico, ~200 kb
1-2
Figlio affetto:
1-2
1-1
1-2
1*p e 2*m
allele 1 p
allele 1 m
?
oppure
1*m e 2*p
Feto:
MWM
P
M
CF
V
C+
1*p e 1 m
oppure
1*m e 1p
1-2 1-2 1-2 1-1 2-2
in entrambi i casi è
PORTATORE
Diagnosi prenatale CF
1*-2
1*-1*
1-2*
1*-2*
1-1*
1*-2
• sano o portatore
1*-2
1-1*
MetH: sano o carrier
Xv-2c: carrier
• portatore
Feto: carrier m causa CF
Fattori che determinano
l’accuratezza diagnostica nella analisi
di linkage
 Vicinanza del marcatore al gene – frequenza di
ricombinazione
FC: KM19 <<0.01, MetH e J3.11 =0.01
DMD marcatori intragenici: 0.05
 Errori da non paternità biologica
 Errori di laboratorio
 Nuove mutazioni
 Eterogeneità genetica
Analisi di linkage e studio degli aplotipi
AD
Locus malattia DISTALE rispetto al primo marcatore
Il gamete con la combinazione 1-4-1 trasmesso assieme all’allele malattia
da I-1 a II-1 = aplotipo associato alla malattia  controllo in generaz III
Aplotipo = serie di alleli in loci associati su un cromosoma (pat o mat)
LINKAGE disequilibrium
Specifica combinazione di alleli in fase a due o piu’
loci linked che si verifica più spesso di quanto
accadrebbe per puro caso
Associazione a livello di popolazione tra un particolare
allele marcatore e una malattia
In una popolazione molte persone non imparentate
hanno ereditato un cromosoma con una patologia da
un antenato comune
LINKAGE
DISEQUILIBRIUM
LINKAGE
M
1
M
3
M
1
Locus “A”
alleli 1 e 2
M
3
M
1
M
1
M
2
M
3
M
3
M
3
M
2
M
2
M
2
M
3
M
3
M
3
Locus A
Locus B
25%
40%
50%
25%
10%
0%
25%
10%
0%
25%
40%
50%
Linkage
equilibrium
Linkage
disequilibrium
parziale
Linkage
disequilibrium
completo
Origine del LD
Mutazioni
ricombinazioni
La determinazione del LD richiede lo studio di nuclei familiari
stabilire gli aplotipi
Possibilità di determinare elevato LD in soggetti non
familiari
(popolazioni isolate – pochi antenati  pochi aplotipi originali)
AD: locus a 0.1 cM locus marcatore A
Malati (Mm)
Controlli (mm)
Individui con
allele A1
67
32
Totale individui
analizzati
84
275
Allele A1 >>> frequente negli affetti
Mut responsabile AD è avvenuta sul chr A1
LD responsabile delle differenze osservate
Grande numero di SNP vicini ha evidenziato che il
genoma umano è costituito da una serie di blocchi
di LD
Frequenze aplotipi nei blocchi diverse rispetto
all’equilibrio
Utili per la determinazione dei geni responsabili di
malattie complesse
Progetto HapMap
 studio collaborativo internazionale - 2002
 obiettivo: individuazione degli aplotipi comuni del genoma
umano per utilizzo in studi di linkage e GWAS (mappaggio geni
malattia)
- popolazioni con antenati Europei, Asiatici e Africani
- ciascun aplotipo contrassegnato da “tagging SNP”
- 500.000 – 600.000 tag SNP si può definire con buona
approssimazione i genotipi di 107 SNP comuni
CEU: Utah residents with Northern and Western European ancestry from the CEPH
collection, CHB: Han Chinese in Beijing, China, JPT: Japanese in Tokyo, Japan, YRI: Yoruba in
Ibadan, Nigeria
ASW: African ancestry in Southwest USA
CHD: Chinese in Metropolitan Denver, Colorado
GIH: Gujarati Indians in Houston, Texas
LWK: Luhya in Webuye, Kenya
MEX: Mexican ancestry in Los Angeles, California
MKK: Maasai in Kinyawa, Kenya
TSI: Toscans in Italy
HapMap: Ciscun aplotipo può essere identificato in
maniera univoca tramite una delle SNP che lo compone
(tag-SNP)
Costruzione aplotipi
(a) Single nucleotide polymorphisms(SNPs) are identified in DNA samples from multiple
individuals.
(b) Adjacent SNPs that are inherited together are compiled into "haplotypes."
(c) "Tag" SNPs within haplotypes are identified that uniquely identify those haplotypes.
By genotyping the three tag SNPs shown in this figure, researchers can identify
which of the four haplotypes shown here are present in each individual.
Identificazione di aplotipi
Utili in studi di associazione
Confronto aplotipi di “casi” con aplotipi di “controlli”
Aplotipo più frequente in casi
Gene causale interno o vicino aplotipo
Linkage disequilibrium e FC
Esercizi
(1) Dato il genotipo AaBb: quali sono i geni e quali gli alleli?
Disegnate schematicamente questo genotipo con i geni
concatenati in repulsione, posizionando gli alleli sui cromosomi
omologhi.
(2) Disegnate schematicamente un genotipo quadruplo
eterozigote con i geni A e C concatenati e i geni B e D
indipendenti, posizionando gli alleli sui cromosomi omologhi.
(3) Disegnare schematicamente due loci indipendenti. Potrebbero
essere posizionati sullo stesso cromosoma?
(4) Quali gameti produce prevalentemente un triplo eterozigote
AaBbCc considerando i 3 casi:
gli alleli A e B concatenati in repulsione e anche B e C
gli alleli A e B concatenati in cis e C in repulsione
gli alleli A e B concatenati in cis e il locus C non
concatenato
(5) Dato il seguente incrocio AaBbDD x AABbdd in cui tutti i
geni segregano indipendentemente
a) Quanti gameti geneticamente differenti sarà
possibile ottenere da ciascun genitore?
b) Quale sarà la proporzione di individui eterozigoti
a tutti i loci nella prole?
(6)
Quali fenotipi produce il seguente incrocio e con quali
frequenze
AaBbCc X AABBCc
(A, B, C, alleli dominanti)
Cambiano le frequenze se il primo individuo è omozigote per
l’allele recessivo al primo locus?
(8) Dal genotipo AaBb vengono prodotti i seguenti
gameti:
AB = 28 gameti
Ab = 472 gameti
aB = 469 gameti
ab = 31 gameti
I loci A e B sono associati o indipendenti?
E’ possibile determinare la distanza genetica tra i
due loci?