RB
Il Linkage
La tipizzazione di famiglie ampie ed informative, dove segrega uno specifico
fenotipo a base genetica, consente di stabilire se esiste una “concatenazione”
tra un marcatore specifico ed il locus del carattere.
L’esistenza di un rapporto di concatenazione viene dimostrato tramite vari
metodi tra cui quello del rapporto di massima verosimiglianza (o metodo dei lod
scores).
La base logica di questo metodo è molto semplice ed è dovuta al fatto che in una
progenie si possono osservare due situazioni, o quella del riassortimento
indipendente di due geni (o di un marcatore con un gene) o quella della
concatenazione degli stessi.
I lod scores vengono così calcolati prendendo in considerazione una meiosi alla
volta e confrontando la probabilità dei genotipi osservati nelle ipotesi alternative
di concatenazione (linkage) o di assortimento indipendente.
RB
IL LINKAGE
Si calcolano cioè due probabilità:
1) la probabilità L0 che la progenie di quella famiglia sia
ottenuta in assenza di concatenazione ( =0.5 ).
2) la probabilità L1 che la stessa progenie si sia generata in
presenza di concatenazione ( < 0.5 ).
Queste probabilità vengono più esattamente definite come
verosimiglianza delle osservazioni nelle due ipotesi di
indipendenza e di linkage.
RB
IL LINKAGE
Si calcola quindi il rapporto di verosimiglianza L= L1/L0
e si cerca il valore di  per cui tale rapporto risulta massimo.
Per semplicità di calcolo si usa il logaritmo in base 10 del
rapporto di verosimiglianza: Z = log ( L1/L0 ) che in inglese viene
denominato lod score.
La mappatura di un fenotipo si ottiene così quando il valore di
Z è uguale o superiore a 3. In effetti questo valore sta ad
indicare che l’ ipotesi di concatenazione per un determinato
valore di  è 1000 volte più probabile di quella di indipendenza
RB
Stima di  fra il locus ed il marcatore
Metodo del LOD SCORE
Likelihood ratio test:  è significativamente < 0.5?
H0 = i due loci sono indipendenti 
 = 0.5
H1 = i due loci sono in linkage 
0 <  < 0.5
Likelihood [L()] = Probabilità che i dati osservati si verifichino
quando la frazione di ricombinazione è 
LOD = log of the odds
Z() = log10 [L()/L( =0.5)]
Limiti di significatività
Z>3
Z < -2
evidenza di linkage è significativa
si può escludere la presenza di linkage
RB
ANALISI DI SEGREGAZIONE
Se numerosi marcatori sono mappati si deve aumentare il
valore della soglia di significatività per avere lo stesso rischio
d’errore. Così:
Z = Z0 + log10 (n of markers)
dove Z0 è la soglia per 1 test
Per 100 markers e Z0 = 3
Z = 3 +log(100)
Z=5
RB
ESERCITAZIONE:
CALCOLO DEL
PUNTEGGIO LOD
RB
ANALISI DI SEGREGAZIONE
Considerando
– N 
n° di meiosi informative
– R 
n° di meiosi ricombinanti
– (N-R)  n° di meiosi non ricombinanti
L ()

L ( 0 ,5 )
sviluppando

R
1   
0 ,5
N R
N

LOD (  )  N * log 10 2  log 10 
R
1   N  R 
Se =0, allora
LOD() = N log102  (0,301 N)
Se =0,5 allora
LOD()=0
RB
Frazione di ricombinazione  θ
Metodo confronta la probabilità [L(θ)] per qualsiasi
frazione di ricombinazione (θ)
0 < θ < 0,50
La determinazione di L(θ) dipende dalla probabilità che si
presenti una particolare frazione di ricombinanti (R) e non
ricombinanti (NR) tra i membri della discendenza
RB
La probabilità che la prole riceva da un genitore
doppiamente eterozigote l’uno o l’altro cromosoma non
ricombinante è:
½ (1 – θ) + ½ (1 – θ) = 1 – θ
Analogamente la probabilità che riceva i ricombinanti è:
½θ+½ θ=θ
RB
La probabilità che ciascun individuo appartenente ad
esempio ad una famiglia di 5 membri presenti un
cromosoma
NON
RICOMBINATO
originante
da
progenitore doppiamente eterozigote è:
K (1 – θ)5
Dove K è un coefficiente n!/ n!(nr)!
Il calcolo del punteggio LOD si basa su un rapporto nel
quale i termini al numeratore e denominatore sono uguali e
quindi si elidono
Ipotizziamo una progenie:
RB
I
1
N.B.
Tondo = femmina
Quadrato = maschio
2
OO
BO
II
1
BO
2
BO
3
BO
4
BO
5
OO
6
OO
7
OO
8
BO
9
OO
10
OO
11
BO
B e O  alleli ad un locus (SBT)
Colore giallo  carattere dominante autosomico facilmente visibile (alleli N e D)
HOR  esempio presenza (giallo D) e assenza corna (bianco N)
Individuo I2 è eterozigote perché nella prole ci sono soggetti con e senza corna
È eterozigote anche al locus SBT perché nella prole sia fenotipi B che O
RB
La consorte I1 è omozigote al locus SBT (OO)
I2 è doppiamente eterozigote
Ipotizzando che i loci SBT e HOR associati  fase di I2 è sconosciuta
Si può trattare di:
HOR-B SBT-D/HOR-O SBT-N (fase 1)
oppure di:
HOR-B SBT-N/HOR-O SBT-D (fase 2)
Cioè abbreviando:
BD/ON oppure BN/OD
RB
Se si suppone che i loci siano associati e il genotipo I2 sia in fase 1 (BD/ON)
avremo:
II  1, 2, 4, 6, 7, 8, 9 e 10  NON RICOMBINANTI (BD o ON)
I-2
I-1
Fase 1
O
O
N
N
X
B
O
D
N
Fase 2
o
B
O
N
D
RB
II-1
II-2
II-3
II-4
II-5
II-6
B
O B
O B
OB
O O
O
O
O
D
N D
N N
ND
N D
N
N
N
Fase 1 NR
Fase 2 R
NR
R
II-7
R
NR
II-8
NR
R
R
NR
II-9
NR
R
II-10
II-11
O
O
B
O
O
O
O
O
B
O
N
N
D
N
N
N
N
N
N
N
Fase 1 NR
Fase 2 R
NR
R
NR
R
NR
R
R
NR
RB
Supponendo una Fase 1 per l’individuo I-2
L’individuo I-1 è irrilevante (doppiamente omozigote)
Individui II  3 – 5 – 11 sono RICOMBINANTI
così per questa discendenza la probabilità che si siano combinati
cromosomi non ricombinanti e ricombinanti sarà
(1 – θ)8 (θ)3
Se supponiamo che sia in Fase 2
II 3 – 5 – 11 sono NON RICOMBINANTI
la probabilità sarà
(1 – θ)3 (θ)8
RB
La probabilità complessiva [L(θ)] per la prole sarà
½ (1 –θ)8 (θ)3 + ½ (1 – θ)3 (θ)8
Si può calcolare il valore di tale espressione per vari valori di θ
Solitamente si indaga tutto il range da 0 a 0,50
Si calcola poi il logaritmo del rapporto tra la probabilità della prole per ogni
particolare valore di θ (diverso da 0,50) e la probabilità per θ = 0,50
Ad esempio con θ = 0,10 il rapporto L(0,10) / L(0,50) è:
1
8
3

1  0 ,10  0 ,10  
2
1  0 ,50  0 ,50 
8
1
2
3
1
 1
3
8

1  0 ,10  0 ,10 
2
1  0 ,50  0 ,50 
3
2
8

2 ,152  10
4
4 ,833  10
4
 0 , 441
RB
Il logaritmo di 0,441  -0,356
che sarà il punteggio LOD per il rapporto anzidetto
Z(0,10) = -0,356
In caso di fase nota per l’individuo I-2
sarebbe nota anche la probabilità per la prole
Ad esempio se I-2  BD/ON
la probabilità per la prole sarebbe
(1 – θ)8 (θ)3
ed il punteggio Z con θ = 0,10
log
1  0 ,10 8 0 ,10 3
1  0 ,50 8 0 ,50 3
 log
4 ,305  10
4
4 ,883  10
4
 0 , 055
RB
E se I-2 fosse nella fase 2 il valore sarebbe – 4,826
θ
0
Z
-∞
0,001
0,01
0,05
0,10
0,20
0,30
0,40
0,45
-5,993 -3,025 -1,071 -0,356 0,138
0,209
0,095
0,029
Osservando tutto l’arco di valori il LOD massimo è 0,214 con
un θ =0,276
I loci possono considerarsi NON associati
Ricordare che per significatività LOD > 3