RB Il Linkage La tipizzazione di famiglie ampie ed informative, dove segrega uno specifico fenotipo a base genetica, consente di stabilire se esiste una “concatenazione” tra un marcatore specifico ed il locus del carattere. L’esistenza di un rapporto di concatenazione viene dimostrato tramite vari metodi tra cui quello del rapporto di massima verosimiglianza (o metodo dei lod scores). La base logica di questo metodo è molto semplice ed è dovuta al fatto che in una progenie si possono osservare due situazioni, o quella del riassortimento indipendente di due geni (o di un marcatore con un gene) o quella della concatenazione degli stessi. I lod scores vengono così calcolati prendendo in considerazione una meiosi alla volta e confrontando la probabilità dei genotipi osservati nelle ipotesi alternative di concatenazione (linkage) o di assortimento indipendente. RB IL LINKAGE Si calcolano cioè due probabilità: 1) la probabilità L0 che la progenie di quella famiglia sia ottenuta in assenza di concatenazione ( =0.5 ). 2) la probabilità L1 che la stessa progenie si sia generata in presenza di concatenazione ( < 0.5 ). Queste probabilità vengono più esattamente definite come verosimiglianza delle osservazioni nelle due ipotesi di indipendenza e di linkage. RB IL LINKAGE Si calcola quindi il rapporto di verosimiglianza L= L1/L0 e si cerca il valore di per cui tale rapporto risulta massimo. Per semplicità di calcolo si usa il logaritmo in base 10 del rapporto di verosimiglianza: Z = log ( L1/L0 ) che in inglese viene denominato lod score. La mappatura di un fenotipo si ottiene così quando il valore di Z è uguale o superiore a 3. In effetti questo valore sta ad indicare che l’ ipotesi di concatenazione per un determinato valore di è 1000 volte più probabile di quella di indipendenza RB Stima di fra il locus ed il marcatore Metodo del LOD SCORE Likelihood ratio test: è significativamente < 0.5? H0 = i due loci sono indipendenti = 0.5 H1 = i due loci sono in linkage 0 < < 0.5 Likelihood [L()] = Probabilità che i dati osservati si verifichino quando la frazione di ricombinazione è LOD = log of the odds Z() = log10 [L()/L( =0.5)] Limiti di significatività Z>3 Z < -2 evidenza di linkage è significativa si può escludere la presenza di linkage RB ANALISI DI SEGREGAZIONE Se numerosi marcatori sono mappati si deve aumentare il valore della soglia di significatività per avere lo stesso rischio d’errore. Così: Z = Z0 + log10 (n of markers) dove Z0 è la soglia per 1 test Per 100 markers e Z0 = 3 Z = 3 +log(100) Z=5 RB ESERCITAZIONE: CALCOLO DEL PUNTEGGIO LOD RB ANALISI DI SEGREGAZIONE Considerando – N n° di meiosi informative – R n° di meiosi ricombinanti – (N-R) n° di meiosi non ricombinanti L () L ( 0 ,5 ) sviluppando R 1 0 ,5 N R N LOD ( ) N * log 10 2 log 10 R 1 N R Se =0, allora LOD() = N log102 (0,301 N) Se =0,5 allora LOD()=0 RB Frazione di ricombinazione θ Metodo confronta la probabilità [L(θ)] per qualsiasi frazione di ricombinazione (θ) 0 < θ < 0,50 La determinazione di L(θ) dipende dalla probabilità che si presenti una particolare frazione di ricombinanti (R) e non ricombinanti (NR) tra i membri della discendenza RB La probabilità che la prole riceva da un genitore doppiamente eterozigote l’uno o l’altro cromosoma non ricombinante è: ½ (1 – θ) + ½ (1 – θ) = 1 – θ Analogamente la probabilità che riceva i ricombinanti è: ½θ+½ θ=θ RB La probabilità che ciascun individuo appartenente ad esempio ad una famiglia di 5 membri presenti un cromosoma NON RICOMBINATO originante da progenitore doppiamente eterozigote è: K (1 – θ)5 Dove K è un coefficiente n!/ n!(nr)! Il calcolo del punteggio LOD si basa su un rapporto nel quale i termini al numeratore e denominatore sono uguali e quindi si elidono Ipotizziamo una progenie: RB I 1 N.B. Tondo = femmina Quadrato = maschio 2 OO BO II 1 BO 2 BO 3 BO 4 BO 5 OO 6 OO 7 OO 8 BO 9 OO 10 OO 11 BO B e O alleli ad un locus (SBT) Colore giallo carattere dominante autosomico facilmente visibile (alleli N e D) HOR esempio presenza (giallo D) e assenza corna (bianco N) Individuo I2 è eterozigote perché nella prole ci sono soggetti con e senza corna È eterozigote anche al locus SBT perché nella prole sia fenotipi B che O RB La consorte I1 è omozigote al locus SBT (OO) I2 è doppiamente eterozigote Ipotizzando che i loci SBT e HOR associati fase di I2 è sconosciuta Si può trattare di: HOR-B SBT-D/HOR-O SBT-N (fase 1) oppure di: HOR-B SBT-N/HOR-O SBT-D (fase 2) Cioè abbreviando: BD/ON oppure BN/OD RB Se si suppone che i loci siano associati e il genotipo I2 sia in fase 1 (BD/ON) avremo: II 1, 2, 4, 6, 7, 8, 9 e 10 NON RICOMBINANTI (BD o ON) I-2 I-1 Fase 1 O O N N X B O D N Fase 2 o B O N D RB II-1 II-2 II-3 II-4 II-5 II-6 B O B O B OB O O O O O D N D N N ND N D N N N Fase 1 NR Fase 2 R NR R II-7 R NR II-8 NR R R NR II-9 NR R II-10 II-11 O O B O O O O O B O N N D N N N N N N N Fase 1 NR Fase 2 R NR R NR R NR R R NR RB Supponendo una Fase 1 per l’individuo I-2 L’individuo I-1 è irrilevante (doppiamente omozigote) Individui II 3 – 5 – 11 sono RICOMBINANTI così per questa discendenza la probabilità che si siano combinati cromosomi non ricombinanti e ricombinanti sarà (1 – θ)8 (θ)3 Se supponiamo che sia in Fase 2 II 3 – 5 – 11 sono NON RICOMBINANTI la probabilità sarà (1 – θ)3 (θ)8 RB La probabilità complessiva [L(θ)] per la prole sarà ½ (1 –θ)8 (θ)3 + ½ (1 – θ)3 (θ)8 Si può calcolare il valore di tale espressione per vari valori di θ Solitamente si indaga tutto il range da 0 a 0,50 Si calcola poi il logaritmo del rapporto tra la probabilità della prole per ogni particolare valore di θ (diverso da 0,50) e la probabilità per θ = 0,50 Ad esempio con θ = 0,10 il rapporto L(0,10) / L(0,50) è: 1 8 3 1 0 ,10 0 ,10 2 1 0 ,50 0 ,50 8 1 2 3 1 1 3 8 1 0 ,10 0 ,10 2 1 0 ,50 0 ,50 3 2 8 2 ,152 10 4 4 ,833 10 4 0 , 441 RB Il logaritmo di 0,441 -0,356 che sarà il punteggio LOD per il rapporto anzidetto Z(0,10) = -0,356 In caso di fase nota per l’individuo I-2 sarebbe nota anche la probabilità per la prole Ad esempio se I-2 BD/ON la probabilità per la prole sarebbe (1 – θ)8 (θ)3 ed il punteggio Z con θ = 0,10 log 1 0 ,10 8 0 ,10 3 1 0 ,50 8 0 ,50 3 log 4 ,305 10 4 4 ,883 10 4 0 , 055 RB E se I-2 fosse nella fase 2 il valore sarebbe – 4,826 θ 0 Z -∞ 0,001 0,01 0,05 0,10 0,20 0,30 0,40 0,45 -5,993 -3,025 -1,071 -0,356 0,138 0,209 0,095 0,029 Osservando tutto l’arco di valori il LOD massimo è 0,214 con un θ =0,276 I loci possono considerarsi NON associati Ricordare che per significatività LOD > 3