12458427402424711748165343246 61764462631351737646141999999 99999945658897899999999194755 Valentino Rossi corridore Harrison Ford attore Rita Levi Montalcini scienziata 12458427402424711748165343246 61764462631351737646141999999 99999945658897899999999194755 Informazione posizionale : alterazioni cromosomiche, analisi di linkage, associazione con aplotipi 12458422424711748165343246617644 62631351737646141999999999999456 58897899999999194755 Harrison Ford attore Rita Levi Montalcini scienziata ? Informazione funzionale Rita Levi Montalcini scienziata: sonda complementare 584 Identificazione posizionale 12458427402424711748165343246617 64462631351737646141999999999999 45658897899999999194755 Clonaggio di geni Delezione associata ad un fenotipo malattia (sonda), Polimorfismo associato ad un fenotipo o ad un QTL, Analisi di linkage Posizione di mappa Proteina mutante Funzione gene Posizione di mappa gene Funzione GENETICA DIRETTA GENETICA INVERSA Mappatura genetica: “marker-marker” mapping usato per costruire reti di marcatori per la correlazione di mappe fisiche e genetiche. “disease-marker” mapping per localizzare geni malattia La costruzione di fitte mappe genetiche “marcatore-marcatore” sono un utile strumento per la mappatura genetica di geni d’interesse. Come si fa l’analisi di “linkage” nella popolazione umana? La situazione ideale per l’analisi di “linkage” A3A3 A2A4 A1 A4 A2 A3(allele A3 o aplotipo A3 associato al gene malattia) A1A2 A1A2 A3A1 A4A2 A4A2 A1A2 A4A3 A1A3 A3A1 R Domanda: Il locus A con i quattro alleli polimorfici A1, A2, A3 ed A4 è associato al gene malattia? Se sì quanto? A1 A4 A1A3 A1A3 A2A1 A2 A3 A4A2 A4A2 A1A2 A4A3 A1A3 A2A1 Possiamo prendere in considerazione una serie di loci polimorfici distribuiti su tutto il genoma e domandarci a quale di questi loci è associato il gene malattia? Il locus A con i quattro alleli polimorfici A1, A2, A3 ed A4 è associato al gene malattia? L’allele che segrega con il gene malattia può essere differente nelle diverse famiglie LOD SCORE Si definisce LOD SCORE il logaritmo in base 10 del rapporto fra la probabilità che si ottenga una data distribuzione di genotipi in caso di associazione (ad una data Frequenza di Ricombinazione) rispetto alla situazione di indipendenza (Frequenza di ricombinazione 0.5) Analisi di linkage Supponiamo che A rappresenti il locus per il gene malattia e B il marcatore genetico associato. Se A e B fossero indipendenti nella progenie dovrei trovare i gameti AB, Ab, aB e ab equi-rappresentati (ossia 0.25) Quindi il gene malattia dovrebbe segregare indifferentemente con B o b Analisi di linkage A e B potrebbero essere associati in CIS 5 Parentali 2 Ricombinanti oppure A e B potrebbero essere associati in TRANS 5 Ricombinanti 2 Parentali Se la fase non è nota il calcolo del LOD SCORE comprende ambedue i casi e li somma perché si escludono a vicenda. Analisi di linkage (Morton 1995) Si definisce LOD SCORE il logaritmo in base 10 del rapporto fra la probabilità che si ottenga una data distribuzione di genotipi in caso di associazione (ad una data Frequenza di Ricombinazione) rispetto alla situazione di indipendenza (Frequenza di ricombinazione 0.5) Il LOD SCORE (Z) può essere calcolato per diversi valori di FR. Se la fase è nota: Z = log10[ (1-FR)P (FR)R / (1/2)Totale ] Se la fase è ignota: Z = log10[ ½ (1-FR)P (FR)R / (1/2)Totale + ½ (1-FR)R (FR)P / (1/2)Totale ] Impostiamo il calcolo ponendo che la fase sia nota : 5 Parentali 2 Ricombinanti Totale 7 Il calcolo del LOD SCORE si fa per varie distanze di mappa. Da dove cominciamo? Dalla distanza di mappa presunta? 28.6 um o cM Z = log10[ (1-FR)P (FR)R / (1/2)Totale ] 2/7= 0.286 p (ricombinanti) = 0.286 p (parentale) = (1- 0.286) = 0.714 Z = log10[ ½ (1-FR)P (FR)R / (1/2)Totale + ½ (1-FR)R (FR)P / (1/2)Totale ] Impostiamo il calcolo ponendo che la fase sia nota : 5 Parentali 2 Ricombinanti Totale 7 p (ricombinante) = 0.286 p (parentale) = (1- 0.286) = 0.714 Z = log10[ (1-FR)P (FR)R / (1/2)Totale] Z = log10[(1-0.286)5 (0.286)2 /(1/2)7] Z = log10[(0.714)5 (0.286)2 /(1/2)7 ] applicando le proprietà dei logaritmi: Z = 7 log10(2)* + 5 log10 (0.714) + 2 log10(0.286) = 7 (0.30) + 5 (-0.146) + 2 (-0.540) = 2.1 -0.73 -1.08 = 2.1 – 1.81 = 0.29 Se la fase fosse ignota: Z = log10[ ½ (1-FR)P (FR)R / (1/2)Totale + ½ (1-FR)R (FR)P / (1/2)Totale ] * - log10 (1/2)7 = -7 log10 1 – (-7 log10 2) = 0 + 7 log10 2 Fase nota: sono noti i genotipi dei nonni Fase ignota Al variare del valore della FR otteniamo una curva. Il valore del LOD score varia al variare della distanza di mappa e possiamo rappresentarlo come una funzione. inconclusiva Il lod score è max a FR= 0. Se si ottiene una curva come la 1 c’è chiara evidenza di associazione stretta associazione. 1 2 Se si ottiene una curva come la 2 c’è evidenza di associazione, ed il valore di Z punta ad un massimo alla distanza fra i marcatori più probabile. Se si ottiene una curva come la 3, l’associazione è esclusa per le distanze che rendono Z inferiore a -2. 4 3 Esclusione di associazione per distanze inferiori a 10 um Se ottenete una curva come la 4, cioè con i valori di Z compresi fra -2 e 3, l’analisi è inconclusiva. Al valore di FR = 0.5, il valore del LOD SCORE si azzera sempre. Linkage analysis with a biochemical marker (ABO system and Nailpatella syndrome) Totale individui analizzati = 18 Presunti Ricombinanti = 3 Parentali = 15 FR = 3/18 = 0.16 presunta distanza 16 cM Z = log10[ (1-FR)P (FR)R / (1/2)Totale ] Z = log10[ (1-0.16)15 (0.16)3 / (1/2)18 ] Z= 18 log10 2 + 15 log10 (0.84) + 3 log10 (0.16) Z= 18 x 0.30 + 15 (- 0.075) + 3 (- 0.79) Z = 5.4 – 1.125 – 2.37 = 1.9 (è il valore di Lod Score alla distanza di 16 um) Linkage analysis with a DNA marker (Neurofibromatosi and a RFLP located on chrmosome 17) http://www.orpha.net Sindrome di Sjogren unknown Sindrome cat-eye duplicazione invertita del 22 Sindrome “buccia di mela” unknown ……………………………….. Vision problems Gut atresia Linkage analysis is much more efficient and accurate if data from more than 2 loci are analyzed simultaneously (Multipoint linkage analysis) Disease-marker mapping • Starting point: • a lod score value from a 2-point (markers) lod score analysis showing that the disease maps near one particular genetic marker. • A marker map locating this marker within a framework of other polymorfic markers. The final aim is to locate the “disease gene” in one of the intervals of the marker map. • “marker-marker” mapping usato per costruire reti di marcatori per la correlazione di mappe fisiche e genetiche. • “disease-marker” malattia mapping per localizzare geni Multipoint linkage analysis: - useful to establish the chromosomal order of a set of linked loci - useful to overcome problems caused by the limited informativeness of markers La curva indica le posizioni di mappa del gene malattia più verosimili. I valori più elevati dei picchi di LOD SCORE rispetto ad una serie di marcatori indicano la localizzazione più probabile del gene rispetto ad essi. Valori di lod score inferiori a -2 ci escludono la regione come potenziale sito di localizzazione del gene malattia. L’analisi di linkage “multipoint” marker-marker non soffre della necessità di dover reperire necessariamente molte famiglie informative in cui segreghi la malattia. Le famiglie CEPH hanno strutture ideali per l’analisi di linkage e sono raccolte in una bio-banca: - tre generazioni - genitori e nonni disponibili - almeno otto individui nella progenie - Sample mixing e non-paternità sono state ampiamente verificate Nel laboratorio si assegna la regione cromosomica del gene ignoto mediante una sonda e una tecnica di localizzazione fisica Identificata la regione candidata si analizzano i DNA di individui appartenenti alle famiglie CEPH che presentano ricombinazione in quella regione. La mappatura “Multipoint” colloca il gene in una posizione precisa nel reticolo di marcatori polimorfici. TAPPE DEL CLONAGGIO POSIZIONALE 1 TAPPA associazione tra fenotipo e regione del genoma 2 TAPPA I marcatori genetici polimorfici che mappano in quella regione vengono analizzati per identificare quelli che mostrano una elevata associazione con il fenotipo malattia (lod score superiore a 3) 3 TAPPA Si cerca di restringere la regione a un intervallo di 2-1 cM o meno che corrisponde al massimo a 2-1 Megabasi. 4 TAPPA Si identificano tutte le “open reading frames” presenti in quella regione. 5 TAPPA Nei soggetti affetti dalla malattia, si esegue l’analisi mutazionale nelle “open reading frame” e sequenze regolative associate per identificare il gene appartenente alla regione genomica identificata che presenta mutazioni 4 TAPPA Genomica funzionale: verifica in vivo attraverso la modificazione del fenotipo in modelli animali transgenici (knock out, knock-in, overexpressione) END OF TOPIC