Sommario Diversità genetica a livello di sequenza Trovare gli SNP Genotipizzare gli SNP Principali applicazioni SNP: definizioni Polimorfismo al singolo nucleotide, in genere si intende la sostituzione di una base – alcuni autori includono anche i polimorfismi di inserzione/ delezione di una base. Più frequente tipo di variazione genetica Per lo più bi-allelici, a causa della loro dipendenza dal tasso di mutazione spontanea nella specie (nel range di 1 x 10-6 per generazione). Parametri che quantificano la frequenza e l’informatività degli SNP: S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile nelle altre specie e nelle colture agrarie) MAF (minor allele frequency = frequenza dell’allele minore): l’informatività di uno SNP è funzione di quanto siano bilanciate le frequenze dei due alleli nella popolazione, idealmente, con p (frequenza di un allele) + q (frequenza dell’altro allele) = 1, p = q = 0.5. SNP Da: Wikipedia Frequenza degli SNP nelle piante Specie Frequenza (S) References Orzo 1 / 108-200 Rolstocks et al., 2005; Kota et al., 2008 Mais 1 / 43-61 Ching et al., 2002; Jones et al., 2009 Riso (indica) Riso (japonica) Frumento Melo Arabidopsis Uomo 1 / 270 Han and Xue, 2003 1 / 5,700 Yamamoto et al., 2010 1 / 335-540 Somers et al. 2003; Ravel et al. 2006 1 / 52 Micheletti et al. submitted 1 / 336 Schmid et al 2003 1 / 100-500 Sachidanandam et al 2001 Mappaggio per associazione Basi del mappaggio per associazione Ricerca di una correlazione statistica tra marcatori e fenotipo utilizzando una collezione di individui non strettamente collegati da pedigree (es. collezioni di germoplasma) Utilizzo il residuo linkage disequilibrium (LD) tra marcatore e gene che controlla il fenotipo L’effettivo livello di verificato empiricamente LD deve essere Linkage disequilibrium (disequilibrio di associazione) Due alleli a loci diversi in una popolazione sono in linkage disequilibrium (LD) quando sono presenti in un inividuo piu’ frequentamente di quanto atteso su base casuale Associazione non bilanciata e non independente tra varianti alleliche a due loci nell’ambito di una popolazione. Aplotipo: la combinazione di alleli a loci limitrofi (associati) presenti su un singolo cromosoma Parentale A Aplotipo A 1 2 alto 3 Parentale B Aplotipo B 4 1 1 2 2 3 3 4 4 Meiosis 1 LD 1 2 3 4 Nuovi Meiosis 2 Meiosis 3 basso aplotipi Approcci di mappaggio per associazione Figura 20.61 Basi teoriche del mappaggio genetico per associazione: (A) l’approccio basato sulla scansione di un genoma consiste nel genotipizzare ad un certo numero di loci gli individui di una popolazione al fine di correlare i polimorfismi o gli aplotipi di specifici geni con i fenotipi; (B) Organizzazione dei blocchi aplotipici nei cromosomi in relazione alla ubicazione dei geni e delle regioni ad elevata ricombinazione (hot spots) (modificata da: Rafalski e Morgante, 2003). - Il disequilibrio da associazione (LD) tra marcatori, geni e caratteri viene utilizzato per mappare i fattori genetici che controllano: - Caratteri mendeliani - Caratteri quantitativi Linkage disequilibrium e risoluzione genetica LD elevato LD basso • Richiede meno marcatori • Richiede molti marcatori • Scarsa risoluzione di mappa • Elevata risoluzione di mappa • Ideale per una ricerca sull’intero genoma • Ideale per l’approccio del “gene candiato” Mod. from Rafalski A., 2002, Curr Opin Plant LD nelle piante LD varia molto tra specie, entro specie ed a seconda della regione cromosomica LD (r2) decay over bp in six maize genes (Wilson et al. 2004 Plant Cell) • Mais: da 2 kb (collezione di vecchie razze locali) fino a 600 kb (collezioni di linee elite moderne) • Arabidopsis: da 100 kb fino ad alcuni cM • Riso: fino a100 kb nel riso coltivato • Orzo: >200 kb nel materiale elite Livelli di LD in specie diverse Tabella 20.17 Linkage disequilibrium (LD) in alcuni organismi in relazione a distanza genetica (cM) o fisica (kb). Barcaccia e Falcinelli, vol III, pag 1016. Buckler and Thornsberry, 2002, Current Opinion in Plant Biology QTL mapping and cloning strategies Linkage mapping (biparental) QTL coarse mapping Resolution Association mapping (set of accessions) 10-20 cM genome-wide (high LD panel) Near isogenic lines (NILs) Positional cloning candidate gene (low LD panel) 1-100 kb Candidate gene validation Gli SNP sono ampiamente utilizzati nello studio del linkage disequilibrium a livello genomico Linkage disequillibrium across the maize 10 chromosomes measured with 914 SNPs on 632 inbred lines. Only SNPs with a minor allele frequency greater than 0.05 are shown (Yan et al 2009 PLoS ONE 4(12): e8451). Genotipizzazione ad alta densità del genoma per analisi di associazione (Genome-Wide Association Mapping) • 8,590 SNPs • 553 linee pure di mais • Fenotipo: contenuto di acido oleico nell’embrione Massima associazione tra SNP e fenotipo in corrispondenza del gene candidato Fad2 (Fatty acid desature) Belò et al, MGG 2008