Sommario
  Diversità
genetica a livello di sequenza
  Trovare gli SNP
  Genotipizzare gli SNP
  Principali applicazioni
SNP: definizioni
 
 
 
 
Polimorfismo al singolo nucleotide, in genere si intende la sostituzione di
una base – alcuni autori includono anche i polimorfismi di inserzione/
delezione di una base.
Più frequente tipo di variazione genetica
Per lo più bi-allelici, a causa della loro dipendenza dal tasso di mutazione
spontanea nella specie (nel range di 1 x 10-6 per generazione).
Parametri che quantificano la frequenza e l’informatività degli SNP:
  S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici)
lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile
nelle altre specie e nelle colture agrarie)
  MAF (minor allele frequency = frequenza dell’allele minore):
l’informatività di uno SNP è funzione di quanto siano bilanciate le
frequenze dei due alleli nella popolazione, idealmente, con p
  (frequenza di un allele) + q (frequenza dell’altro allele) = 1, p = q = 0.5.
SNP
Da: Wikipedia
Frequenza degli SNP nelle piante
Specie
Frequenza (S)
References
Orzo
1 / 108-200 Rolstocks et al., 2005; Kota et al., 2008
Mais
1 / 43-61 Ching et al., 2002; Jones et al., 2009
Riso (indica)
Riso (japonica)
Frumento
Melo
Arabidopsis
Uomo
1 / 270 Han and Xue, 2003
1 / 5,700 Yamamoto et al., 2010
1 / 335-540 Somers et al. 2003; Ravel et al. 2006
1 / 52 Micheletti et al. submitted
1 / 336 Schmid et al 2003
1 / 100-500 Sachidanandam et al 2001
Mappaggio per
associazione
Basi del mappaggio per associazione
 
Ricerca di una correlazione statistica tra
marcatori e fenotipo utilizzando una collezione
di
individui
non
strettamente
collegati
da pedigree (es. collezioni di germoplasma)
 
Utilizzo il residuo linkage disequilibrium
(LD) tra marcatore e gene che controlla il
fenotipo
 
L’effettivo
livello
di
verificato empiricamente
LD
deve
essere
Linkage disequilibrium (disequilibrio di associazione)
Due alleli a loci diversi in una popolazione sono in linkage
disequilibrium (LD) quando sono presenti in un inividuo piu’
frequentamente di quanto atteso su base casuale
Associazione non bilanciata e non independente tra varianti
alleliche a due loci nell’ambito di una popolazione.
Aplotipo: la combinazione di alleli a loci limitrofi (associati)
presenti su un singolo cromosoma
Parentale A
Aplotipo A
1
2
alto
3
Parentale B
Aplotipo B
4
1
1
2
2
3
3
4
4
Meiosis 1
LD
1
2
3
4
Nuovi
Meiosis 2
Meiosis 3
basso
aplotipi
Approcci di mappaggio per associazione
Figura 20.61
Basi teoriche del mappaggio
genetico per associazione:
(A) l’approccio basato sulla
scansione di un genoma consiste
nel genotipizzare ad
un certo numero di loci gli
individui di una popolazione al
fine di correlare
i polimorfismi o gli aplotipi di
specifici geni con i fenotipi;
(B) Organizzazione dei blocchi
aplotipici nei cromosomi in
relazione alla ubicazione dei
geni e delle regioni ad elevata
ricombinazione (hot spots)
(modificata da: Rafalski e
Morgante, 2003).
- Il disequilibrio da associazione (LD) tra marcatori, geni e
caratteri
viene utilizzato per mappare i fattori genetici che
controllano:
- Caratteri mendeliani
- Caratteri quantitativi
Linkage disequilibrium e risoluzione genetica
LD elevato
LD basso
• Richiede meno marcatori
• Richiede molti marcatori
• Scarsa risoluzione di mappa
• Elevata risoluzione di
mappa
• Ideale per una ricerca
sull’intero genoma
• Ideale per l’approccio del
“gene candiato”
Mod. from Rafalski A., 2002, Curr Opin Plant
LD nelle piante
  LD
varia molto tra specie, entro specie ed
a seconda della regione cromosomica
LD (r2) decay over bp in six maize genes
(Wilson et al. 2004 Plant Cell)
•  Mais: da 2 kb (collezione di
vecchie razze locali) fino a 600
kb (collezioni di linee elite
moderne)
• Arabidopsis: da 100 kb fino ad
alcuni cM
• Riso: fino a100 kb nel riso
coltivato
• Orzo: >200 kb nel materiale
elite
Livelli di LD in specie diverse
Tabella 20.17
Linkage disequilibrium (LD) in alcuni organismi
in relazione a distanza genetica (cM) o fisica (kb).
Barcaccia e Falcinelli, vol III, pag 1016.
Buckler and Thornsberry, 2002, Current Opinion in Plant Biology
QTL mapping and cloning strategies
Linkage mapping
(biparental)
QTL coarse
mapping
Resolution
Association mapping
(set of accessions)
10-20 cM
genome-wide
(high LD panel)
Near isogenic
lines (NILs)
Positional
cloning
candidate gene
(low LD panel)
1-100 kb
Candidate gene validation
Gli SNP sono ampiamente utilizzati nello studio del
linkage disequilibrium a livello genomico
Linkage disequillibrium across the maize 10 chromosomes measured with 914 SNPs
on 632 inbred lines. Only SNPs with a minor allele frequency greater than 0.05 are
shown (Yan et al 2009 PLoS ONE 4(12): e8451).
Genotipizzazione ad alta densità del genoma per analisi di
associazione (Genome-Wide Association Mapping)
•  8,590 SNPs
•  553 linee pure di
mais
•  Fenotipo:
contenuto di
acido oleico
nell’embrione
Massima associazione tra SNP e fenotipo in
corrispondenza del gene candidato Fad2 (Fatty acid
desature)
Belò et al, MGG 2008