Marcatori
molecolari:
applicazioni
Dott.ssa Marica Soattin
Marcatori Molecolari
Strumenti affidabili ed efficaci per la l’analisi della struttura dei
genomi e del polimorfismo genico negli animali
Struttura genetica delle popolazioni e
flusso genico tra le popolazioni
Mappaggio di QTL e geni da
impiegare nella MAS
Multi-locus: AFLP (M-AFLP and S-SAP)
Single-locus: SSR and SNP
Studio struttura genetica delle popolazioni
I dati raccolti con i marcatori molecolari impiegati su una determinata
popolazione possono essere utilizzati per analizzare la struttura
genetica degli individui costituenti la popolazione
Indici di:
Diversità
genetica
Similarità
genetica
Calcolo
frequenze
alleliche
Fingerprints
Struttura popolazioni naturali
Le popolazioni naturali possono essere considerate come un insieme di
sottopopolazioni distribuite in una determinata area geografica e tra
loro parzialmente isolate dal punto di vista riproduttivo
risultato
Aumento dell’inbreeding con conseguente aumento
dell’omozigosi
misura
L’effetto sulla struttura genetica delle popolazioni può essere misurato
in termini di diminuzione delle frequenze degli eterozigoti
Calcolo frequenze alleliche
9 Marcatori co-dominanti
D=f a a
1 1
R=f a a
2 2
H=f a a
1 2
Conteggio diretto degli alleli
pa =(D+½H)
1
qa =1–p a =(R+½H)
1
2
9 Marcatori dominanti
pa =1–√(1-f b)
Assumere che la pop è in HW eq
1
f b =f a1a1+f a1a0
(1-f b)=f a0a0
pa =1–√(1-f b)
0
Le freq alleliche così ottenute possono essere usate per calcolare…..
Barcaccia & Falcinelli 2007 Volume III
Statistiche di diversità genetica: coefficiente di eterozigosità
Coefficienti di diversità genetica
HS
HS
HI
FST
HI
FIS
FIT
HT
HI
Eterozigosità media degli
individui nelle sottopop.
HS=1–Σpi2
Eterozigosità attesa nella
sottopolazione
HT=1–Σp–i2
Eterozigosità attesa nella pop
complessiva
Genetic distance (Nei,1978)
GDij=
–ln Σpipj
√Σpi2Σpj2
Barcaccia & Falcinelli 2007 Volume III
Statistiche di diversità genetica: coefficiente di inbreeding
Statistiche di Wright (1965)
–
HS–HI
FIS=
–
HS
Inbreeding degli individui rispetto alla sottopopolazione
HT–HI
FIT=
HT
Inbreeding degli individui rispetto alla popolazione totale
HT–HS
FST=
HT
Riduzione di eterozigosi di una sottopolazione rispetto
alla pop tot (Indice di fissazione per marcatori
dominanti)
–
Statistics of Nei (1973)
FST> = 0
(Differentiation degrees)
–
DST= HT–HS
DST
GST=
HT
Indice di fissazione per marcatori co-dominanti
Barcaccia & Falcinelli 2007 Volume III
Similarità e dissimilarità genetica
Tiene conto dell’insieme di marcatori raccolti nel campione che vengono
utilizzati per costruire matrici di similarità genetica calcolando i coeff.
relativi in tutte le combinazioni a coppia tra tutti gli animali
GSij=1
i
j
+
–
+
a
b
–
c
d
a
(a+b+c)
2a
GSij=
(2a+b+c)
2a
GSij=
(a+b)+(a+c)
a+d
GSij=
(a+d)+(b+c)
GSij=
GDij= 1–SGij
GSij=0,5
GSij=0
Jaccard (1908)
Dice (1945)
Nei and Li (1978)
Rohlf (1993)
Barcaccia & Falcinelli 2007 Volume III
Analisi di raggruppamento
Le matrici dei coefficienti di similarità e diversità genetica, calcolate a
partire dai polimorfismi molecolari,
possono essere impiegate per
costruire dendrogrammi e definire centroidi allo scopo di mettere in
evidenza le relazioni genetiche tra individui di pop naturali o sperimentali
appartenenti alla stessa specie
A1
A15
A19
A6
A4
A21
A22
A18
A7
A25
A28
A30
5
22
36
P9
B4
B18
B8
B12
B7
B5
B19
B14
B16
B6
B26
P7
B28
BR2
P1
P25
P6
P11
P20
15
27
P15
P18
P17
P33
2
3
17
43
18
39
13
P26
C4
C11
C29
C8
C14
C9
C26
C13
C15
C24
C21
C18
D9
D15
D5
D20
D4
D10
D17
D29
D7
D30
D27
D28
BR1
BR3
BR4
BR5
BR22
BR23
BR6
BR11
BR13
BR26
BR12
BR11
0.40
0.50
0.60
0.70
Similarità genetica di Dice
0.80
0.90
1.00
Dendrogramma
ottenuto attraverso
il metodo UPGMA
Applicazioni dei marcatori molecolari
Marker-assisted selection (MAS)
La selezione degli individui viene fatta sulla base della
presenza di un marcatore strettamente associato al gene o
QTL che controlla il carattere oggetto di selezione
La selezione genetica avviene ad uno stadio più precoce rendendo
così la procedura di valutazione molto più rapida con riduzione di
tempi e costi (performance test)
Esempio di applicazione dei marcatori molecolari
FB4
E4
Marcatore I-SSR331150 co-segregante con il colore del fiore
F1
QTL (Quantitative Trait Loci)
Uno dei loci o dei segmenti cromosomici dove risiedono i geni che
controllano l’espressione di un determinato carattere quantitativo
Un QTL può essere visto come un blocco cromosomico in grado
di controllare più caratteri quantitativi
La rilevazione dei QTL dipende dalla presenza di mappe
genetiche altamente sature e da osservazioni delle variazioni
fenotipiche per i caratteri agronomici di interesse
Costruite stimando le distanze reciproche di un numero molto
grande di marcatori stabilendo così la loro posizione reciproca
lungo il cromosoma (gruppo di associazione)
Per realizzare programmi di MAS è prima
necessario identificare marcatori molecolari o
geni associati a caratteri di interesse zootecnico
Mappaggio di caratteri mendeliani e QTLs
• Analisi di segregazione in popolazioni sperimentali
E’ possibile analizzare la co-segregazione
del carattere “mendelizzato” con il tratto
cromosomico identificato da un marcatore
molecolare
Barcaccia & Falcinelli 2007 Volume III
Mappaggio di caratteri mendeliani e QTLs
• Analisi del linkage disequilibrium in popolazioni naturali
La variabilità è dovuta al verificarsi di numerosi
eventi di scambio nelle regioni ad elevata
ricombinazione nei cromosomi
L’analisi degli eventi di ricombinazione è basata
sulla valutazione delle combinazioni degli alleli
di loci di uno o più cromosomi (aplotipi)
Barcaccia & Falcinelli 2007 Volume III
Applicazioni dei marcatori nel settore
zootecnico
•
Costruzione di mappe genetiche e fisiche
•
Mappaggio di geni utili
•
Mappaggio di QTL
•
Diagnosi di anomalie genetiche
•
Analisi di paternità
•
Stima della consanguineità e ausilio ai piani di
accoppiamento
•
Tracciabilità dei prodotti
•
Studi su filogenesi, variabilità genetica, struttura e
dinamica di specie e popolazioni
Chapter 2
Genomic DNA fingerprinting of chicken (Gallus gallus L.)
indigenous breeds with M-AFLP and S-SAP markers
designed on interspersed repeats
Chicken local breeds
Few highly specialized broilers have replaced local breeds
53 local breeds
61% are extinguished, 13% are threatened
6.7%
are preserved by specific conservation programs!
Local breeds conservation and valorization programs are essential
because:
Irreplaceable source of useful genes for rusticity,
adaptability and resistance to diseases
Increasing consumer interest due to social, historical
and economical reasons and to the perception that
autochthonous breeds are healthy and natural
Chicken genome organization
1200 Mbp
38 pairs of autosomes and 2 sex chr
5 macro-chromosomes
5 intermediate-chromosomes
28 micro-chromosomes
15% repetitive DNA fraction
Short tandem repeats
Long interspersed repeats
CR1 Chicken Repeat 1
Macro-chromosomes
Micro-chromosomes
Nanda et al. (2002)
Coullin et al. (2005)
Main objectives of the research
9Development
of an innovative molecular system of
population genomics for chicken DNA fingerprinting
based on the analysis of repetitive sequence families
(mini- and microsatellite)
9Cloning of breed-discriminant or breed-specific STS
molecular markers
Ermellinata
di Rovigo
Pépoi
2000 ind
Robusta
lionata
Robusta
maculata
Polverara Padovana
1500 ind
Methods: AFLP derived-markers
Genomic DNA fingerprints were generated in a sample representing the six
indigenous breeds and one broiler
S-SAP:
SAP Sequence-Specific Amplification Polymorphism (Minisatellite)
M-AFLP:
AFLP Microsatellite-Amplified Fragment Length Polymorphism
AFLP
Enzyme Eco-RI
Enzyme Taq-I
Adaptor-Eco
SSR- and CR1-anchored primers
Adaptor-Taq
Primer-Eco+NNN
Primer-Taq+NNN
S-SAP
Adaptor-Eco Minisatellite CR1
Primer-CR1
Adaptor-Taq
TG/CA repeat
M-AFLP
AGC/GCT repeat
SSR-specific primers
anchored at 3’ or 5’ end of
the repeat
Primer-Taq
S-SAP
M-AFLP
Adaptor-Eco
Microsatellite (AGC)n
Primer I-SSR
Adaptor-Taq
CR1-specific primers
designed on 3’ and 5’
regions of the element
Primer-Taq
CR1rev
CR1int
CR1for
M-AFLP and S-SAP fingerprints
AGC microsatellite
anchored
M-AFLP
Population genetics
study
CR1-internal
core
S-SAP
Selection and sequencing of polymorphic
breed-discriminant and breed-specific markers
Genetic relationships among local breeds and commercial
broiler based upon M-AFLP and S-SAP polymorphisms
M-AFLP
HT
HS
FST
M-AFLP
0.334 0.162 0.515
S-SAP
0.381 0.232 0.391
HT: Nei’s total genetic diversity
HS: Mean genetic diversity within single breeds
S-SAP
FST: fixation index
Mean Dice’s genetic similarity coefficients
within and between local breeds were 0.769
and 0.581, respectively
Chicken genome retrievals
Clone
Chr.
Accession
No.
Locus ID
Type
Gene product
#37
1
EF417921
NW 001471534 Intergenic
5’ Hypothetical protein – 3’ monoamine oxidase
B
#38
15
EF417922
NW 001471459
Genic
Hypothetical protein
#39
3
EF417923
NW 001471677
Genic
Acetyl-CoA Synthetase 2
#40
2
EF417924
NW 001471654 Intergenic 5’ Syntrophin beta 1 – 3’ Hyaluronan synthase 2
#42
3
EF417925
NW 001471671
#44
2
EF417926
NW 001471639 Intergenic
5’ hypothetical protein – 3’ Neuropilin- and
tolloid-like protein 1
#48
4
EF417927
NW 001471687
Genic
Fibroblast growth factor receptor-like 1
#50
1
EF417928
NW 001471525
Genic
Hypothetical protein
#51
26
EF417929
NW 001471609
Genic
Potassium voltage-gated channel, Shal-related
subfamily
#52
1
EF417930
NW 001471534
Genic
Interferon alpha/beta/omega receptor 1
#55
9
EF417931
NW 001471743 Intergenic
5’ Cek6 protein – 3’ Alpha-1,4-Nacetylglucosaminyltransferase
#56
17
EF417932
NW 001471503
Hypothetical protein
Genic
Genic
Sorting nexin 14
SCAR markers
Acrylamide blot
Breed-specific or -polymorphic
markers from M-AFLP or S-SAP
experiment
Isolation and purification of interesting fragments
Amplification and electrophoresis
Sequencing of amplified fragment and primer design
Specific-locus amplification and electrophoresis analysis of SCAR marker
SCAR molecular markers set up
The upper (333 bp) marker was
shared among the vast majority of
individuals over all local breeds.
#38
The lower (307 pb) marker
was detected only in the
Polverara individuals with a
relative frequency of 52%
#52
#55
No other discriminating SCAR
markers were detectable
Specific-clone sequencing and
SNP discover
Haplotypes definition
Breed
Clone # 38
Clone #39
Clone #50
67
251
189
191
C/T (A)
A
C
T
-
Padovana
C/T
A
C
T
Pepòi
C/T
A/C
T
Polverara
C/T
A/C
Rob. Lionata
C or C/T
Rob. Maculata
Ermellinata
Broiler
312
51
70
96
-
-
A
C
T
C
G
G
A
C
T
C
T
A
A
C
G
C
-
-
C
A
A
A
C
T
A
C
T
C
A
A
A
C
T
C or C/T
A
C
T
C
A
A
C
C
T
C/T (A)
A
C
T
C
G
A
C
C
T
Forward SNP site-specific
primer was designed with
its discriminant 3′-end in
the point mutation position
23 223
Clone #56
Conclusions
9S-SAP and M-AFLP marker systems were shown to
be suitable to produce informative fingerprints and
polymorphisms within/among local breeds and the broiler
9SCAR markers: not reliable for genetic
traceability because of SNPs undetectable by PCR
amplification (except for SCAR #38)
9SNP haplotypes: breed-specific and individual-
discriminant haplotypes were detected
9Breed-specific clones has shown homology with
genes implicated in metabolic processes
Chapter 4
Discovering of novel leptin gene-based SNPs and sequencetagged site genotyping of dairy sheep (Ovis aries L.)
populations
Australian Sheep
John and Elizabeth Macarthur are founders of the wool
industry in Australia
1797: dozen of Spanish merinos brought to Sydney from
South Africa
1807: beginning of trade for Australian wool industry
More than 80% of 100 millions of sheep is merino
Saxon merino
Spanish merino
Peppin merino
Awassi
South Aus Merino
(Goulburn)
Australian sheep
Wool
Meat
Milk
Many projects have been developing for mapping of QTL
associated with growth rate, body traits and milk composition
Australian Sheep Gene Mapping Web Site
http://rubens.its.unimelb.edu.au/~jillm/jill.htm
Sheep QTL database
Sheep comparative maps
Sheep and lactation
High pick milk:
animals are not able to consume adequate amounts of nutrients in the
first 3 weeks of lactation (NEGATIVE ENERGY BALANCE – NEB)
Flat lactation curve (=Persistent lactation)
- Animals less subjected to metabolic stress in early lactation
- More constant energy requirement throughout the lactation
More desirable
Sheep lactation curve features
Wood model (1967) is appropriate to explain the characteristics of the
sheep lactation curve (McGill, 2005)
Persistent lactation curve is
desirable because maintain a
positive EB and
consequently, a more
constant milk yield during
whole lactation
BCS, live-weight, NEFA, BHBA, leptin, protein, fat, lactose are used as
EB indicators.
Leptin physiology
- Small protein of 16 kDa
- Secreted by adipose tissue cells into the bloodstream
- Regulating food/feed intake and energy balance
- Regulating pituitary hormone secretion and hypothalamic- pituitary organ
interactions (adrenal, thyroid and gonads)
- Regulating body growth and development
- Involving reproductive function
- Function depending on OB-Receptor
Casanueva et al., 1999
Leptin gene
Structure characterized by Zhang et al., 1994.
It is located on HS-7, Bt-4, Oa-4
Gene structure is highly conserved across species
Mouse protein exhibits 83% homology with human leptin
Promoter
3 kb
Exon 1
Exon 2
Exon 3
33 bp
171 bp
360 bp
Intron 1
Intron 2
11 kb
1,7 kb
ATG
STOP
3’ UTR
Research goals
Leptin gene sequencing and SNP discovering using four
sires of the population Awassi x Merino (F1)
SNP-based genotyping exploiting both new and known
(Boucher et al., 2006) mutations on back-cross and double
back-cross ewe’s population
Evaluation of the correlation between genotypes/
haplotypes and some phenotypic traits
Experimental sheep population
SNP
detection
Genotyping
Heterologous primer design
3 kb
11 kb
33 bp
Promoter EX1
171 bp
1,7 kb
360 bp
EX2
In2
EX3
In1
Bos taurus
Homo sapiens
Sus scrofa
Sus scrofa
Ovis aries
Multi-alignment software: ClustalW and Workbench
Primer design software: Primer 3 and PerlPrimer
TOT ~ 9 kb
3’-UTR
Statistical analysis
Variance analysis to test if some correlations exist among identified
genotypes and different quantitative traits
Milking data
Lactation curve characteristics
Persistency (at 100, 80, 45 d)
Feed intake
Animal weight
Parity
Exp year (2005, 2006)
Leptin conc.
% Fat
% Protein
% Lactose
T max
Y max
Y tot
Optimization of PCR conditions
Promoter
EX1
In1
EX2
In2
EX33’UTR
Pr2
Pr3
Pr4
Pr5
Pr6
Pr/In1
In1/1
In1/2
In1/3
In1/4
Ex2
In 2b
In 2b
In 2c
Ex3
3’UTR
ID
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Reliability
*
-
-
-
*
*
-
*
-
*
*
*
*
*
*
*
Size (bp)
600
703
659
400
539
631
590
621
570
609
15
1
16
1
5
2
12
3
4
8
530
5
15
6
7
9
11 primer combinations out of 16
generated good amplification products
for a total of 6.452 bp
SNP detection
The sequencing of sire 463 revealed two SNPs (both G/A) at positions
G170A G332A of EXON III
Missense mutations Arg>Gly
Both SNPs introduce site mutation for Msp-I and
HpyCH4V restriction enzymes
PCR-RFLP
markers
Single PCR product obtained by
Leptin-specific primers
amplification
Exo-SAP purification
Sequencing of purified fragment
SNP detection
Restriction
enzyme site
identification
Digestion of amplyfication products and
electrophoresis analysis of PCR-RFLP
markers
PCR-RFLP experiment
The entire experiment has been carried out on ewes belonging
to back-cross and double back-cross populations
192 females of 4 families were investigated
Family n. 1
Grand Dam
Grand Sire
Sire
*
GG
Family n. 2
Grand Dam
Grand Sire
Sire
*
AG
Only (*) family n. 2 has shown animals AG beside GG at
position 170 of EXON III
Genotypes frequencies
Family
size
Genotypes
Genotype Frequency
Allele Frequency
GG
AG
GG
AG
G
A
1
103
101
2
0.98
0.02
0.99
0.01
2a
35
17
18
0.49
0.51
0.74
0.26
2b
63
31
32
0.49
0.51
0.75
0.25
3
32
32
0
1
0
1.00
0
4
22
21
1
0.95
0.05
0.98
0.02
Overall
255
192
202
171
53
21
0.79
0.89
0.21
0.11
0.90
0.95
0.10
0.05
Genotype
F obs
F exp
AA
0
2.8
AG
53
47.5
GG
202
204.8
Ҳ2= 3.43 n.s
Statistical analysis results
In progress!!
Summarizing…
Leptin gene has been sequenced for ~ 5,000 bp
The sequencing allowed to discover two SNPs G/A at positions
170 and 332 of EXON III (missense mutation Arg>Gly)
The three SNPs reported by Boucher et al. (2006) have not been
detected in the ewe’s awassi and merino population
G170A and G332A mutation introduces respectively a variation on
Msp-I and HpyCH4V restriction enzyme site allowing the easy
recognition of these polymorphisms by PCR-RFLP
Summarizing…
Because of their contiguity, two SNPs might be in LD
The SNP G170A has been used for genotyping of 192 (255) ewes
for which phenotypic data were available
SNP genotyping revealed AG and GG genotypes with a frequency
of around 50% in the family number 2 and 10% (20%) in the entire
population
The population was found to be in HW equilibrium and the
absence of AA genotype is not significantly deviating