SELEZIONE ASSISTITA CON MARCATORI MOLECOLARI
Che cosa è un marcatore genetico?
E’ un fenotipo (una qualsiasi caratteristica morfologica) strettamente associato al
carattere di interesse, che consente di selezionare piante che portino il carattere di
interesse
Un esempio di marcatore genetico: colore
dell’ipocotile e maschio-sterilità in girasole
t
ms
X
t
ms
Ms
ms
T
t
Le piante maschiosterili hanno
ipocotile verde chiaro, quelle maschio
fertili hanno ipocotile rosso
t
Ms
ms
Ms
T
1 cM
ms
50%
t
ms
T
t
50%
Che cosa sono i marcatori molecolari?
Un marcatore molecolare è una sequenza di
DNA o una proteina facilmente
analizzabile, la cui eredità da una
generazione all’altra possa essere
monitorata. Un pattern di marcatori
molecolari è un vero e proprio “fenotipo”
Perché sono necessari i marcatori
molecolari?
I fattori ambientali possono influenzare le
caratteristiche morfologiche
I marcatori molecolari sono espressione diretta
del materiale genetico e consentono di valutare
le variazioni genetiche
I marcatori molecolari possono essere usati per:
misurare la diversità genetica
mappature genetiche
selezione di germoplasma in programmi di miglioramento genetico
Polimorfismo delle proteine:
Polimorfismo del DNA:
proteine di riserva del seme
isoenzimi
nucleare
citoplasmatico
Caratteristiche desiderabili di un marcatore molecolare
Polimorfico
A eredità codominante
Che copre tutto il genoma
Facile, veloce ed economico da studiare
Riproducibile
Trasferibile ad altri genotipi della stessa specie
Nessun singolo
marcatore
risponde a tutte
queste
caratteristiche
Esempio di codominanza: superossido dismutasi di girasole
MARCATORI MOLECOLARI (a DNA)
Basati sull’amplificazione
mediante PCR
Basati su enzimi di restrizione,
Southern blot e ibridazione
AFLP
SNP
MARCATORI BASATI SUGLI RFLP
Gli RFLP esaminano differenze nella taglia di specifici frammenti di restrizione del
DNA; consentono di osservare variazioni anche minime della sequenza del DNA;
le variazioni sono ereditate come caratteri mendeliani e possono quindi funzionare
come marcatori genetici, anche di caratteri quantitativi. Si realizzano (di solito) sul
DNA genomico totale. Richiedono DNA purificato, ad alto peso molecolare.
Metodologia:
tagliare il DNA in frammenti
separarli per elettroforesi su gel
trasferirli su membrana
Differenze nei pattern di restrizione a seconda dell’enzima usato
Differenze di sequenza evidenziate da un enzima di restrizione
1
2
3
4
5
6
MARCATORI BASATI SULLA PCR
La “polymerase chain reaction” serve per amplificare specifiche sequenze
di DNA utilizzando cambiamenti ciclici delle temperature di reazione:
94°C per la denaturazione
55°C per l’appaiamento (annealing) dell’oligonucleotide (primer)
72°C per la sintesi (extension) del DNA con l’uso della Taq Polymerase
Ad ogni ciclo raddoppia
il numero di frammenti
prodotti
Dopo l’elettroforesi, il numero delle bande ottenibili in un individuo dipende dal tipo di primer:
1) Aspecifici
Es.: R.A.P.D.
(primer lunghi 1015 nt, aspecifici)
2) Specifici (si legano ad una sequenza nota, specifica, del genoma)
[lunghezza > di 18 nt]:
2a) specifici per sequenze ripetute (es. retrotrasposoni) 
2b) specifici per sequenze a singola copia (es. geni) 
multilocus (il numero di
bande dipende dal
numero di ripetizioni nel
genoma)
single locus (danno 1 banda
negli omozigoti e due negli
eterozigoti [per la lunghezza
del frammento])
MARCATORI SINGLE LOCUS: MICROSATELLITI
-Microsatelliti (simple sequence repeats = SSR):
utilizzano primers progettati su sequenze fiancheggianti i microsatelliti
evidenziano variazioni di lunghezza dei microsatelliti (o assenza dei primers)
ACGTCTGCTAATCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCGGGTCTGGA
ACGTCTGCTAATCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCGGGTCTGGA
ACGTCTGCTAATCTCTCTCTCTCTCTCTCTCTCTCGGGTCTGGA
Ind.#1 100101
Ind.#2 011011
Ferogrammi relativi alle lunghezze dei loci VVMD6, VVMD17,
VVMD21 VVMD24 di tre genotipi di vite: Chianti 2000/1, Nielluccio
189 e V. champini.
Lunghezze dei frammenti di DNA amplificati (in bp) con 10 microsatelliti in 22 accessioni di vite; per ogni locus è
stato riportato il valore relativo ai due alleli. Dove non è stato riportato nessun valore, le coppie di primers non hanno
dato nessun prodotto di amplificazione.
AFLP (Amplified-Fragment-Lenght-Polymorphism)
Una combinazione di RFLP e PCR
Procedura:
1)digestione con enzimi di restrizione
2)attacco alle estremità dei frammenti di adattatori per l’enzima usato +
sequenza specifica
3)PCR con primers omologhi alla sequenza specifica
MARCATORI SNP
I marcatori molecolari possono essere trattati come geni mendeliani
(es. F2 di un diibrido)
… e utilizzati per fare mappe genetiche
Mappa genetica-citologica-molecolare di
Medicago truncatula
MARKER ASSISTED SELECTION (MAS) PER CARATTERI
QUANTITATIVI
I caratteri quantitativi sono determinati da componenti genetiche ed ambientali. Il
fenotipo può essere molto “distante”da quelle che sono le sue componenti
genetiche.
La selezione è basata su metodi biometrici (medie e varianze) e spesso non può
stimare con precisione sufficiente le componenti genetiche.
Con i marcatori molecolari si può cercare di ricondurre i caratteri quantitativi a
caratteri (quasi) qualitativi, facilitando così la selezione.
Q.T.L. = quantitative trait locus
“locus controlling part of the phenotypic variation of a quantitative trait”
(Gelderman, 1975)
I QTL sono loci (posizioni) sul cromosoma che individuano le sequenze
coinvolte nella determinazione di caratteri quantitativi, NON
NECESSARIAMENTE codificanti prodotti genici precisi.
Questi loci possono individuare regioni cromosomiche in cui si hanno:
1) Geni maggiori, che hanno particolare importanza nella determinazione del
carattere
2) Gruppi di geni coinvolti nello stesso carattere quantitativo e strettamente
vicini sul cromosoma
Il QTL è una sequenza di DNA che identifica la posizione del carattere
quantitativo in virtù della sua ASSOCIAZIONE (più o meno stretta) a geni che
controllano quel carattere.
In questo senso, può essere costituita da DNA genico, codificante, o anche non
codificante (che individua segmenti intergenici).
UN QTL ANTE LITTERAM
Sax K. (1923) The association of size differences with seed-coat pattern and
pigmentation in Phaseolus vulgaris.
Gli individui vengono misurati per il carattere quantitativo: il QTL viene
evidenziato se si osserva una differenza significativa tra le medie fenotipiche
delle sottopopolazioni x, y e z  LD (Linkage Disequilibrium)
A LIVELLO MOLECOLARE:
Se dalla F2 faccio una serie di autofecondazioni, alla fine raggiungerò in tutti
gli individui l’omozigosi, con questi quattro possibili genotipi:
RECOMBINANT INBRED LINES (R.I.L.)
A = alta
B = bassa
A
B
A
B
B
A
A
B
A
A
A
Esempio: Single Marker Analysis
(SMA) - ANOVA
1) Individui divisi in due classi genotipiche per tutti i marcatori disponibili (Aa vs aa)
2) ANOVA o t-test per vedere se le medie fenotipiche sono diverse (ipotesi H0:
µaa) - differenza = (µAa – µaa) (1-2r)
3) Effetto come semplice differenza delle medie:
d = µAa – µaa
yij = µ + αi + Eij
Dove:
yij: valore fenotipico dell’individuo j per la classe genotipica i
µ: media fenotipica
αi : effetto del locus marcatore di genotipo i (che può essere scomposto in effetto
additivo e di dominanza)
Eij: variabile residuale
µAa =
dove:
M: marcatore (fattore)
E: fattore residuale
ni: numero di individui di genotipo i (j = 1,2,…, ni)
g: numero di genotipi possibili
N: numero totale di individui della discendenza
Il valore di questo rapporto viene confrontato con i
valori soglia della distribuzione F per (g-1) e (N-g) gradi
di libertà e un rischio α (corretto secondo Bonferroni)
PEV (proporzione della varianza fenotipica
dovuta a quel particolare QTL)
LOD (z) = log10 del rapporto di verosimiglianza tra l’ipotesi di presenza di un QTL
in una posizione z e quella di assenza del QTL
sono le stime di massima verosimiglianza sotto l’ipotesi di un solo
QTL nella posizione z
Nel caso di assenza di QTL, i fenotipi sono indipendenti con
distribuzione identica N(µ, )
Come si stabilisce la
soglia di LOD? Ad ogni
valore di LOD dobbiamo
associare un rischio α (o
“p-value”) che ci dia
un’idea della significatività statistica del QTL (in
genere al 5% di ogni
esperimento)
Quali dati si ottengono da una mappatura di QTL?
1) Numero e posizione dei QTL: quanti QTL controllano il carattere e
dove sono
2) Livello di significatività e intervallo di confidenza sulla posizione
di ognuno di essi
3) Effetto positivo o negativo sul fenotipo (cioè se la sostituzione
allelica fa aumentare o diminuire il valore del fenotipo)
4) Effetto sul fenotipo: PEV (proporzione della varianza fenotipica
dovuta a quel particolare QTL)
5) Effetti epistatici (interazione fra QTL e pleiotropia)
“Genome-scan”: il test di LOD viene ripetuto su tutto il genoma
Risultato di una mappatura di un QTL
Dai marcatori molecolari indeterminati si può passare a marcatori basati sui geni e
infine agli SNP (Single Nucleotide Polymorphisms) per ottenere i QTN (Quantitative
Trait Nucleotides)
I caratteri complessi vengono scomposti nei singoli fattori mendeliani che li determinano
Esempi di QTL correlati con geni nelle piante (Paran e Zamir, 2003)
Un esempio di QTL (resistenza al freddo in orzo)
Map positions of some dehydrin genes
in barley. Traditional barley
chromosome designations are shown in
parentheses below the Triticeae
genome designations. The map
positions of genes detected by
Himalaya probes dhn1 through dhn6
are indicated. Loci detected by dhn1
and dhn2 (red bar) on linkage group
5H are within the 99% confidence
interval (yellow box) of a QTL
contributing to winterhardiness,
photoperiod response, and heading
date in a number of studies (Pan et al.,
1994). This region of the group 5
chromosomes also houses the barley
Sh2 locus, which is a determinant of
winter or spring growth habit.
A cosa può corrispondere un QTL - Il locus tb1 di mais
Doebley et al. (1997): il mais è molto diverso morfologicamente dal teosinte (Zea mays ssp.
parviglumis, o Zea mays ssp. mexicana, suo progenitore selvatico) ma è molto simile nella struttura
dei geni nei cromosomi e nelle sequenze nucleotidiche ed è perfettamente incrociabile con il teosinte.
Si suppone quindi che il mais si sia originato dal teosinte per mutazione in 5 loci maggiori, fra cui:
gene tga1 su cromosoma 4 - gene tb1 su cromosoma 1
(a) pianta di teosinte (Zea mays ssp mexicana) con
una branca laterale primaria (b) mostrante fiori
maschili terminali (T) e sete (S) che emergono dalle
foglie che avvolgono la pannocchia. (c) pianta di
mais selvatico, infiorescenza femminile laterale
selvatica (d). Una pianta mutante di tipo tb1(e) con
le branche laterali che portano anch’esse i fiori
maschili, ma non la spiga femminile (f)
Il locus tb1 di mais
È stato accertato che l’effetto fenotipico del gene tb1 (teosinte branched 1) su diversi
caratteri della spiga dipende soprattutto da una regione cis regolatoria a monte di oltre
60 Kb, diverse nelle varie linee anche per la presenza di elementi retrotrasponibili.
Il locus tb1 di mais. Linee di
introgressione di teosinte in
mais con diversa struttura nel
locus tb1. Aspetti della
sequenza sono indicati in
alto; gli effetti
dell’introgressione sono
indicati a destra. La regione
critica che influenza il
branching basale e alcuni
caratteri della spiga è
indicata al centro con la
colonna in grigio (Clark et
al. 2006).
QTL di resistenza a lepidotteri in mais
Putative chromosomal cluster
containing quantitative trait loci
(blue ovals) involved in corn borer
resistance of temperate and tropical
maize with genes involved in cell
wall fortification.
RIASSUMENDO:
Cosa occorre per fare una mappatura di un QTL:
1) Popolazioni derivate da incroci controllati
(F2, BC, RIL, NIL e altre)
2) Mappa di associazione
3) Indice fisiologico, biochimico ecc., espressione del carattere
quantitativo di interesse da misurare in ogni individuo della progenie
dell’incrocio controllato
4) Analisi statistiche: a) per la ricerca di marcatori molecolari legati
geneticamente a QTL per il carattere quantitativo analizzato; b) per la
stima dei parametri genetici dei QTL individuati
Quanto deve essere “accurato” un QTL? Cioè, quanto deve essere stretta la sua
associazione al carattere?
Linkage disequilibrium in funzione dell’età della popolazione o della specie
A seconda del livello di linkage disequilibrium possiamo identificare i QTL con
dei marcatori molecolari oppure è necessario analizzare dei geni “candidati”
Approccio dei geni candidati
Identificazione di geni candidati
CGs
Screening dei geni candidati mediante:
a) Studi di associazione in popolazioni naturali tra polimorfismi del GC
e variabilità del carattere
b) Analisi della co-segregazione con eventuali QTL che controllano
parte della variabilità del carattere
Verifica dei geni candidati mediante mappature comparative, analisi
fisiologiche e (se possibile) trasformazione.