UNIVERSITÀ DEGLI STUDI DI VERONA FACOLTÀ DI

UNIVERSITÀ DEGLI STUDI DI VERONA
FACOLTÀ DI MEDICINA E CHIRURGIA
CORSO DI LAUREA IN TECNICHE DI LABORATORIO
BIOMEDICO
Polo Universitario delle Professioni Sanitarie Rovereto
Dipartimento di Genetica e Biologia Molecolare
Fondazione Edmund Mach
Laboratorio di analisi e ricerca
TESI DI LAUREA
MAPPAGGIO FINE DEL LOCUS Co SUL CROMOSOMA 10 DI
MELO CHE CONTROLLA L’HABITUS COLONNARE
Relatore:
Dott. Velasco Riccardo
Correlatore:
Dott. Baldi Paolo
Dott. Salvi Silvio
Laureando:
Pinelli Luca
ANNO ACCADEMICO 2008/2009
UNIVERSITÀ DEGLI STUDI DI VERONA
FACOLTÀ DI MEDICINA E CHIRURGIA
CORSO DI LAUREA IN TECNICHE DI LABORATORIO
BIOMEDICO
Polo Universitario delle Professioni Sanitarie Rovereto
Dipartimento di Genetica e Biologia Molecolare
Fondazione Edmund Mach
Laboratorio di analisi e ricerca
TESI DI LAUREA
MAPPAGGIO FINE DEL LOCUS Co SUL CROMOSOMA 10
DI MELO CHE CONTROLLA L’HABITUS COLONNARE
Relatore:
Dott. Velasco Riccardo
Correlatore:
Dott. Baldi Paolo
Dott. Salvi Silvio
Laureando:
Pinelli Luca
ANNO ACCADEMICO 2008/2009
«La scienza non è nient'altro che una
perversione se non ha come suo fine ultimo il
miglioramento delle condizioni dell'umanità.»
(Nikola Tesla)
Dedicato alla memoria di Pinelli Renato (1953-2007) e Giovannini Martino
(1982-2009).
Non so se trovo le parole giuste per ringraziare i miei genitori e la mia
famiglia, però vorrei che questo mio lavoro, per quanto possibile, fosse un
premio anche per loro e per i sacrifici che hanno fatto. Un particolare
ringraziamento anche a tutte le persone che mi sono state sempre vicine
e mi hanno sostenuto anche nei momenti più difficili permettendomi di
raggiungere questo importante traguardo.
.
INDICE:
1. INTRODUZIONE…………………………………..……………….……1
1.1. Specie e studio di interesse…………………...............................1
1.2. Marcatori molecolari………………………………………...……….2
1.3. I geni come primi marcatori……………………………………...…2
1.4. Marcatori di DNA………………………………………………….….3
1.4.1.RFLP (Restriction Fragment Length Polymorphism).............6
1.4.2.AFLP (Amplified Fragment Length Polymorphism)….………7
1.4.3.RAPD (Random Amplified Polymorphic DNA)……….………7
1.4.4.SNP (Single Nucleotide Polymorphism)………………………7
1.4.5.VNTR (Variable Number Tandem Repeat)………..…….……8
1.5. SSR (Simple Sequence Repeat).…………….……………….……8
1.5.1.Introduzione……………………………………….……………..8
1.5.2.Amplificazione dei microsatelliti…………………………....…10
1.5.3.Identificazione dei microsatelliti ………………………...……10
1.5.4.Limitazioni dei microsatelliti ………………………………..…10
1.6. Gene colonnare (Co)……………………………………………….11
1.7. Mappe genetiche……………………………………………..……..13
1.8. Predizione geni e proteine candidati……………………………15
2. MATERIALI E METODI…………………………………………….….….16
2.1. Materiale vegetale…………………………………………………..16
Liofilizzazione e macinazione dei campioni…………………....16
Estrazione del DNA genomico…………………….……………....17
2.2. Quantificazione del DNA genomico………………………….…..19
2.3. Amplificazione del DNA genomico…………………………….....21
2.4. Elettroforesi su gel d’agarosio…………………………………...22
2.5. Genotipizzazione mediante elettroforesi capillare………….....23
2.6. Analisi dati…………………………………………….………….….24
5
3. RISULTATI e DISCUSSIONE………………………………………..…..25
3.1. Fenotipizzazione…………………………………………………..…25
3.2.Genotipizzazione marcatori provenienti da bibliografia…...…
27
3.3.Sviluppo nuovi
marcatori…………………………………………..29
3.4.Ricerca geni candidati..…………………………………………….32
4. CONCLUSIONI…………………………………………………….….…...34
5. BIBLIOGRAFIA……………………………………………………..……..35
1. INTRODUZIONE
1.1. Specie di studio e suo interesse
Originario di una zona sud caucasica, il melo è oggi coltivato
intensivamente in Cina, Stati Uniti, Russia, Europa, soprattutto in Italia e in
Francia. Appartiene alla grande famiglia delle Rosaceae, sottofamiglia
Pomoideae, genere Malus. Il melo è una pianta di dimensioni medioelevate che in natura può raggiungere un'altezza anche di 8-10 metri.
In Italia la produzione (circa 3,5 tonnellate all’anno) è concentrata nel
settentrione: l'80% del raccolto nazionale, infatti, proviene da tre regioni
del Nord: Trentino-Alto Adige (46%), Emilia-Romagna (17%) e Veneto
(14%). Altre aree di una certa importanza sono Piemonte, Lombardia e
Campania.
Il melo riveste un considerevole interesse a livello economico e per questo
negli ultimi anni gli enti di ricerca si sono concentrati sullo studio di nuove
strategie e metodi innovativi atti ad identificare piante sempre più resistenti
a fattori ambientali e a malattie. Il primo approccio per ottenere un
miglioramento genetico è stata l'applicazione di programmi mirati di
incrocio in cui però il problema principale è rappresentato dai lunghi cicli
generazionali. L’analisi è passata dallo studio di caratteri fenotipici allo
studio di caratteristiche genetiche e allo sviluppo di marcatori molecolari
che possano portare alla selezione precoce di individui più produttivi e
maggiormente resistenti ai patogeni. Negli ultimi anni sono stati investiti
numerosi fondi in particolar modo nel sequenziamento del genoma del
melo ancora in corso alla Fondazione Edmund Mach di San Michele
all'Adige, Trento.
1
1.2. Marcatori molecolari
Per lo studio della variabilità genetica attualmente vengono effettuate
analisi sul DNA che, a differenza dell’analisi a livello morfologico e
biochimico, presenta notevoli vantaggi:
- è più stabile e manipolabile;
- è indipendente da ogni influenza ambientale;
- è ripetuto in modo costante e fedele in ogni cellula e tessuto
dell’organismo;
- è altamente polimorfico tra individui diversi (le proteine invece sono molto
più conservate; infatti, teoricamente data la degenerazione del codice
genetico si potrebbe anche avere fino a un 30% di mutazioni nella
sequenza nucleotidica di un gene senza che a questa corrisponda una
differenza nella sequenza amminoacidica della proteina codificata;
- consente di risolvere problemi di identità tra individui diversi.
Un marcatore molecolare è una sequenza di DNA (trascritta o non
trascritta) che esiste in due o più versioni distinguibili e che quindi può
essere utilizzata per fissare un punto su una mappa genetica o fisica.
La mappatura genetica, che si basa sul concetto di frequenza di
ricombinazione, la consente di individuare la posizione nel genoma dei
geni e di altre sequenze specifiche di DNA. Le tecniche genetiche
includono esperimenti di incrocio per l’ottenimento di popolazioni
segreganti o, nel caso dell’uomo, l’esame della storia familiare (pedigree).
La mappatura fisica, che fa sempre uso di tecniche di biologia molecolare,
rappresenta la distanza fisica, reale, tra i vari geni su un cromosoma.
1.3. I geni come primi marcatori
Le prime mappe genetiche, costruite nei decenni iniziali del ventesimo
secolo
per
organismi
come
il
moscerino
della
frutta
(Drosofila
melanogaster), usavano i geni come marcatori. Ciò avveniva molti anni
prima che si comprendesse che i geni sono segmenti di DNA. I geni erano
visti come entità astratte responsabili della trasmissione di caratteristiche
2
ereditarie dai genitori alla prole. Per essere utile nell’analisi genetica, una
caratteristica ereditaria doveva esistere in due forme alternative o fenotipi,
ad esempio i fusti alti o bassi delle piante di pisello originariamente
studiate da Mendel. Ogni fenotipo è specificato da un allele diverso del
gene corrispondente. Inizialmente i soli geni che potevano essere studiati
erano quelli che specificavano fenotipi distinguibili ad un esame visivo.
Così, per esempio, le prime mappe del moscerino della frutta mostravano
la posizione dei geni per il colore del corpo, il colore degli occhi, la forma
delle ali e simili: tutti fenotipi distinguibili a occhio nudo o con un semplice
microscopio ottico. All’inizio questo approccio era adeguato, ma fu presto
chiaro ai genetisti che esisteva solo un numero limitato di fenotipi visibili la
cui ereditarietà potesse essere studiata e, in molti casi, l’analisi era resa
più difficoltosa dal fatto che più di un gene regola un singolo fenotipo.
1.4. Marcatori di DNA
I geni sono marcatori utili, ma non ideali. Il problema, in particolare con i
genomi più grandi come quelli dei vertebrati e delle piante da fiore, è che
una mappa basata unicamente sui geni non è molto dettagliata. Questo
sarebbe vero anche se venisse mappato ogni singolo gene perché nella
maggior parte dei genomi eucariotici i geni sono spaziati gli uni dagli altri
da vaste interruzioni. Il problema viene reso ancora più complicato dal
fatto che solo una frazione del numero totale dei geni è presente in forme
alleliche che possano essere distinte in modo semplice. Le mappe
geniche non sono quindi molto dettagliate e sono necessari altri tipi di
marcatori. Caratteristiche di sequenza mappate, diverse dai geni, sono
chiamate marcatori di DNA. La maggior parte di tali marcatori si basa su
una tecnica che ha rivoluzionato l’approccio metodologico sia nel campo
della genetica che delle biotecnologie: la PCR (Polymerase Chain
Reaction). Sviluppata da Kary Mullis nel 1985, questa è stata indicata
come una delle scoperte più importanti del XX secolo tanto che il suo
inventore è stato insignito del Premio Nobel per la Chimica nel 1993. Tale
reazione consente di amplificare, mediante una procedura automatizzata,
3
una regione di DNA di particolare interesse a partire da quantità esigue di
materiale genetico, sfruttando le proprietà di alcune DNA polimerasi
particolarmente stabili alle alte temperature. Tali enzimi sono in grado di
sintetizzare un nuovo filamento complementare ad un filamento a singola
elica usato come stampo. La reazione viene innescata in presenza di un
iniziatore (primer), costituito da un oligonucleotide sintetico in grado di
appaiarsi in quanto omologo ad una parte della regione da amplificare,
che serve alla polimerasi come inizio per la sintesi della nuova catena in
direzione 5’→ 3’. Il processo di amplificazione, che può essere attuato in
condizioni differenti, prevede la ripetizione ciclica di tre passaggi (Figura
1.1) al termine dei quali si ottengono una quantità enorme di frammenti di
DNA amplificati rispetto a quelli di partenza. I tre passaggi fondamentali
sono:
- denaturazione del DNA (denaturation)
- appaiamento degli iniziatori al templato (annealing)
- allungamento dei nuovi filamenti (elongation)
La PCR permette la diagnosi precoce di malattie maligne, come la
leucemia o i linfomi, e nella ricerca sul cancro viene già utilizzata di
routine. La PCR può essere effettuata direttamente su campioni di DNA
genomico per rilevare specifiche mutazioni nelle cellule maligne con una
sensibilità che è almeno 10.000 volte superiore a quella di altri metodi. La
PCR consente anche l'identificazione di microrganismi non coltivabili o a
lenta crescita, quali micobatteri e batteri anaerobi. Il DNA virale può altresì
essere rilevato mediante PCR. Gli iniziatori utilizzati devono essere
specifici per le sequenze mirate nel DNA di un virus, e la PCR può essere
utilizzata per le analisi diagnostiche o sequenziamento del DNA del
genoma virale. L'elevata sensibilità della PCR consente la rilevazione dei
virus poco dopo l'infezione e anche prima della comparsa della malattia.
La diagnosi precoce può dare ai medici un vantaggio considerevole in
trattamento.
4
Negli anni sono stati sviluppati vari tipi di marcatori molecolari (Garcia et
al., 2004) come gli RFLP (Restriction Fragment Length Polymorphism),
RAPD (Random Amplified Polymorphic DNA), AFLP (Amplified Fragment
Length Polymorphism), VNTR (variable number tandem repeat), SNP
(single nucleotide polymorphism), STR (Short tandem repeat), SSR
(Simple Sequence Repeat) e molti altri (Michelmore et al., 1992).
Figura 1.1. Schema del processo di una reazione di PCR. Si noti come partendo da un
solo filamento di DNA se ne ottengano molte copie.
5
1.4.1.RFLP (Restriction Fragment Length Polymorphism)
In biologia molecolare la sigla RFLP (dall'inglese restriction fragment
length polymorphism, polimorfismo di lunghezza dei frammenti di
restrizione) viene utilizzata per indicare due concetti distinti: una
caratteristica delle molecole del DNA che consente di distinguerle l'una
dall'altra, grazie alle differenze nelle sequenze di nucleotidi che le
compongono, e la tecnica di laboratorio che sfrutta tali caratteristiche per
mettere a confronto le varie molecole di DNA. Tale tecnica viene utilizzata
nella realizzazione di impronte genetiche e nei test di paternità. Furono
utilizzati per la prima volta negli anni '80, vengono tipizzati tramite
Southern-blot e ibridati con sonde marcate radioattivamente.
Di norma si provvede per prima cosa all'estrazione e alla purificazione del
DNA da un campione individuale. Il DNA viene quindi sezionato in
frammenti di restrizione mediante enzimi di restrizione detti endonucleasi,
che attuano il taglio unicamente in corrispondenza di particolari sequenze
nucleotidiche, specifiche per ogni enzima. I frammenti di restrizione
vengono quindi separati per lunghezza mediante elettroforesi su gel
d'agarosio. Successivamente attraverso la tecnica di ibridazione nota
come Southern-Blot si identificano le bande determinate dall'ibridazione
con sonde di sequenza nota marcate radioattivamente od attraverso
fluorocromi. Le distinzioni tra i genotipi sono determinate dalle differenze
nel numero e nella lunghezza delle bande che compaiono utilizzando la
stessa sonda per l'ibridazione. Tali differenze sono a loro volta
determinate dal numero di siti di taglio presenti nella sequenza
considerata. La distanza tra le posizioni di taglio degli enzimi di restrizione
(i cosiddetti siti di restrizione) è variabile tra un individuo e l'altro. Ciò si
riflette in una diversa posizione di alcune bande sul gel, da cui il termine
polimorfismo. Questa differenza può essere usata per distinguere
geneticamente due individui o mostrare le relazioni genetiche che
intercorrono tra individui, in quanto i figli ereditano il materiale genetico dai
propri genitori. Lo stesso metodo viene usato anche per determinare le
relazioni che intercorrono tra le varie specie.
6
1.4.2.AFLP (Amplified Fragment Length Polymorphism)
I marcatori AFLP sono polimorfismi originati da riarrangiamenti del DNA
che determinano la perdita o la creazione di siti di restrizione. Il DNA
genomico è inizialmente digerito con due diversi enzimi di restrizione
generando frammenti di diversa lunghezza e successivamente amplificato
mediante reazione di PCR. Il materiale ottenuto è marcato selettivamente
e visualizzato tramite elettroforesi su gel di poliacrilamide.
Gli AFLP sono dei marcatori altamente polimorfici e hanno il vantaggio di
essere ben riproducibili, dei candidati ideali per l’analisi di variabilità
genetica e la costruzione di mappe.
1.4.3. RAPD (Random Amplified Polymorphic DNA)
I marcatori RAPD sono polimorfismi basati sulla presenza/assenza di un
prodotto di amplificazione ottenuto mediante la reazione a catena della
polimerasi (PCR). L’amplificazione del DNA genomico avviene con
l’utilizzo di un unico iniziatore degenerato di 8-12 nucleotidi che si appaia
in maniera casuale ad uno dei due filamenti del DNA. Il prodotto di PCR
viene rilevato tramite una colorazione con etidio bromuro dopo corsa
elettroforetica su gel d’agarosio. La presenza o l’assenza del prodotto di
amplificazione determina il polimorfismo ad un locus per via di mutazioni
puntiformi sul sito di appaiamento dell’iniziatore.
I vantaggi di questa tecnica sono diversi tra cui la velocità dell’analisi e
l’utilizzo di una minima quantità di DNA. Di contro alcuni svantaggi sono la
bassa riproducibilità della tecnica dovuta a vari fattori (il tipo di estrazione
del DNA, concentrazione dei reagenti, etc..) e la natura dominante di
questi marcatori che impedisce di distinguere l’omozigosi dall’eterozigosi.
1.4.4.SNP (Single Nucleotide Polymorphism)
I Polimorfismi a Singolo Nucleotide (SNP), scoperti negli anni 80, sono la
classe più frequente di polimorfismi presenti nel genoma e sono
determinati dalla sostituzione di una singola coppia di basi. I cambiamenti
7
dei singoli nucleotidi possono essere indotti da vari fattori come sostanze
chimiche mutagene oppure da errori durante la replicazione del DNA.
Il polimorfismo viene distinto in due categorie:
-
di transizione quando vi è una sostituzione con un nucleotide della
stessa classe. (C→T) e (A→G);
-
di transversione quando vi è una sostituzione con un nucleotide di
classe diversa. (C→A), (C→G), (T→A) e (T→G).
Gli SNP sono distribuiti lungo tutto il genoma e la maggior parte di essi è
localizzata a livello delle regioni non codificanti del genoma. Mentre quelli
localizzati all’interno di regioni codificanti e presenti con una minore
frequenza spesso sono associati alle alterazioni responsabili di una
malattia o di una variante fenotipica.
L’analisi degli SNP acquisisce particolare importanza in campo biomedico
poiché variazioni di singoli nucleotidi possono influenzare lo sviluppo di
alcuni tipi di patologie.
1.4.5.VNTR (Variable Number Tandem Repeat)
Un variable number tandem repeat (o VNTR) è una posizione in un
genoma, dove una breve sequenza nucleotidica è organizzata come una
ripetizione in tandem. Ve ne possono essere molte sui cromosomi, e
spesso mostrano variazioni di lunghezza tra gli individui. Ogni variante
agisce come un allele ereditato, e può essere quindi utilizzata per
l'identificazione personale o dei genitori. Questo tipo di analisi è utile per la
ricerca genetica e della biologia, medicina legale, e impronta digitale del
DNA.
1.5. SSR (Simple Sequence Repeat)
1.5.1.Introduzione
I microsatelliti, o Simple Sequence Repeat (SSR), sono loci polimorfici
presenti nel DNA nucleare e degli organelli costituiti da unità ripetute di
8
1-6 coppie di basi. Sono generalmente co-dominanti e sono utilizzati
come marcatori molecolari viste le loro ampie applicazioni nel campo
della genetica, tra cui l’identificazione di parentela e gli studi di
popolazione. I microsatelliti possono essere utilizzati anche per lo studio
del dosaggio del gene (in cerca di duplicazione o delezione di una
particolare regione genetica).
Un esempio comune di un microsatellite è una ripetizione (CA)n, dove n è
variabile tra gli alleli. Questi marcatori presentano spesso elevati livelli di
inter-e intra-polimorfismo specifici, in particolare quando le ripetizioni sono
in numero maggiore di dieci. La sequenza ripetuta è spesso semplice,
costituita da due, tre o quattro nucleotidi (rispettivamente ripetizione di-, trie tetra nucleotide), e può essere ripetuto da 10 a 100 volte. Le ripetizioni
CA sono molto frequenti nel genoma umano e di altre specie, e sono
presenti ogni poche migliaia di paia di basi. In questo modo i microsatelliti
sono ideali per la determinazione della paternità, studi di genetica di
popolazione
e
la
costruzione
di
mappe
genetiche.
I Microsatelliti devono la loro variabilità a un aumento del tasso di
mutazione rispetto ad altre regioni neutrali del DNA. Questi alti tassi di
mutazione possono essere spiegati frequentemente da uno slittamento di
lettura durante la replicazione del DNA su un singolo filamento. La
mutazione può verificarsi anche durante la ricombinazione e durante la
meiosi. Alcuni errori in slittamento sarebbero compensati da meccanismi
di revisione all'interno del nucleo, ma di alcune mutazioni può sfuggire la
riparazione. La lunghezza delle unità ripetute, il numero di ripetizioni e la
presenza di ripetizioni variabili così come la frequenza di trascrizione
nell'area del microsatelliti sono tutti fattori che possono influenzare questo
processo. Interruzioni dei microsatelliti, dovute ad esempio a mutazioni,
possono risultare in un ridotto polimorfismo. Lo stesso meccanismo può
talvolta
portare
ad
una
errata
amplificazione
del
microsatellite,
specialmente se un errore di slittamento della polimerasi avviene durante i
primi cicli della PCR.
9
1.5.2.Amplificazione dei microsatelliti
I microsatelliti possono essere amplificati per l'identificazione tramite
reazione a catena della polimerasi, utilizzando le sequenze delle regioni
fiancheggianti uniche come iniziatori (Zietkiewick et al., 1994). Il DNA è
ripetutamente denaturato ad alta temperatura per separare la componente
a doppia elica, poi raffreddato per permettere appaiamento degli iniziatori
e l'estensione di sequenze nucleotidiche attraverso il microsatelliti. Gli
iniziatori che fiancheggiano i microsatelliti sono semplici e veloci da usare,
ma lo sviluppo del corretto funzionamento dell’iniziatore stesso è spesso
un processo faticoso e costoso. Inizialmente tramite programmi automatici
si ricercano i vari marcatori sulla sequenza genomica di interesse.
Identificato i marcatori devono essere costruiti (manualmente o tramite
appositi software) gli iniziatori di amplificazioni nelle regioni fiancheggianti
il marcatore precedentemente identificato.
1.5.3.Identificazione dei microsatelliti
L’identificazione e l’analisi dei vari microsatelliti viene effettuata tramite
una corsa elettroforetica del prodotto di PCR. I risultati della corsa
possono poi essere analizzati in vari modi per identificare i vari alleli e di
conseguenza fare le analisi del pattern genomico.
1.5.4.Limitazioni dei microsatelliti
I microsatelliti hanno dimostrato di essere marcatori molecolari versatili, in
particolare per l'analisi della popolazione, ma non sono senza limitazioni. I
microsatelliti sviluppati per specie di particolare interesse possono spesso
essere applicate a specie strettamente collegate, ma la percentuale di loci
che amplificano con successo può diminuire con l'aumentare la distanza
genetica. Mutazioni puntiformi nei siti di annealing possono portare ad
una mancata amplificazione. In questo caso si parla di “allele nullo”. Gli
10
alleli nulli complicano l'interpretazione dei microsatelliti e quindi effettuare
stime di parentela può risultare difficoltoso. In alcuni casi la PCR e la
successiva identificazione può risultare difficoltosa quanto si ha la
presenza di alleli (di solito omozigoti) che mascherano l’amplificazione di
alleli più deboli (eterozigoti). Nelle cellule tumorali, dove i controlli sulla
replicazione del DNA possono essere danneggiati, i microsatelliti possono
essere guadagnati o persi con una frequenza particolarmente elevata nel
corso di ogni mitosi. Quindi una linea di cellule tumorali potrebbe mostrare
un impronta digitale genetica diversa da quella del tessuto ospite.
1.6. Il carattere colonnare (Co)
Il portamento è considerato un fattore molto importante nelle piante da
frutto in quanto influenza la qualità della frutta, la densità di piantagione, e
gli interventi di potatura necessari. Una grande variabilità è stata
riscontrata nelle differenti varietà di melo (Figura 1.2), e negli anni, sono
stati fatti molti sforzi per classificare i diversi tipi di portamento secondo
parametri quali la lunghezza e la distribuzione, il vigore della pianta e la
posizione dei frutti (Lespinasse et al., 1986; Kenis, 2003, 2004, 2007).
11
Figura 1.2. Tipologie di portamento dell’albero del melo
Il portamento colonnare nel melo è causato da una mutazione dominante
a livello del locus co ed è stato inizialmente identificato in un mutazione
spontanea della cultivar McIntosh denominata Wijcik (Fisher, 1970). La
mutazione è caratterizzata da un numero ridotto di ramificazioni laterali, un
aumento del numero di lamburde e internodi molto ravvicinati tra loro
(Kesley & Brown, 1992). Queste caratteristiche sono importanti per
rendere
il
melo
colonnare una risorsa
genetica
importante
per
l’ottenimento di nuove varietà, in particolare per la produzione di cultivar
compatte (Lapins, 1976, Tobutt, 1984, Kesley & Brown,1992). Il fenotipo
colonnare sembra essere controllato da un singolo gene dominante (Co)
(Kim et al., 2003; Tian et al., 2005; Zhu et al., 2007;) anche se uno o più
geni minori potrebbero essere coinvolti nell’espressione del carattere. Dal
1985 sono state selezionate cinque cultivar che portano il gene Co:
Telamon, Tuscan, Trajan, Maple e Charlotte (Tobutt, 1988a,b). Al
momento, tutte le varietà colonnari a disposizione sono eterozigoti (Coco).
In alcune progenie segreganti l'habitus colonnare non è facile da
12
individuare in alberi giovani, in particolare durante le prime due stagioni di
crescita. Di conseguenza, un marcatore del DNA strettamente associato al
gene Co potrebbe essere prezioso per la selezione precoce di alberi che
portano questo carattere. Inoltre, l’ottenimento di una mappa molecolare
altamente
satura
della regione
che
controlla
l’habitus
colonnare
costituirebbe una base di partenza ideale per il clonaggio del gene Co. Il
gene Co è stato inizialmente localizzato con il marcatore di tipo RAPD
dominante P459800 sul gruppo di linkage 10 di 'Wijcik McIntosh' (Conner et
al., 1998). Nel corso degli anni altri marcatori molecolari sono stati
individuati nella stessa regione. In particolare sono stati identificati
marcatori RAPD e AFLP associati al gene Co, che in alcuni casi sono stati
convertiti in marcatori SCAR affidabili e facilmente trattabili. Negli ultimi
anni sono stati sviluppati anche alcuni marcatori SSR (Hemmat et al.,
1997, 2003; Goulao et al.,2001; Espley et al..2009). I marcatori SSR sono
particolarmente utili perché facilmente trasferibili tra mappe genetiche
diverse consentendo così lo studio di un carattere prescelto in diversi
background genetici. I marcatori attualmente a disposizione sono
comunque troppo distanti dal locus Co per consentire un’efficace
identificazione e clonaggio del gene responsabile del carattere. Per questo
vi è la necessità di sviluppare nuovi marcatori più vicini al gene in modo da
creare una mappa ad alta risoluzione per la successiva identificazione del
gene e della proteina correlati.
1.7. Mappe genetiche
Una mappa genetica o mappa di concatenazione è una rappresentazione
della distanza che separa i geni, basata sui dati di ricombinazione
genetica. La ricombinazione genetica si ha grazie al crossing-over, il quale
modifica il corredo genetico cellulare semplicemente scambiando tra loro
sezioni di cromosomi omologhi, durante la profase I della meiosi. Mappare
i geni è un processo che determina la posizione relativa dei geni sui
cromosomi a partire da un locus preso come riferimento. Si distingue dalla
mappa fisica, che invece è basata sulle distanze fisiche lungo il
13
cromosoma, ed è espressa in coppie di basi (bps). Le mappe genetiche
per linkage sono mappe costruite mediante associazione genetica,
determinando la frequenza con cui due marcatori sintenici (ossia associati
e quindi localizzati sullo stesso cromosoma) sono ereditati insieme. Nelle
mappe genetiche non e' necessario conoscere la localizzazione sul
cromosoma dei marcatori studiati, in quanto nella costruzione di queste
mappe si cerca di svelare l'associazione tra due o più loci. Loci che sono
molto vicini sul cromosoma hanno una probabilità maggiore di essere
ereditati insieme rispetto a loci distanti. Studi genetici su famiglie per
determinare quanto frequentemente due o più coppie di alleli sono
ereditati insieme, permettono la costruzione di mappe genetiche in cui la
distanza tra due geni e' misurata in cM (in onore al genetista americano
Thomas Hunt Morgan). Un cM, o unità di mappa genetica, e' definito come
la distanza tra due geni per i quali un prodotto della meiosi su cento e'
ricombinante. Un esempio di mappa genetica è riportato in Figura 1.3.
14
Figura 1.3. Mappa genetica del cromosoma 10 di melo.
Dopo aver calcolato le frequenze di ricombinazione grazie anche a dei sistemi
informatici come JOINMAP (Van Ooijen et al., 1993; Stam, 1993), MAPMAKER
(Lander et al., 1987), LINKAGE, ecc.. si possono costruire mappe genetiche
(Liebhard et al., 2003)., su cui porre anche marcatori molecolari utili alla
ricostruzione completa di interi cromosomi grazie alla creazione di contig (Figura
1.4) cioè frammenti le cui estremità siano sovrapponibili concatenandoli per
creare frammenti di genoma sempre più grandi fino a ricostruire interamente i
cromosomi e di conseguenza l’intero genoma.
15
Frammenti
Figura 1.4. Esempio di creazione di un contig. Le estremità dei frammenti vengono
sovrapposte in apposite regioni del genoma (A,B,C,D,E) per formare un intero contig. I
veri contig, successivamente, verranno uniti per ricostruire interamente i cromosomi e
l’intera sequenza genomica.
1.8. Predizione geni e proteine candidati
Dopo la ricostruzione della mappa genetica nella zona presunta del locus
del gene di interesse si passa ad un’analisi probabilistica per cercare di
identificare il gene ricercato.
Esistono dei software di predizione genica, i quali rappresentano dei
tentativi di identificare, all’interno di una sequenza di DNA, le regioni con la
più elevata probabilità di essere codificanti (proteine o altro), sulla base
delle caratteristiche delle sequenze dei geni già noti dello specifico
organismo considerato o di organismi affini. Grazie all’applicazione di tali
programmi bioinformatici, su ogni contig di melo sono identificate delle
regioni codificanti o ORFs (dall’inglese Open Reading Frame) che
corrispondono agli ipotetici geni contenuti in queste regioni.
16
2. MATERIALI E METODI
2.1. Materiale vegetale
Per lo studio in considerazione sono stati effettuati degli incroci delle
cultivar Golden X Wijcik , Goldrush X Wijcik
e Galaxy X Wijcik . Il
campionamento è stato eseguito su 129 individui della popolazione
Golden X Wijcik, 139 individui della popolazione Goldrush X Wijcik e 60
individui della popolazione Galaxy X Wijcik prelevando una foglia giovane
da ogni pianta.
2.2. Liofilizzazione e macinazione dei campioni
Le foglie campionate in tubi di raccolta sono state inserite nel liofilizzatore
per 24 ore, e successivamente conservate a -80°C.
Il materiale vegetale liofilizzato è stato successivamente macinato
utilizzando il Mixer Mill 300 (Retsch) secondo il seguente protocollo:
1. Prelevare dal freezer la piastra contenente i tubi di raccolta.
2. Aggiungere una biglia per ogni tubo e chiudere con gli appositi
tappi.
3. Chiudere le piastre con gli appositi coperchi e battere sul bancone
per evitare che le biglie rimangano attaccate al tessuto
4. Rottura dei tessuti
a) Inserire le piastre negli appositi adattatori e fissarli nei
morsetti del Mixer Mill.
b) Azionare lo strumento per 1 minuto a 20 Hz.
c) Togliere e smontare le piastre dagli adattatori ed annotarne
l’orientamento.
d) Richiudere le piastre con i coperchi e battere per 5 volte al
fine di evitare che le biglie rimangano attaccate al tessuto.
e) Inserire le piastre negli appositi adattatori e fissarli nei
morsetti del Mixer Mill. Il montaggio deve essere tale che i
tubi che prima erano più interni siano ora più esterni. In
17
questo modo si assicura che la rottura dei tessuti sia uguale
in tutti i tubi.
f) Azionare lo strumento per 1 minuto a 20 Hz.
g) Controllare che tutti i campioni siano frantumati.
h) Se necessario battere 5 volte sul bancone le piastre e
azionare lo strumento per 1 minuto a 30 Hz.
i) Se necessario battere nuovamente le piastre sul bancone. Il
montaggio deve essere tale che i tubi che prima erano più
interni siano ora più esterni. In questo modo si assicura che
la rottura dei tessuti sia la stessa in tutti i tubi.
j) Azionare lo strumento per 1 minuto a 30 Hz.
k) Ripetere il punto i e j se necessario.
5. Togliere e smontare le piastre dagli adattatori, battere sul bancone
5 volte per evitare che del tessuto rimanga nei tappi.
6. Centrifugare le piastre fino a 3000 rpm per convogliare il tessuto sul
fondo.
7. Prima di utilizzare i campioni picchiettare gentilmente il fondo dei
tubi in modo da smuovere il tessuto impaccato sul fondo.
2.3. Estrazione del DNA genomico
Il DNA genomico è stato estratto mediante il kit d’estrazione DNeasy 96
Plant Kit (QIAGEN) e la stazione robotica Freedom Evoware (TECAN) con
testa a 96 aghi, usando il seguente protocollo:
Prima di eseguire l’estrazione aggiungere etanolo al 96% ai Buffer AP3 e
AW come indicato sulla confezione ed inoltre preriscaldare il Buffer AP1 a
65°C.
1. Preparare la soluzione di lisi per 110 campioni in una falcon da 50
ml come riportato in tabella:
18
Volume per campioni
Buffer AP1 (a 65°C )
RNase A (100 mg/ml)
Reagent DX
400 μL
1 μL
1 μL
Volume per 110
campioni
44 mL
110 μL
110μL
2. Mescolare per inversione la falcon. Aggiungere ad ogni campione
400 μL della soluzione di lisi e chiuderli con gli appositi tappi.
Chiudere le piastre e agitare vigorosamente per 15 secondi.
Centrifugare fino a raggiungere i 3000 rpm e fermarsi.
3. Rimuovere i tappi e aggiungere ad ogni campione 130 μL Buffer
AP2 e chiudere con nuovi tappi. Chiudere le piastre ed agitare 15
secondi. Centrifugare fino a raggiungere i 3000 rpm e fermarsi.
4. Mettere i campioni per 10 minuti a -20°C per permettere la
precipitazione di proteine e inibitori della reazione di estrazione..
5. Centrifugare le piastre a 6000 giri per 5 minuti.
6. Trasferire, utilizzando una multicanale, 400 μL in nuove piastre
microtubes collection facendo attenzione a mantenere l’ordine dei
tubi. Recuperare le biglie dalle racks usate precedentemente.
7. Aggiungere 1,5 volumi di buffer AP3 (normalmente 500 μL) ad ogni
campione e chiudere con nuovi tappi.
8. Chiudere le piastre ed agitare vigorosamente per 15 secondi.
Centrifugare fino a raggiungere i 3000 rpm e fermarsi.
9. Mettere le piastre DNeasy 96 nei blocchi S e segnarne un angolo
per contraddistinguerle.
10. Togliere i tappi e trasferire 1 mL di ogni campione nelle piastre
DNeasy 96. Chiudere le piastre con il foglietto adesivo AirPore
Tape e centrifugare per 4 minuti a 6000 rpm. Nel caso il lisato non
sia passato tutto dal filtro centrifugare per altri 4 minuti.
11. Togliere il foglietto adesivo ed aggiungere ad ogni campione 800 μL
di Buffer AW.
19
12. Chiudere le piastre DNeasy 96 con un nuovo foglietto adesivo
AirPore Tape e centrifugare a 6000 rpm per 15 minuti per seccare
le membrane.
13. Togliere il foglietto adesivo e posizionare ogni piastra DNeasy 96
nella direzione corretta sulle piastre di eluizione microtube RS.
Aggiungere ad ogni campione 100 µL di Buffer AE preriscaldato a
60°C e chiudere le piastre DNeasy 96 con un nuovo foglietto
adesivo AirPore Tape. Incubare per 1 minuto a temperatura
ambiente. Centrifugare per 2 minuti a 6000 rpm.
14. Ripetere il passaggio 13 aggiungendo altri 100 µL di Buffer AE
preriscaldato a 60°C ad ogni campione e chiudere le piastre
DNeasy 96 con un nuovo foglietto adesivo AirPore Tape. Incubare
per 1 minuto a temperatura ambiente e poi centrifugare per 2 min a
6000 rpm.
15. Trasferire il Dna, eluito in 200 µL, nelle nuove piastre e conservare
in frigo o a -20°C.
2.4. Quantificazione del DNA genomico
La quantificazione del DNA è stata effettuata utilizzando un intercalante
fluorescente
del
DNA
(Quant-iT
PicoGreen
dsDNA
Assay
Kit,
INVITROGEN) ed un lettore di fluorescenza (Synergy2, BIOTEK). La
curva di taratura per la quantificazione del DNA genomico è stata creata
usando una quantità nota di DNA a doppia elica di fago lambda (λ).
Preparazione dei campioni standard per la curva di taratura:
1. Preparare una aliquota di fago lambda (λ) alla concentrazione di
partenza di 100 ng/μL;
2. Preparare sei campioni standard per costruire la curva di taratura.
Ogni standard deve avere un volume finale di 1000 μL;
3. Diluire il λ alla concentrazione di 10 ng/μL:
prelevarne 10 μL [100 ng/μL] e aggiungere 90 μL di TE;
20
4. Preparare i campioni standard alle concentrazioni di 1 - 0,5 - 0,1 -
0,01 - 0,001 - 0 ng/μL per la curva di taratura come riportato in
tabella:
Volume finale (μL)
Concentrazion
Volume (μL)
Volume (μL)
e finale di DNA
TE 1X
di DNA λ
1 ng/μL
1470
30 [100 ng/μL]
con PicoGreen
1500 [2 ng/μL]
0,5 ng/μL
500
500 [2 ng/μL]
1000 [1 ng/μL]
0,1 ng/μL
800
200 [1 ng/μL]
1000 [0,2 ng/μL]
0,01 ng/μL
900
1000 [0,02 ng/μL]
0,001 ng/μL
900
100 [0,2 ng/μL]
100 [0,02
0 ng/μL
1000
ng/μL]
0
BIANCO
1000
0
di DNA λ da usare
1000 [0,002 ng/μL]
1000
1000
Preparazione dei campioni di DNA genomico da quantificare:
1. Diluire i campioni di DNA genomico 1 a 50 (1:50), (Prelevare 1 μL
di DNA in 49 μL TE);
2. Prelevare 5 μL del diluito (1:50) e dispensarlo nella piastra di
lettura;
3. Aggiungere ai campioni 45 μL di TE in modo da raggiungere una
diluizione pari a 1 a 200;
4. Dispensare 50 μL di Picogreen diluito (1:200) in ogni pozzetto della
piastra (compresi i pozzetti degli standard).
La fluorescenza è rilevata mediante Synergy2 (BIOTEK) utilizzando filtri di
eccitazione a 485/20 e filtri di emissione a 516/20.
2.5. Amplificazione del DNA genomico
Il DNA genomico è stato amplificato tramite PCR. Dopo aver fatto
scongelare il DNA precedentemente estratto è stata preparata la mix di
21
PCR. Nella piastra di reazione viene aggiunto 1 µL di DNA e
successivamente 14 µL di mix lavorando sempre in ghiaccio.
Reagente
Buffer 10X
MgCl2 (2 mM)
dNTPs (0,2 mM)
Primer Fowards (1 µM)
Primer Reverse (1 µM)
Taq Gold (0,2U/ µL)
H2O
Quantità (µL)
1,5
1,2
1,5
2
2
0,1
Porto a 15 µL
Quantità per 100 campioni (µL)
150
120
150
200
200
10
570
Dopo aver posto la mix e il DNA nelle apposite piastre da 96 campioni si
chiudono con gli appositi tappi. Le si centrifuga per alcuni secondi e poi le
si pone nel termociclatore e si fa partire la razione di PCR.
Passaggi
I° Step
II° Step
III° Step
IV° Step
V° Step
VI° Step
VII° Step
Temperatura (°C)
Tempo (secondi)
94°C
10’
94°C
30”
60°C
30”
72°C
1’
Poi 34 volte al II° Step
72°C
5’
14°C
Quando a 14°C fine reazione
2.6. Elettroforesi su gel d’agarosio
La visualizzazione del DNA genomico amplificato è stata effettuata
facendo correre il DNA su gel d’agarosio con un marcatore di corsa a
peso molecolare e concentrazione nota, DNA Ladder mix (Mass Ruler,
Fermentas).
Per la colorazione del DNA è stato utilizzato il GelStar nucleic acid gel
stain (BioWhittaker Molecular Applications, Rockland ME USA),
un
intercalante del DNA che emette luce se esposto alla luce UV. E’ stata poi
preparata la miscela per la corsa elettroforetica:
22
•
1 µL Gel star
•
2 µL Loading Buffer (≈1 µL per 5 di totale)
•
5 µL H2O
•
5 µL campione e marcatore
La miscela viene caricato su gel d’agarosio allo 1,5% immerso in tampone
TAE 0,5X. La corsa elettroforetica è stata effettuata ad un voltaggio di
circa 80 V per circa 10-15 minuti.
L’intensità della luminosità delle bande è proporzionale alla quantità di
DNA presente in quel pozzetto e quindi la quantificazione è stata stimata
mettendo a confronto l’intensità della luminosità del campione con quella
del marcatore di corsa a concentrazione nota. La lettura è stata effettuata
grazie ad un acquisitore di immagini munito di camera a raggi UV e di
macchina fotografica (Uvitec).
2.7.Genotipizzazione mediante elettroforesi capillare
Dopo aver verificato dalla corsa elettroforetica che la reazione di PCR
abbia funzionato bisogna verificare che il prodotto della reazione sia il
frammento di DNA di interesse e che esso sia utile come marcatore
molecolare per il nostro studio.
A seconda della concentrazione del DNA vengono scelte le opportune
diluizioni da effettuare sul prodotto di PCR prima di passare all’elettroforesi
capillare e corsa al sequenziatore 3730xl DNA Analyzer (ABI).
Diluizione
Quantità prodotto
2x
5x
10x
PCR (µL)
15 µL
15 µL
15 µL
H2O (µL)
15 µL
60 µL
135 µL
Volume totale
(µL)
30 µL
75 µL
150 µL
In una nuova piastra vengono posti 0,3 µL di DNA diluito e 9,7 µL d una
soluzione di Formammide e un size standard Gene Scan-500 LIZ (ABI) a
dimensioni note ( 5 µL di size standard in 1mL di formammide).
La piastra va poi coperta con gli appositi tappi forati per la corsa al
sequenziatore.
23
NB: questi passaggi devono essere effettuati sotto cappa perché la
formammide è una sostanza tossica (R61, S45-53).
La piastra viene centrifugata per alcuni secondi e poi posta in un
termociclatore per circa 4 minuti a 95°C passaggio che permette di
denaturare la doppia elica del DNA per la successiva corsa elettroforetica
capillare. Una volta denaturato il DNA è subito raffreddato in ghiaccio per
evitare la rinaturazione della doppia elica che impedirebbe la successiva
analisi.
La piastra viene infine caricata sul sequenziatore per la corsa
elettroforetica capillare.
2.8. Analisi dati
Il sequenziatore effettua una corsa capillare separando i vari frammenti di
DNA in base alla loro lunghezza (la lunghezza varia in base alle ripetizioni
del microsatellite). Successivamente, tramite l’uso di un apposito software
(GeneMapper v 4.0) i dati vengono utilizzati per costruire un grafico dove
in ascissa viene posta la lunghezza dei frammenti di DNA espressa in paia
di basi e in ordinata la quantità di fluorescenza emessa. I vari picchi
corrispondono agli alleli (Figura 2.1).
24
A
B
Figura 2.1. Esempio di elettroferogramma di un campione. Il primo picco (A) corrisponde
alla fluorescenza degli iniziatori residui. Gli altri picchi (B) corrispondono ai due alleli della
popolazione.
L’ultimo passaggio consiste nell’assegnare correttamente i vari alleli ai
parentali e alle piante figlie di una popolazione segregante, permettendo
così l’identificazione di quegli alleli associati al fenotipo colonnare. Per far
questo si procede alla costruzione di una mappa genetica della regione di
interesse.
3. RISULTATI e DISCUSSIONE
3.1. Fenotipizzazione
Inizialmente ogni pianta utilizzata per lo studio è stata fenotipizzata in base
a caratteristiche morfologiche visive per identificare correttamente le
piante
colonnari
e
quelle
standard.
La
fenotipizzazione
avviene
principalmente su base visiva. Grazie all’esperienza dell’operatore (Figura
3.1) e ad indicazioni derivanti da precedenti studi (Lespinasse et al., 1986;
25
Kenis, 2003; Kenis et al., 2007) si riesce ad identificare correttamente il
portamento della pianta. Solo nel caso di piante sufficientemente mature
(in campo da almeno 3-4 anni) è possibile aiutarsi nella fenotipizzazione
con misure oggettive quali il numero degli internodi, il numero e la
lunghezza dei rami laterali e il diametro del tronco. Va comunque precisato
che non esiste in assoluto un modo per classificare senza possibilità di
errore il portamento di una pianta, in quanto innumerevoli fattori genetici e
ambientali possono concorrere a modificarlo leggermente, creando così
un certo numero di fenotipi classificabili come “intermedi”.
Le popolazioni fenotipizzate sono:
1. Golden x Wijcik costituita da 129 individui;
2. Goldrush x Wijcik costituita da
3. Galaxy x Wijcik costituita da
139 individui;
60 individui.
26
A
B
Figura 3.1. Esempio di pianta ad habitus colonnare (A) e pianta a portamento normale
(B) della popolazione Golden x Wijcik.
Le piante sono state divise come mostrato in tabella I:
Tabella I: suddivisione della popolazione in base al portamento della pianta.
Popolazione
habitus
habitus
colonnare (n°) normale (n°)
habitus
intermedio (n°)
Totale
Golden x Wijcik
46
77
6
129
Goldrush x
Wijcik
51
83
5
139
Galaxy x Wijcik
30
26
4
60
Totale
Popolazione
127
186
15
328
27
3.2.Genotipizzazione marcatori provenienti da bibliografia
Al fine di fornire un solido punto di partenza per la mappatura fine della
regione genomica di interesse, diversi marcatori disponibili in letteratura
sono stati testati utilizzando tre popolazioni segreganti: Golden x Wijcik,
Goldrush x Wijcik e Galaxy x Wijcik, per un totale di 328 piante. Sono stati
utilizzati sia marcatori SSR che SCAR e i risultati sono mostrati nella figura
3.2(A). Su di un lato un marcatore SSR, CH03d11, risulta cosegregante
con il gene Co (nessuna ricombinazione con il gene nella popolazione).
Sul lato opposto un marcatore SSR, HI01b01, e un marcatore SCAR
(SCAR216) sono stati rispettivamente posti 2,7 cM (9 ricombinazioni nella
popolazione) e 6,1 cM (20 ricombinazioni nella popolazione) dall’ipotetico
gene Co. Un nuovo marcatore SSR (Co01L02) è stato sviluppato dalla
stessa parte di CH03d11 utilizzando i dati disponibili
provenienti dal
progetto di sequenziamento del DNA di melo in corso alla Fondazione
Edmund Mach di San Michele all’Adige, Trento. La distanza stimata di
Co01L02 dal gene Co è stata di 2,4 cM (8 ricombinazioni nella
popolazione). Il nuovo marcatore è stato sviluppato in quella particolare
regione per colmare un vuoto. Infatti, i marcatori proposti dalla letteratura
non amplificavano nella nostra popolazione. Una regione genomica
relativamente grande è stato scelta come punto di partenza a causa delle
dimensioni
relativamente
piccole
della
popolazione
segregante
disponibile. Le distanze in centimorgan (cM) sono state calcolate in base
agli individui che presentavano ricombinazioni tra un marcatore e l’altro
rapportando poi il risultato di ricombinazioni su 328 piante a 100. Infatti un
cM, o unità di mappa genetica, e' definito come la distanza tra due geni o
marcatori per i quali un prodotto della meiosi su cento e' ricombinante. Il
passo successivo è quello di ancorare la mappa genetica della regione Co
sulla sequenza reale del genoma, limitata tra Co01L02 e HI01b01. I tre
marcatori SSR considerati sono stati dislocati su tre gruppi distinti e
consecutivi di sequenze o cluster come raffigurato nella Figura 3.2(B), che
delimita una regione genomica di circa 5 Mb. La regione genomica
28
compresa tra Co01L02 e HI01b01 è stato poi presa in considerazione per
un'analisi più approfondita, alla ricerca di nuovi marcatori SSR cosegreganti con Co. I Marcatori e le sequenze degli iniziatori sono mostrati
in tabella II:
Tabella III: Marcatori SSR o SCAR provenienti da lavori precedenti, le sequenze degli
iniziatori.
Marcatore SSR o SCAR
CH03d11
HI01b01
SCAR216
Co01L02
Sequenza Iniziatori
Forward:
5'-ACCCCACAGAAACCTTCTCC-3’
Reverse:
5'-CAACTGCAAGAATCGCAGAG-3’
Forward:
5'-GCTACAGGCTTGTTGATAACGC-3’
Reverse:
5'-ACGAATGAAATGTCTAAACAGGC-3’
Forward:
5'-GATCCATCACGACTATCAGG-3’
Reverse:
5'-TCAACCGGTGTTCACATTTC-3’
Forward:
5'-AGCCACAAACGGTACATAGC-3’
Reverse:
5'-ATTATTGTTATTTCTCGTTGACG-3’
29
2,4 cM
2,7 cM
6,1 cM
Figura 3.2. La Mappa genetica della regione Co (A) mostra i tre marcatori SSR e il
marcatore SCAR utilizzati come punti di partenza. Le distanze sono espresse in
centimorgan (cM). Nella figura B sono raffigurati i Cluster di sequenze genomiche che
contengono i marcatori mostrati. Lunghezze sono espressi in milioni di paia di basi (Mb).
3.3. Sviluppo nuovi marcatori
Sette nuovi marcatori SSR sono stati sviluppati, nella regione di interesse.
I due marcatori più esterni, Co04R03 e Co04R13 (Figura 3.3A) distano tra
loro circa 1 cM (3 ricombinazioni tra loro nella popolazione). All'interno di
questa regione cinque nuovi marcatori SSR (Co02R10, Co04R09,
Co04R10, Co04R11 e Co04R12) hanno mostrato il linkage completo con
Co, cioè non presentavano ricombinazioni con il gene. Secondo gli ultimi
dati genomici disponibili la distanza fisica tra Co04R03 e Co04R13 è stata
stimata a 820 kb (Figura 3.3B).
30
2,4 cM
0,5 cM
0,5 cM
2,7 cM
Figura 3.3. Mappatura fine della regione Co (A). Cinque marcatori SSR (Co02R10,
Co04R09, Co04R10, Co04R11, Co04R12) hanno mostrato linkage completo con il gene
Co. Le distanze sono espresse in centimorgan (cM). Nella figura B sono mostrati i cluster
genomici e la posizione fisica del marcatore utilizzato. Lunghezze sono espresse in
migliaia di coppie di basi (kb)
Nella tabella III sono mostrate le sequenze degli iniziatori dei nuovi
marcatori.
Tabella III: Marcatori SSR nuovi che sono stati mappati durante questo progetto, le
sequenze degli iniziatori.
Marcatore
Co04R03
Co02R10
Sequenza Iniziatori
Forward:
5'-GTTTGCTCTTTTGACTGACGC-3’
Reverse:
5'-CTCAGCTTTTCAGCCATTTCC-3’
Forward:
5'-ATCATGGAGGGTCTACTTCG-3’
Reverse:
5'-GAGATTAAGAAAGCGCGAACC-3’
31
Co04R09
Co04R10
Co04R11
Co04R12
Co04R13
Forward:
5'-TAGTGACATATACATGGTGCG-3’
Reverse:
5'-GTTGGAGAATGAGTGACGGC-3’
Forward:
5'-ACCTGGTTCCGGTACATAGC-3’
Reverse:
5'-AACCTTCCATGGCAGCAATC-3’
Forward:
5'-ACATCATGGTATGACAGAGGTG-3’
Reverse:
5'-TCTAAGCCTGTCAAGATGGC-3’
Forward:
5'-TTTATCTGACTAAGGGGAAGG-3’
Reverse:
5'-ATGGACTTGTATTCCTTAGGG-3’
Forward:
5'-ATTTTCCCTCTCTTCTGTTGC-3’
Reverse:
5'-TCTTGGAAAGACGTGGCACG-3’
Dopo aver disegnato e testato i vari marcatori si è dovuto associare i vari
picchi dell’ elettroferogramma ai corrispondenti alleli per verificare l’utilità
diagnostica del marcatore e la sua capacità di distinguere la popolazione
ad habitus colonnare e non. I risultati sono raffigurati nella tabella IV:
Tabella IV: Marcatori SSR nuovi che sono stati mappati durante questo progetto e gli
alleli associati alle varie cultivar.
Marcatore Alleli Golden
Alleli Goldrush
Co04R03
205-209
205
Co02R10
243
243-247
Co04R09
188-192
176-188
Co04R10
193
183-193
Co04R11
198-214
190-214
Co04R12
208
208
Co04R13
247
241-247
3.4. Ricerca geni candidati
Alleli Galaxy
205-209
243
188-192
193
214
208
247-249
Alleli Wijcik
209-212
251-300
156-188
185-203
172-184
194-223
235-237
La regione da noi identificata (quella compresa tra Co04R03 e Co04R13)
è quella che presumibilmente contiene il gene di interesse. Tramite
l’utilizzo di appositi software sono stati quindi identificati i geni presenti
all’interno di questa regione e le loro sequenze sono state inserite in
32
banca dati per cercare di attribuire loro una funzione. A questo scopo, si
sono effettuati confronti tra le sequenze di melo e dei database contenenti
sequenze appartenenti a diversi organismi, di cui è nota la funzione.
Questo perché si suppone che, in organismi diversi, sequenze di DNA
simili codifichino per proteine con funzione analoga. Per i confronti viene
utilizzato l’algoritmo BLAST (Basic Local Alignment Search Tool), il quale
individua le regioni di similarità locali tra sequenze nucleotidiche o
proteiche. Per ogni risultato restituito, il programma calcola e associa un
valore di significatività statistica, il quale esprime la probabilità che la
corrispondenza ottenuta sia dovuto al caso. Quanto più tale valore è
prossimo a zero, tanto più è significativa (e non casuale) la similarità tra
due sequenze. Poiché, tra specie diverse, le sequenze amminoacidiche
sono più conservate rispetto a quelle nucleotidiche, in virtù della
degenerazione del codice genetico, si è utilizzata l’opzione blastx, che
effettua una “traduzione concettuale” della sequenza di DNA nei sei
possibili frame di lettura (tre su entrambi i filamenti) e successivamente
confronta tutti i risultati con un database di sequenze proteiche
selezionando la migliore fra le varie possibilità. Come ultimo passaggio, è
stata effettuata una ricerca bibliografica in PubMed, un archivio digitale di
pubblicazioni scientifiche (Joanne et al., 2007; Moraes et al., 2005; Lauri
et al., 2008; Yonghong et al., 2006,2008; Schumacher at al.,1999; Greb et
al., 2003; Müller et al., 2006; Clay et al., 2005; Hua-Lin et al., 2006;
Zhengdao et al., 2008), utilizzando combinazioni di parole chiave quali ad
esempio “shoot branching elongation” con lo scopo di trovare, in
letteratura, geni noti associati all’allungamento dei germogli laterali; se
alcuni di essi corrispondono, per funzione, a quella associata alle
predizioni di melo, si è identificato un possibile gene candidato. Dopo
queste operazioni sono stati identificati i seguenti geni che potrebbero
regolare l’habitus colonnare (Tabella V):
Tabella V: Geni candidati che potrebbero controllare l’habitus colonnare, organismi in
cui sono stati identificati, la loro funzione e i riferimenti bibliografici.
33
4. CONCLUSIONI
Al momento il principale fattore limitante sono le piccole dimensioni della
popolazione segregante disponibile. Al fine di superare questo problema
nuovo incroci sono stati eseguiti sia nel 2008 e nel 2009. L'obiettivo è
34
quello di ottenere almeno 1000-1500 individui segreganti, che permetterà
di aumentare il livello di risoluzione a meno di 0,1 cM su ciascun lato del
gene. Quando la regione nell’intorno del gene verrà ancora ridotta si meno
potrà restringere ulteriormente il numero di geni candidati per una
successiva analisi di espressione e funzione. Nonostante si sia partiti da
una regione di circa 5 Mb (compresa tra Co01L02 e HI01b01), si è riuscito
a restringerla a circa 820 kb (compresa tra Co04R03 e Co04R13) cioè
diminuzione del 83.6% circa, che però non è ancora sufficiente per
identificare correttamente il gene di interesse. Un risequenziamento della
regione genomica individuata di Wijcik e uno studio più approfondito della
regione potranno finalmente fornire il gene effettivamente responsabile del
tratto. Quando il gene colonnare verrà identificato, in teoria, non ci sarà più
bisogno di aspettare che la pianta cresca prima di determinarne l’habitus.
Si potrà creare dei particolari kit che permettano di genotipizzare la pianta
appena sviluppa le prime foglie. Selezionando le piantine con habitus
colonnare si potrà creare delle cultivar sempre più compatte con meno
bisogno di manodopera permettendo di aumentare la produzione
riducendo i costi. Nei vari studi si è osservato una variazione anche
consistente della distanza in cM dei vari marcatori nelle diverse cultivar
studiate (Tian, 2005; Kenis et al, 2007) ciò potrebbe essere spiegato dalla
presenza di altri geni coinvolti nell’espressione dell’habitus colonnare e
dalla difficoltà di ottenere una fenotipizzazione certa. Anche su questo
fronte potrebbero in futuro essere effettuati nuovi studi per identificare le
componenti geniche coinvolte e riuscire ad identificare dei marcatori che i
permettano di identificare le diverse popolazione nei primi stadi dello
sviluppo della pianta.
5. BIBLIOGRAFIA
Clay, K.N., Nelson, T., 2005. The Recessive Epigenetic swellmap mutation
Affects the Expression of Two Step II Splicing Factors Required for the
Transcription of the Cell Proliferation Gene STRUWWELPETER and
35
for the Timing of Cell Cycle Arrest in the Arabidopsis Leaf. The Plant
Cell, 17: 1994–2008.
Conner, P.J., Brown, S.K., Weeden, N.F., 1998. Molecular marker analysis
of quantitative traits for growth and development in juvenile apple
trees. Theoretical and Applied Genetics, 96: 1027–1035.
Dörte, M., Schmitz, G., Theres, K., 2006. Blind Homologous R2R3 Myb
Genes Control the Pattern of Lateral Meristem Initiation in Arabidopsis.
The Plant Cell, 18: 586–597.
Espley, V.R., Brendolise, C., Chagné, D., Kutty-Amma, S., Gardiner, E.S.,
Hellens, P.R., Green, S., Volz, R., Putterill, J., Schouten, H.J., Allana,
A.C., 2009. Multiple Repeats of a Promoter Segment Causes
Transcription Factor Autoregulation in Red Apples. The Plant Cell, 21:
168–183.
Fisher, D.V., 1970. Spur strains of “McIntosh” discovered in British
Colombia. Canadian Fruit Varieties Horticultural Digest, 24: 27–32.
Garcia, AAF., Benchimol, LL., Barbosa, AMM., Geraldi, IO., Souza Jr, CL.,
Souza, AP, 2004. Comparison of RAPD, RFLP, AFLP and SSR
markers for diversity studies in tropical maize inbred lines. Genetics
and Molecular Biology; 27(4) : 579-588.
Goulao, L., Oliveira, C.M., 2001. Molecular characterization of cultivars of
apple (Malus domestica Borkh.) using microsatellite (SSR and ISSR)
markers. Euphytica, 122: 81–89.
Greb, T., Clarenz, O., Schäfer, E., Dörte, M., Herrero, R., Theres, K.,
2003. Molecular analysis of the LATERAL SUPPRESSOR gene in
36
Arabidopsis reveals a conserved control mechanism for axillary
meristem formation. Genes & Developement, 17: 1175–1187.
Hemmat, M., Weeden, N.F., Conner, P.J., Brown, S.K., 1997. A
DNAmarker for columnar growth habit in apple contains a simple
sequence repeat. Journal of the American Society for Horticultural
Science, 122: 347–349.
Hemmat, M., Weeden, N.F., and Brown, S.K., 2003. Mapping and
evaluation of Malus domestica microsatellites in apple and pear.
Journal of the American Society for Horticultural Science, 128: 515–
520.
Hua-Lin Zhou, Si-Jie He, Yang-Rong Cao, Tao Chen, Bao-Xing Du,
Cheng-Cai Chu, Jin-Song Zhang and Shou-Yi Chen, 2006. OsGLU1,
a putative membrane-bound endo-1,4-b-D-glucanase from rice, affects
plant internode elongation. Plant Molecular Biology, 60: 137–151.
Kenis, K., 2003. The use of molecular markers in apple breeding:
genotype identification and study of tree architecture. PhD dissertation
no 574, Faculty of Agricultural and Applied Biological Sciences,
Katholieke Universiteit Leuven, Belgium.
Kenis, K. and Keulemans, J., 2004. QTL analysis of growth characteristics
in apple. Acta Horticulturae, 663: 369–374.
Kenis, K., Keulemans, J., 2007. Study of tree architecture of apple (Malus
domestica Borkh.) by QTL analysis of growth traits.
Breeding, 19: 193–208.
37
Mololecular
Kesley, D.F., Brown, S.K., 1992. “McIntosh Wijcik”: A columnar mutation of
“McIntosh” apple proving useful in physiology and breeding research.
Fruit Varieties Journal, 46: 83–87.
Kim, M.Y., Song, K.J., Hwang, J.H., Shin, Y.U., Lee, K.J., 2003.
Development of RAPD and SCAR markers linked to the Co gene
conferring columnar growth habit in apple (Malus pumila Mill). The
Journal of Horticultural Science and Biotechnology, 78: 512–517.
Lander, E.S., Green, P., Abrahamson, J., Barlow, A., Daly, M.J., Lincoln,
S.E., et al., 1987. MAPMAKER: an interactive computer package for
constructing primary genetic linkage maps of experimental and natural
populations. Genomics, 1 (2): 174-181.
Lapins, K.O., 1976. Inheritance of compact growth type in apple. Journal
of the American Society for Horticultural Science, 101: 133–135.
Lauri, P.E., Bourdel, G., Trottier, C., Cochard, H., 2008. Apple shoot
architecture: evidence for strong variability of bud size and
composition and hydraulics within a branching zone. New Phytologist,
178: 798–807.
Lespinasse, J.M., Delort, J.F., 1986. Apple tree management in vertical
axis: appraisal after ten years of experiments. Acta Horticulturae, 160:
139–155.
Liebhard, R., Koller, B., Gianfranceschi, L., Gessler, C., 2003. Creating a
saturated reference map for the apple (Malus × domestica Borkh.)
genome. Theoretical and Applied Genetics, 106: 1497–1508.
Michelmore, R.W., Paran, I. and Kesseli, R. V. 1992. Identification of
markers linked to disease-resistance genes by bulk segregant
38
analysis: A rapid method to detect markers in specific genome region
by using segregating population. Proceedings of the National
Academy of Sciences of the USA, 88: 2444–2448.
Moraes, E.M., Abreu, G.A., Andrade, C.S.S., Sene, M.F., Vera, N., 2005.
Population genetic structure of two columnar cacti with a patchy
distribution in eastern Brazil. Solferini Genetica, 125: 311–323.
Schumacher, K., Schmitt, T., Rossberg, M., Schmitz, G., Theres, K., 1999.
The Lateral suppressor (Ls) gene of tomato encodes a new member
of the VHIID protein family. Plant Biology Proceedings of the National
Academy of Sciences, 96: 290–295.
Stam, P., 1993. Construction of integrated genetic linkage maps by means
of a new computer package: JOINMAP. The Plant Journal,3 (5):
739-744.
Tian, Y.K., Wang, C.W., Zhang, J.S., James, C., Dai, H.Y., 2005. Mapping
Co, a gene controlling the columnar phenotype of apple, with
molecular markers. Euphytica, 145: 181–188.
Tobutt, K.R., 1984. Breeding columnar apples at East Malling. Acta
Horticulturae, 159: 63–68.
Tobutt, K.R., 1988a. Columnar apple tree-Telamon variety. Plant patent—
United States Patent and Trademark Office.[Washington, D.C.: The
Office] 19: (6224) 2 pp.
Tobutt, K.R., 1988b. Columnar apple tree-Tuscan variety. Plant patent—
United States Patent and Trademark Office.[Washington, D.C.: The
Office] 19: (6225) 2 pp.
39
Van Ooijen, JW., Voorrips, RE., 2001, "JoinMap (tm) 3.0: Software for the
calculation of genetic linkage maps". The Plant Journal, 3: 739-744.
Yonghong, W., Jiayang, L., 2006. Genes controlling plant architecture.
Biotechnology, 17: 123–129.
Yonghong, W., Jiayang, L., 2008. Molecular Basis of Plant Architecture.
Annual Revision Plant Biology, 59: 253-279.
Zhengdao, Wu, Soliman, M.K., Bolton, J.J., Saha, S., Jenkins, J.N., 2008.
Identification of differentially expressed genes associated with cotton
fiber development in a chromosomal substitution line (CS-B22sh).
Functional & Integrative Genomics, 8: 165–174.
Zhu, Y.D., Zhang, W., Li, G.C., Wang, T., 2007. Evaluation of inter-simple
sequence repeat analysis for mapping the Co gene in apple (Malus
pumila Mill.). Journal of Horticultural Science & Biotechnology, 82 (3):
371–376.
Zietkiewicz, E.,Rafalski, A. and Labuda, D., 1994. Genome fingerprinting
by simple sequence repeat (SSR) – anchored polymerase chain
reaction amplification. Genomics, 20: 176–183.
40