UNIVERSITÀ DEGLI STUDI DI VERONA FACOLTÀ DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN TECNICHE DI LABORATORIO BIOMEDICO Polo Universitario delle Professioni Sanitarie Rovereto Dipartimento di Genetica e Biologia Molecolare Fondazione Edmund Mach Laboratorio di analisi e ricerca TESI DI LAUREA MAPPAGGIO FINE DEL LOCUS Co SUL CROMOSOMA 10 DI MELO CHE CONTROLLA L’HABITUS COLONNARE Relatore: Dott. Velasco Riccardo Correlatore: Dott. Baldi Paolo Dott. Salvi Silvio Laureando: Pinelli Luca ANNO ACCADEMICO 2008/2009 UNIVERSITÀ DEGLI STUDI DI VERONA FACOLTÀ DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN TECNICHE DI LABORATORIO BIOMEDICO Polo Universitario delle Professioni Sanitarie Rovereto Dipartimento di Genetica e Biologia Molecolare Fondazione Edmund Mach Laboratorio di analisi e ricerca TESI DI LAUREA MAPPAGGIO FINE DEL LOCUS Co SUL CROMOSOMA 10 DI MELO CHE CONTROLLA L’HABITUS COLONNARE Relatore: Dott. Velasco Riccardo Correlatore: Dott. Baldi Paolo Dott. Salvi Silvio Laureando: Pinelli Luca ANNO ACCADEMICO 2008/2009 «La scienza non è nient'altro che una perversione se non ha come suo fine ultimo il miglioramento delle condizioni dell'umanità.» (Nikola Tesla) Dedicato alla memoria di Pinelli Renato (1953-2007) e Giovannini Martino (1982-2009). Non so se trovo le parole giuste per ringraziare i miei genitori e la mia famiglia, però vorrei che questo mio lavoro, per quanto possibile, fosse un premio anche per loro e per i sacrifici che hanno fatto. Un particolare ringraziamento anche a tutte le persone che mi sono state sempre vicine e mi hanno sostenuto anche nei momenti più difficili permettendomi di raggiungere questo importante traguardo. . INDICE: 1. INTRODUZIONE…………………………………..……………….……1 1.1. Specie e studio di interesse…………………...............................1 1.2. Marcatori molecolari………………………………………...……….2 1.3. I geni come primi marcatori……………………………………...…2 1.4. Marcatori di DNA………………………………………………….….3 1.4.1.RFLP (Restriction Fragment Length Polymorphism).............6 1.4.2.AFLP (Amplified Fragment Length Polymorphism)….………7 1.4.3.RAPD (Random Amplified Polymorphic DNA)……….………7 1.4.4.SNP (Single Nucleotide Polymorphism)………………………7 1.4.5.VNTR (Variable Number Tandem Repeat)………..…….……8 1.5. SSR (Simple Sequence Repeat).…………….……………….……8 1.5.1.Introduzione……………………………………….……………..8 1.5.2.Amplificazione dei microsatelliti…………………………....…10 1.5.3.Identificazione dei microsatelliti ………………………...……10 1.5.4.Limitazioni dei microsatelliti ………………………………..…10 1.6. Gene colonnare (Co)……………………………………………….11 1.7. Mappe genetiche……………………………………………..……..13 1.8. Predizione geni e proteine candidati……………………………15 2. MATERIALI E METODI…………………………………………….….….16 2.1. Materiale vegetale…………………………………………………..16 Liofilizzazione e macinazione dei campioni…………………....16 Estrazione del DNA genomico…………………….……………....17 2.2. Quantificazione del DNA genomico………………………….…..19 2.3. Amplificazione del DNA genomico…………………………….....21 2.4. Elettroforesi su gel d’agarosio…………………………………...22 2.5. Genotipizzazione mediante elettroforesi capillare………….....23 2.6. Analisi dati…………………………………………….………….….24 5 3. RISULTATI e DISCUSSIONE………………………………………..…..25 3.1. Fenotipizzazione…………………………………………………..…25 3.2.Genotipizzazione marcatori provenienti da bibliografia…...… 27 3.3.Sviluppo nuovi marcatori…………………………………………..29 3.4.Ricerca geni candidati..…………………………………………….32 4. CONCLUSIONI…………………………………………………….….…...34 5. BIBLIOGRAFIA……………………………………………………..……..35 1. INTRODUZIONE 1.1. Specie di studio e suo interesse Originario di una zona sud caucasica, il melo è oggi coltivato intensivamente in Cina, Stati Uniti, Russia, Europa, soprattutto in Italia e in Francia. Appartiene alla grande famiglia delle Rosaceae, sottofamiglia Pomoideae, genere Malus. Il melo è una pianta di dimensioni medioelevate che in natura può raggiungere un'altezza anche di 8-10 metri. In Italia la produzione (circa 3,5 tonnellate all’anno) è concentrata nel settentrione: l'80% del raccolto nazionale, infatti, proviene da tre regioni del Nord: Trentino-Alto Adige (46%), Emilia-Romagna (17%) e Veneto (14%). Altre aree di una certa importanza sono Piemonte, Lombardia e Campania. Il melo riveste un considerevole interesse a livello economico e per questo negli ultimi anni gli enti di ricerca si sono concentrati sullo studio di nuove strategie e metodi innovativi atti ad identificare piante sempre più resistenti a fattori ambientali e a malattie. Il primo approccio per ottenere un miglioramento genetico è stata l'applicazione di programmi mirati di incrocio in cui però il problema principale è rappresentato dai lunghi cicli generazionali. L’analisi è passata dallo studio di caratteri fenotipici allo studio di caratteristiche genetiche e allo sviluppo di marcatori molecolari che possano portare alla selezione precoce di individui più produttivi e maggiormente resistenti ai patogeni. Negli ultimi anni sono stati investiti numerosi fondi in particolar modo nel sequenziamento del genoma del melo ancora in corso alla Fondazione Edmund Mach di San Michele all'Adige, Trento. 1 1.2. Marcatori molecolari Per lo studio della variabilità genetica attualmente vengono effettuate analisi sul DNA che, a differenza dell’analisi a livello morfologico e biochimico, presenta notevoli vantaggi: - è più stabile e manipolabile; - è indipendente da ogni influenza ambientale; - è ripetuto in modo costante e fedele in ogni cellula e tessuto dell’organismo; - è altamente polimorfico tra individui diversi (le proteine invece sono molto più conservate; infatti, teoricamente data la degenerazione del codice genetico si potrebbe anche avere fino a un 30% di mutazioni nella sequenza nucleotidica di un gene senza che a questa corrisponda una differenza nella sequenza amminoacidica della proteina codificata; - consente di risolvere problemi di identità tra individui diversi. Un marcatore molecolare è una sequenza di DNA (trascritta o non trascritta) che esiste in due o più versioni distinguibili e che quindi può essere utilizzata per fissare un punto su una mappa genetica o fisica. La mappatura genetica, che si basa sul concetto di frequenza di ricombinazione, la consente di individuare la posizione nel genoma dei geni e di altre sequenze specifiche di DNA. Le tecniche genetiche includono esperimenti di incrocio per l’ottenimento di popolazioni segreganti o, nel caso dell’uomo, l’esame della storia familiare (pedigree). La mappatura fisica, che fa sempre uso di tecniche di biologia molecolare, rappresenta la distanza fisica, reale, tra i vari geni su un cromosoma. 1.3. I geni come primi marcatori Le prime mappe genetiche, costruite nei decenni iniziali del ventesimo secolo per organismi come il moscerino della frutta (Drosofila melanogaster), usavano i geni come marcatori. Ciò avveniva molti anni prima che si comprendesse che i geni sono segmenti di DNA. I geni erano visti come entità astratte responsabili della trasmissione di caratteristiche 2 ereditarie dai genitori alla prole. Per essere utile nell’analisi genetica, una caratteristica ereditaria doveva esistere in due forme alternative o fenotipi, ad esempio i fusti alti o bassi delle piante di pisello originariamente studiate da Mendel. Ogni fenotipo è specificato da un allele diverso del gene corrispondente. Inizialmente i soli geni che potevano essere studiati erano quelli che specificavano fenotipi distinguibili ad un esame visivo. Così, per esempio, le prime mappe del moscerino della frutta mostravano la posizione dei geni per il colore del corpo, il colore degli occhi, la forma delle ali e simili: tutti fenotipi distinguibili a occhio nudo o con un semplice microscopio ottico. All’inizio questo approccio era adeguato, ma fu presto chiaro ai genetisti che esisteva solo un numero limitato di fenotipi visibili la cui ereditarietà potesse essere studiata e, in molti casi, l’analisi era resa più difficoltosa dal fatto che più di un gene regola un singolo fenotipo. 1.4. Marcatori di DNA I geni sono marcatori utili, ma non ideali. Il problema, in particolare con i genomi più grandi come quelli dei vertebrati e delle piante da fiore, è che una mappa basata unicamente sui geni non è molto dettagliata. Questo sarebbe vero anche se venisse mappato ogni singolo gene perché nella maggior parte dei genomi eucariotici i geni sono spaziati gli uni dagli altri da vaste interruzioni. Il problema viene reso ancora più complicato dal fatto che solo una frazione del numero totale dei geni è presente in forme alleliche che possano essere distinte in modo semplice. Le mappe geniche non sono quindi molto dettagliate e sono necessari altri tipi di marcatori. Caratteristiche di sequenza mappate, diverse dai geni, sono chiamate marcatori di DNA. La maggior parte di tali marcatori si basa su una tecnica che ha rivoluzionato l’approccio metodologico sia nel campo della genetica che delle biotecnologie: la PCR (Polymerase Chain Reaction). Sviluppata da Kary Mullis nel 1985, questa è stata indicata come una delle scoperte più importanti del XX secolo tanto che il suo inventore è stato insignito del Premio Nobel per la Chimica nel 1993. Tale reazione consente di amplificare, mediante una procedura automatizzata, 3 una regione di DNA di particolare interesse a partire da quantità esigue di materiale genetico, sfruttando le proprietà di alcune DNA polimerasi particolarmente stabili alle alte temperature. Tali enzimi sono in grado di sintetizzare un nuovo filamento complementare ad un filamento a singola elica usato come stampo. La reazione viene innescata in presenza di un iniziatore (primer), costituito da un oligonucleotide sintetico in grado di appaiarsi in quanto omologo ad una parte della regione da amplificare, che serve alla polimerasi come inizio per la sintesi della nuova catena in direzione 5’→ 3’. Il processo di amplificazione, che può essere attuato in condizioni differenti, prevede la ripetizione ciclica di tre passaggi (Figura 1.1) al termine dei quali si ottengono una quantità enorme di frammenti di DNA amplificati rispetto a quelli di partenza. I tre passaggi fondamentali sono: - denaturazione del DNA (denaturation) - appaiamento degli iniziatori al templato (annealing) - allungamento dei nuovi filamenti (elongation) La PCR permette la diagnosi precoce di malattie maligne, come la leucemia o i linfomi, e nella ricerca sul cancro viene già utilizzata di routine. La PCR può essere effettuata direttamente su campioni di DNA genomico per rilevare specifiche mutazioni nelle cellule maligne con una sensibilità che è almeno 10.000 volte superiore a quella di altri metodi. La PCR consente anche l'identificazione di microrganismi non coltivabili o a lenta crescita, quali micobatteri e batteri anaerobi. Il DNA virale può altresì essere rilevato mediante PCR. Gli iniziatori utilizzati devono essere specifici per le sequenze mirate nel DNA di un virus, e la PCR può essere utilizzata per le analisi diagnostiche o sequenziamento del DNA del genoma virale. L'elevata sensibilità della PCR consente la rilevazione dei virus poco dopo l'infezione e anche prima della comparsa della malattia. La diagnosi precoce può dare ai medici un vantaggio considerevole in trattamento. 4 Negli anni sono stati sviluppati vari tipi di marcatori molecolari (Garcia et al., 2004) come gli RFLP (Restriction Fragment Length Polymorphism), RAPD (Random Amplified Polymorphic DNA), AFLP (Amplified Fragment Length Polymorphism), VNTR (variable number tandem repeat), SNP (single nucleotide polymorphism), STR (Short tandem repeat), SSR (Simple Sequence Repeat) e molti altri (Michelmore et al., 1992). Figura 1.1. Schema del processo di una reazione di PCR. Si noti come partendo da un solo filamento di DNA se ne ottengano molte copie. 5 1.4.1.RFLP (Restriction Fragment Length Polymorphism) In biologia molecolare la sigla RFLP (dall'inglese restriction fragment length polymorphism, polimorfismo di lunghezza dei frammenti di restrizione) viene utilizzata per indicare due concetti distinti: una caratteristica delle molecole del DNA che consente di distinguerle l'una dall'altra, grazie alle differenze nelle sequenze di nucleotidi che le compongono, e la tecnica di laboratorio che sfrutta tali caratteristiche per mettere a confronto le varie molecole di DNA. Tale tecnica viene utilizzata nella realizzazione di impronte genetiche e nei test di paternità. Furono utilizzati per la prima volta negli anni '80, vengono tipizzati tramite Southern-blot e ibridati con sonde marcate radioattivamente. Di norma si provvede per prima cosa all'estrazione e alla purificazione del DNA da un campione individuale. Il DNA viene quindi sezionato in frammenti di restrizione mediante enzimi di restrizione detti endonucleasi, che attuano il taglio unicamente in corrispondenza di particolari sequenze nucleotidiche, specifiche per ogni enzima. I frammenti di restrizione vengono quindi separati per lunghezza mediante elettroforesi su gel d'agarosio. Successivamente attraverso la tecnica di ibridazione nota come Southern-Blot si identificano le bande determinate dall'ibridazione con sonde di sequenza nota marcate radioattivamente od attraverso fluorocromi. Le distinzioni tra i genotipi sono determinate dalle differenze nel numero e nella lunghezza delle bande che compaiono utilizzando la stessa sonda per l'ibridazione. Tali differenze sono a loro volta determinate dal numero di siti di taglio presenti nella sequenza considerata. La distanza tra le posizioni di taglio degli enzimi di restrizione (i cosiddetti siti di restrizione) è variabile tra un individuo e l'altro. Ciò si riflette in una diversa posizione di alcune bande sul gel, da cui il termine polimorfismo. Questa differenza può essere usata per distinguere geneticamente due individui o mostrare le relazioni genetiche che intercorrono tra individui, in quanto i figli ereditano il materiale genetico dai propri genitori. Lo stesso metodo viene usato anche per determinare le relazioni che intercorrono tra le varie specie. 6 1.4.2.AFLP (Amplified Fragment Length Polymorphism) I marcatori AFLP sono polimorfismi originati da riarrangiamenti del DNA che determinano la perdita o la creazione di siti di restrizione. Il DNA genomico è inizialmente digerito con due diversi enzimi di restrizione generando frammenti di diversa lunghezza e successivamente amplificato mediante reazione di PCR. Il materiale ottenuto è marcato selettivamente e visualizzato tramite elettroforesi su gel di poliacrilamide. Gli AFLP sono dei marcatori altamente polimorfici e hanno il vantaggio di essere ben riproducibili, dei candidati ideali per l’analisi di variabilità genetica e la costruzione di mappe. 1.4.3. RAPD (Random Amplified Polymorphic DNA) I marcatori RAPD sono polimorfismi basati sulla presenza/assenza di un prodotto di amplificazione ottenuto mediante la reazione a catena della polimerasi (PCR). L’amplificazione del DNA genomico avviene con l’utilizzo di un unico iniziatore degenerato di 8-12 nucleotidi che si appaia in maniera casuale ad uno dei due filamenti del DNA. Il prodotto di PCR viene rilevato tramite una colorazione con etidio bromuro dopo corsa elettroforetica su gel d’agarosio. La presenza o l’assenza del prodotto di amplificazione determina il polimorfismo ad un locus per via di mutazioni puntiformi sul sito di appaiamento dell’iniziatore. I vantaggi di questa tecnica sono diversi tra cui la velocità dell’analisi e l’utilizzo di una minima quantità di DNA. Di contro alcuni svantaggi sono la bassa riproducibilità della tecnica dovuta a vari fattori (il tipo di estrazione del DNA, concentrazione dei reagenti, etc..) e la natura dominante di questi marcatori che impedisce di distinguere l’omozigosi dall’eterozigosi. 1.4.4.SNP (Single Nucleotide Polymorphism) I Polimorfismi a Singolo Nucleotide (SNP), scoperti negli anni 80, sono la classe più frequente di polimorfismi presenti nel genoma e sono determinati dalla sostituzione di una singola coppia di basi. I cambiamenti 7 dei singoli nucleotidi possono essere indotti da vari fattori come sostanze chimiche mutagene oppure da errori durante la replicazione del DNA. Il polimorfismo viene distinto in due categorie: - di transizione quando vi è una sostituzione con un nucleotide della stessa classe. (C→T) e (A→G); - di transversione quando vi è una sostituzione con un nucleotide di classe diversa. (C→A), (C→G), (T→A) e (T→G). Gli SNP sono distribuiti lungo tutto il genoma e la maggior parte di essi è localizzata a livello delle regioni non codificanti del genoma. Mentre quelli localizzati all’interno di regioni codificanti e presenti con una minore frequenza spesso sono associati alle alterazioni responsabili di una malattia o di una variante fenotipica. L’analisi degli SNP acquisisce particolare importanza in campo biomedico poiché variazioni di singoli nucleotidi possono influenzare lo sviluppo di alcuni tipi di patologie. 1.4.5.VNTR (Variable Number Tandem Repeat) Un variable number tandem repeat (o VNTR) è una posizione in un genoma, dove una breve sequenza nucleotidica è organizzata come una ripetizione in tandem. Ve ne possono essere molte sui cromosomi, e spesso mostrano variazioni di lunghezza tra gli individui. Ogni variante agisce come un allele ereditato, e può essere quindi utilizzata per l'identificazione personale o dei genitori. Questo tipo di analisi è utile per la ricerca genetica e della biologia, medicina legale, e impronta digitale del DNA. 1.5. SSR (Simple Sequence Repeat) 1.5.1.Introduzione I microsatelliti, o Simple Sequence Repeat (SSR), sono loci polimorfici presenti nel DNA nucleare e degli organelli costituiti da unità ripetute di 8 1-6 coppie di basi. Sono generalmente co-dominanti e sono utilizzati come marcatori molecolari viste le loro ampie applicazioni nel campo della genetica, tra cui l’identificazione di parentela e gli studi di popolazione. I microsatelliti possono essere utilizzati anche per lo studio del dosaggio del gene (in cerca di duplicazione o delezione di una particolare regione genetica). Un esempio comune di un microsatellite è una ripetizione (CA)n, dove n è variabile tra gli alleli. Questi marcatori presentano spesso elevati livelli di inter-e intra-polimorfismo specifici, in particolare quando le ripetizioni sono in numero maggiore di dieci. La sequenza ripetuta è spesso semplice, costituita da due, tre o quattro nucleotidi (rispettivamente ripetizione di-, trie tetra nucleotide), e può essere ripetuto da 10 a 100 volte. Le ripetizioni CA sono molto frequenti nel genoma umano e di altre specie, e sono presenti ogni poche migliaia di paia di basi. In questo modo i microsatelliti sono ideali per la determinazione della paternità, studi di genetica di popolazione e la costruzione di mappe genetiche. I Microsatelliti devono la loro variabilità a un aumento del tasso di mutazione rispetto ad altre regioni neutrali del DNA. Questi alti tassi di mutazione possono essere spiegati frequentemente da uno slittamento di lettura durante la replicazione del DNA su un singolo filamento. La mutazione può verificarsi anche durante la ricombinazione e durante la meiosi. Alcuni errori in slittamento sarebbero compensati da meccanismi di revisione all'interno del nucleo, ma di alcune mutazioni può sfuggire la riparazione. La lunghezza delle unità ripetute, il numero di ripetizioni e la presenza di ripetizioni variabili così come la frequenza di trascrizione nell'area del microsatelliti sono tutti fattori che possono influenzare questo processo. Interruzioni dei microsatelliti, dovute ad esempio a mutazioni, possono risultare in un ridotto polimorfismo. Lo stesso meccanismo può talvolta portare ad una errata amplificazione del microsatellite, specialmente se un errore di slittamento della polimerasi avviene durante i primi cicli della PCR. 9 1.5.2.Amplificazione dei microsatelliti I microsatelliti possono essere amplificati per l'identificazione tramite reazione a catena della polimerasi, utilizzando le sequenze delle regioni fiancheggianti uniche come iniziatori (Zietkiewick et al., 1994). Il DNA è ripetutamente denaturato ad alta temperatura per separare la componente a doppia elica, poi raffreddato per permettere appaiamento degli iniziatori e l'estensione di sequenze nucleotidiche attraverso il microsatelliti. Gli iniziatori che fiancheggiano i microsatelliti sono semplici e veloci da usare, ma lo sviluppo del corretto funzionamento dell’iniziatore stesso è spesso un processo faticoso e costoso. Inizialmente tramite programmi automatici si ricercano i vari marcatori sulla sequenza genomica di interesse. Identificato i marcatori devono essere costruiti (manualmente o tramite appositi software) gli iniziatori di amplificazioni nelle regioni fiancheggianti il marcatore precedentemente identificato. 1.5.3.Identificazione dei microsatelliti L’identificazione e l’analisi dei vari microsatelliti viene effettuata tramite una corsa elettroforetica del prodotto di PCR. I risultati della corsa possono poi essere analizzati in vari modi per identificare i vari alleli e di conseguenza fare le analisi del pattern genomico. 1.5.4.Limitazioni dei microsatelliti I microsatelliti hanno dimostrato di essere marcatori molecolari versatili, in particolare per l'analisi della popolazione, ma non sono senza limitazioni. I microsatelliti sviluppati per specie di particolare interesse possono spesso essere applicate a specie strettamente collegate, ma la percentuale di loci che amplificano con successo può diminuire con l'aumentare la distanza genetica. Mutazioni puntiformi nei siti di annealing possono portare ad una mancata amplificazione. In questo caso si parla di “allele nullo”. Gli 10 alleli nulli complicano l'interpretazione dei microsatelliti e quindi effettuare stime di parentela può risultare difficoltoso. In alcuni casi la PCR e la successiva identificazione può risultare difficoltosa quanto si ha la presenza di alleli (di solito omozigoti) che mascherano l’amplificazione di alleli più deboli (eterozigoti). Nelle cellule tumorali, dove i controlli sulla replicazione del DNA possono essere danneggiati, i microsatelliti possono essere guadagnati o persi con una frequenza particolarmente elevata nel corso di ogni mitosi. Quindi una linea di cellule tumorali potrebbe mostrare un impronta digitale genetica diversa da quella del tessuto ospite. 1.6. Il carattere colonnare (Co) Il portamento è considerato un fattore molto importante nelle piante da frutto in quanto influenza la qualità della frutta, la densità di piantagione, e gli interventi di potatura necessari. Una grande variabilità è stata riscontrata nelle differenti varietà di melo (Figura 1.2), e negli anni, sono stati fatti molti sforzi per classificare i diversi tipi di portamento secondo parametri quali la lunghezza e la distribuzione, il vigore della pianta e la posizione dei frutti (Lespinasse et al., 1986; Kenis, 2003, 2004, 2007). 11 Figura 1.2. Tipologie di portamento dell’albero del melo Il portamento colonnare nel melo è causato da una mutazione dominante a livello del locus co ed è stato inizialmente identificato in un mutazione spontanea della cultivar McIntosh denominata Wijcik (Fisher, 1970). La mutazione è caratterizzata da un numero ridotto di ramificazioni laterali, un aumento del numero di lamburde e internodi molto ravvicinati tra loro (Kesley & Brown, 1992). Queste caratteristiche sono importanti per rendere il melo colonnare una risorsa genetica importante per l’ottenimento di nuove varietà, in particolare per la produzione di cultivar compatte (Lapins, 1976, Tobutt, 1984, Kesley & Brown,1992). Il fenotipo colonnare sembra essere controllato da un singolo gene dominante (Co) (Kim et al., 2003; Tian et al., 2005; Zhu et al., 2007;) anche se uno o più geni minori potrebbero essere coinvolti nell’espressione del carattere. Dal 1985 sono state selezionate cinque cultivar che portano il gene Co: Telamon, Tuscan, Trajan, Maple e Charlotte (Tobutt, 1988a,b). Al momento, tutte le varietà colonnari a disposizione sono eterozigoti (Coco). In alcune progenie segreganti l'habitus colonnare non è facile da 12 individuare in alberi giovani, in particolare durante le prime due stagioni di crescita. Di conseguenza, un marcatore del DNA strettamente associato al gene Co potrebbe essere prezioso per la selezione precoce di alberi che portano questo carattere. Inoltre, l’ottenimento di una mappa molecolare altamente satura della regione che controlla l’habitus colonnare costituirebbe una base di partenza ideale per il clonaggio del gene Co. Il gene Co è stato inizialmente localizzato con il marcatore di tipo RAPD dominante P459800 sul gruppo di linkage 10 di 'Wijcik McIntosh' (Conner et al., 1998). Nel corso degli anni altri marcatori molecolari sono stati individuati nella stessa regione. In particolare sono stati identificati marcatori RAPD e AFLP associati al gene Co, che in alcuni casi sono stati convertiti in marcatori SCAR affidabili e facilmente trattabili. Negli ultimi anni sono stati sviluppati anche alcuni marcatori SSR (Hemmat et al., 1997, 2003; Goulao et al.,2001; Espley et al..2009). I marcatori SSR sono particolarmente utili perché facilmente trasferibili tra mappe genetiche diverse consentendo così lo studio di un carattere prescelto in diversi background genetici. I marcatori attualmente a disposizione sono comunque troppo distanti dal locus Co per consentire un’efficace identificazione e clonaggio del gene responsabile del carattere. Per questo vi è la necessità di sviluppare nuovi marcatori più vicini al gene in modo da creare una mappa ad alta risoluzione per la successiva identificazione del gene e della proteina correlati. 1.7. Mappe genetiche Una mappa genetica o mappa di concatenazione è una rappresentazione della distanza che separa i geni, basata sui dati di ricombinazione genetica. La ricombinazione genetica si ha grazie al crossing-over, il quale modifica il corredo genetico cellulare semplicemente scambiando tra loro sezioni di cromosomi omologhi, durante la profase I della meiosi. Mappare i geni è un processo che determina la posizione relativa dei geni sui cromosomi a partire da un locus preso come riferimento. Si distingue dalla mappa fisica, che invece è basata sulle distanze fisiche lungo il 13 cromosoma, ed è espressa in coppie di basi (bps). Le mappe genetiche per linkage sono mappe costruite mediante associazione genetica, determinando la frequenza con cui due marcatori sintenici (ossia associati e quindi localizzati sullo stesso cromosoma) sono ereditati insieme. Nelle mappe genetiche non e' necessario conoscere la localizzazione sul cromosoma dei marcatori studiati, in quanto nella costruzione di queste mappe si cerca di svelare l'associazione tra due o più loci. Loci che sono molto vicini sul cromosoma hanno una probabilità maggiore di essere ereditati insieme rispetto a loci distanti. Studi genetici su famiglie per determinare quanto frequentemente due o più coppie di alleli sono ereditati insieme, permettono la costruzione di mappe genetiche in cui la distanza tra due geni e' misurata in cM (in onore al genetista americano Thomas Hunt Morgan). Un cM, o unità di mappa genetica, e' definito come la distanza tra due geni per i quali un prodotto della meiosi su cento e' ricombinante. Un esempio di mappa genetica è riportato in Figura 1.3. 14 Figura 1.3. Mappa genetica del cromosoma 10 di melo. Dopo aver calcolato le frequenze di ricombinazione grazie anche a dei sistemi informatici come JOINMAP (Van Ooijen et al., 1993; Stam, 1993), MAPMAKER (Lander et al., 1987), LINKAGE, ecc.. si possono costruire mappe genetiche (Liebhard et al., 2003)., su cui porre anche marcatori molecolari utili alla ricostruzione completa di interi cromosomi grazie alla creazione di contig (Figura 1.4) cioè frammenti le cui estremità siano sovrapponibili concatenandoli per creare frammenti di genoma sempre più grandi fino a ricostruire interamente i cromosomi e di conseguenza l’intero genoma. 15 Frammenti Figura 1.4. Esempio di creazione di un contig. Le estremità dei frammenti vengono sovrapposte in apposite regioni del genoma (A,B,C,D,E) per formare un intero contig. I veri contig, successivamente, verranno uniti per ricostruire interamente i cromosomi e l’intera sequenza genomica. 1.8. Predizione geni e proteine candidati Dopo la ricostruzione della mappa genetica nella zona presunta del locus del gene di interesse si passa ad un’analisi probabilistica per cercare di identificare il gene ricercato. Esistono dei software di predizione genica, i quali rappresentano dei tentativi di identificare, all’interno di una sequenza di DNA, le regioni con la più elevata probabilità di essere codificanti (proteine o altro), sulla base delle caratteristiche delle sequenze dei geni già noti dello specifico organismo considerato o di organismi affini. Grazie all’applicazione di tali programmi bioinformatici, su ogni contig di melo sono identificate delle regioni codificanti o ORFs (dall’inglese Open Reading Frame) che corrispondono agli ipotetici geni contenuti in queste regioni. 16 2. MATERIALI E METODI 2.1. Materiale vegetale Per lo studio in considerazione sono stati effettuati degli incroci delle cultivar Golden X Wijcik , Goldrush X Wijcik e Galaxy X Wijcik . Il campionamento è stato eseguito su 129 individui della popolazione Golden X Wijcik, 139 individui della popolazione Goldrush X Wijcik e 60 individui della popolazione Galaxy X Wijcik prelevando una foglia giovane da ogni pianta. 2.2. Liofilizzazione e macinazione dei campioni Le foglie campionate in tubi di raccolta sono state inserite nel liofilizzatore per 24 ore, e successivamente conservate a -80°C. Il materiale vegetale liofilizzato è stato successivamente macinato utilizzando il Mixer Mill 300 (Retsch) secondo il seguente protocollo: 1. Prelevare dal freezer la piastra contenente i tubi di raccolta. 2. Aggiungere una biglia per ogni tubo e chiudere con gli appositi tappi. 3. Chiudere le piastre con gli appositi coperchi e battere sul bancone per evitare che le biglie rimangano attaccate al tessuto 4. Rottura dei tessuti a) Inserire le piastre negli appositi adattatori e fissarli nei morsetti del Mixer Mill. b) Azionare lo strumento per 1 minuto a 20 Hz. c) Togliere e smontare le piastre dagli adattatori ed annotarne l’orientamento. d) Richiudere le piastre con i coperchi e battere per 5 volte al fine di evitare che le biglie rimangano attaccate al tessuto. e) Inserire le piastre negli appositi adattatori e fissarli nei morsetti del Mixer Mill. Il montaggio deve essere tale che i tubi che prima erano più interni siano ora più esterni. In 17 questo modo si assicura che la rottura dei tessuti sia uguale in tutti i tubi. f) Azionare lo strumento per 1 minuto a 20 Hz. g) Controllare che tutti i campioni siano frantumati. h) Se necessario battere 5 volte sul bancone le piastre e azionare lo strumento per 1 minuto a 30 Hz. i) Se necessario battere nuovamente le piastre sul bancone. Il montaggio deve essere tale che i tubi che prima erano più interni siano ora più esterni. In questo modo si assicura che la rottura dei tessuti sia la stessa in tutti i tubi. j) Azionare lo strumento per 1 minuto a 30 Hz. k) Ripetere il punto i e j se necessario. 5. Togliere e smontare le piastre dagli adattatori, battere sul bancone 5 volte per evitare che del tessuto rimanga nei tappi. 6. Centrifugare le piastre fino a 3000 rpm per convogliare il tessuto sul fondo. 7. Prima di utilizzare i campioni picchiettare gentilmente il fondo dei tubi in modo da smuovere il tessuto impaccato sul fondo. 2.3. Estrazione del DNA genomico Il DNA genomico è stato estratto mediante il kit d’estrazione DNeasy 96 Plant Kit (QIAGEN) e la stazione robotica Freedom Evoware (TECAN) con testa a 96 aghi, usando il seguente protocollo: Prima di eseguire l’estrazione aggiungere etanolo al 96% ai Buffer AP3 e AW come indicato sulla confezione ed inoltre preriscaldare il Buffer AP1 a 65°C. 1. Preparare la soluzione di lisi per 110 campioni in una falcon da 50 ml come riportato in tabella: 18 Volume per campioni Buffer AP1 (a 65°C ) RNase A (100 mg/ml) Reagent DX 400 μL 1 μL 1 μL Volume per 110 campioni 44 mL 110 μL 110μL 2. Mescolare per inversione la falcon. Aggiungere ad ogni campione 400 μL della soluzione di lisi e chiuderli con gli appositi tappi. Chiudere le piastre e agitare vigorosamente per 15 secondi. Centrifugare fino a raggiungere i 3000 rpm e fermarsi. 3. Rimuovere i tappi e aggiungere ad ogni campione 130 μL Buffer AP2 e chiudere con nuovi tappi. Chiudere le piastre ed agitare 15 secondi. Centrifugare fino a raggiungere i 3000 rpm e fermarsi. 4. Mettere i campioni per 10 minuti a -20°C per permettere la precipitazione di proteine e inibitori della reazione di estrazione.. 5. Centrifugare le piastre a 6000 giri per 5 minuti. 6. Trasferire, utilizzando una multicanale, 400 μL in nuove piastre microtubes collection facendo attenzione a mantenere l’ordine dei tubi. Recuperare le biglie dalle racks usate precedentemente. 7. Aggiungere 1,5 volumi di buffer AP3 (normalmente 500 μL) ad ogni campione e chiudere con nuovi tappi. 8. Chiudere le piastre ed agitare vigorosamente per 15 secondi. Centrifugare fino a raggiungere i 3000 rpm e fermarsi. 9. Mettere le piastre DNeasy 96 nei blocchi S e segnarne un angolo per contraddistinguerle. 10. Togliere i tappi e trasferire 1 mL di ogni campione nelle piastre DNeasy 96. Chiudere le piastre con il foglietto adesivo AirPore Tape e centrifugare per 4 minuti a 6000 rpm. Nel caso il lisato non sia passato tutto dal filtro centrifugare per altri 4 minuti. 11. Togliere il foglietto adesivo ed aggiungere ad ogni campione 800 μL di Buffer AW. 19 12. Chiudere le piastre DNeasy 96 con un nuovo foglietto adesivo AirPore Tape e centrifugare a 6000 rpm per 15 minuti per seccare le membrane. 13. Togliere il foglietto adesivo e posizionare ogni piastra DNeasy 96 nella direzione corretta sulle piastre di eluizione microtube RS. Aggiungere ad ogni campione 100 µL di Buffer AE preriscaldato a 60°C e chiudere le piastre DNeasy 96 con un nuovo foglietto adesivo AirPore Tape. Incubare per 1 minuto a temperatura ambiente. Centrifugare per 2 minuti a 6000 rpm. 14. Ripetere il passaggio 13 aggiungendo altri 100 µL di Buffer AE preriscaldato a 60°C ad ogni campione e chiudere le piastre DNeasy 96 con un nuovo foglietto adesivo AirPore Tape. Incubare per 1 minuto a temperatura ambiente e poi centrifugare per 2 min a 6000 rpm. 15. Trasferire il Dna, eluito in 200 µL, nelle nuove piastre e conservare in frigo o a -20°C. 2.4. Quantificazione del DNA genomico La quantificazione del DNA è stata effettuata utilizzando un intercalante fluorescente del DNA (Quant-iT PicoGreen dsDNA Assay Kit, INVITROGEN) ed un lettore di fluorescenza (Synergy2, BIOTEK). La curva di taratura per la quantificazione del DNA genomico è stata creata usando una quantità nota di DNA a doppia elica di fago lambda (λ). Preparazione dei campioni standard per la curva di taratura: 1. Preparare una aliquota di fago lambda (λ) alla concentrazione di partenza di 100 ng/μL; 2. Preparare sei campioni standard per costruire la curva di taratura. Ogni standard deve avere un volume finale di 1000 μL; 3. Diluire il λ alla concentrazione di 10 ng/μL: prelevarne 10 μL [100 ng/μL] e aggiungere 90 μL di TE; 20 4. Preparare i campioni standard alle concentrazioni di 1 - 0,5 - 0,1 - 0,01 - 0,001 - 0 ng/μL per la curva di taratura come riportato in tabella: Volume finale (μL) Concentrazion Volume (μL) Volume (μL) e finale di DNA TE 1X di DNA λ 1 ng/μL 1470 30 [100 ng/μL] con PicoGreen 1500 [2 ng/μL] 0,5 ng/μL 500 500 [2 ng/μL] 1000 [1 ng/μL] 0,1 ng/μL 800 200 [1 ng/μL] 1000 [0,2 ng/μL] 0,01 ng/μL 900 1000 [0,02 ng/μL] 0,001 ng/μL 900 100 [0,2 ng/μL] 100 [0,02 0 ng/μL 1000 ng/μL] 0 BIANCO 1000 0 di DNA λ da usare 1000 [0,002 ng/μL] 1000 1000 Preparazione dei campioni di DNA genomico da quantificare: 1. Diluire i campioni di DNA genomico 1 a 50 (1:50), (Prelevare 1 μL di DNA in 49 μL TE); 2. Prelevare 5 μL del diluito (1:50) e dispensarlo nella piastra di lettura; 3. Aggiungere ai campioni 45 μL di TE in modo da raggiungere una diluizione pari a 1 a 200; 4. Dispensare 50 μL di Picogreen diluito (1:200) in ogni pozzetto della piastra (compresi i pozzetti degli standard). La fluorescenza è rilevata mediante Synergy2 (BIOTEK) utilizzando filtri di eccitazione a 485/20 e filtri di emissione a 516/20. 2.5. Amplificazione del DNA genomico Il DNA genomico è stato amplificato tramite PCR. Dopo aver fatto scongelare il DNA precedentemente estratto è stata preparata la mix di 21 PCR. Nella piastra di reazione viene aggiunto 1 µL di DNA e successivamente 14 µL di mix lavorando sempre in ghiaccio. Reagente Buffer 10X MgCl2 (2 mM) dNTPs (0,2 mM) Primer Fowards (1 µM) Primer Reverse (1 µM) Taq Gold (0,2U/ µL) H2O Quantità (µL) 1,5 1,2 1,5 2 2 0,1 Porto a 15 µL Quantità per 100 campioni (µL) 150 120 150 200 200 10 570 Dopo aver posto la mix e il DNA nelle apposite piastre da 96 campioni si chiudono con gli appositi tappi. Le si centrifuga per alcuni secondi e poi le si pone nel termociclatore e si fa partire la razione di PCR. Passaggi I° Step II° Step III° Step IV° Step V° Step VI° Step VII° Step Temperatura (°C) Tempo (secondi) 94°C 10’ 94°C 30” 60°C 30” 72°C 1’ Poi 34 volte al II° Step 72°C 5’ 14°C Quando a 14°C fine reazione 2.6. Elettroforesi su gel d’agarosio La visualizzazione del DNA genomico amplificato è stata effettuata facendo correre il DNA su gel d’agarosio con un marcatore di corsa a peso molecolare e concentrazione nota, DNA Ladder mix (Mass Ruler, Fermentas). Per la colorazione del DNA è stato utilizzato il GelStar nucleic acid gel stain (BioWhittaker Molecular Applications, Rockland ME USA), un intercalante del DNA che emette luce se esposto alla luce UV. E’ stata poi preparata la miscela per la corsa elettroforetica: 22 • 1 µL Gel star • 2 µL Loading Buffer (≈1 µL per 5 di totale) • 5 µL H2O • 5 µL campione e marcatore La miscela viene caricato su gel d’agarosio allo 1,5% immerso in tampone TAE 0,5X. La corsa elettroforetica è stata effettuata ad un voltaggio di circa 80 V per circa 10-15 minuti. L’intensità della luminosità delle bande è proporzionale alla quantità di DNA presente in quel pozzetto e quindi la quantificazione è stata stimata mettendo a confronto l’intensità della luminosità del campione con quella del marcatore di corsa a concentrazione nota. La lettura è stata effettuata grazie ad un acquisitore di immagini munito di camera a raggi UV e di macchina fotografica (Uvitec). 2.7.Genotipizzazione mediante elettroforesi capillare Dopo aver verificato dalla corsa elettroforetica che la reazione di PCR abbia funzionato bisogna verificare che il prodotto della reazione sia il frammento di DNA di interesse e che esso sia utile come marcatore molecolare per il nostro studio. A seconda della concentrazione del DNA vengono scelte le opportune diluizioni da effettuare sul prodotto di PCR prima di passare all’elettroforesi capillare e corsa al sequenziatore 3730xl DNA Analyzer (ABI). Diluizione Quantità prodotto 2x 5x 10x PCR (µL) 15 µL 15 µL 15 µL H2O (µL) 15 µL 60 µL 135 µL Volume totale (µL) 30 µL 75 µL 150 µL In una nuova piastra vengono posti 0,3 µL di DNA diluito e 9,7 µL d una soluzione di Formammide e un size standard Gene Scan-500 LIZ (ABI) a dimensioni note ( 5 µL di size standard in 1mL di formammide). La piastra va poi coperta con gli appositi tappi forati per la corsa al sequenziatore. 23 NB: questi passaggi devono essere effettuati sotto cappa perché la formammide è una sostanza tossica (R61, S45-53). La piastra viene centrifugata per alcuni secondi e poi posta in un termociclatore per circa 4 minuti a 95°C passaggio che permette di denaturare la doppia elica del DNA per la successiva corsa elettroforetica capillare. Una volta denaturato il DNA è subito raffreddato in ghiaccio per evitare la rinaturazione della doppia elica che impedirebbe la successiva analisi. La piastra viene infine caricata sul sequenziatore per la corsa elettroforetica capillare. 2.8. Analisi dati Il sequenziatore effettua una corsa capillare separando i vari frammenti di DNA in base alla loro lunghezza (la lunghezza varia in base alle ripetizioni del microsatellite). Successivamente, tramite l’uso di un apposito software (GeneMapper v 4.0) i dati vengono utilizzati per costruire un grafico dove in ascissa viene posta la lunghezza dei frammenti di DNA espressa in paia di basi e in ordinata la quantità di fluorescenza emessa. I vari picchi corrispondono agli alleli (Figura 2.1). 24 A B Figura 2.1. Esempio di elettroferogramma di un campione. Il primo picco (A) corrisponde alla fluorescenza degli iniziatori residui. Gli altri picchi (B) corrispondono ai due alleli della popolazione. L’ultimo passaggio consiste nell’assegnare correttamente i vari alleli ai parentali e alle piante figlie di una popolazione segregante, permettendo così l’identificazione di quegli alleli associati al fenotipo colonnare. Per far questo si procede alla costruzione di una mappa genetica della regione di interesse. 3. RISULTATI e DISCUSSIONE 3.1. Fenotipizzazione Inizialmente ogni pianta utilizzata per lo studio è stata fenotipizzata in base a caratteristiche morfologiche visive per identificare correttamente le piante colonnari e quelle standard. La fenotipizzazione avviene principalmente su base visiva. Grazie all’esperienza dell’operatore (Figura 3.1) e ad indicazioni derivanti da precedenti studi (Lespinasse et al., 1986; 25 Kenis, 2003; Kenis et al., 2007) si riesce ad identificare correttamente il portamento della pianta. Solo nel caso di piante sufficientemente mature (in campo da almeno 3-4 anni) è possibile aiutarsi nella fenotipizzazione con misure oggettive quali il numero degli internodi, il numero e la lunghezza dei rami laterali e il diametro del tronco. Va comunque precisato che non esiste in assoluto un modo per classificare senza possibilità di errore il portamento di una pianta, in quanto innumerevoli fattori genetici e ambientali possono concorrere a modificarlo leggermente, creando così un certo numero di fenotipi classificabili come “intermedi”. Le popolazioni fenotipizzate sono: 1. Golden x Wijcik costituita da 129 individui; 2. Goldrush x Wijcik costituita da 3. Galaxy x Wijcik costituita da 139 individui; 60 individui. 26 A B Figura 3.1. Esempio di pianta ad habitus colonnare (A) e pianta a portamento normale (B) della popolazione Golden x Wijcik. Le piante sono state divise come mostrato in tabella I: Tabella I: suddivisione della popolazione in base al portamento della pianta. Popolazione habitus habitus colonnare (n°) normale (n°) habitus intermedio (n°) Totale Golden x Wijcik 46 77 6 129 Goldrush x Wijcik 51 83 5 139 Galaxy x Wijcik 30 26 4 60 Totale Popolazione 127 186 15 328 27 3.2.Genotipizzazione marcatori provenienti da bibliografia Al fine di fornire un solido punto di partenza per la mappatura fine della regione genomica di interesse, diversi marcatori disponibili in letteratura sono stati testati utilizzando tre popolazioni segreganti: Golden x Wijcik, Goldrush x Wijcik e Galaxy x Wijcik, per un totale di 328 piante. Sono stati utilizzati sia marcatori SSR che SCAR e i risultati sono mostrati nella figura 3.2(A). Su di un lato un marcatore SSR, CH03d11, risulta cosegregante con il gene Co (nessuna ricombinazione con il gene nella popolazione). Sul lato opposto un marcatore SSR, HI01b01, e un marcatore SCAR (SCAR216) sono stati rispettivamente posti 2,7 cM (9 ricombinazioni nella popolazione) e 6,1 cM (20 ricombinazioni nella popolazione) dall’ipotetico gene Co. Un nuovo marcatore SSR (Co01L02) è stato sviluppato dalla stessa parte di CH03d11 utilizzando i dati disponibili provenienti dal progetto di sequenziamento del DNA di melo in corso alla Fondazione Edmund Mach di San Michele all’Adige, Trento. La distanza stimata di Co01L02 dal gene Co è stata di 2,4 cM (8 ricombinazioni nella popolazione). Il nuovo marcatore è stato sviluppato in quella particolare regione per colmare un vuoto. Infatti, i marcatori proposti dalla letteratura non amplificavano nella nostra popolazione. Una regione genomica relativamente grande è stato scelta come punto di partenza a causa delle dimensioni relativamente piccole della popolazione segregante disponibile. Le distanze in centimorgan (cM) sono state calcolate in base agli individui che presentavano ricombinazioni tra un marcatore e l’altro rapportando poi il risultato di ricombinazioni su 328 piante a 100. Infatti un cM, o unità di mappa genetica, e' definito come la distanza tra due geni o marcatori per i quali un prodotto della meiosi su cento e' ricombinante. Il passo successivo è quello di ancorare la mappa genetica della regione Co sulla sequenza reale del genoma, limitata tra Co01L02 e HI01b01. I tre marcatori SSR considerati sono stati dislocati su tre gruppi distinti e consecutivi di sequenze o cluster come raffigurato nella Figura 3.2(B), che delimita una regione genomica di circa 5 Mb. La regione genomica 28 compresa tra Co01L02 e HI01b01 è stato poi presa in considerazione per un'analisi più approfondita, alla ricerca di nuovi marcatori SSR cosegreganti con Co. I Marcatori e le sequenze degli iniziatori sono mostrati in tabella II: Tabella III: Marcatori SSR o SCAR provenienti da lavori precedenti, le sequenze degli iniziatori. Marcatore SSR o SCAR CH03d11 HI01b01 SCAR216 Co01L02 Sequenza Iniziatori Forward: 5'-ACCCCACAGAAACCTTCTCC-3’ Reverse: 5'-CAACTGCAAGAATCGCAGAG-3’ Forward: 5'-GCTACAGGCTTGTTGATAACGC-3’ Reverse: 5'-ACGAATGAAATGTCTAAACAGGC-3’ Forward: 5'-GATCCATCACGACTATCAGG-3’ Reverse: 5'-TCAACCGGTGTTCACATTTC-3’ Forward: 5'-AGCCACAAACGGTACATAGC-3’ Reverse: 5'-ATTATTGTTATTTCTCGTTGACG-3’ 29 2,4 cM 2,7 cM 6,1 cM Figura 3.2. La Mappa genetica della regione Co (A) mostra i tre marcatori SSR e il marcatore SCAR utilizzati come punti di partenza. Le distanze sono espresse in centimorgan (cM). Nella figura B sono raffigurati i Cluster di sequenze genomiche che contengono i marcatori mostrati. Lunghezze sono espressi in milioni di paia di basi (Mb). 3.3. Sviluppo nuovi marcatori Sette nuovi marcatori SSR sono stati sviluppati, nella regione di interesse. I due marcatori più esterni, Co04R03 e Co04R13 (Figura 3.3A) distano tra loro circa 1 cM (3 ricombinazioni tra loro nella popolazione). All'interno di questa regione cinque nuovi marcatori SSR (Co02R10, Co04R09, Co04R10, Co04R11 e Co04R12) hanno mostrato il linkage completo con Co, cioè non presentavano ricombinazioni con il gene. Secondo gli ultimi dati genomici disponibili la distanza fisica tra Co04R03 e Co04R13 è stata stimata a 820 kb (Figura 3.3B). 30 2,4 cM 0,5 cM 0,5 cM 2,7 cM Figura 3.3. Mappatura fine della regione Co (A). Cinque marcatori SSR (Co02R10, Co04R09, Co04R10, Co04R11, Co04R12) hanno mostrato linkage completo con il gene Co. Le distanze sono espresse in centimorgan (cM). Nella figura B sono mostrati i cluster genomici e la posizione fisica del marcatore utilizzato. Lunghezze sono espresse in migliaia di coppie di basi (kb) Nella tabella III sono mostrate le sequenze degli iniziatori dei nuovi marcatori. Tabella III: Marcatori SSR nuovi che sono stati mappati durante questo progetto, le sequenze degli iniziatori. Marcatore Co04R03 Co02R10 Sequenza Iniziatori Forward: 5'-GTTTGCTCTTTTGACTGACGC-3’ Reverse: 5'-CTCAGCTTTTCAGCCATTTCC-3’ Forward: 5'-ATCATGGAGGGTCTACTTCG-3’ Reverse: 5'-GAGATTAAGAAAGCGCGAACC-3’ 31 Co04R09 Co04R10 Co04R11 Co04R12 Co04R13 Forward: 5'-TAGTGACATATACATGGTGCG-3’ Reverse: 5'-GTTGGAGAATGAGTGACGGC-3’ Forward: 5'-ACCTGGTTCCGGTACATAGC-3’ Reverse: 5'-AACCTTCCATGGCAGCAATC-3’ Forward: 5'-ACATCATGGTATGACAGAGGTG-3’ Reverse: 5'-TCTAAGCCTGTCAAGATGGC-3’ Forward: 5'-TTTATCTGACTAAGGGGAAGG-3’ Reverse: 5'-ATGGACTTGTATTCCTTAGGG-3’ Forward: 5'-ATTTTCCCTCTCTTCTGTTGC-3’ Reverse: 5'-TCTTGGAAAGACGTGGCACG-3’ Dopo aver disegnato e testato i vari marcatori si è dovuto associare i vari picchi dell’ elettroferogramma ai corrispondenti alleli per verificare l’utilità diagnostica del marcatore e la sua capacità di distinguere la popolazione ad habitus colonnare e non. I risultati sono raffigurati nella tabella IV: Tabella IV: Marcatori SSR nuovi che sono stati mappati durante questo progetto e gli alleli associati alle varie cultivar. Marcatore Alleli Golden Alleli Goldrush Co04R03 205-209 205 Co02R10 243 243-247 Co04R09 188-192 176-188 Co04R10 193 183-193 Co04R11 198-214 190-214 Co04R12 208 208 Co04R13 247 241-247 3.4. Ricerca geni candidati Alleli Galaxy 205-209 243 188-192 193 214 208 247-249 Alleli Wijcik 209-212 251-300 156-188 185-203 172-184 194-223 235-237 La regione da noi identificata (quella compresa tra Co04R03 e Co04R13) è quella che presumibilmente contiene il gene di interesse. Tramite l’utilizzo di appositi software sono stati quindi identificati i geni presenti all’interno di questa regione e le loro sequenze sono state inserite in 32 banca dati per cercare di attribuire loro una funzione. A questo scopo, si sono effettuati confronti tra le sequenze di melo e dei database contenenti sequenze appartenenti a diversi organismi, di cui è nota la funzione. Questo perché si suppone che, in organismi diversi, sequenze di DNA simili codifichino per proteine con funzione analoga. Per i confronti viene utilizzato l’algoritmo BLAST (Basic Local Alignment Search Tool), il quale individua le regioni di similarità locali tra sequenze nucleotidiche o proteiche. Per ogni risultato restituito, il programma calcola e associa un valore di significatività statistica, il quale esprime la probabilità che la corrispondenza ottenuta sia dovuto al caso. Quanto più tale valore è prossimo a zero, tanto più è significativa (e non casuale) la similarità tra due sequenze. Poiché, tra specie diverse, le sequenze amminoacidiche sono più conservate rispetto a quelle nucleotidiche, in virtù della degenerazione del codice genetico, si è utilizzata l’opzione blastx, che effettua una “traduzione concettuale” della sequenza di DNA nei sei possibili frame di lettura (tre su entrambi i filamenti) e successivamente confronta tutti i risultati con un database di sequenze proteiche selezionando la migliore fra le varie possibilità. Come ultimo passaggio, è stata effettuata una ricerca bibliografica in PubMed, un archivio digitale di pubblicazioni scientifiche (Joanne et al., 2007; Moraes et al., 2005; Lauri et al., 2008; Yonghong et al., 2006,2008; Schumacher at al.,1999; Greb et al., 2003; Müller et al., 2006; Clay et al., 2005; Hua-Lin et al., 2006; Zhengdao et al., 2008), utilizzando combinazioni di parole chiave quali ad esempio “shoot branching elongation” con lo scopo di trovare, in letteratura, geni noti associati all’allungamento dei germogli laterali; se alcuni di essi corrispondono, per funzione, a quella associata alle predizioni di melo, si è identificato un possibile gene candidato. Dopo queste operazioni sono stati identificati i seguenti geni che potrebbero regolare l’habitus colonnare (Tabella V): Tabella V: Geni candidati che potrebbero controllare l’habitus colonnare, organismi in cui sono stati identificati, la loro funzione e i riferimenti bibliografici. 33 4. CONCLUSIONI Al momento il principale fattore limitante sono le piccole dimensioni della popolazione segregante disponibile. Al fine di superare questo problema nuovo incroci sono stati eseguiti sia nel 2008 e nel 2009. L'obiettivo è 34 quello di ottenere almeno 1000-1500 individui segreganti, che permetterà di aumentare il livello di risoluzione a meno di 0,1 cM su ciascun lato del gene. Quando la regione nell’intorno del gene verrà ancora ridotta si meno potrà restringere ulteriormente il numero di geni candidati per una successiva analisi di espressione e funzione. Nonostante si sia partiti da una regione di circa 5 Mb (compresa tra Co01L02 e HI01b01), si è riuscito a restringerla a circa 820 kb (compresa tra Co04R03 e Co04R13) cioè diminuzione del 83.6% circa, che però non è ancora sufficiente per identificare correttamente il gene di interesse. Un risequenziamento della regione genomica individuata di Wijcik e uno studio più approfondito della regione potranno finalmente fornire il gene effettivamente responsabile del tratto. Quando il gene colonnare verrà identificato, in teoria, non ci sarà più bisogno di aspettare che la pianta cresca prima di determinarne l’habitus. Si potrà creare dei particolari kit che permettano di genotipizzare la pianta appena sviluppa le prime foglie. Selezionando le piantine con habitus colonnare si potrà creare delle cultivar sempre più compatte con meno bisogno di manodopera permettendo di aumentare la produzione riducendo i costi. Nei vari studi si è osservato una variazione anche consistente della distanza in cM dei vari marcatori nelle diverse cultivar studiate (Tian, 2005; Kenis et al, 2007) ciò potrebbe essere spiegato dalla presenza di altri geni coinvolti nell’espressione dell’habitus colonnare e dalla difficoltà di ottenere una fenotipizzazione certa. Anche su questo fronte potrebbero in futuro essere effettuati nuovi studi per identificare le componenti geniche coinvolte e riuscire ad identificare dei marcatori che i permettano di identificare le diverse popolazione nei primi stadi dello sviluppo della pianta. 5. BIBLIOGRAFIA Clay, K.N., Nelson, T., 2005. The Recessive Epigenetic swellmap mutation Affects the Expression of Two Step II Splicing Factors Required for the Transcription of the Cell Proliferation Gene STRUWWELPETER and 35 for the Timing of Cell Cycle Arrest in the Arabidopsis Leaf. The Plant Cell, 17: 1994–2008. Conner, P.J., Brown, S.K., Weeden, N.F., 1998. Molecular marker analysis of quantitative traits for growth and development in juvenile apple trees. Theoretical and Applied Genetics, 96: 1027–1035. Dörte, M., Schmitz, G., Theres, K., 2006. Blind Homologous R2R3 Myb Genes Control the Pattern of Lateral Meristem Initiation in Arabidopsis. The Plant Cell, 18: 586–597. Espley, V.R., Brendolise, C., Chagné, D., Kutty-Amma, S., Gardiner, E.S., Hellens, P.R., Green, S., Volz, R., Putterill, J., Schouten, H.J., Allana, A.C., 2009. Multiple Repeats of a Promoter Segment Causes Transcription Factor Autoregulation in Red Apples. The Plant Cell, 21: 168–183. Fisher, D.V., 1970. Spur strains of “McIntosh” discovered in British Colombia. Canadian Fruit Varieties Horticultural Digest, 24: 27–32. Garcia, AAF., Benchimol, LL., Barbosa, AMM., Geraldi, IO., Souza Jr, CL., Souza, AP, 2004. Comparison of RAPD, RFLP, AFLP and SSR markers for diversity studies in tropical maize inbred lines. Genetics and Molecular Biology; 27(4) : 579-588. Goulao, L., Oliveira, C.M., 2001. Molecular characterization of cultivars of apple (Malus domestica Borkh.) using microsatellite (SSR and ISSR) markers. Euphytica, 122: 81–89. Greb, T., Clarenz, O., Schäfer, E., Dörte, M., Herrero, R., Theres, K., 2003. Molecular analysis of the LATERAL SUPPRESSOR gene in 36 Arabidopsis reveals a conserved control mechanism for axillary meristem formation. Genes & Developement, 17: 1175–1187. Hemmat, M., Weeden, N.F., Conner, P.J., Brown, S.K., 1997. A DNAmarker for columnar growth habit in apple contains a simple sequence repeat. Journal of the American Society for Horticultural Science, 122: 347–349. Hemmat, M., Weeden, N.F., and Brown, S.K., 2003. Mapping and evaluation of Malus domestica microsatellites in apple and pear. Journal of the American Society for Horticultural Science, 128: 515– 520. Hua-Lin Zhou, Si-Jie He, Yang-Rong Cao, Tao Chen, Bao-Xing Du, Cheng-Cai Chu, Jin-Song Zhang and Shou-Yi Chen, 2006. OsGLU1, a putative membrane-bound endo-1,4-b-D-glucanase from rice, affects plant internode elongation. Plant Molecular Biology, 60: 137–151. Kenis, K., 2003. The use of molecular markers in apple breeding: genotype identification and study of tree architecture. PhD dissertation no 574, Faculty of Agricultural and Applied Biological Sciences, Katholieke Universiteit Leuven, Belgium. Kenis, K. and Keulemans, J., 2004. QTL analysis of growth characteristics in apple. Acta Horticulturae, 663: 369–374. Kenis, K., Keulemans, J., 2007. Study of tree architecture of apple (Malus domestica Borkh.) by QTL analysis of growth traits. Breeding, 19: 193–208. 37 Mololecular Kesley, D.F., Brown, S.K., 1992. “McIntosh Wijcik”: A columnar mutation of “McIntosh” apple proving useful in physiology and breeding research. Fruit Varieties Journal, 46: 83–87. Kim, M.Y., Song, K.J., Hwang, J.H., Shin, Y.U., Lee, K.J., 2003. Development of RAPD and SCAR markers linked to the Co gene conferring columnar growth habit in apple (Malus pumila Mill). The Journal of Horticultural Science and Biotechnology, 78: 512–517. Lander, E.S., Green, P., Abrahamson, J., Barlow, A., Daly, M.J., Lincoln, S.E., et al., 1987. MAPMAKER: an interactive computer package for constructing primary genetic linkage maps of experimental and natural populations. Genomics, 1 (2): 174-181. Lapins, K.O., 1976. Inheritance of compact growth type in apple. Journal of the American Society for Horticultural Science, 101: 133–135. Lauri, P.E., Bourdel, G., Trottier, C., Cochard, H., 2008. Apple shoot architecture: evidence for strong variability of bud size and composition and hydraulics within a branching zone. New Phytologist, 178: 798–807. Lespinasse, J.M., Delort, J.F., 1986. Apple tree management in vertical axis: appraisal after ten years of experiments. Acta Horticulturae, 160: 139–155. Liebhard, R., Koller, B., Gianfranceschi, L., Gessler, C., 2003. Creating a saturated reference map for the apple (Malus × domestica Borkh.) genome. Theoretical and Applied Genetics, 106: 1497–1508. Michelmore, R.W., Paran, I. and Kesseli, R. V. 1992. Identification of markers linked to disease-resistance genes by bulk segregant 38 analysis: A rapid method to detect markers in specific genome region by using segregating population. Proceedings of the National Academy of Sciences of the USA, 88: 2444–2448. Moraes, E.M., Abreu, G.A., Andrade, C.S.S., Sene, M.F., Vera, N., 2005. Population genetic structure of two columnar cacti with a patchy distribution in eastern Brazil. Solferini Genetica, 125: 311–323. Schumacher, K., Schmitt, T., Rossberg, M., Schmitz, G., Theres, K., 1999. The Lateral suppressor (Ls) gene of tomato encodes a new member of the VHIID protein family. Plant Biology Proceedings of the National Academy of Sciences, 96: 290–295. Stam, P., 1993. Construction of integrated genetic linkage maps by means of a new computer package: JOINMAP. The Plant Journal,3 (5): 739-744. Tian, Y.K., Wang, C.W., Zhang, J.S., James, C., Dai, H.Y., 2005. Mapping Co, a gene controlling the columnar phenotype of apple, with molecular markers. Euphytica, 145: 181–188. Tobutt, K.R., 1984. Breeding columnar apples at East Malling. Acta Horticulturae, 159: 63–68. Tobutt, K.R., 1988a. Columnar apple tree-Telamon variety. Plant patent— United States Patent and Trademark Office.[Washington, D.C.: The Office] 19: (6224) 2 pp. Tobutt, K.R., 1988b. Columnar apple tree-Tuscan variety. Plant patent— United States Patent and Trademark Office.[Washington, D.C.: The Office] 19: (6225) 2 pp. 39 Van Ooijen, JW., Voorrips, RE., 2001, "JoinMap (tm) 3.0: Software for the calculation of genetic linkage maps". The Plant Journal, 3: 739-744. Yonghong, W., Jiayang, L., 2006. Genes controlling plant architecture. Biotechnology, 17: 123–129. Yonghong, W., Jiayang, L., 2008. Molecular Basis of Plant Architecture. Annual Revision Plant Biology, 59: 253-279. Zhengdao, Wu, Soliman, M.K., Bolton, J.J., Saha, S., Jenkins, J.N., 2008. Identification of differentially expressed genes associated with cotton fiber development in a chromosomal substitution line (CS-B22sh). Functional & Integrative Genomics, 8: 165–174. Zhu, Y.D., Zhang, W., Li, G.C., Wang, T., 2007. Evaluation of inter-simple sequence repeat analysis for mapping the Co gene in apple (Malus pumila Mill.). Journal of Horticultural Science & Biotechnology, 82 (3): 371–376. Zietkiewicz, E.,Rafalski, A. and Labuda, D., 1994. Genome fingerprinting by simple sequence repeat (SSR) – anchored polymerase chain reaction amplification. Genomics, 20: 176–183. 40