Ri.Selv.Italia Sottoprogetto 2.2 Produzione di legno fuori foresta – Arboricoltura da legno con specie a rapido accrescimento (pioppicoltura) Responsabile scientifico dr. Achille Giorcelli (C.R.A. – Unità di Ricerca per le Produzioni legnose fuori foresta, Casale Monferrato – AL) Relazione Finale Titolo: 2.2.6 - Identificazione clonale – Sviluppo di modelli per l’analisi congiunta dei descrittori. Unità Operativa: Dipartimento di biotecnologie agrarie – Università degli studi di Firenze P.le delle Cascine 24, 50144 FIRENZE, tel. 055 3445048 Responsabile Unità Operativa: prof. Alessandro Camussi [email protected] 1) Obiettivi della scheda di ricerca Sono attualmente disponibili liste molto estese di descrittori per l’identificazione varietale, basati essenzialmente su diverse caratteristiche morfologiche e fenologiche. L’utilizzo nella pratica applicativa può essere ostacolato anche dalla difficoltà dell’analisi statistica dei risultati, mentre l’uso di un numero ridotto di descrittori per caratterizzare cloni non è spesso possibile anche se le caratteristiche considerate hanno una reale rilevanza economica senza una verifica del loro contenuto informativo. Molte caratteristiche spesso mostrano ridotta ripetibilità o sono altamente variabili anche entro lo stesso clone. Anche se metodi di “fingerprinting” molecolare stanno dimostrando sempre più la loro efficacia, la descrizione clonale è correntemente accettata solo sulla base di caratteristiche morfologiche. Lo scarso potere discriminante dei descrittori morfologici considerati singolarmente può essere compensato valutando congiuntamente un gran numero di questi e ottenendo una rappresentazione congiunta della descrizione del clone. La ricerca si è proposta di verificare ed applicare modelli di analisi per la valutazione di descrittori con caratteristiche diverse in modo congiunto. L’obbiettivo risiede essenzialmente nella individuazione di descrittori semplici da rilevare ma ai quali sia associato un elevato potere discriminante. La sperimentazione in vivaio e i disegni sperimentali adottati hanno consentito di correlare il potere discriminante con le caratteristiche note a priori dei cloni inclusi nella sperimentazione stessa. Al termine del progetto è attesa l’individuazione dei descrittori più idonei ad essere utilizzati per la valutazione clonale in pioppo e la possibilità di integrazione con informazioni di carattere molecolare. 2) Materiali, metodi e organizzazione del lavoro L’attività di ricerca è stata strutturata in due settori complementari: l’analisi dei dati ottenuti da prove comparative (essenzialmente nei primi due anni/fasi della ricerca) e lo sviluppo di marcatori molecolari e loro utilizzo nella valutazione congiunta con i descrittori morfologici (soprattutto nella seconda parte del progetto). Per entrambi gli aspetti l’attività è stata strettamente coordinata con l’U.O. dell’ISP di Casale Monferrato che oltre a fornire il materiale clonale ha allestito i vivai sperimentali e rilevato i dati in campo a seguito di una pianificazione sperimentale effettuata in modo congiunto. I descrittori morfologici sono stati ottenuti in un primo esperimento con tre vivai (a Casale, nei pressi di Mantova e a Spello) includendo in ciascuno 30 cloni distribuiti in modo randomizzato in dieci ripetizioni di parcelle di cinque piante. I cloni di pioppo sono stati scelti nell’ambio della collezione di cloni iscritti al Registro e giudicati rappresentativi delle specie e della variabilità. I descrittori relativi alla morfologia della pianta sono stati successivamente raccolti da due piante per parcella e i dati descrittivi delle caratteristiche della foglia sono stati raccolti da due foglie da ciascuna pianta. La scelta dei caratteri, tra i molti disponibili a livello di letteratura internazionale, ha privilegiato considerazioni sulla natura distributiva, a livello statistico, e sulle informazioni già presenti circa le condizioni di rilevazione in campo da parte di un numero 1 ridotto di rilevatori, tenendo conto delle finalità a cui la derivazione di modelli descrittori erano rivolte. Un secondo esperimento comparativo è stato impiantato e seguito dall’U.O. di Casale in due località (Mantova e Casale) comprendente più di 100 cloni in parcelle replicate in tre blocchi randomizzati. Anche in questo caso sono stati rilevati descrittori della pianta e delle foglie mediante variabili binarie e quantitative. A Firenze sono stati sviluppati marcatori SSCP (Single-Strand Conformation Polymorphisms) costruendo specifici primer fiancheggianti gli introni di due specifici geni della famiglia delle Catalasi già ampiamente studiati nel laboratorio. L’analisi della variazione all’interno degli introni che può definirsi essenzialmente neutra e non posta sotto il vaglio della selezione o dell’adattamento si è dimostrata molto utile in studi evolutivi, di differenziazione geografica e in genetica delle popolazioni. Questi marcatori sono stati analizzati sullo stesso campione di cloni e su materiale sperimentale la cui origine genetica è nota. I risultati relativi al polimorfismo morfologico e a quello molecolare sono stati analizzati separatamente e congiuntamente mediante pacchetti specifici “open source” (R) e commerciali (SAS, STATA, CLUSTAN). 3) Risultati raggiunti Analisi dei descrittori morfologici Sono stati confrontati i metodi di analisi disponibili in letteratura anche sulla base di verifiche metodologiche su set di dati disponibili. La natura dei dati utilizzati come descrittori rende poco efficaci le normali procedure parametriche basate su assunzioni di natura gaussiana. Più interessanti si sono dimostrati gli approcci non parametrici o di simulazione numerica. Sono state esaminate diverse procedure in questo ambito in grado di individuare ove possibile un sottoinsieme di caratteristiche che consentano in modo semplice ed operativamente facile il massimo potere discriminante tra cloni di pioppo. I dati provenienti dalla sperimentazione in campo, raccolti nel corso dell’estate e dell’inizio dell’autunno 2002 dall’U.O. di Casale sono stati trasmessi a Firenze per la immissione su supporto elettronico e per la successiva elaborazione. Il data set completo comprende, per le due località che hanno permesso di ottenere dati completi (Casale e Mantova), 1200 record per gli indici morfologici della pianta (con 6 variabili) e 1180 per gli indici fogliari (con 13 variabili ripetute due volte). E’ stata verificata l’ipotesi di eguaglianza dei cloni con metodologie adatte alle caratteristiche distributive dei diversi caratteri (ANOVA e regressione logistica multinomiale). Anche se è presente una significativa interazione dei cloni con le località, le differenze tra cloni sono significative per tutti i caratteri. Queste differenze rappresentano il maggiore contributo alla variabilità osservata. Per i descrittori qualitativi di cui sono rilevati dati su due foglie per pianta è possibile stimare la ripetibilità che si è dimostrata sufficientemente buona. L’analisi del contenuto informativo e della ripetibilità ha confermato l’utilità dei descrittori scelti per la classificazione clonale, anche in condizioni in cui, sulla base del complesso disegno sperimentale, può essere valutata l’interazione genotipo per ambiente. L’utilizzo congiunto dei descrittori in chiave discriminante è risultato più complesso a causa delle differenti proprietà distributive. Una strategia alternativa molto recente nell’ambito della teoria dei classificatori ad albero (tree classifiers) proposta da Leo Breiman (University of California, Barkeley) e denominato Random Forest.consiste nell’utilizzo di tecniche numeriche innovative basate su simulazioni al calcolatore. Abbiamo applicato ai dati la procedura Random Forest,. Essa si è rilevata particolarmente efficace per la discriminazione clonale. Random Forest è basata sulla creazione di un insieme ampio (Forest) di alberi classificatori, generati casualmente, che viene lasciato crescere tramite simulazione al calcolatore. Le foreste stocastiche sono una combinazione di alberi classificatori tali per cui ogni albero componente dipende dal valore assunto da un vettore casuale estratto indipendentemente e con la stessa distribuzione per tutti gli alberi della foresta. In una foresta stocastica la cross-validazione avviene internamente senza ricorso a sottoinsiemi di dati esterni alla procedura. Ogni albero è costruito usando un campione bootstrap differente dei dati originali. Circa un terzo delle unità statistiche originali è omessa da tale campione bootstrap. Il tasso di errore si ricava riclassificando ogni unità statistica secondo ognuno degli alberi che non l’hanno impiegata, assegnando la classe risultata come 2 la maggior votata e comparando tale assegnazione con il risultato noto. Esistono stime interne che permettono di descrivere il processo di classificazione e la sua efficienza. La procedura consente di utilizzare variabili con proprietà distributive anche molto diverse e di individuare i migliori descrittori sulla base della loro efficienza classificatoria. Come in tutti procedimenti di analisi discriminante, le foreste stocastiche derivano le regole migliori per assegnare i singoli casi (nel nostro caso le singole piante) alla classe di appartenenza. La bontà del procedimento si verifica riclassificando le singole piante appartenenti al training data set sulla base delle regole classificatorie ottenute. Con i nostri dati sperimentali la riclassificazione ottenuta è piuttosto buona, considerando che il training data set è costituito da vettori relativi a dati di singole piante allevate in due diverse località. I risultati di classificazione peggiori sono relativi al clone I-45/51 ed al clone Triplo, entrambi Populus x canadensis, che si ripartiscono quasi al 50% le relative piante. Il clone Bellini presenta anch’esso un elevato errore, con sole 16 piante correttamente classificate sulle 37 valutate. D’altro canto i cloni Sile, Vereechen (P. nigra), I154 II, I214 ed I476 vedono praticamente tutte le loro piante correntemente classificate dalla procedura. L’errore medio di classificazione di tutti i cloni è comunque basso ed uguale a 0,13 con ben 22 cloni su 30 al disotto di tale livello. La seconda parte della ricerca ha previsto l’utilizzo congiunto di marcatori molecolari basati su polimorfismi a livello di DNA, gli SSCP. Come tutti i marcatori molecolari non risentono delle variazioni ambientali e sono pertanto particolarmente utili a fini descrittivi, classificatori e per l’identificazione clonale anche in stadi molto precoci di sviluppo. Pur escludendo a priori un rapporto di causalità tra i polimorfismi rilevati negli introni di due specifici geni e le caratteristiche fenologiche e morfologiche dei cloni, abbiamo voluto verificare se esistesse qualche relazione tra il livello di somiglianza individuato a livello molecolare e quello rilevabile morfologicamente. Polimorfismo molecolare ed analisi congiunta L’analisi dei polimorfismi molecolari si è dimostrata molto interessante, dimostrando l’efficacia dei marcatori SSCP che sono in grado di associare ad ogni clone uno specifico “fingerprint” o profilo molecolare quantificabile in una sequenza binaria (0/1) sulla base della assenza o presenza delle bande elettroforetiche per ogni introne. Il confronto dei profili ha permesso di discriminare i cloni oggetto di analisi con una precisione in alcuni casi superiore a quella dimostrata in pubblicazioni anche recenti tramite marcatori molecolari casuali (AFLP, SSR). L’esame del dendrogramma UPGMA sulla base dell’indice di dissomiglianza di Jaccard ha rivelato una associazione tra cloni che rispecchia l’appartenenza alle singole specie, dimostrando che il polimorfismo casuale a livello di introni riflette di fatto la storia evolutiva del materiale in esame. La presenza contemporanea di descrittori morfologici per gran parte dei cloni esaminati a livello molecolare (i descrittori utilizzati sono quelli relativi alla prova su due località e tre blocchi randomizzati di cui sopra) ha permesso di confrontare la classificazione derivata dall’informazione molecolare con quella morfologica. Per rendere più semplice il confronto si è preferito limitare quest’ultima alle caratteristiche ampelografiche sulla base delle risultanze ottenute nel corso della prima fase dell’indagine. L’analisi multivariata di questi specifici descrittori (essenzialmente lunghezze ed angoli fogliari) ha confermato, tramite analisi delle componenti principali, l’importanza relative dei caratteri ottenuta attraverso l’approccio delle Foreste Casuali. L’esame delle relazioni di somiglianza sulla base delle caratteristiche fogliari tra i cloni raggruppati (inclusi cioè nei cluster) tramite la sola informazione molecolare ha dimostrato una notevole somiglianza nella riposta classificatoria dei due approcci. Ciò dimostrerebbe che la variabilità molecolare è in grado di rivelare relazioni di somiglianza tra cloni di pioppo che riflettono una parallela ed indipendente variazione delle caratteristiche morfologiche, per lo meno quando si considerino caratteri descrittori morfologici non sensibili alle pressioni della selezione antropica quali le caratteristiche fogliari. Di conseguenza è stato possibile includere le due classi di informazione indipendenti (statisticamente e biologicamente) in un’unica funzione di distanza (distanza di Gower) che è risultata in grado di distinguere (cioè discriminare) ogni clone preso in esame. 4) Conclusioni e prospettive di prosecuzione Gli obbiettivi del progetto sono stati raggiunti in modo ottimale con la proposizione di strategie innovative di analisi di descrittori morfologici. L’analisi congiunta di marcatori 3 molecolari a livello di DNA e di descrittori morfologici ha permesso di aggiungere nuove evidenze all’utilità dei primi nella identificazione e descrizione dei cloni in pioppo. Le strategie future di valutazione possono avvalersi dei risultati ottenuti anche sulla base della proposta di realizzazione di schede varietali che oltre alle principali caratteristiche morfologiche e tecnologiche del clone contengano anche l’informazione molecolare necessaria per la costruzione del profilo (fingerprint) del clone stesso. Un ulteriore sviluppo dell’attività nell’ambito delle tecnologie di identificazione clonale può essere proprio quella di assemblare profili molecolari di tipo diverso in un definito e standardizzato profilo identificativo che possa ricevere l’approvazione delle associazioni di categoria preposte alla salvaguardia dell’identità clonale e dell’iscrizione a registro delle nuove varietà. La definizione del profilo ottimale richiede comunque l’utilizzo ed in parte la messa a punto di procedure di analisi dell’informazione molecolare e della sua rappresentatività. Partecipanti al Progetto appartenenti all’UO Alessandri Stefano; Ricercatore confermato; Dipartimento Biotecnologie Agrarie –Università degli Studi di Firenze tel. 055 3445048 Bardazzi Irene; Assegnista di ricerca; Dipartimento Biotecnologie Agrarie –Università degli Studi di Firenze tel. 055 3445048 Caparrini Simona; Dottoranda di ricerca; Dipartimento Biotecnologie Agrarie –Università degli Studi di Firenze tel. 055 3445048 Giorcelli Achille; Ricercatore; CRA- ISP-Casale M; 0142990900; [email protected] Picco Franco; Tecnico di ricerca; CRA- ISP-Casale M; 0142990900; [email protected] Racchi Milvia Luisa; Professore straordinario; DiBA -UNIFI; 055 3445048; Stefanini Federico Mattia; Professore associato; Dip.Statistica - Università degli Studi di Firenze; 0554237266; [email protected] Finanziamenti ricevuti complessivamente (nel triennio) 1° anno: € 11.370,00 2° anno: € 3° anno: € 12.260,00 TOTALE: € 33.490,00 9.500,00 Elenco pubblicazioni edite Stefanini F., Giorcelli A., Picco F., Camussi A., 2003 - New methods for the classification of poplar clones by means of morphological descriptors. XLVII annual Congress Società Italiana di Genetica Agraria (Verona, 24-27/9/03) ISBN 88-900622-4-X Stefanini F. M., Giorcelli A., Picco F., Camussi A., 2004. Nuovi metodi per la classificazione di cloni di pioppo sulla base di descrittori morfologici - Discussione primi risultati RISELVITALIA MILANO 16/09/2004 Caparrini S., Camussi A., Racchi M., Velasco R., 2004 - Efficient Detection of Dna Polymorphism in Populus Genus by Single-strand Conformational Polymorphism of Catalase Genes. 22nd Session of the International Poplar Commission “The Contribution Of Poplars And Willows To Sustainable Forestry And Rural Development”, Santiago de Chile Camussi A., Stefanini F., 2004. The identification of Poplar clones by Montecarlo methods: the Random Forests. 22nd Session of the International Poplar Commission: “The Contribution of Poplars and Willows to Sustainable Forestry and Rural Development”. Santiago de Chile Caparrini S., Velasco R., Racchi M., Camussi A., 2004. Detection of Dna Polymorphism in the Populus Genus by Intron Analysis of Catalase Genes. Italian Society of Agricultural Genetics XLVIII Sifv-Siga Joint Meeting, F.68- Lecce Giorcelli A., Picco F., Stefanini F., Camussi A., 2004. Analisi di descrittori morfologici in pioppo: contenuto informativo e ripetibilita’. Presentazione e discussione dei primi risultati di RI.SELV:ITALIA (Milano 16/9/04) 4 Caparrini S., Camussi A., Racchi M.L., 2004. The catalase gene family in poplar: structure, expression and evolution. Italian Society of Agricultural Genetics XLVIII Sifv-Siga Joint Meeting, F.68- Lecce Camussi A., Stefanini F., 2005. La classificazione di cloni di pioppo con metodi montecarlo: le foreste casuali. Forest@: 2, 2, 217-204 Turchi A., Caparrini S., Racchi M.L., Camussi A., 2005. SSCP Polymorphisms Analyses of Catalase Gene Introns for Clonal Identification in Poplar. Italian Society of Agricultural Genetics Proceedings of the XLIX Annual Meeting. Potenza Camussi A., 2005. Complex system and artificial cognitive processes in plant genetics. Italian Society of Agricultural Genetics Proceedings of the XLIX Annual Meeting. Potenza Turchi A., Caparrini S., Giorcelli A, Picco F., Racchi M.L., Camussi A., 2006. SSCP Polymorphisms of gene introns and morphological traits: novel procedures for clonal identification in poplar. Proceedings of the 50 th Italian Society of Agricultural Genetics Annual Congress. Ischia. 5