Ri.Selv.Italia
Sottoprogetto 2.2
Produzione di legno fuori foresta – Arboricoltura da legno con specie a rapido accrescimento
(pioppicoltura)
Responsabile scientifico
dr. Achille Giorcelli
(C.R.A. – Unità di Ricerca per le Produzioni legnose fuori foresta, Casale Monferrato – AL)
Relazione Finale
Titolo: 2.2.6 - Identificazione clonale – Sviluppo di modelli per l’analisi
congiunta dei descrittori.
Unità Operativa: Dipartimento di biotecnologie agrarie – Università degli studi di Firenze P.le delle Cascine 24, 50144 FIRENZE, tel. 055 3445048
Responsabile Unità Operativa: prof. Alessandro Camussi [email protected]
1) Obiettivi della scheda di ricerca
Sono attualmente disponibili liste molto estese di descrittori per l’identificazione varietale,
basati essenzialmente su diverse caratteristiche morfologiche e fenologiche. L’utilizzo nella
pratica applicativa può essere ostacolato anche dalla difficoltà dell’analisi statistica dei risultati,
mentre l’uso di un numero ridotto di descrittori per caratterizzare cloni non è spesso possibile
anche se le caratteristiche considerate hanno una reale rilevanza economica senza una verifica
del loro contenuto informativo. Molte caratteristiche spesso mostrano ridotta ripetibilità o sono
altamente variabili anche entro lo stesso clone. Anche se metodi di “fingerprinting” molecolare
stanno dimostrando sempre più la loro efficacia, la descrizione clonale è correntemente
accettata solo sulla base di caratteristiche morfologiche. Lo scarso potere discriminante dei
descrittori morfologici considerati singolarmente può essere compensato valutando
congiuntamente un gran numero di questi e ottenendo una rappresentazione congiunta della
descrizione del clone.
La ricerca si è proposta di verificare ed applicare modelli di analisi per la valutazione di
descrittori con caratteristiche diverse in modo congiunto. L’obbiettivo risiede essenzialmente
nella individuazione di descrittori semplici da rilevare ma ai quali sia associato un elevato
potere discriminante. La sperimentazione in vivaio e i disegni sperimentali adottati hanno
consentito di correlare il potere discriminante con le caratteristiche note a priori dei cloni
inclusi nella sperimentazione stessa.
Al termine del progetto è attesa l’individuazione dei descrittori più idonei ad essere utilizzati
per la valutazione clonale in pioppo e la possibilità di integrazione con informazioni di
carattere molecolare.
2) Materiali, metodi e organizzazione del lavoro
L’attività di ricerca è stata strutturata in due settori complementari: l’analisi dei dati ottenuti
da prove comparative (essenzialmente nei primi due anni/fasi della ricerca) e lo sviluppo di
marcatori molecolari e loro utilizzo nella valutazione congiunta con i descrittori morfologici
(soprattutto nella seconda parte del progetto). Per entrambi gli aspetti l’attività è stata
strettamente coordinata con l’U.O. dell’ISP di Casale Monferrato che oltre a fornire il materiale
clonale ha allestito i vivai sperimentali e rilevato i dati in campo a seguito di una pianificazione
sperimentale effettuata in modo congiunto.
I descrittori morfologici sono stati ottenuti in un primo esperimento con tre vivai (a Casale, nei
pressi di Mantova e a Spello) includendo in ciascuno 30 cloni distribuiti in modo randomizzato
in dieci ripetizioni di parcelle di cinque piante. I cloni di pioppo sono stati scelti nell’ambio della
collezione di cloni iscritti al Registro e giudicati rappresentativi delle specie e della variabilità. I
descrittori relativi alla morfologia della pianta sono stati successivamente raccolti da due
piante per parcella e i dati descrittivi delle caratteristiche della foglia sono stati raccolti da due
foglie da ciascuna pianta. La scelta dei caratteri, tra i molti disponibili a livello di letteratura
internazionale, ha privilegiato considerazioni sulla natura distributiva, a livello statistico, e
sulle informazioni già presenti circa le condizioni di rilevazione in campo da parte di un numero
1
ridotto di rilevatori, tenendo conto delle finalità a cui la derivazione di modelli descrittori erano
rivolte.
Un secondo esperimento comparativo è stato impiantato e seguito dall’U.O. di Casale in due
località (Mantova e Casale) comprendente più di 100 cloni in parcelle replicate in tre blocchi
randomizzati. Anche in questo caso sono stati rilevati descrittori della pianta e delle foglie
mediante variabili binarie e quantitative.
A Firenze sono stati sviluppati marcatori SSCP (Single-Strand Conformation Polymorphisms)
costruendo specifici primer fiancheggianti gli introni di due specifici geni della famiglia delle
Catalasi già ampiamente studiati nel laboratorio. L’analisi della variazione all’interno degli
introni che può definirsi essenzialmente neutra e non posta sotto il vaglio della selezione o
dell’adattamento si è dimostrata molto utile in studi evolutivi, di differenziazione geografica e
in genetica delle popolazioni.
Questi marcatori sono stati analizzati sullo stesso campione di cloni e su materiale
sperimentale la cui origine genetica è nota.
I risultati relativi al polimorfismo morfologico e a quello molecolare sono stati analizzati
separatamente e congiuntamente mediante pacchetti specifici “open source” (R) e commerciali
(SAS, STATA, CLUSTAN).
3) Risultati raggiunti
Analisi dei descrittori morfologici
Sono stati confrontati i metodi di analisi disponibili in letteratura anche sulla base di verifiche
metodologiche su set di dati disponibili. La natura dei dati utilizzati come descrittori rende
poco efficaci le normali procedure parametriche basate su assunzioni di natura gaussiana. Più
interessanti si sono dimostrati gli approcci non parametrici o di simulazione numerica. Sono
state esaminate diverse procedure in questo ambito in grado di individuare ove possibile un
sottoinsieme di caratteristiche che consentano in modo semplice ed operativamente facile il
massimo potere discriminante tra cloni di pioppo.
I dati provenienti dalla sperimentazione in campo, raccolti nel corso dell’estate e dell’inizio
dell’autunno 2002 dall’U.O. di Casale sono stati trasmessi a Firenze per la immissione su
supporto elettronico e per la successiva elaborazione. Il data set completo comprende, per le
due località che hanno permesso di ottenere dati completi (Casale e Mantova), 1200 record
per gli indici morfologici della pianta (con 6 variabili) e 1180 per gli indici fogliari (con 13
variabili ripetute due volte).
E’ stata verificata l’ipotesi di eguaglianza dei cloni con metodologie adatte alle caratteristiche
distributive dei diversi caratteri (ANOVA e regressione logistica multinomiale). Anche se è
presente una significativa interazione dei cloni con le località, le differenze tra cloni sono
significative per tutti i caratteri. Queste differenze rappresentano il maggiore contributo alla
variabilità osservata. Per i descrittori qualitativi di cui sono rilevati dati su due foglie per
pianta è possibile stimare la ripetibilità che si è dimostrata sufficientemente buona.
L’analisi del contenuto informativo e della ripetibilità ha confermato l’utilità dei descrittori
scelti per la classificazione clonale, anche in condizioni in cui, sulla base del complesso
disegno sperimentale, può essere valutata l’interazione genotipo per ambiente. L’utilizzo
congiunto dei descrittori in chiave discriminante è risultato più complesso a causa delle
differenti proprietà distributive.
Una strategia alternativa molto recente nell’ambito della teoria dei classificatori ad albero
(tree classifiers) proposta da Leo Breiman (University of California, Barkeley) e denominato
Random Forest.consiste nell’utilizzo di tecniche numeriche innovative basate su simulazioni al
calcolatore. Abbiamo applicato ai dati la procedura Random Forest,. Essa si è rilevata
particolarmente efficace per la discriminazione clonale. Random Forest è basata sulla
creazione di un insieme ampio (Forest) di alberi classificatori, generati casualmente, che viene
lasciato crescere tramite simulazione al calcolatore. Le foreste stocastiche sono una
combinazione di alberi classificatori tali per cui ogni albero componente dipende dal valore
assunto da un vettore casuale estratto indipendentemente e con la stessa distribuzione per
tutti gli alberi della foresta.
In una foresta stocastica la cross-validazione avviene internamente senza ricorso a
sottoinsiemi di dati esterni alla procedura. Ogni albero è costruito usando un campione
bootstrap differente dei dati originali. Circa un terzo delle unità statistiche originali è omessa
da tale campione bootstrap. Il tasso di errore si ricava riclassificando ogni unità statistica
secondo ognuno degli alberi che non l’hanno impiegata, assegnando la classe risultata come
2
la maggior votata e comparando tale assegnazione con il risultato noto. Esistono stime
interne che permettono di descrivere il processo di classificazione e la sua efficienza. La
procedura consente di utilizzare variabili con proprietà distributive anche molto diverse e di
individuare i migliori descrittori sulla base della loro efficienza classificatoria.
Come in tutti procedimenti di analisi discriminante, le foreste stocastiche derivano le regole
migliori per assegnare i singoli casi (nel nostro caso le singole piante) alla classe di
appartenenza. La bontà del procedimento si verifica riclassificando le singole piante
appartenenti al training data set sulla base delle regole classificatorie ottenute.
Con i nostri dati sperimentali la riclassificazione ottenuta è piuttosto buona, considerando che
il training data set è costituito da vettori relativi a dati di singole piante allevate in due diverse
località. I risultati di classificazione peggiori sono relativi al clone I-45/51 ed al clone Triplo,
entrambi Populus x canadensis, che si ripartiscono quasi al 50% le relative piante. Il clone
Bellini presenta anch’esso un elevato errore, con sole 16 piante correttamente classificate sulle
37 valutate. D’altro canto i cloni Sile, Vereechen (P. nigra), I154 II, I214 ed I476 vedono
praticamente tutte le loro piante correntemente classificate dalla procedura. L’errore medio di
classificazione di tutti i cloni è comunque basso ed uguale a 0,13 con ben 22 cloni su 30 al
disotto di tale livello.
La seconda parte della ricerca ha previsto l’utilizzo congiunto di marcatori molecolari basati su
polimorfismi a livello di DNA, gli SSCP. Come tutti i marcatori molecolari non risentono delle
variazioni ambientali e sono pertanto particolarmente utili a fini descrittivi, classificatori e per
l’identificazione clonale anche in stadi molto precoci di sviluppo. Pur escludendo a priori un
rapporto di causalità tra i polimorfismi rilevati negli introni di due specifici geni e le
caratteristiche fenologiche e morfologiche dei cloni, abbiamo voluto verificare se esistesse
qualche relazione tra il livello di somiglianza individuato a livello molecolare e quello rilevabile
morfologicamente.
Polimorfismo molecolare ed analisi congiunta
L’analisi dei polimorfismi molecolari si è dimostrata molto interessante, dimostrando l’efficacia
dei marcatori SSCP che sono in grado di associare ad ogni clone uno specifico “fingerprint” o
profilo molecolare quantificabile in una sequenza binaria (0/1) sulla base della assenza o
presenza delle bande elettroforetiche per ogni introne. Il confronto dei profili ha permesso di
discriminare i cloni oggetto di analisi con una precisione in alcuni casi superiore a quella
dimostrata in pubblicazioni anche recenti tramite marcatori molecolari casuali (AFLP, SSR).
L’esame del dendrogramma UPGMA sulla base dell’indice di dissomiglianza di Jaccard ha
rivelato una associazione tra cloni che rispecchia l’appartenenza alle singole specie,
dimostrando che il polimorfismo casuale a livello di introni riflette di fatto la storia evolutiva del
materiale in esame.
La presenza contemporanea di descrittori morfologici per gran parte dei cloni esaminati a
livello molecolare (i descrittori utilizzati sono quelli relativi alla prova su due località e tre
blocchi randomizzati di cui sopra) ha permesso di confrontare la classificazione derivata
dall’informazione molecolare con quella morfologica. Per rendere più semplice il confronto si è
preferito limitare quest’ultima alle caratteristiche ampelografiche sulla base delle risultanze
ottenute nel corso della prima fase dell’indagine. L’analisi multivariata di questi specifici
descrittori (essenzialmente lunghezze ed angoli fogliari) ha confermato, tramite analisi delle
componenti principali, l’importanza relative dei caratteri ottenuta attraverso l’approccio delle
Foreste Casuali.
L’esame delle relazioni di somiglianza sulla base delle caratteristiche fogliari tra i cloni
raggruppati (inclusi cioè nei cluster) tramite la sola informazione molecolare ha dimostrato una
notevole somiglianza nella riposta classificatoria dei due approcci. Ciò dimostrerebbe che la
variabilità molecolare è in grado di rivelare relazioni di somiglianza tra cloni di pioppo che
riflettono una parallela ed indipendente variazione delle caratteristiche morfologiche, per lo
meno quando si considerino caratteri descrittori morfologici non sensibili alle pressioni della
selezione antropica quali le caratteristiche fogliari.
Di conseguenza è stato possibile includere le due classi di informazione indipendenti
(statisticamente e biologicamente) in un’unica funzione di distanza (distanza di Gower) che è
risultata in grado di distinguere (cioè discriminare) ogni clone preso in esame.
4) Conclusioni e prospettive di prosecuzione
Gli obbiettivi del progetto sono stati raggiunti in modo ottimale con la proposizione di
strategie innovative di analisi di descrittori morfologici. L’analisi congiunta di marcatori
3
molecolari a livello di DNA e di descrittori morfologici ha permesso di aggiungere nuove
evidenze all’utilità dei primi nella identificazione e descrizione dei cloni in pioppo. Le strategie
future di valutazione possono avvalersi dei risultati ottenuti anche sulla base della proposta di
realizzazione di schede varietali che oltre alle principali caratteristiche morfologiche e
tecnologiche del clone contengano anche l’informazione molecolare necessaria per la
costruzione del profilo (fingerprint) del clone stesso.
Un ulteriore sviluppo dell’attività nell’ambito delle tecnologie di identificazione clonale può
essere proprio quella di assemblare profili molecolari di tipo diverso in un definito e
standardizzato profilo identificativo che possa ricevere l’approvazione delle associazioni di
categoria preposte alla salvaguardia dell’identità clonale e dell’iscrizione a registro delle nuove
varietà.
La definizione del profilo ottimale richiede comunque l’utilizzo ed in parte la messa a punto di
procedure di analisi dell’informazione molecolare e della sua rappresentatività.
Partecipanti al Progetto appartenenti all’UO
Alessandri Stefano; Ricercatore confermato; Dipartimento Biotecnologie Agrarie –Università
degli Studi di Firenze tel. 055 3445048
Bardazzi Irene; Assegnista di ricerca; Dipartimento Biotecnologie Agrarie –Università degli
Studi di Firenze tel. 055 3445048
Caparrini Simona; Dottoranda di ricerca; Dipartimento Biotecnologie Agrarie –Università degli
Studi di Firenze tel. 055 3445048
Giorcelli Achille; Ricercatore; CRA- ISP-Casale M; 0142990900; [email protected]
Picco Franco; Tecnico di ricerca; CRA- ISP-Casale M; 0142990900; [email protected]
Racchi Milvia Luisa; Professore straordinario; DiBA -UNIFI; 055 3445048;
Stefanini Federico Mattia; Professore associato; Dip.Statistica - Università degli Studi di
Firenze; 0554237266; [email protected]
Finanziamenti ricevuti complessivamente (nel triennio)
1° anno:
€ 11.370,00
2° anno:
€
3° anno:
€ 12.260,00
TOTALE:
€ 33.490,00
9.500,00
Elenco pubblicazioni edite
Stefanini F., Giorcelli A., Picco F., Camussi A., 2003 - New methods for the classification of
poplar clones by means of morphological descriptors. XLVII annual Congress Società Italiana
di Genetica Agraria (Verona, 24-27/9/03) ISBN 88-900622-4-X
Stefanini F. M., Giorcelli A., Picco F., Camussi A., 2004. Nuovi metodi per la classificazione di
cloni di pioppo sulla base di descrittori morfologici - Discussione primi risultati RISELVITALIA MILANO 16/09/2004
Caparrini S., Camussi A., Racchi M., Velasco R., 2004 - Efficient Detection of Dna
Polymorphism in Populus Genus by Single-strand Conformational Polymorphism of Catalase
Genes. 22nd Session of the International Poplar Commission “The Contribution Of Poplars And
Willows To Sustainable Forestry And Rural Development”, Santiago de Chile
Camussi A., Stefanini F., 2004. The identification of Poplar clones by Montecarlo methods: the
Random Forests. 22nd Session of the International Poplar Commission: “The Contribution of
Poplars and Willows to Sustainable Forestry and Rural Development”. Santiago de Chile
Caparrini S., Velasco R., Racchi M., Camussi A., 2004. Detection of Dna Polymorphism in the
Populus Genus by Intron Analysis of Catalase Genes. Italian Society of Agricultural Genetics
XLVIII Sifv-Siga Joint Meeting, F.68- Lecce
Giorcelli A., Picco F., Stefanini F., Camussi A., 2004. Analisi di descrittori morfologici in pioppo:
contenuto informativo e ripetibilita’. Presentazione e discussione dei primi risultati di
RI.SELV:ITALIA (Milano 16/9/04)
4
Caparrini S., Camussi A., Racchi M.L., 2004. The catalase gene family in poplar: structure,
expression and evolution. Italian Society of Agricultural Genetics XLVIII Sifv-Siga Joint
Meeting, F.68- Lecce
Camussi A., Stefanini F., 2005. La classificazione di cloni di pioppo con metodi montecarlo: le
foreste casuali. Forest@: 2, 2, 217-204
Turchi A., Caparrini S., Racchi M.L., Camussi A., 2005. SSCP Polymorphisms Analyses of
Catalase Gene Introns for Clonal Identification in Poplar. Italian Society of Agricultural
Genetics Proceedings of the XLIX Annual Meeting. Potenza
Camussi A., 2005. Complex system and artificial cognitive processes in plant genetics. Italian
Society of Agricultural Genetics Proceedings of the XLIX Annual Meeting. Potenza
Turchi A., Caparrini S., Giorcelli A, Picco F., Racchi M.L., Camussi A., 2006. SSCP
Polymorphisms of gene introns and morphological traits: novel procedures for clonal
identification in poplar. Proceedings of the 50 th Italian Society of Agricultural Genetics Annual
Congress. Ischia.
5