Centro Studi Sistemi Idrici In collaborazione con Politecnico di Bari e Università degli Studi di Ferrara Corso sull’utilizzo dei modelli EPR (Evolutionary Polynomial Regression) 21 maggio 2010 Dipartimento di Ingegneria dell’Università degli Studi di Ferrara La Regressione Polinomiale Evolutiva - EPR è una tecnica modellistica ibrida di tipo data-driven che integra i vantaggi della regressione numerica in un algoritmo genetico per la ricerca della forma matematica del modello. Con questa tecnica è possibile fornire ai tecnici uno strumento sintetico e al tempo stesso accurato che consenta di innestare l’expertise maturata sul fenomeno specifico in un approccio alla modellazione basato sui dati al fine di individuare le relazioni esistenti tra le variabili del problema (knowledge discovery). I metodi di regressione numerica rappresentano lo strumento più comunemente utilizzato nella ricerca del miglior modello che descriva una serie di dati; tuttavia essi richiedono che la forma della funzione (lineare, esponenziale, logaritmica, ecc.) sia specificata a priori. Gli algoritmi genetici nascono come metodi di intelligenza artificiale ispirandosi alla evoluzione naturale per la ricerca delle soluzioni più adatte al problema. Le soluzioni sono codificate in cromosomi (stringhe) che si evolvono secondo operatori di mutazione e cross-over in analogia ai meccanismi evolutivi nella riproduzione sessuata naturale, sulla base del miglior adattamento di ciascuna al problema. La creazione automatica di modelli matematici secondo un approccio del genere è detta regressione simbolica. La tecnica EPR fornisce espressioni simboliche aventi strutture pseudo-polinomiali di cui un esempio è rappresentato dall’espressione (1) e si sviluppa in due passi come riportato schematicamente in Figura. Y f a j , X1 ...X k , g X1 ...X k Dati y m Y a0 a j X1 t j 1 ES j ,1 ... Xk ES j ,k g X1 ES j ,k 1 ... Xk ES j ,2k (1) EPR consente la piena interazione con l’utente in tutte le fasi di ricerca del modello e dunque la possibilità di inserire tutti gli elementi di conoscenza acquisita sul sistema in esame: Algoritmo Genetico E P R Selezione degli esponenti ES(j,i) per ogni variabile Xi del j-esimo termine polinomiale. Regressione numerica Stima dei coefficienti aj dei termini polinomiali y Modello Pre-processing - preparazione dei dati (input Xi) e scelta della struttura matematica di base delle espressioni da ricercare (es. espressione (1)); Ricerca del modello - Range di variabilità degli esponenti da assegnare ad ogni Xi; funzione g da incorporare nei termini del “polinomio”; numero massimo m di termini; tipo di regressione numerica; tipo di strategia evolutiva da adottare (ad obiettivo singolo o multiplo) per l’assegnazione degli esponenti; Post-processing - selezione delle espressioni che meglio verificano le conoscenza pregresse sul fenomeno in esame. L’implementazione di un GA multi-obiettivo (MOGA) basato sul criterio di dominanza di Pareto consente di evolvere le espressioni massimizzando l’adattamento ai dati e minimizzando al tempo stesso la complessità del modello sotto forma di numero di termini del polinomio e/o di numero di input selezionati. Questo consente di ottenere espressioni compatte facilmente comprensibili da parte dei tecnici o analisti e che pertanto possono essere facilmente utilizzate sia per la descrizione che per il controllo del sistema in oggetto. t La tecnica EPR può essere applicata ad un vasto campo di problematiche che vanno dalla modellazione del numero di scoppi in una rete di distribuzione idrica alla modellazione del processo di evapotraspirazione con identificazione dei fattori che maggiormente lo influenzano, dalla modellazione esplicita del fattore di attrito nella formulazione di Darcy-Weisbach delle perdite di carico, alla modellazione della portata indice in ragione dei diversi fattori geomorfoclimatici. E’ dunque applicabile in ogni contesto di tipo data-driven ogni qualvolta si mira a definire un legame formale fra le grandezze che caratterizzano o quantificano un prefissato fenomeno e tutte le grandezze che lo influenzano o determinano. Modalità del corso. Il corso si terrà presso il Dipartimento di Ingegneria dell’Università di Ferrara il giorno 21 maggio 2010 ed avrà una durata di 8 ore. Nella prima parte del corso, la cui natura è teorica/pratica, verranno introdotti i concetti fondamentali che caratterizzano la modellistica data-driven e la descrizione dettagliata della modellistica EPR. Seguirà la descrizione della manualistica e dell’uso del software con esempi concreti basati su casi di letteratura e su dati messi a disposizione dalla struttura organizzatrice o su dati portati direttamente dal partecipante. Ad ogni partecipante verrà poi rilasciata una copia del software EPR e del relativo manuale oltre che del software ANN-MOGA (e relativo manuale) di cui verrà fatto uso durante il corso al fine di fornire esempi di comparazione rispetto alla modellistica EPR. Il software EPR è scritto in ambiente MATLABTM pertanto la conoscenza della programmazione in tale ambiente è un requisito che faciliterà la comprensione del corso al quale è comunque possibile partecipare anche in assenza di tale conoscenza. Il corso si rivolge ai giovani ricercatori universitari, agli assegnisti di ricerca, ai dottorandi e ai titolari di borse post-doc ai quali offre un potente strumento scientifico utile per affrontare, nella forma data-driven, le diverse tematiche dei loro campi di ricerca. La quota di iscrizione è di 500 € (+ IVA). Per ulteriori informazioni, contattare: Prof. Ing. Marco Franchini ([email protected]), Prof. Ing. Orazio Giustolisi ([email protected]), Prof. Ing. Paolo Bertola ([email protected]).