Centro Studi Sistemi Idrici Corso sull`utilizzo dei modelli EPR

Centro Studi Sistemi Idrici
In collaborazione con
Politecnico di Bari e Università degli Studi di Ferrara
Corso sull’utilizzo dei modelli EPR (Evolutionary Polynomial Regression)
21 maggio 2010
Dipartimento di Ingegneria dell’Università degli Studi di Ferrara
La Regressione Polinomiale Evolutiva - EPR è una tecnica modellistica ibrida di tipo data-driven che integra i vantaggi della regressione
numerica in un algoritmo genetico per la ricerca della forma matematica del modello. Con questa tecnica è possibile fornire ai tecnici uno
strumento sintetico e al tempo stesso accurato che consenta di innestare l’expertise maturata sul fenomeno specifico in un approccio alla
modellazione basato sui dati al fine di individuare le relazioni esistenti tra le variabili del problema (knowledge discovery).
I metodi di regressione numerica rappresentano lo strumento più comunemente utilizzato nella ricerca del miglior modello che descriva una
serie di dati; tuttavia essi richiedono che la forma della funzione (lineare, esponenziale, logaritmica, ecc.) sia specificata a priori. Gli algoritmi
genetici nascono come metodi di intelligenza artificiale ispirandosi alla evoluzione naturale per la ricerca delle soluzioni più adatte al
problema. Le soluzioni sono codificate in cromosomi (stringhe) che si evolvono secondo operatori di mutazione e cross-over in analogia ai
meccanismi evolutivi nella riproduzione sessuata naturale, sulla base del miglior adattamento di ciascuna al problema. La creazione
automatica di modelli matematici secondo un approccio del genere è detta regressione simbolica.
La tecnica EPR fornisce espressioni simboliche aventi strutture pseudo-polinomiali di cui un esempio è rappresentato dall’espressione (1) e si
sviluppa in due passi come riportato schematicamente in Figura.

Y  f a j , X1 ...X k , g  X1 ...X k 
Dati
y
m
Y  a0   a j   X1 
t
j 1
ES  j ,1
 ...   Xk 
ES  j ,k 

 g  X1 

ES  j ,k 1
 ...   Xk 
ES  j ,2k 

(1)
EPR consente la piena interazione con l’utente in tutte le fasi di ricerca del modello e dunque la
possibilità di inserire tutti gli elementi di conoscenza acquisita sul sistema in esame:
Algoritmo Genetico
E
P
R
Selezione degli esponenti ES(j,i)
per ogni variabile Xi del j-esimo
termine polinomiale.
Regressione numerica
Stima dei coefficienti aj dei
termini polinomiali
y
Modello
Pre-processing - preparazione dei dati (input Xi) e scelta della struttura matematica di base delle
espressioni da ricercare (es. espressione (1));
Ricerca del modello - Range di variabilità degli esponenti da assegnare ad ogni Xi; funzione g da
incorporare nei termini del “polinomio”; numero massimo m di termini; tipo di regressione numerica;
tipo di strategia evolutiva da adottare (ad obiettivo singolo o multiplo) per l’assegnazione degli
esponenti;
Post-processing - selezione delle espressioni che meglio verificano le conoscenza pregresse sul
fenomeno in esame.
L’implementazione di un GA multi-obiettivo (MOGA) basato sul criterio di dominanza di Pareto
consente di evolvere le espressioni massimizzando l’adattamento ai dati e minimizzando al tempo
stesso la complessità del modello sotto forma di numero di termini del polinomio e/o di numero di
input selezionati. Questo consente di ottenere espressioni compatte facilmente comprensibili da parte
dei tecnici o analisti e che pertanto possono essere facilmente utilizzate sia per la descrizione che per
il controllo del sistema in oggetto.
t
La tecnica EPR può essere applicata ad un vasto campo di problematiche che vanno dalla modellazione del numero di scoppi in una rete di
distribuzione idrica alla modellazione del processo di evapotraspirazione con identificazione dei fattori che maggiormente lo influenzano,
dalla modellazione esplicita del fattore di attrito nella formulazione di Darcy-Weisbach delle perdite di carico, alla modellazione della portata
indice in ragione dei diversi fattori geomorfoclimatici. E’ dunque applicabile in ogni contesto di tipo data-driven ogni qualvolta si mira a
definire un legame formale fra le grandezze che caratterizzano o quantificano un prefissato fenomeno e tutte le grandezze che lo influenzano o
determinano.
Modalità del corso. Il corso si terrà presso il Dipartimento di Ingegneria dell’Università di Ferrara il giorno 21 maggio 2010 ed avrà una
durata di 8 ore. Nella prima parte del corso, la cui natura è teorica/pratica, verranno introdotti i concetti fondamentali che caratterizzano la
modellistica data-driven e la descrizione dettagliata della modellistica EPR. Seguirà la descrizione della manualistica e dell’uso del software
con esempi concreti basati su casi di letteratura e su dati messi a disposizione dalla struttura organizzatrice o su dati portati direttamente dal
partecipante. Ad ogni partecipante verrà poi rilasciata una copia del software EPR e del relativo manuale oltre che del software ANN-MOGA
(e relativo manuale) di cui verrà fatto uso durante il corso al fine di fornire esempi di comparazione rispetto alla modellistica EPR.
Il software EPR è scritto in ambiente MATLABTM pertanto la conoscenza della programmazione in tale ambiente è un requisito che faciliterà
la comprensione del corso al quale è comunque possibile partecipare anche in assenza di tale conoscenza.
Il corso si rivolge ai giovani ricercatori universitari, agli assegnisti di ricerca, ai dottorandi e ai titolari di borse post-doc ai quali offre un
potente strumento scientifico utile per affrontare, nella forma data-driven, le diverse tematiche dei loro campi di ricerca.
La quota di iscrizione è di 500 € (+ IVA). Per ulteriori informazioni, contattare: Prof. Ing. Marco Franchini ([email protected]),
Prof. Ing. Orazio Giustolisi ([email protected]), Prof. Ing. Paolo Bertola ([email protected]).