01/07/2014 Laboratorio di Modellistica SanitarioSanitario-Ambientale Analisi di sensitività, calibrazione e valutazione dell ’ incertezza degli input di un modello matematico: matematico: fondamenti e metodologie Giorgio Mannina [email protected] Sommario Definizioni Generalità sull’analisi di sensitività Analisi di sensitività di tipo locale Analisi di sensitività di tipo globale Classificazione matematico dell ’ incertezza di un modello Il metodo Monte Carlo Tecniche di campionamento casuale: Latin Hypercube sampling, Simple random Sample (SRS) Calibrazione di un modello matematico Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 1 01/07/2014 Definizioni Analisi di sensitività L’analisi di sensitività (AS) di un modello matematico è quel processo attraverso il quale è possibile studiare la variazione della risposta del modello (output del modello) al variare di uno o più fattori di input (parametri e/o variabili) e discriminare tra fattori influenti e non influenti. Incertezza L’incertezza è un indicatore del livello di ignoranza/conoscenza di un sistema o processo Analisi di incertezza L’analisi dell’incertezza (AI) di un modello matematico è quel processo attraverso il quale è possibile individuare, in funzione della sorgente di incertezza, il grado di incertezza degli output del modello Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Definizioni Calibrazione La calibrazione di un modello è il processo di “aggiustamento” del valore dei parametri finalizzato al miglioramento del fitting tra i valori delle variabili simulate ed i dati misurati per le stesse variabili. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 2 01/07/2014 Calibrazione outliers!! y E2 E4 En E1 E3 outliers!! x F.O. = MIN [f(Somma(E1…En)] Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Generalità sull’ sull’analisi di sensitività L’analisi di sensitività I valori dei fattori di input del modello vengono perturbati (singolarmente, a gruppi o contemporaneamente) all’interno di un fissato campo di variazione (per fissata distribuzione) al fine di identificare la sensitività per ogni fattore del modello. Il processo di AS permette di determinare, all’interno di limiti ragionevoli, quali parametri o variabili di input hanno sull’output del modello un effetto che può essere considerato trascurabile, significativo, lineare o non lineare Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 3 01/07/2014 Nomenclatura Alta Interazione Fattori “interacting” Fattori importanti Fattori non influenti Bassa Bassa Sensitività Soglia per la misura di sensitività Fattori “interacting” Alta Soglia per la misura di interazione Fattori influenti Prof. G. Mannina - Laboratorio di Modellistica Sanitario Sanitario--Ambientale Generalità sull’ sull’analisi di sensitività I parametri di un modello non sono sensibili e/o insensibili Un modello (intendendo l ’ output) risulta sensibile e/o insensibile ai parametri del modello stesso!! Prof. G. Mannina - Laboratorio di Modellistica Sanitario Sanitario--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 4 01/07/2014 Generalità sull’ sull’analisi di sensitività Perché effettuare una AS? Le motivazioni per le quali si esegue una AS sono molteplici e dipendono dall ’ obiettivo prefissato dal modellatore. Il modellatore può condurre l’AS per determinare: se il modello descrive in modo appropriato il sistema o il processo modellato. Un modello non descrive in modo appropriato i processi coinvolti se esso è fortemente dipendente dai fattori supposti non influenti o se il range di predizione del modello è fisicamente improbabile. In tal caso, l’AS evidenzia la necessità di rivedere la struttura del modello stesso; se esiste una regione nello spazio dei fattori di input per cui la variazione del modello risulta massima; le regioni ottimali all’interno dello spazio dei fattori da utilizzare in un successivo studio di calibrazione; Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Generalità sull’ sull’analisi di sensitività Perché effettuare una AS? Si rende possibile valutare se e quali fattori o gruppi di essi interagiscono tra di loro. Infatti, nella maggior parte dei modelli ambientali gli effetti combinati dei fattori non possono essere espressi dalla somma dei singoli effetti. Ciò implica una interazione tra i fattori che può avere implicazioni importanti in uno studio modellistico; È possibile valutare quali siano i fattori di input che contribuiscono maggiormente alla variazione dell ’ output e quali, invece, richiedono ulteriori studi al fine di migliorarne la conoscenza di base. L’individuazione di tali fattori agevola la fase preliminare di pianificazione del processo sperimentale consentendo di pianificare un piano sperimentale ad hoc finalizzato a trarre più informazioni dai dati che si intende rilevare. In tal modo è possibile minimizzare l’incertezza dei risultati del modello legata agli errori di misura; Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 5 01/07/2014 Generalità sull’ sull’analisi di sensitività Perché effettuare una AS? si rende possibile valutare individuare i parametri poco significativi del modello. Sono poco significativi quei parametri la cui variazione non produce cambiamenti rilevanti nell’output del modello. Nel caso in cui il modello risultasse più complesso rispetto alle necessità del modellatore tutti quei fattori, processi e quindi parametri che risultano poco significativi per l’oggetto dello studio possono essere trascurati. La conoscenza di tutti i parametri che influenzano invece in modo significativo la risposta del modello favorisce/migliora la fase di calibrazione di un modello. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Generalità sull’ sull’analisi di sensitività Le tipologie di AS I metodi di AS possono essere suddivisi, sulla base dello spazio fattoriale di interesse, in due grandi classi: metodi di analisi di sensitività locale (ASL) e metodi di analisi di sensitività globale (ASG). Tipo locale Analisi di sensitività Tipo globale Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 6 01/07/2014 Generalità sull’ sull’analisi di sensitività Le tipologie di AS I metodi di ASL focalizzano l’attenzione sull’impatto locale che i fattori di input hanno sull’output di un modello. In tale contesto, interessa valutare l ’ effetto sull ’ output del modello di piccole variazioni dei fattori di input rispetto a predefiniti valori nominali, generalmente considerate singolarmente. I metodi di ASG valutano l ’ effetto che la variazione contemporanea, in ampi range di variazione, dei fattori di input ha sull’output del modello. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Analisi di sensitività locale Introduzione La ASL viene condotta mediante il calcolo di derivate parziali delle funzioni di output rispetto alle variabili di input; i metodi di ASL vengono infatti anche chiamati “metodi basati sulle derivate”. Al fine di valutare tali derivate numericamente, ogni parametro xi di input viene fatto variare nell ’ intorno di un valore nominale (xinom) e valutata la risposta del modello per ogni output y. ( ∆y = ∑ yi − yin om x2 i x2nom ) 2 ∆y MODELLO MODELLO x1nom perturbazioni parametriche x1 simulazioni x2nom x1nom valutazione della variazione di uscita Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 7 01/07/2014 Analisi di sensitività locale Peculiarità dell’ dell’ASL L’ASL può essere vista come un particolare caso di approccio one factor at a time (OAT), poiché durante la variazione del singolo fattore tutti gli altri vengono mantenuti costanti. L’approccio locale è applicabile quando la variazione attorno al valore nominale, di ognuno dei fattori di input, risulta essere talmente piccola da potere assumere verosimilmente lineare la relazione che intercorre tra input e output. I metodi di ASL risultano poco utili laddove l ’ obiettivo dell’analisi è quello di confrontare l’effetto della variazione dei diversi fattori di input sugli output del modello, poiché in tal caso l’incertezza relativa di ogni fattore di input dovrebbe essere pesata. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Analisi di sensitività locale Peculiarità dell’ dell’ASL I metodi di ASL presenti in letteratura hanno la caratteristica di essere molto efficienti in termini computazionali, in quanto richiedono un numero di perturbazioni sufficientemente basso per singolo fattore da analizzare. Tuttavia, i metodi ASL sono inefficienti in termini di tempo di programmazione. Essi richiedono, ad esempio, al fine di eseguire le operazioni di analisi OAT, l’intervento da parte del modellatore sul codice aumentando così l ’ incertezza legata agli errori di programmazione. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 8 01/07/2014 Analisi di sensitività locale Le funzioni di sensitività La variazione del fattore xi determina una variazione dell’output y. La sensitività del generico parametro xi sull ’ output y viene quantificata mediante una “funzione di sensitività”. Particolare attenzione, nell’applicazione dell’ASL ricopre la scelta della funzione di sensitività adottata per quantificare l’influenza che il fattore xi ha sull’output y. L’esito dell’ASL, ad esempio, di un modello per la simulazione di un impianto di depurazione, può essere fortemente influenzato dalle condizioni operative, dalla caratterizzazione del refluo influente e dalla natura dell’indice e/o coefficiente di sensitività utilizzato. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Analisi di sensitività locale Le funzioni di sensitività La misura della sensitività locale, si,j, del parametro xi rispetto alla variabile yj è in genere rappresentata dalla pendenza della funzione che descrive il valore di yj al variare di xi come segue: si , j = ∂y j ∂ xi Tale misura di sensitività descrive la variazione assoluta di una variabile di output del modello per variazione unitaria (assoluta) del valore del parametro, essa dipende tanto dall’ordine di grandezza della variabile di output quanto da quello del parametro. Tale circostanza ha l ’ inconveniente di rendere impossibile il confronto tra le misure di sensitività di diverse variabili di output o di una stessa variabile ma calcolate rispetto a diversi parametri Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 9 01/07/2014 Analisi di sensitività locale Le funzioni di sensitività Per ovviare all ’ inconveniente sopra citato la funzione di sensitività viene normalizzata. Tale normalizzazione può essere seguita rispetto al valore della variabile corrispondente al valore nominale del parametro e rispetto al valore del parametro nominale stesso : si , j nom ∂y j xi = y j nom ∂ x i Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Analisi di sensitività globale Peculiarità dell’ dell’ASG La ASG consente di quantificare l’impatto che l’intero spazio parametrico ha sull ’ output del modello comportando la variazione contemporanea di tutti i fattori di input. Nella ASG l’incertezza dell’output del modello viene associata all’incertezza dei fattori di input e descritta, tipicamente, da funzioni di distribuzione di probabilità che coprono i range di variazione dei fattori. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 10 01/07/2014 Analisi di sensitività globale Peculiarità dell’ dell’ASG Le proprietà fondamentali dell’analisi di sensitività di tipo globale sono: L ’ influenza del fattore di scala e della forma distribuzione: in particolare si tiene conto dell’effetto range di variazione del singolo fattore e la rispettiva della funzione di densità di probabilità hanno sulla della sensitività dello stesso. della che il forma stima Media multidimensionale: la stima della sensitività di ogni fattore viene effettuata variando contemporaneamente tutti i fattori di input e facendo riferimento dunque al contemporaneo effetto su tutte le variabili del modello Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Analisi di sensitività globale Peculiarità dell’ dell’ASG L’adozione di un metodo ASG ha l’inconveniente di richiedere tempi computazionali >> rispetto a quelli necessari per la ASL in quanto la variazione contemporanea di tutti i parametri determina un incremento del numero di simulazioni necessarie. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 11 01/07/2014 Analisi di sensitività globale Classificazione dei metodi di ASG I metodi di analisi ASG vengono generalmente suddivisi in tre grandi categorie: Metodi basati sulla decomposizione della varianza: Sobol ’ , Fourier Amplitude Sensitivity Test (FAST), Extended-FAST, etc… Metodi di screening: Morris screening, Latin Hypercube-OAT, etc… Metodi basati sulla regressione lineare: analisi della regressione lineare standardizzata (SRC), analisi di regressione a step, etc… Di seguito vengono presentate le caratteristiche peculiari di ognuna delle categorie elencate entrando nel dettaglio dei metodi SRC, Morris screening e Extended-FAST Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Analisi di sensitività globale Metodi basati sulla decomposizione della varianza: il metodo ExtendedExtended-FAST Il metodo Extended-FAST è basato sul teorema di decomposizione della varianza. A tal proposito si riportano di seguito alcune utili definizioni: Valore atteso: atteso: il valore atteso (chiamato anche media, speranza o speranza matematica) di una variabile casuale X, indicato con E[X], è un parametro di sintesi del valore medio di un fenomeno aleatorio. Nel caso in cui la variabile casuale sia discreta (la variabile casuale assume un numero finito o una infinità numerabile di valori) il valore atteso della variabile X è dato dalla somma dei possibili valori di tale variabile, ciascuno moltiplicato per la probabilità di essere assunto (ossia di verificarsi), cioè è la media ponderata dei possibili risultati. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 12 01/07/2014 Analisi di sensitività globale Metodi basati sulla decomposizione della varianza: il metodo ExtendedExtended-FAST Varianza: la varianza di una variabile casuale x fornisce la Varianza: misura di quanto siano dispersi i valori assunti dalla variabile, ovvero di quanto si discostino dal valore atteso. La varianza della variabile casuale x viene indicata con σ2(x) o Var(x) ed è espressa come il valore atteso del quadrato della variabile xE[x]: σ 2 ( x ) = Var ( x ) = E [( x − E [ x ])2 ] La formula per la varianza di un'intera popolazione è: σ 2 ( x ) = Var ( x) = ) ( 2 1 N ∑ xi − x N i =1 dove N rappresenta la dimensione della popolazione e x la media aritmetica della popolazione. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Analisi di sensitività globale Metodi basati sulla decomposizione della varianza: il metodo ExtendedExtended-FAST In sintesi, il teorema della decomposizione della varianza afferma che la varianza dell’output Y di un modello, indicata con Var(Y), può essere partizionata nel seguente modo: Var ( Y ) = n n ∑D + ∑D i i =1 i≤ j ≤n ij + ... + n ∑D 1...n (1) i ≤ ... n dove Di rappresenta l’effetto del primo ordine del fattore i-esimo: [ ] Di = Varxi E x−i (Y xi ) Il pedice xi indica che viene assunta la variazione del solo fattore iesimo mentre x-i indica che viene assunta la variazione per tutti i fattori tranne l’i-esimo (tutti i fattori sono noti tranne l’i-esimo) Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 13 01/07/2014 Analisi di sensitività globale Metodi basati sulla decomposizione della varianza: il metodo ExtendedExtended-FAST n Mentre ∑D i ≤ j ≤n ij + ... + n ∑D rappresenta l’interazione tra gli n fattori 1...n i ≤...n coinvolti o somma degli effetti di ordine superiore al primo. Nello specifico l’interazione tra i parametri i e j viene calcolata come segue: [( [ )] [ ( )] ] Di j = Var E Y xi , x j − Varxi Ex−i (Y xi ) − Varx j Ex− j Y x j varianza del valore atteso di Y noti tutti i fattori tranne xi e xj varianza del valore atteso di Y noti tutti i fattori tranne xj varianza del valore atteso di Y noti tutti i fattori tranne xi Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Analisi di sensitività globale Metodi basati sulla decomposizione della varianza: il metodo ExtendedExtended-FAST Dividendo tutti i membri della (1) per Var(Y) si ottiene n n 1= ∑ i =1 ∑D Di i≤ j ≤n ij n ∑D 1...n + ... + i≤...n Var ( Y ) Var ( Y ) Var ( Y ) + somma degli indici del primo ordine di tutti gli n fattori somma degli indici di ordine superiore al primo. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 14 01/07/2014 Analisi di sensitività globale Metodi basati sulla decomposizione della varianza: il metodo ExtendedExtended-FAST Pertanto la somma tra gli effetti di ordine totale relativamente a tutti i fattori coinvolti è pari ad 1. Dunque nel caso in cui si voglia calcolare l’effetto dell’ordine totale di un fattore bisogna sottrarre ad 1 il valore della varianza del modello associata alla interazione tra il fattore in esame e gli altri coinvolti. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Analisi di sensitività globale Metodi basati sulla decomposizione della varianza: il metodo ExtendedExtended-FAST L ’ applicazione del metodo Extended-FAST non richiede alcuna assunzione sulla struttura del modello (lineare, monotono, etc.). Per ogni fattore il metodo Extended-FAST fornisce due misure di sensitività: Si = ( ) Varxi E x−i (Y xi ) Var (Y ) Indice dell’effetto del primo ordine Si rappresenta il contributo alla varianza del modello,Var(Y), dovuto al solo fattore i, senza considerare l’interazione dell’ isimo fattore. In particolare Si rappresenta la percentuale di riduzione della varianza (in media) che si avrebbe se il fattore isimo fosse noto. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 15 01/07/2014 Analisi di sensitività globale Metodi basati sulla decomposizione della varianza: il metodo ExtendedExtended-FAST ST i = 1 − ( ) Varx−i E xi (Y x −i ) Var (Y ) Indice dell’effetto totale STi rappresenta il contributo alla varianza del modello,Var(Y), dovuto al solo fattore i, considerando pure le interazione tra i fattori. In particolare, rappresenta la percentuale di riduzione della varianza (in media) che si avrebbe se tutti i fattori tranne i fossero noti. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Di Analisi di sensitività globale Metodi di screening: il metodo Morris screening Il metodo Morris screening si basa sulla quantificazione degli effetti elementari (EE) che la variazione dei fattori di input producono sugli output del modello. In particolare l’effetto elementare dell’i-esimo fattore (EEi) conseguente ad una perturbazione ∆ del fattore rappresenta la differenza relativa tra l’output del modello ottenuto con e senza perturbazione: EE i ( x1 ,..., x n , ∆ ) = y ( x1 ,..., x i −1 , x i + ∆, x i +1 ,..., x n ) − y ( x1 ,..., x n ) ∆ Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 16 01/07/2014 Di Analisi di sensitività globale Metodi di screening: il metodo Morris screening Per ogni fattore i la misura della sensitività è espressa dalla media (µ) e dalla deviazione standard (σ) della funzione degli effetti elementari; µ quantifica l ’ importanza del fattore e σ l’interazione Il metodo Morris screening richiede un numero di simulazioni che è pari a r(N+1), dove N è il numero di fattori ed r il numero di ripetizioni nel campionamento OAT del fattore (varia da 5-70) Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Analisi di sensitività globale Metodi basati sulla regressione lineare: il metodo Standardized Regression Coefficients - SRC Il metodo SRC è basato sulla esemplificazione mediante regressione lineare multipla degli output del modello: n y j = bo + ∑ bi ⋅ xi + ε i =1 dove yj reppresenta l’output j-esimo del modello, xi l’i-esimo fattore, n il numero di fattori, bi le pendenze della regressione e ε l’errore random del modello di regressione. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 17 01/07/2014 Analisi di sensitività globale Metodi basati sulla regressione lineare: il metodo Standardized Regression Coefficients - SRC Le pendenze della regressione standardizzata rappresentano la misura di sensitività espressa dal coefficiente di regressione (SRC). Tale pendenza è esplicitabile come segue: SRC ( x i ) = β i = bi ⋅ σ xi σ y Dove σxi e σy rappresentano rispettivamente la deviazione standard del fattore e dell’output Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Analisi di sensitività globale Metodi basati sulla regressione lineare: il metodo Standardized Regression Coefficients - SRC Il metodo SRC è applicabile qualora il coefficiente di determinazione R2, che è la porzione della varianza totale rappresentata dal modello di regressione, sia maggiore di 0.7. Il segno di βi indica se l’effetto della variazione del fattore sulla variazione dell’output è positivo o negativo (effetto positivo: aumentando xi aumenta y; effetto negativo aumentando xi diminuisce y) Il valore assoluto di β i da il grado di influenza del fattore. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 18 01/07/2014 Analisi di sensitività globale:SRC 1 Quantità Sensitivity [βi] (a) Threshold 0.5 0 -0.5 -0.5 -1 1 2 3 4 5 6 1 7 8 9 10 11 12 13 14 15 16 17 Parameter No. (b) Qualità 0.5 0 -0.5 -1 Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Analisi di sensitività globale: Morris 1 (a) Treshold * µ i=+2SEMi 0.8 Parameter 0.6 σ Quantità 0.4 2 3 0.2 4 5 0 0 0.2 0.4 1 µ* 0.6 0.8 1 0.6 0.8 1 (b) 0.8 Qualità 0.6 8 2 16 3 9 6 0.4 15 0.2 0 1 0 0.2 0.4 µ* Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 19 01/07/2014 Analisi di sensitività globale: EE-Fast 1 (a) Si Interaction Quantità Sensitivity [Si, STi] 0.8 0.6 0.4 0.2 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Parameter No. 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Parameter No. 1 (b) 0.8 Qualità 0.6 0.4 0.2 0 1 Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Classificazione dell’ dell’incertezza Fonti di incertezza Qualunque sia il modello in analisi le fonti di incertezza delle predizioni del modello possono essere classificate in 4 grandi categorie: Input del modello. A questa categoria appartengono tutti i dati necessari per eseguire le simulazioni (nel caso di un modello di un impianto di depurazione: portate in ingresso, caratteristiche del refluo da trattare…) Struttura del modello Parametri del modello Metodo di implementazione e/o risoluzione adottato (software, linguaggio di programmazione) Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 20 01/07/2014 Classificazione dell’ dell’incertezza Fonti di incertezza Schematizzazione delle fonti di incertezza nel caso di un modello ASM: Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Valutazione dell’ dell’incertezza La valutazione dell ’ incertezza di un modello matematico considera in primo luogo la definizione dello scopo del modello che include la identificazione delle sorgenti rilevanti di incertezza. Identificata ogni singola fonte di incertezza e selezionate le fonti significative, è possibile valutare l’incertezza. Esistono diversi metodi per quantificare l’incertezza, tra i quali: Metodi usati per caratterizzare e classificare (in funzione della significatività) le incertezze: Valutazione della qualità dei dati Stima dei parametri Analisi di sensitività … Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 21 01/07/2014 Valutazione dell’ dell’incertezza Metodi finalizzati ad incrementare dell’’informazione: Controllo di qualità Coinvolgimento dei portatori di interesse … la qualità Metodi usati per quantificare e propagare l’’incertezza di modelli di calcolo finalizzati a quantificare l’’ incertezza dell’’output del modello: Propagazione Gaussiana dell’errore Simulazioni di Monte Carlo Analisi di scenari … Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale I metodi Monte Carlo Generalità Il metodo Monte Carlo è un procedimento matematico basato sull'utilizzazione di numeri casuali. La definizione più utilizzata è la seguente: Il metodo di Monte Carlo consiste nel cercare la soluzione di un problema, rappresentandola quale parametro di una ipotetica popolazione e nello stimare tale parametro tramite l'esame di un campione della popolazione ottenuto mediante sequenze di numeri casuali.. casuali Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 22 01/07/2014 I metodi Monte Carlo Gli step del metodo Si effettua un numero elevato di simulazioni deterministiche variando uno o più parametri in modo casuale secondo una statistica predefinita Si analizzano i risultati delle simulazioni su base statistica Si cerca un legame fra la statistica del parametro e quella dell’uscita del modello Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale I metodi Monte Carlo Esempio di metodo Monte Carlo Variazioni casuali del rateo di crescita di una popolazione Es. Sviluppo di una popolazione in funzione del rateo di crescita 120 Si considera media e varianza delle simulazioni 100 P opul ti Popolazione 80 Si correla la distribuzione del rateo di crescita alla distribuzione della popolazione 60 40 r 20 0 0 20 40 60 Tempo pop 80 100 120 Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 23 01/07/2014 I metodi Monte Carlo Particolare interesse nei metodi di tipo Monte Carlo ricopre la forma della distribuzione di probabilità della popolazione che può essere di vario tipo a seconda del caso in esame (Poisson, normale, uniforme esponenziale…) Un altro elemento chiave dei metodi Monte Carlo è rappresentato dal metodo adottato per il campionamento casuale (Latin hypercube sample, simple random sample…) che caratterizza il metodo stesso Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Tecniche di campionamento casuale Simple random sample Il Simple random sample (SRS) (campionamento casuale semplice) rappresenta il naturale punto di partenza per lo studio di tutti gli altri disegni campionari. L’SRS è un campionamento di tipo equiprobabilistico Si consideri una popolazione di N unità dalla quale si debba estrarre un campione di n unità distinte. L’SRS è la tecnica che attribuisce la stessa probabilità di selezione ad ogni insieme di n unità distinte della popolazione. Consegue dalla precedente definizione che anche ogni singola unità della popolazione ha la stessa probabilità di entrare a far parte del campione. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 24 01/07/2014 Tecniche di campionamento casuale Simple random sample Nella selezione di un campione casuale è possibile scegliere se ogni unità possa entrare più di una volta nel campione. Se questa possibilità non è ammessa il campionamento è detto senza ripetizione, ripetizione altrimenti con ripetizione. ripetizione Nella pratica, l'estrazione con ripetizione viene adottata raramente. E' intuitivo che, fissata la dimensione del campione, l'osservazione ripetuta di una o più unità rappresenta una perdita di informazione. E' tuttavia anche evidente che la distinzione tra estrazione con e senza ripetizione perde gradualmente di importanza all'aumentare della dimensione della popolazione di rilevazione. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Tecniche di campionamento casuale Simple random sample Seppure il metodo SRS sia tra i più semplici metodi di campionamento casuale esso è anche il meno efficiente qualora sia necessario ridurre il campionamenti e quindi le simulazioni da effettuare. Ciò è dovuto al fatto che al diminuire della dimensione campionaria diminuisce la probabilità di coprire l’ intero range di variazione della variabile aleatoria, ottenendo così un campione falsato. Al fine di ovviare a tale problema si preferiscono, nel caso si voglia ridurre il numero di simulazioni, i metodi di campionamento stratificati. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 25 01/07/2014 Tecniche di campionamento casuale Latin Hypercube sampling (LHS) La Latin Hypercube Sampling (LHS) (campionamento ad ipercubo latino) è un metodo di campionamento casuale di tipo stratificato. Ciò implica che il metodo LHS è basato sulla suddivisione del campo di esistenza delle variabili aleatorie (ad esempio parametri) in N regioni a cui competa la stessa probabilità. Il campionamento casuale è limitato ad un numero pari ad N campioni: si estrae infatti per ogni variabile un singolo campione per regione. Si generano in seguito N combinazioni casuali di questi campioni in modo che ogni campione venga utilizzato una sola volta e che tutti i campioni vengano utilizzati Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Tecniche di campionamento casuale Latin Hypercube sampling (LHS) Esempio di LHS nel caso in cui le variabili aleatorie sono due (parametri φ1 e φ2) il cui campo di esistenza è suddiviso in N=10 parti. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 26 01/07/2014 Calibrazione di un modello matematico Introduzione Il processo di calibrazione e/o di stima dei parametri di un modello è definito come: la determinazione dei valori ottimali dei parametri ottenuta mediante l’ausilio di dati sperimentali nell’ipotesi che la struttura del modello (relazioni tra variabili e parametri) sia esplicitamente nota. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Calibrazione di un modello matematico Le fasi Le fasi del processo di calibrazione prevedono: Scelta del data set set di dati da adottare in fase di stima; set di dati da adottare in fase di validazione del modello con i valori dei parametri stimati Identificazione dei parametri da calibrare Analisi di identificabilità strutturale: se un parametro è combinazione di altri e tale combinazione è esplicitata da una legge, noti i valori misurati di tutti i parametri della legge tranne uno, il valore del parametro incognito è bene calcolarlo a partire dalla legge ed escluderlo tra i parametri da calibrare Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 27 01/07/2014 Calibrazione di un modello matematico Le fasi Analisi di identificabilità pratica: consente di individuare quali parametri possono essere calibrati a partire dai dati disponibili. Analisi di sensitività Differenziazione tra parametri lineari e non Il legame tra parametri del modello e variabili può essere di tipo lineare o meno, poiché la non linearità complica il processo di stima dei parametri è importante discriminare tra parametri lineari e non. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Calibrazione di un modello matematico Le fasi Linearizzazione del modello E’ pratica abbastanza frequente quella di rendere lineari modelli che nella loro forma originale sono non-lineari. Un esempio è il modello della cinetica di Monod linearizzata come segue: 1 µ = Ks µ max ⋅ 1 1 + S µ max Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 28 01/07/2014 Calibrazione di un modello matematico Le fasi Scelta della funzione obiettivo per la stima dei parametri Questa fase consiste nella individuazione della funzione obiettivo (funzione dei valori simulati e misurati) da minimizzare e/o massimizzare (a seconda della sua espressione) da adottare per la scelta dei valori calibrati dei parametri Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Calibrazione di un modello matematico Le fasi Valutazione della qualità dei parametri stimati Quando i parametri di un modello vengono calibrati sulla base di un set di dati è essenziale, ancor prima della fase di validazione, valutare la bontà della risposta del modello calibrato. E’ necessario valutare due aspetti fondamentali: Se i dati simulati presentano un buon fitting con quelli misurati; Quantificare l ’ accuratezza della risposta del modello. Nel caso in cui l ’ accuratezza sia sufficiente il processo di calibrazione è concluso viceversa sono richiesti ulteriori dati misurata per migliorare tale accuratezza. Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 29 01/07/2014 Calibrazione di un modello matematico Scelta della funzione obiettivo per la stima dei parametri La più nota funzione obiettivo per la stima dei parametri di un modello è la funzione somma degli scarti quadratici J(θ ) = ∑ ( yi − ŷi ( θ )) N 2 i =1 Dove yi sono le osservazioni (in totale sono disponibili N osservazioni) e ŷi ( θ ) sono le predizioni del modello per un dato set di parametri θ La condizione per cui J risulta minimo è quella alla quale corrisponde il set di parametri ottimale Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Calibrazione di un modello matematico Scelta della funzione obiettivo per la stima dei parametri Nel caso in cui gli errori delle misure dei dati adottati si considerano indipendenti (non correlati) ed originati da una distribuzione normale è possibile adottare le funzioni di massima verosimiglianza che esprimono qual ’ è la probabilità che un dato set di dati misurati si adatti ai valori simulati dal modello (assumendo che il modello sia corretto). Tra le funzioni di verosimiglianza si ha la funzione che 2 tiene conto dello stimatore χ L( y | θ ) = N ∏ i =1 1 1 1 exp − 2 2π σ i yi − ŷi ( θ σi i =1 N ∑ ) 2 Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 30 01/07/2014 Calibrazione di un modello matematico Scelta della funzione obiettivo per la stima dei parametri dove y è il set di n osservazioni e σ i è la deviazione standard delle misure yi . Per ogni set di dati y il set di parametri ottimale è quello per cui L( y | θ ) = N ∏ i =1 1 1 1 exp − 2 2π σ i yi − ŷi ( θ σi i =1 N ∑ ) 2 è massima . Il che è equivalente a dire che è minimo il valore della funzione: J (θ ) = χ 2(θ ) = N 1 ∑ σ ( y − ŷ ( θ )) 2 i =1 2 i i i Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale Calibrazione di un modello matematico Scelta della funzione obiettivo per la stima dei parametri Nel caso in cui la deviazione standard delle misure è costante quanto detto sopra risulta equivalente alla minimizzazione della seguente funzione: J(θ ) = ∑ ( yi − ŷi ( θ )) N 2 i =1 Prof. G. Mannina - Laboratorio di Modellistica Sanitaria Sanitaria--Ambientale PhD Course Cassino 2014 - Prof. Mannina - Università di Palermo 31