Supporto didattico 4 – AA 2008-2009 Docente dott. G. Modica TECNICHE DI NORMALIZZAZIONE DEI DATI PER IL LORO UTILIZZO NELL’AMBITO DEI METODI MULTICRITERIALI IN AMBIENTE GIS Giuseppe Modica [email protected] Corso di Laurea Specialistica Scienze Forestali ed Ambientali DiSTAfA Dipartimento di Scienze e Tecnologie Agroforestali e Ambientali SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE DiSTAfA Dipartimento di Scienze e Tecnologie Agroforestali e Ambientali 1 SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE La Normalizzazione dei dati Concetti di base La normalizzazione è un’operazione statistica che permette di mettere a confronto distribuzioni diverse diverse.. Le procedure di normalizzazione sono effettuate allo scopo di ricondurre dati riferiti a scale di valori differenti, sia numeriche sia linguistiche, entro un intervallo di valori comune comune.. È una operazione che, ad esempio, consente di trasformare i punteggi dei criteri di valutazione, espressi nelle rispettive scale di misura, in una scala unica compresa tipicamente tra zero ed uno uno.. Si parla in questo caso di intervallo chiuso [0, 1]. In teoria, una procedura di normalizzazione non dovrebbe alterare il contenuto informativo dei dati di partenza partenza.. Nella realtà operativa, vengono impiegate diverse tecniche che consentono questa trasformazione ed i risultati cui consentono di pervenire sono diversi 1 Supporto didattico 4 – AA 2008-2009 DiSTAfA Docente dott. G. Modica Dipartimento di Scienze e Tecnologie Agroforestali e Ambientali 2 SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE Tasformazioni lineari Criterio del valore massimo Trasformazioni che mantengono la direzione delle preferenze (ad esempio il valore massimo resta massimo ed il minimo resta minimo anche dopo la trasformazione)) yi = xi xmax Criterio del valore minimo e massimo yi = DiSTAfA xi − xmin xmax − xmin Dipartimento di Scienze e Tecnologie Agroforestali e Ambientali 3 SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE Tasformazioni lineari Trasformazioni che mantengono la direzione delle preferenze (ad esempio il valore massimo resta massimo ed il minimo resta minimo anche dopo la trasformazione)) Trasformazione vettoriale o Euclidea yi = xi ∑x 2 i Criterio del totale di riga yi = xi ∑x i 2 Supporto didattico 4 – AA 2008-2009 DiSTAfA Docente dott. G. Modica Dipartimento di Scienze e Tecnologie Agroforestali e Ambientali 4 SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE Tasformazioni lineari Trasformazioni che mantengono la direzione delle preferenze (ad esempio il valore massimo resta massimo ed il minimo resta minimo anche dopo la trasformazione)) DiSTAfA Dipartimento di Scienze e Tecnologie Agroforestali e Ambientali 5 SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE Procedura dell’AHP Analytic Hierarchy Process (Saaty , 1977) L’analisi gerarchica Definizione di una gerarchia Scomposizione di un problema decisionale in un insieme di sottoproblemi più semplici Le analisi gerarchiche sono sempre più di largo utilizzo per affrontare problemi decisionali. Spesso, il decisore sceglie tra più alternative sulla base di procedure basate su giudizi linguistici, più congeniali al ragionamento umano. Successivamente, i giudizi linguistici sono tradotti in valori numerici e trattati secondo precisi algoritmi di calcolo. 3 Supporto didattico 4 – AA 2008-2009 DiSTAfA Docente dott. G. Modica Dipartimento di Scienze e Tecnologie Agroforestali e Ambientali 6 SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE Procedura della Valutazione Gerarchica delle Alternative (AHP, Analytic Hierarchy Process (Saaty , 1977) L’analisi gerarchica di Saaty La procedura della Valutazione Gerarchica delle Alternative (AHP, Analytic Hierarchy Process)) si basa su una matrice di giudizi espressi nel confronto a coppia fra i vari fattori Process fattori.. Gli elementi di ciascuna coppia vengono comparati al fine di stabilire quale di essi è più importante in rapporto all'elemento sovraordinato, e in quale misura misura.. Il risultato del confronto è il coefficiente di dominanza (mij) che rappresenta una stima della dominanza del primo elemento (i) rispetto al secondo (j). A1 I giudizi previsti nella scala fondamentale dei rapporti (Saaty, 2000) sono di tipo qualitativo, sfruttando l’abilità e le caratteristiche del ragionamento umano nell’esprimere giudizi di preferenza. Il metodo prevede cinque indicatori linguistici che corrispondono ad altrettanti valori numerici e, qualora necessario, possono essere convenientemente utilizzati anche dei giudizi intermedi. La necessità di aumentare l’utilizzo di giudizi intermedi aumenta all’aumentare del numero dei fattori considerati A1 ⎡ m11 A2 ⎢⎢m21 A3 ⎢⎣m31 A2 A3 m12 m22 m31 m11 ⎤ m11 ⎥⎥ m33 ⎥⎦ n ⋅ ( n − 1) 2 Confrontando a coppia gli n elementi, si ottengono n2 giudizi; in considerazione della proprietà di reciprocità, la risoluzione della matrice richiede la definizione di un numero di giudizi pari a Matrice dei confronti a coppie Æ proprietà La consistenza della matrice dei confronti dipende dal sistema di preferenze del decisore e dalla scala di preferenze adottata DiSTAfA Dipartimento di Scienze e Tecnologie Agroforestali e Ambientali 7 SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE Procedura dell’AHP Analytic Hierarchy Process (Saaty , 1977) Concetti di base Scala dei giudizi di Saaty e corrispondenti valori numerici utilizzati nei confronti a coppia tra i fattori inseriti nella valutazione multicriteriale. Definizione (Indicatore linguistico) I giudizi previsti nella scala fondamentale dei rapporti (Saaty, 2000) sono di tipo qualitativo, sfruttando l’abilità e le caratteristiche del ragionamento umano nell’esprimere giudizi di preferenza. Il metodo prevede cinque indicatori linguistici che corrispondono ad altrettanti valori numerici e, qualora necessario, possono essere convenientemente utilizzati anche dei giudizi intermedi. La necessità di aumentare l’utilizzo di giudizi intermedi aumenta all’aumentare del numero dei fattori considerati. Intensità dell’importanza relativa Uguale importanza Debole importanza di un fattore rispetto ad un altro Importanza forte Importanza dimostrata Importanza assoluta Valori intermedi tra due giudizi adiacenti 1 3 5 7 9 2, 4, 6, 8 Se v è il giudizio espresso quando i è confrontato con j, 1/v è giudizio reciproco di j confrontato con i Reciproci 1/9 1/7 1/5 1/3 1 3 5 7 9 assoluta molto forte forte moderata uguale moderata forte molto forte assoluta meno importante più importante Esempio di matrice dei confronti a coppia. Nel caso specifico, le alternative, o criteri, posti a confronto sono 3. Da notare come, per quanto visto in precedenza, basta esprimere un numero di giudizi pari a: n·(n-1)/2 Æ 3· (3-1)/2 = 3. 4 Supporto didattico 4 – AA 2008-2009 DiSTAfA Docente dott. G. Modica Dipartimento di Scienze e Tecnologie Agroforestali e Ambientali 8 SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE Procedura dell’AHP Analytic Hierarchy Process Procedura di valutazione dell’AHP Æ Il rapporto di Consistenza CR = (Saaty , 1977) IC = Indice di Coerenza IR = Indice Random Il Rapporto di Consistenza (CR, Consistency Ratio) è stato introdotto da Saaty (1977) ai fini della valutazione della congruenza nell’espressione dei giudizi IC IR L’indice di Coerenza misura la deviazione dalla coerenza nell’espressione dei giudizi e si calcola attraverso la seguente formula: IC = λmax − n n −1 λmax è l’autovalore l’autovalore principale della matrice; n è il numero dei fattori inseriti nella matrice. L’autovalore L’ autovalore principale della matrice (λmax) si ricava attraverso il prodotto della matrice delle priorità x per la matrice dei confronti componenti yi a 11 a12 a 13 ... a1n x1 y1 a 21 a 22 a 23 ... a2 n x2 y2 a3n × x 3 A = [aij ] = a 31 n a ij = ∑ b jk c kj k =1 DiSTAfA = a 32 a 33 ... .. .. .. .. .. .. .. an 1 an 2 an 3 ... ann xn yn La matrice a, prodotto delle due matrici b e c, è A (Matrice prodotto), prodotto), ottenendo il vettore y, di dove: y1 = a11 x 1 + a12 x 2 + a13 x 3 + ..... + a1n x n y3 y2 = a21 x 1 + a22 x 2 + a23 x 3 + ..... + a2 n x n y 3 = a31 x 1 + a32 x 2 + a33 x 3 + ..... + a3n x n Gli elementi xi della matrice delle priorità sono ottenuti attraverso la media delle righe della matrice dei ............................................................................. yn = an 1 x 1 + an 2 x 2 + an 3 x 3 + ..... + ann x n confronti A. Dipartimento di Scienze e Tecnologie Agroforestali e Ambientali 9 SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE Procedura dell’AHP Analytic Hierarchy Process Divedendo le componenti yi del vettore y così ottenuto per le omologhe del vettore x (xi) si ottengono le componenti zi di un nuovo vettore z, la cui media è l’autovalore l’autovalore principale λmax. (Saaty , 1977) z z Come riportato C i t t da d Saaty S t (1977) e ormai largamente accettato, valori del CR superiori a 0,10 stanno ad indicare un’incongruenza dei giudizi espressi nel confronto a coppie. In tal caso è opportuno riformulare i confronti coppie. z = 1 = 2 = 3 y / y y = n 1 / x / x 2 3 .......... z x 1 2 .......... y / n x λ max a = 3 ( z1 + z2 + z3 + ...... + zn ) n .... n Quanto più il valore di λmax si avvicina al numero degli elementi della matrice (n) tanto più è coerente il risultato. L’ L’Indice Random (IR) è stato calcolato sperimentalmente e nella tabella seguente si riportano i valori che esso assume al variare del rango della matrice, per n compreso tra 1 e 12. Rango matrice (n) 1 2 3 4 5 6 7 8 9 10 11 12 Indice Random (IR) 0 0 0.58 0.90 1.12 1.24 1.32 1.41 1.45 1.49 1.51 1.48 5 Supporto didattico 4 – AA 2008-2009 Docente dott. G. Modica 10 ELEMENTI DI LOGICA FUZZY Insieme “persone alte” UNA BREVE INTRODUZIONE La LOGICA FUZZY (“sfumato”, “sfuocato” ) è stata introdotta per formalizzare concetti del linguaggio naturale che non possono essere categoricamente riconosciuti come veri o falsi, ma che possono avere un certo grado di verità. Si contrappone alla logica booleana o cosiddetta “Crisp” (“chiaro”, “preciso”); Logica classica “La Logica Fuzzy può essere definita in contrapposizione alla logica tradizionale. La logica bivalente (Crisp) vede il mondo in bianco o in nero, pieno o vuoto ecc. La Logica fuzzy invece è polivalente e vede il mondo a colori, in uno spettro di tonalità diverse, che variano in modo continuo tra i vari estremi sopra esemplificati” (Kosko (Kosko,, 1993); La generalizzazione dalla logica booleana a quella Fuzzy passa per la generalizzazione del concetto di appartenenza di un elemento ad un insieme. Logica fuzzy Alcune precisazioni formali Nella teoria degli insiemi classica, un “oggetto”, può appartenere a questo insieme, oppure no; non esistono vie di mezzo; Nella logica fuzzy il concetto di appartenenza è ridefinito in maniera quantitativa, associando ad ogni elemento il grado di appartenenza a quella classe; DiSTAfA Dipartimento di Scienze e Tecnologie Agroforestali e Ambientali 11 SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE LOGICA FUZZY (L. Zadeh , 1965) Molti M lti fenomeni f i naturali t li mostrano t un certo grado di incertezza o di “sfumatura”, difficilmente fromalizzabili secondo limiti ben precisi (crisp). Ed è il caso di alcune grandezze territoriali che spesso vengono anche prsentate secondo classi ben definiti ma che nella realtà sono fenomeni “continui”. Si pensi ad esempio ad alcune grandezze come la pendenza dei versanti, il grado si suscettività di un’area per un uso specifico. Alcuni concetti di base Dato un elemento ed un insieme fuzzy fuzzy,, non si può parlare di una sua proprietà di appartenenza/non--appartenenza all’insieme come di un predicato a valori binari veroappartenenza/non verofalso (0/1); la proprietà di appartenenza è invece definita come un grado di appartenenza che può assumere qualsiasi valore nell’intervallo di valori continui (reali) compreso tra 0 e 1. Tale grado esprime una “qualità” di appartenenza ad un certo insieme. È il caso di sottolineare che la teoria degli g insiemi fuzzyy è uno strumento p per descrivere,, con rigoroso formalismo matematico, la nozione di incertezza nelle situazioni in cui essa non sia di natura stocastica. FUZZINESS versus PROBABILITY Il grado di appartenenza ad una funzione varia normalmente tra 0 e 1 e questo non fa che aumentare la possibilità di confondere il concetto di fuzzy (fuzziness fuzziness)) con quello di probabilità (probability (probability), ), considerandoli di fatto equivalenti. Tra i due termini esiste, invece, una sottile ma significativa differenza. Probabilità Æ fornisce un’indicazione sulla possibilità che un evento si verifichi. Non sappiamo però quando ciò possa accadere. Fuzziness Æ si riferisce invece al grado di appartenenza di un oggetto ad una classe o ad un fenomeno. Il fenomeno quindi esiste, non conosciamo solo il grado di appartenenza all’insieme di riferimento. 6 Supporto didattico 4 – AA 2008-2009 Docente dott. G. Modica 12 ELEMENTI DI LOGICA FUZZY Definizioni di base – I fuzzy set Nella generalizzazione secondo logica booleana (cosiddetta logica crisp crisp)) il concetto di appartenenza di un elemento ad un insieme è formalizzato nel seguente modo: ⎧1 sse x ∈ A ⎩0 sse x ∉ A μ A ( x) = ⎨ Il valore assunto dalla funzione viene detto grado di appartenenza e nella logica booleana i valori sono ristretti a 0 ed 1 che che equivalgono semplicemente alle diciture: “x appartiene ad A”, “x non appartiene ad A”. Ne consegue che gli elementi che appartengono all’insieme A sono indicati come μ A ( x) = 1 mentre quelli che non vi appartengono come μ ( x) = 0 A Sia X un insieme non vuoto. Nella logica fuzzy la funzione di appartenenza può assumere un qualsiasi valore nell’intervallo [0,1]. La Funzione di Appartenenza μA(x) dell'insieme fuzzy A (membership (membership function function)) o funzione caratteristica, associa ad ogni punto in X un numero reale nell’intervallo [0,1]. Il valore di μA(x) rappresenta il grado di appartenenza di x in A, tanto più elevato quanto più vicino ad 1. L’appartenenza di un generico elemento x con un insieme fuzzy A in X può quindi essere così formalizzata μ A ( x) : X → [0,1] Un fuzzy set A in X è quindi caratterizzato dalla sua funzione caratteristica e dal grado di appartenenza µA(x) dell’elemento x nell’insieme fuzzy A per ogni x ∈ X. Si perviene così alla definizione di un insieme fuzzy fuzzy:: data una collezione di oggetti x, l’insieme fuzzy A in X è l’insieme di coppie ordinate: A = {( x, μ A ( x)) : x ∈ X } 13 ELEMENTI DI LOGICA FUZZY Esempi di fuzzy set Nella logica tradizionale una persona è considerata adulta, ovvero fa parte del set "adulti" al 100%, quando supera il diciottesimo anno d'età, altrimenti rientra nel set “giovani" al 100% In logica fuzzy, fuzzy, invece, il fuzzy set ha una sfumatura sul confine adulti/giovani. Ciascuno dei due insiemi, “giovani” ed “adulti”, è definito da una funzione di appartenenza. La teoria fuzzy traccia una curva fra gli opposti, fra A e non non-A 7 Supporto didattico 4 – AA 2008-2009 DiSTAfA Docente dott. G. Modica Dipartimento di Scienze e Tecnologie Agroforestali e Ambientali 14 SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE LOGICA FUZZY Si prendano in considerazine tre persone (A A, B e C), cui corrispondono le seguenti altezze: 185 cm, 165 cm e 186 cm. Si prendano in considerazione 3 classi di altezza con gli intervalli di valori l i di seguito it indicati: i di ti BASSA (short) [0, 165] MEDIA (average) [165.1, 185] ALTA (tall) [185.1, 250]. Esempi sui fuzzy set Se ci riferiamo ad una classificazione di tipo crisp avremo la situazione prospettata in tabella: tabella: Come appare evidente le altezze di A e C sono assai simili ma dato il tipo di classificazione adottata, questi ricadono in classi diverse: media e alta adottata, alta,, rispettivamente rispettivamente.. Consideriamo ora una classificazione secondo i fuzzy set. All’uopo è necessario definire tre funzioni di appartenza appartenza,, tante quante sono le classi di altezza previste. previste. Ad esempio: esempio: • Short Æ funzione lineare con valore 1 fino a 150 cm; valori decrescenti da 150 fino a 180 cm. • Average Æ valore 0 per altezze < 150 cm; funzione lineare crescente fino a 175 cm dove assume il valore 1; valori decrescenti da 175 fino a 200 cm, soglia in cui la funzine vale 0. • Tall Æ valore 0 fino a 170 cm; valori crescenti da 170 fino a 200 cm, in cui la funzione vale 1. μ short ( B) = b−x b−a μ average ( B) = = 180 − 165 180 − 150 = 0,5 x − a 165 − 150 = = 0,6 b − a 175 − 150 μtall ( B ) = 0 Una proprietà importante delle membership functions relative ad uno stesso parametro è la loro reciproca sovrapposizione, sicché alcuni valori della variabile possono appartenere parzialmente a più insiemi fuzzy. Tanto più estesa è la zona di sovrapposizione, tanta più incertezza viene compresa nel sistema. DiSTAfA Dipartimento di Scienze e Tecnologie Agroforestali e Ambientali 15 SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE LOGICA FUZZY MEMBERSHIP FUNCTIONS In figura sono indicati i 3 passaggi fondamentali di un procedimento fuzzy. La fase di fuzzificazione consiste nel passare dal valore numerico della variabile considerata al suo corrispondente valore di appartenenza all all’insieme insieme fuzzy, fuzzy tramite la funzione di appartenenza, normalizzando tutti i valori nell’intervallo [0, 1]. L’inferenza è il momento in cui vengono applicate le regole di combinazione tra gli insiemi fuzzy. Generalmente si tratta di semplici espressioni linguistiche che vengono convertite in formalismo matematico con il linguaggio “if…then” della Logica. L’output fuzzy è anch’esso un valore di appartenenza sia può essere usato sia “puro”, come proprietà qualitativa, che “defuzzificato”, come numero reale. La defuzzificazione è il processo di restituzione del risultato sotto forma di numero. 8 Supporto didattico 4 – AA 2008-2009 DiSTAfA Docente dott. G. Modica Dipartimento di Scienze e Tecnologie Agroforestali e Ambientali 16 SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE LOGICA FUZZY Consideriamo ad esempio il caso di studio in cui viene formali ato il problema relativo formalizzato relati o all’individuazione delle aree più suscettive per uno specifico scopo. All the conditions mentioned above (except the one for the restricted area) are vague, but correspond to the way we express these conditions in our languages and thinking. Using the conventional approach the above mentioned conditions would be translated into crisp classes, such as • slope less than 10 degrees • aspect between 135 degrees and 225 degrees, or the terrain is flat • elevation between 1,500 meters and 2,000 meters • within 1 kilometer from a lake • not within 300 meters from a major road In termini linguistici la formalizzazione del problema può essere in questi termini: • Pendenza moderata • Esposizione favorevole • Altitudine moderata • Vicinanza ad elementi naturali • Vicinanza agli assi viari principali • Assenza di vincoli o restrizioni di alcun tipo DiSTAfA Dipartimento di Scienze e Tecnologie Agroforestali e Ambientali 17 SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE LOGICA FUZZY Consideriamo il terreno pianeggiante quando la pendenza è inferiore a 10°. L’esposizione dei versanti è favorevole quando è orientata a S d t Sud Sud-est, S d e Sud-ovest. S d t In this part of the country, any elevation above 1,350 meters and below 2,150 meters is moderate with an “ideal” elevation between 1,700 and 1,800 meters. Everyy location within 1 kilometer from a water body (lake or reservoir) is near that feature. Close to a major road means within a buffer of 300 meters. In this example, we consider a major roadto be US 36, SR 7, SR 93, or SR 119. 9 Supporto didattico 4 – AA 2008-2009 DiSTAfA Docente dott. G. Modica Dipartimento di Scienze e Tecnologie Agroforestali e Ambientali 18 SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE LOGICA FUZZY Consideriamo il terreno pianeggiante quando la pendenza è inferiore a 10°. L’esposizione dei versanti è favorevole quando è orientata a S d t Sud Sud-est, S d e Sud-ovest. S d t In this part of the country, any elevation above 1,350 meters and below 2,150 meters is moderate with an “ideal” elevation between 1,700 and 1,800 meters. Everyy location within 1 kilometer from a water body (lake or reservoir) is near that feature. Membership function for “high elevation” (sinusoidal membership function) Close to a major road means within a buffer of 300 meters. In this example, we consider a major roadto be US 36, SR 7, SR 93, or SR 119. 10