Supporto didattico 4 – AA 2008-2009 Docente dott. G. Modica 1

annuncio pubblicitario
Supporto didattico 4 – AA 2008-2009
Docente dott. G. Modica
TECNICHE DI NORMALIZZAZIONE DEI DATI
PER IL LORO UTILIZZO NELL’AMBITO DEI METODI
MULTICRITERIALI IN AMBIENTE GIS
Giuseppe Modica [email protected]
Corso di Laurea Specialistica
Scienze Forestali ed Ambientali
DiSTAfA
Dipartimento di Scienze e Tecnologie
Agroforestali e Ambientali
SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE
DiSTAfA
Dipartimento di Scienze e Tecnologie
Agroforestali e Ambientali
1
SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE
La Normalizzazione dei dati
Concetti di base
‰ La normalizzazione è un’operazione statistica che permette di mettere a
confronto distribuzioni diverse
diverse..
‰ Le procedure di normalizzazione sono effettuate allo scopo di ricondurre dati
riferiti a scale di valori differenti, sia numeriche sia linguistiche, entro un
intervallo di valori comune
comune..
‰ È una operazione che, ad esempio, consente di trasformare i punteggi dei
criteri di valutazione, espressi nelle rispettive scale di misura, in una scala
unica compresa tipicamente tra zero ed uno
uno.. Si parla in questo caso di
intervallo chiuso [0, 1].
‰ In teoria, una procedura di normalizzazione non dovrebbe alterare il
contenuto informativo dei dati di partenza
partenza..
‰ Nella realtà operativa, vengono impiegate diverse tecniche che consentono
questa trasformazione ed i risultati cui consentono di pervenire sono diversi
1
Supporto didattico 4 – AA 2008-2009
DiSTAfA
Docente dott. G. Modica
Dipartimento di Scienze e Tecnologie
Agroforestali e Ambientali
2
SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE
Tasformazioni lineari
Criterio del valore massimo
Trasformazioni che mantengono
la direzione delle preferenze (ad
esempio il valore massimo resta
massimo ed il minimo resta
minimo anche dopo la
trasformazione))
yi =
xi
xmax
Criterio del valore minimo e massimo
yi =
DiSTAfA
xi − xmin
xmax − xmin
Dipartimento di Scienze e Tecnologie
Agroforestali e Ambientali
3
SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE
Tasformazioni lineari
Trasformazioni che mantengono
la direzione delle preferenze (ad
esempio il valore massimo resta
massimo ed il minimo resta
minimo anche dopo la
trasformazione))
Trasformazione vettoriale o Euclidea
yi =
xi
∑x
2
i
Criterio del totale di riga
yi =
xi
∑x
i
2
Supporto didattico 4 – AA 2008-2009
DiSTAfA
Docente dott. G. Modica
Dipartimento di Scienze e Tecnologie
Agroforestali e Ambientali
4
SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE
Tasformazioni lineari
Trasformazioni che mantengono
la direzione delle preferenze (ad
esempio il valore massimo resta
massimo ed il minimo resta
minimo anche dopo la
trasformazione))
DiSTAfA
Dipartimento di Scienze e Tecnologie
Agroforestali e Ambientali
5
SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE
Procedura dell’AHP
Analytic Hierarchy Process
(Saaty , 1977)
L’analisi gerarchica
Definizione di una gerarchia
Scomposizione di un problema decisionale in un insieme di sottoproblemi più semplici
Le analisi gerarchiche sono
sempre più di largo utilizzo per
affrontare problemi decisionali.
Spesso, il decisore sceglie tra
più alternative sulla base di
procedure basate su giudizi
linguistici, più congeniali al
ragionamento umano.
Successivamente, i giudizi
linguistici sono tradotti in valori
numerici e trattati secondo
precisi algoritmi di calcolo.
3
Supporto didattico 4 – AA 2008-2009
DiSTAfA
Docente dott. G. Modica
Dipartimento di Scienze e Tecnologie
Agroforestali e Ambientali
6
SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE
Procedura della Valutazione
Gerarchica delle
Alternative (AHP,
Analytic Hierarchy Process
(Saaty , 1977)
L’analisi gerarchica di Saaty
La procedura della Valutazione Gerarchica delle Alternative (AHP, Analytic Hierarchy
Process)) si basa su una matrice di giudizi espressi nel confronto a coppia fra i vari fattori
Process
fattori..
Gli elementi di ciascuna coppia vengono comparati al fine di stabilire quale di essi è più
importante in rapporto all'elemento sovraordinato, e in quale misura
misura..
Il risultato del confronto è il coefficiente di dominanza (mij) che rappresenta una stima
della dominanza del primo elemento (i) rispetto al secondo (j).
A1
I giudizi previsti nella scala
fondamentale dei rapporti
(Saaty, 2000) sono di tipo
qualitativo, sfruttando l’abilità e
le caratteristiche del
ragionamento umano
nell’esprimere giudizi di
preferenza.
Il metodo prevede cinque
indicatori linguistici che
corrispondono ad altrettanti
valori numerici e, qualora
necessario, possono essere
convenientemente utilizzati
anche dei giudizi intermedi. La
necessità di aumentare l’utilizzo
di giudizi intermedi aumenta
all’aumentare del numero dei
fattori considerati
A1 ⎡ m11
A2 ⎢⎢m21
A3 ⎢⎣m31
A2
A3
m12
m22
m31
m11 ⎤
m11 ⎥⎥
m33 ⎥⎦
n ⋅ ( n − 1)
2
Confrontando a coppia gli n elementi, si ottengono n2 giudizi; in considerazione della
proprietà di reciprocità, la risoluzione della matrice richiede la definizione di un
numero di giudizi pari a
Matrice dei confronti a coppie Æ proprietà
La consistenza della matrice dei confronti dipende dal sistema di preferenze del decisore
e dalla scala di preferenze adottata
DiSTAfA
Dipartimento di Scienze e Tecnologie
Agroforestali e Ambientali
7
SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE
Procedura dell’AHP
Analytic Hierarchy Process
(Saaty , 1977)
Concetti di base
Scala dei giudizi di Saaty e corrispondenti valori numerici utilizzati nei confronti a coppia tra i
fattori inseriti nella valutazione multicriteriale.
Definizione (Indicatore linguistico)
I giudizi previsti nella scala
fondamentale dei rapporti
(Saaty, 2000) sono di tipo
qualitativo, sfruttando l’abilità e
le caratteristiche del
ragionamento umano
nell’esprimere giudizi di
preferenza.
Il metodo prevede cinque
indicatori linguistici che
corrispondono ad altrettanti
valori numerici e, qualora
necessario, possono essere
convenientemente utilizzati
anche dei giudizi intermedi. La
necessità di aumentare l’utilizzo
di giudizi intermedi aumenta
all’aumentare del numero dei
fattori considerati.
Intensità dell’importanza relativa
Uguale importanza
Debole importanza di un fattore rispetto ad un altro
Importanza forte
Importanza dimostrata
Importanza assoluta
Valori intermedi tra due giudizi adiacenti
1
3
5
7
9
2, 4, 6, 8
Se v è il giudizio espresso quando i è confrontato con
j, 1/v è giudizio reciproco di j confrontato con i
Reciproci
1/9
1/7
1/5
1/3
1
3
5
7
9
assoluta
molto forte
forte
moderata
uguale
moderata
forte
molto forte
assoluta
meno importante
più importante
Esempio di matrice dei confronti a
coppia. Nel caso specifico, le
alternative, o criteri, posti a confronto
sono 3.
Da notare come, per quanto visto in
precedenza, basta esprimere un
numero di giudizi pari a:
n·(n-1)/2 Æ 3· (3-1)/2 = 3.
4
Supporto didattico 4 – AA 2008-2009
DiSTAfA
Docente dott. G. Modica
Dipartimento di Scienze e Tecnologie
Agroforestali e Ambientali
8
SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE
Procedura dell’AHP
Analytic Hierarchy Process
Procedura di valutazione dell’AHP Æ Il rapporto di Consistenza
CR =
(Saaty , 1977)
IC = Indice di Coerenza
IR = Indice Random
Il Rapporto di Consistenza (CR,
Consistency Ratio) è stato
introdotto da Saaty (1977) ai fini
della valutazione della congruenza
nell’espressione dei giudizi
IC
IR
L’indice di Coerenza misura la deviazione dalla coerenza nell’espressione dei giudizi e si calcola
attraverso la seguente formula:
IC =
λmax − n
n −1
λmax è l’autovalore
l’autovalore principale della matrice;
n è il numero dei fattori inseriti nella matrice.
L’autovalore
L’
autovalore principale della matrice (λmax) si ricava attraverso il prodotto della matrice delle
priorità x per la matrice dei confronti
componenti yi
a 11
a12
a 13
...
a1n
x1
y1
a 21
a 22
a 23
...
a2 n
x2
y2
a3n × x 3
A = [aij ] = a 31
n
a ij = ∑ b jk c kj
k =1
DiSTAfA
=
a 32
a 33
...
..
..
..
..
..
..
..
an 1
an 2
an 3
...
ann
xn
yn
La matrice a, prodotto delle
due matrici b e c, è
A (Matrice prodotto),
prodotto), ottenendo il vettore y, di
dove:
y1 = a11 x 1 + a12 x 2 + a13 x 3 + ..... + a1n x n
y3
y2 = a21 x 1 + a22 x 2 + a23 x 3 + ..... + a2 n x n
y 3 = a31 x 1 + a32 x 2 + a33 x 3 + ..... + a3n x n
Gli elementi xi della matrice delle
priorità sono ottenuti attraverso la
media delle righe della matrice dei
.............................................................................
yn = an 1 x 1 + an 2 x 2 + an 3 x 3 + ..... + ann x n
confronti
A.
Dipartimento di Scienze e Tecnologie
Agroforestali e Ambientali
9
SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE
Procedura dell’AHP
Analytic Hierarchy Process
Divedendo le componenti yi del vettore y così ottenuto per le omologhe del vettore x (xi) si
ottengono le componenti zi di un nuovo vettore z, la cui media è l’autovalore
l’autovalore principale λmax.
(Saaty , 1977)
z
z
Come riportato
C
i t t da
d Saaty
S t
(1977) e ormai largamente
accettato, valori del CR
superiori a 0,10 stanno ad
indicare un’incongruenza dei
giudizi espressi nel confronto a
coppie. In tal caso è opportuno
riformulare i confronti coppie.
z
=
1
=
2
=
3
y
/
y
y
=
n
1
/
x
/
x
2
3
..........
z
x
1
2
..........
y
/
n
x
λ max
a =
3
( z1 + z2 + z3 + ...... + zn )
n
....
n
Quanto più il valore di λmax si avvicina al numero degli elementi della matrice (n) tanto più è
coerente il risultato.
L’
L’Indice
Random (IR) è stato calcolato sperimentalmente e nella tabella seguente si
riportano i valori che esso assume al variare del rango della matrice, per n compreso tra 1
e 12.
Rango matrice (n)
1
2
3
4
5
6
7
8
9
10
11
12
Indice Random (IR)
0
0
0.58
0.90
1.12
1.24
1.32
1.41
1.45
1.49
1.51
1.48
5
Supporto didattico 4 – AA 2008-2009
Docente dott. G. Modica
10
ELEMENTI DI LOGICA FUZZY
Insieme “persone alte”
UNA BREVE INTRODUZIONE
La LOGICA FUZZY (“sfumato”, “sfuocato” ) è stata
introdotta per formalizzare concetti del linguaggio naturale che
non possono essere categoricamente riconosciuti come veri o
falsi, ma che possono avere un certo grado di verità.
Si contrappone alla logica booleana o cosiddetta “Crisp”
(“chiaro”, “preciso”);
Logica classica
“La Logica Fuzzy può essere definita in contrapposizione alla
logica tradizionale. La logica bivalente (Crisp) vede il mondo in
bianco o in nero, pieno o vuoto ecc. La Logica fuzzy invece è
polivalente e vede il mondo a colori, in uno spettro di tonalità
diverse, che variano in modo continuo tra i vari estremi sopra
esemplificati” (Kosko
(Kosko,, 1993);
La generalizzazione dalla logica booleana a quella Fuzzy passa
per la generalizzazione del concetto di appartenenza di un
elemento ad un insieme.
Logica fuzzy
Alcune precisazioni formali
Nella teoria degli insiemi classica, un “oggetto”, può
appartenere a questo insieme, oppure no; non esistono vie di
mezzo;
Nella logica fuzzy il concetto di appartenenza è ridefinito in
maniera quantitativa, associando ad ogni elemento il grado di
appartenenza a quella classe;
DiSTAfA
Dipartimento di Scienze e Tecnologie
Agroforestali e Ambientali
11
SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE
LOGICA FUZZY
(L. Zadeh , 1965)
Molti
M
lti fenomeni
f
i naturali
t li mostrano
t
un certo grado di incertezza o di
“sfumatura”, difficilmente
fromalizzabili secondo limiti ben
precisi (crisp).
Ed è il caso di alcune grandezze
territoriali che spesso vengono
anche prsentate secondo classi
ben definiti ma che nella realtà
sono fenomeni “continui”.
Si pensi ad esempio ad alcune
grandezze come la pendenza
dei versanti, il grado si
suscettività di un’area per un
uso specifico.
Alcuni concetti di base
Dato un elemento ed un insieme fuzzy
fuzzy,, non si può parlare di una sua proprietà di
appartenenza/non--appartenenza all’insieme come di un predicato a valori binari veroappartenenza/non
verofalso (0/1); la proprietà di appartenenza è invece definita come un grado di appartenenza
che può assumere qualsiasi valore nell’intervallo di valori continui (reali) compreso tra 0 e
1. Tale grado esprime una “qualità” di appartenenza ad un certo insieme.
È il caso di sottolineare che la teoria degli
g insiemi fuzzyy è uno strumento p
per descrivere,,
con rigoroso formalismo matematico, la nozione di incertezza nelle situazioni in cui essa
non sia di natura stocastica.
FUZZINESS versus PROBABILITY
Il grado di appartenenza ad una funzione varia normalmente tra 0 e 1 e questo non fa
che aumentare la possibilità di confondere il concetto di fuzzy (fuzziness
fuzziness)) con quello di
probabilità (probability
(probability),
), considerandoli di fatto equivalenti.
Tra i due termini esiste, invece, una sottile ma significativa differenza.
‰
Probabilità Æ fornisce un’indicazione sulla possibilità che un evento si
verifichi. Non sappiamo però quando ciò possa accadere.
‰
Fuzziness Æ si riferisce invece al grado di appartenenza di un oggetto ad
una classe o ad un fenomeno. Il fenomeno quindi esiste, non conosciamo
solo il grado di appartenenza all’insieme di riferimento.
6
Supporto didattico 4 – AA 2008-2009
Docente dott. G. Modica
12
ELEMENTI DI LOGICA FUZZY
Definizioni di base – I fuzzy set
Nella generalizzazione secondo logica booleana (cosiddetta logica crisp
crisp)) il concetto di appartenenza di un elemento ad un
insieme è formalizzato nel seguente modo:
⎧1 sse x ∈ A
⎩0 sse x ∉ A
μ A ( x) = ⎨
Il valore assunto dalla funzione viene detto grado di appartenenza e nella logica booleana i valori sono ristretti a 0 ed 1 che
che
equivalgono semplicemente alle diciture: “x appartiene ad A”, “x non appartiene ad A”.
Ne consegue che gli elementi che appartengono all’insieme A sono indicati come
μ A ( x) = 1
mentre quelli che non vi appartengono come
μ ( x) = 0
A
Sia X un insieme non vuoto. Nella logica fuzzy la funzione di appartenenza può assumere un qualsiasi valore nell’intervallo
[0,1]. La Funzione di Appartenenza μA(x) dell'insieme fuzzy A (membership
(membership function
function)) o funzione caratteristica, associa
ad ogni punto in X un numero reale nell’intervallo [0,1].
Il valore di μA(x) rappresenta il grado di appartenenza di x in A, tanto più elevato quanto più vicino ad 1. L’appartenenza di
un generico elemento x con un insieme fuzzy A in X può quindi essere così formalizzata
μ A ( x) : X → [0,1]
Un fuzzy set A in X è quindi caratterizzato dalla sua funzione caratteristica e dal grado di appartenenza µA(x) dell’elemento
x nell’insieme fuzzy A per ogni x
∈ X.
Si perviene così alla definizione di un insieme fuzzy
fuzzy:: data una collezione di oggetti x, l’insieme fuzzy A in X è l’insieme di
coppie ordinate:
A = {( x, μ A ( x)) : x ∈ X
}
13
ELEMENTI DI LOGICA FUZZY
Esempi di fuzzy set
Nella logica tradizionale una persona è considerata adulta,
ovvero fa parte del set "adulti" al 100%, quando supera il
diciottesimo anno d'età, altrimenti rientra nel set “giovani" al
100%
In logica fuzzy,
fuzzy, invece, il fuzzy set ha una sfumatura sul
confine adulti/giovani. Ciascuno dei due insiemi, “giovani” ed
“adulti”, è definito da una funzione di appartenenza.
La teoria fuzzy traccia una curva fra gli opposti, fra A e non
non-A
7
Supporto didattico 4 – AA 2008-2009
DiSTAfA
Docente dott. G. Modica
Dipartimento di Scienze e Tecnologie
Agroforestali e Ambientali
14
SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE
LOGICA FUZZY
Si prendano in considerazine tre
persone (A
A, B e C), cui
corrispondono le seguenti altezze:
185 cm, 165 cm e 186 cm. Si
prendano in considerazione 3
classi di altezza con gli intervalli di
valori
l i di seguito
it indicati:
i di ti BASSA
(short) [0, 165]
MEDIA (average) [165.1, 185]
ALTA (tall) [185.1, 250].
Esempi sui fuzzy set
Se ci riferiamo ad una classificazione di tipo crisp avremo la situazione prospettata in tabella:
tabella:
Come appare evidente le altezze di A e C sono assai simili ma dato il tipo di classificazione
adottata, questi ricadono in classi diverse: media e alta
adottata,
alta,, rispettivamente
rispettivamente..
Consideriamo ora una classificazione secondo i fuzzy set. All’uopo è necessario definire tre
funzioni di appartenza
appartenza,, tante quante sono le classi di altezza previste.
previste. Ad esempio:
esempio:
• Short Æ funzione lineare con valore 1 fino a 150 cm; valori decrescenti da 150 fino a 180 cm.
• Average Æ valore 0 per altezze < 150 cm; funzione lineare crescente fino a 175 cm dove assume il
valore 1; valori decrescenti da 175 fino a 200 cm, soglia in cui la funzine vale 0.
• Tall Æ valore 0 fino a 170 cm; valori crescenti da 170 fino a 200 cm, in cui la funzione vale 1.
μ short ( B) =
b−x
b−a
μ average ( B) =
=
180 − 165
180 − 150
= 0,5
x − a 165 − 150
=
= 0,6
b − a 175 − 150
μtall ( B ) = 0
Una proprietà importante delle membership functions relative ad uno stesso parametro è la loro reciproca
sovrapposizione, sicché alcuni valori della variabile possono appartenere parzialmente a più insiemi fuzzy. Tanto più
estesa è la zona di sovrapposizione, tanta più incertezza viene compresa nel sistema.
DiSTAfA
Dipartimento di Scienze e Tecnologie
Agroforestali e Ambientali
15
SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE
LOGICA FUZZY
MEMBERSHIP FUNCTIONS
In figura sono indicati i 3 passaggi fondamentali di un
procedimento fuzzy.
La fase di fuzzificazione consiste nel passare dal valore
numerico della variabile considerata al suo
corrispondente valore di appartenenza all
all’insieme
insieme fuzzy,
fuzzy
tramite la funzione di appartenenza, normalizzando tutti
i valori nell’intervallo [0, 1]. L’inferenza è il momento in
cui vengono applicate le regole di combinazione tra gli
insiemi fuzzy. Generalmente si tratta di semplici
espressioni linguistiche che vengono convertite in
formalismo matematico con il linguaggio “if…then” della
Logica.
L’output fuzzy è anch’esso un valore di appartenenza
sia può essere usato sia “puro”, come proprietà
qualitativa, che “defuzzificato”, come numero reale. La
defuzzificazione è il processo di restituzione del risultato
sotto forma di numero.
8
Supporto didattico 4 – AA 2008-2009
DiSTAfA
Docente dott. G. Modica
Dipartimento di Scienze e Tecnologie
Agroforestali e Ambientali
16
SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE
LOGICA FUZZY
Consideriamo ad esempio il
caso di studio in cui viene
formali ato il problema relativo
formalizzato
relati o
all’individuazione delle aree più
suscettive per uno specifico
scopo.
All the conditions mentioned above (except the one for the restricted area) are
vague, but correspond to the way we express these conditions in our languages and
thinking. Using the conventional approach the above mentioned conditions would
be translated into crisp classes, such as
• slope less than 10 degrees
• aspect between 135 degrees and 225 degrees, or the terrain is flat
• elevation between 1,500 meters and 2,000 meters
• within 1 kilometer from a lake
• not within 300 meters from a major road
In termini linguistici la
formalizzazione del problema
può essere in questi termini:
• Pendenza moderata
• Esposizione favorevole
• Altitudine moderata
• Vicinanza ad elementi
naturali
• Vicinanza agli assi viari
principali
• Assenza di vincoli o
restrizioni di alcun tipo
DiSTAfA
Dipartimento di Scienze e Tecnologie
Agroforestali e Ambientali
17
SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE
LOGICA FUZZY
Consideriamo il terreno
pianeggiante quando la
pendenza è inferiore a 10°.
L’esposizione dei versanti è
favorevole quando è orientata a
S d t Sud
Sud-est,
S d e Sud-ovest.
S d
t
In this part of the country, any
elevation above
1,350 meters and below 2,150
meters is moderate with an
“ideal” elevation between 1,700
and 1,800
meters. Everyy location within 1
kilometer from a water body
(lake or reservoir) is near that
feature.
Close to a major road means
within a buffer of 300 meters. In
this example, we consider a
major roadto be US 36, SR 7,
SR 93, or SR 119.
9
Supporto didattico 4 – AA 2008-2009
DiSTAfA
Docente dott. G. Modica
Dipartimento di Scienze e Tecnologie
Agroforestali e Ambientali
18
SEZIONE COSTRUZIONI RURALI E TERRITORIO AGROFORESTALE
LOGICA FUZZY
Consideriamo il terreno
pianeggiante quando la
pendenza è inferiore a 10°.
L’esposizione dei versanti è
favorevole quando è orientata a
S d t Sud
Sud-est,
S d e Sud-ovest.
S d
t
In this part of the country, any
elevation above
1,350 meters and below 2,150
meters is moderate with an
“ideal” elevation between 1,700
and 1,800
meters. Everyy location within 1
kilometer from a water body
(lake or reservoir) is near that
feature.
Membership function for “high elevation” (sinusoidal membership function)
Close to a major road means
within a buffer of 300 meters. In
this example, we consider a
major roadto be US 36, SR 7,
SR 93, or SR 119.
10
Scarica