Individuazione e caratterizzazione attraverso metodologie
geostatistiche
Esempio: individuare le caratteristiche spaziali (grana) della topografia
di un versante, perché la topografia può influenzare altri fenomeni
ecologici, come ad esempio: umidità dei suoli, temperatura ed andamento
delle temperature giornaliere ecc.
Per primo, è necessario scegliere una variabile che ci permetta di
misurare l'indice di topografia (es. altitudine o pendenza o esposizione).
Si misura il suo valore in un punto determinato su un lato del versante,
poi allontanandosi alcuni metri, si misura nuovamente la stessa variabile.
I valori presi su punti vicini tendono ad essere simili.
Allontanandosi ancora, si misura la stessa variabile, e cosi via si continua
a misurare la stessa variabile per poi comparare i nuovi valori con quelli
presi in precedenza, in questo modo si arriva ad un punto nel quale si
cambia versante. Se si è oltrepassato il limite tra i versanti e se la
variabile scelta è adeguata, i valori misurati cambieranno.
Se questo tipo di misura viene effettuato in tanti versanti, sarà
possibile stimare il valore medio della superficie di ogni versante e così
individuare la scala caratteristica della topografia.
AUTOCORRELAZIONE
Misura in che grado il valore osservato di una variabile in un dato sito è
significativamente dipendente dai valori di quella stessa variabile in
un'altra localizzazione. L'analisi dell'autocorrelazione spaziale permette di
individuare delle ricorrenze in una sequenza di dati attraverso l'analisi di
somiglianza all'interno di un set di dati.
La sequenza viene comparata con se stessa in posizioni successive continue
e così viene calcolato un indice di somiglianza tra intervalli adiacenti
Una variabile è spazialmente correlata se presenta una associazione
significativa tra diversi punti in funzione della distanza che li separa, cosa
che viene misurata attraverso un coefficiente di autocorelazione.
Per a calcolare la somiglianza nei valori di una variabile misurata in due
campioni (ad esempio due campioni contigui) è sufficiente il seguente
coefficiente di correlazione.
 ziz j 
rij = ∑  2 
1  zi 
n
Dove “n" indica il numero totale di osservazioni; "z" indica i valori della
variabile per i due campioni indicati da "i" e "j" (che presentano una
deviazione yi-ymean).
AUTOCORRELAZIONE
AUTOCORRELAZIONE
Se si vuole applicare questo semplice indice a scale diverse, vale a dire per
comparare campioni non contigui ma distribuiti a distanze diverse, è
necessario introdurre alcune modifiche.
Uno dei modi più semplici di rendere questo indice una misura scalaspecifica è quello proposto da Moran
L'indice di autocorrelazione di Moran introduce un fattore (una sorta di
peso) che permette di comparare e sommare i valori di correlazione di tutti
i campioni che distano lo stesso intervallo (o distanza lag) e di escludere dal
calcolo tutte quelle comparazioni di campioni distribuiti a distanze diverse
L'indice di autocorrelazione di Moran
∑∑w z z
ij i j
I(d ) =
i
j
W ∑ zi
2
j
Dove “ wij ” è il peso per i campioni “i” e “j”, mentre “W” rappresenta la
somma di tutti i pesi.
Dunque il peso adotta il valore 1 solo se i due punti distano una determinata
distanza "d" (o distanza lag); altrimenti il peso adotta un valore 0.
w= 1 o 0.
AUTOCORRELAZIONE
Allo stesso modo che il coefficiente di correlazione di Pearson,
“I(d)” (coefficiente di autocorrelazione di Moran) presenta
valori tra “-1” e “1”, rappresentando il valore “1” la correlazione
perfetta positiva. Il valore atteso in condizioni casuali
(random) è vicino a “0.0”, il che significa mancanza di
autocorrelazione.
La distanza tra due punti viene chiamata sfasamento (lag). Per
un’analisi con valore di sfasamento 1, la sequenza dei dati
analizzati è proprio quella dei dati originali. Per un analisi dove
il valore di sfasamento è 2 la distanza tra i dati da comparare
è di due campioni e lo stesso per altri valori di sfasamento, 3,
4, ecc.
Il correlogramma
Diagramma nel quale
vengono rappresentati i
valori di autocorrelazione
(es. indice di Moran sulle
ascisse) come funzione
della distanza (lag o
distanza di sfasamento
sulle ordinate).
correlogramma del valore topografico di umidità calcolato per
poco più di 400 campioni a caso di uno spartiacque di 1600
ettari di estensione. Le linee sottili nella figura rappresentano
i limiti di confidenza stimati per permutazione.
Il correlogramma
Dimensione
delle macchie
Distanza
tra macchie
Le scale vengono indicate dai picchi dei valori di correlazione
al di sopra dello 0. Per una struttura che si ripete a gruppi
(macchie), la dimensione dei gruppi (dimensione media delle
macchie) compare come un primo picco di autocorrelazione.
Questo valore diminuisce per le distanze che superano la
dimensione media delle macchie per poi incrementare fino ad
un secondo picco che indica la distanza tra le macchie.
Forme caratteristiche
di correlogramma sono
associabili a ben
precise strutture
Paesaggio
spaziali.
casuale
I correlogrammi
Paesaggio con
gradiente
Paesaggio con una struttura che si
ripete più volte.
l’analisi dell’autocorrelazione rappresenta
uno strumento per individuare le possibili
variazioni periodiche o ripetizioni nella
struttura spaziale attraverso l’analisi
della covarianza all’interno di un set di
dati.
* *
*
*
SEMIVARIANZA
SEMIVARIANZA
Funzione che descrive la corrispondenza tra i valori che assume una
variabile misurata in campioni presi a determinate distanze. La semivarianza
permette di misurare il grado di dipendenza spaziale dei campioni ed
esprime la varianza come una funzione continua della scala. L’analisi della
semivarianza, come modo alternativo per individuare la struttura spaziale di
un insieme di dati geostatistici, considera la dissomiglianza tra valori
misurati in due punti separati tra di loro da una determinata distanza.
L’analisi della semivarianza presenta due applicazioni fondamentali:
•quello semplicemente descrittivo che permette la caratterizzazione
spaziale di un insieme di dati geostatistici,
•e quello predittivo nel quale i semivariogrammi vengono aggiustati e
descritti secondo dei modelli parametrici teorici, modelli che permettono
successivamente il calcolo dei valori della variabile per punti che
originariamente non sono stati misurati. Il metodo di interpolazione Kriging
rappresenta un esempio di questo ultimo approccio.
SEMIVARIANZA
Se seguiamo la notazione adoperata per la correlazione, yii è il
valore di una variabile misurato nel punto i ed N è il numero
totale dei punti, la semivarianza γ (gamma) ad una distanza d è
definita
2
w
y
−
y
∑ ij i j
γ (d ) =
(2Nd )
[ (
)]
dove “j” è un punto ad una distanza “d” da “i”, ed “Ndd” è il
numero di punti a quella distanza (o in quella classe di distanza).
Osserviamo ad esempio che se due punti vicini presentano
valori simili, il termine differenza del numeratore (y(j+d)
(j+d) - y(j)
(j)) è
piccolo e dunque la semivariaza a quella distanza è bassa. Ad
una distanza maggiore tra i punti, l’associazione tra i valori
misurati spesso non differisce da quella di due punti casuali
misurati in una griglia.
Il semivariogramma
Rappresentazione grafica del valore di semivarianza in rapporto
alla distanza lag (o classi di distanza). Un semivariogramma è
definito dal:
valore asintotico
(sill)
ordinata all’origine
della semivarianza
(nugget)
campo (range:
distanza alla quale
si raggiunge il
valore asintotico)
*
*
*
Il semivariogramma
Semivariogramma per il valore
topografico di un versante.
Per riportare i valori tra 0 ed 1 i valori
di semivarianza vengono divisi per il
valore di varianza media del campione
intero.
Ad una distanza 0 il valore di un punto viene comparato con sé stesso
e quindi la semivarianza è 0. Quando la distanza incrementa, se i
punti comparati sono diversi, la semivarianza cresce. Questo
incremento continua fino a che i punti a quella distanza ed oltre non
presentano nessuna dipendenza spaziale ed il quadrato della loro
distanza si avvicina alla varianza media di tutto il set di dati e la
pendenza della curva si annulla (sill).
Campo (range): area o dimensione spaziale dove i campioni
spazialmente dipendenti.
I punti che presentano valori di semivarianza vicini alla soglia
vengono considerati spazialmente indipendenti e quindi a quella
distanza la variabile è indipendente
Come tecnica di individuazione della scala:
il campo (range) indica la scala caratteristica della variabile.
L’ordinata all’origine (nugget) presenta un valore
interpretativo dove un valore alto (non zero) indica la presenza
di una struttura spaziale che si sviluppa ad una scala più
dettagliata della risoluzione minima dell’insieme di dati
campionati (ad esempio, il fenomeno studiato presenta una
grana più piccola o fine della distanza minima tra campioni).
Dunque se si vuole analizzare quel processo o struttura risulta
indispensabile campionare con una maglia più di dettaglio.
Come tecnica di interpolazione di dati :
Una volta costruito il semivariogramma, è possibile cercare la
funzione che meglio si adatta all’andamento della curva.
Due gruppi di modelli: quelli che non arrivano mai ad una
asintota o sill (Lineari) e quelli che presentano una sill (Sferici,
Esponenziali, Gaussiano)
E’ da sottolineare il fatto che l’applicazione dei metodi
geostatistici rappresenta un ottimo strumento di indagine per
svariati dati territoriali..
Il fatto che i dati territoriali spesso varino in funzione della
distanza, li rende non adatti ad essere analizzati con i metodi
classici della statistica parametrica che ha come premessa
l’indipendenza dei valori misurati. Dunque sarebbe opportuno
realizzare sempre in fase preliminare un’analisi della
autocorrelazione prima di applicare un’analisi statistico
parametrico ad un insieme di dati presi in aree territoriali
vaste o associati ad una dimensione spaziale .
Esempi:
Analisi della semivarianza
per dati floristici della
città di Roma.
Variabile: Ricchezza di
specie vegetali (da 130:
giallo a 440 verde scuro)
Esempi:
Analisi della semivarianza per dati NDVI primavera e state
della Sardegna e per zone incendiate.
AVHRR (advanced very high resolution radiometer) immagini
giornaliere di 1.1 Km di risoluzione
NDVI (Normalized difference vegetation index)
NDVI=(NIR-RED)/NIR+RED)
-1≥NDVI ≥1 riscalato tra 0 e 200.
100 assenza di biomassa
dim pixel degradata a 5*5 km
I valori di NDVI sono
strettamente correlati alla
presenza di biomassa
fotosintetizzante e costituisce
una misura indiretta della
salute e crescita della
vegetazione