Individuazione e caratterizzazione attraverso metodologie geostatistiche Esempio: individuare le caratteristiche spaziali (grana) della topografia di un versante, perché la topografia può influenzare altri fenomeni ecologici, come ad esempio: umidità dei suoli, temperatura ed andamento delle temperature giornaliere ecc. Per primo, è necessario scegliere una variabile che ci permetta di misurare l'indice di topografia (es. altitudine o pendenza o esposizione). Si misura il suo valore in un punto determinato su un lato del versante, poi allontanandosi alcuni metri, si misura nuovamente la stessa variabile. I valori presi su punti vicini tendono ad essere simili. Allontanandosi ancora, si misura la stessa variabile, e cosi via si continua a misurare la stessa variabile per poi comparare i nuovi valori con quelli presi in precedenza, in questo modo si arriva ad un punto nel quale si cambia versante. Se si è oltrepassato il limite tra i versanti e se la variabile scelta è adeguata, i valori misurati cambieranno. Se questo tipo di misura viene effettuato in tanti versanti, sarà possibile stimare il valore medio della superficie di ogni versante e così individuare la scala caratteristica della topografia. AUTOCORRELAZIONE Misura in che grado il valore osservato di una variabile in un dato sito è significativamente dipendente dai valori di quella stessa variabile in un'altra localizzazione. L'analisi dell'autocorrelazione spaziale permette di individuare delle ricorrenze in una sequenza di dati attraverso l'analisi di somiglianza all'interno di un set di dati. La sequenza viene comparata con se stessa in posizioni successive continue e così viene calcolato un indice di somiglianza tra intervalli adiacenti Una variabile è spazialmente correlata se presenta una associazione significativa tra diversi punti in funzione della distanza che li separa, cosa che viene misurata attraverso un coefficiente di autocorelazione. Per a calcolare la somiglianza nei valori di una variabile misurata in due campioni (ad esempio due campioni contigui) è sufficiente il seguente coefficiente di correlazione. ziz j rij = ∑ 2 1 zi n Dove “n" indica il numero totale di osservazioni; "z" indica i valori della variabile per i due campioni indicati da "i" e "j" (che presentano una deviazione yi-ymean). AUTOCORRELAZIONE AUTOCORRELAZIONE Se si vuole applicare questo semplice indice a scale diverse, vale a dire per comparare campioni non contigui ma distribuiti a distanze diverse, è necessario introdurre alcune modifiche. Uno dei modi più semplici di rendere questo indice una misura scalaspecifica è quello proposto da Moran L'indice di autocorrelazione di Moran introduce un fattore (una sorta di peso) che permette di comparare e sommare i valori di correlazione di tutti i campioni che distano lo stesso intervallo (o distanza lag) e di escludere dal calcolo tutte quelle comparazioni di campioni distribuiti a distanze diverse L'indice di autocorrelazione di Moran ∑∑w z z ij i j I(d ) = i j W ∑ zi 2 j Dove “ wij ” è il peso per i campioni “i” e “j”, mentre “W” rappresenta la somma di tutti i pesi. Dunque il peso adotta il valore 1 solo se i due punti distano una determinata distanza "d" (o distanza lag); altrimenti il peso adotta un valore 0. w= 1 o 0. AUTOCORRELAZIONE Allo stesso modo che il coefficiente di correlazione di Pearson, “I(d)” (coefficiente di autocorrelazione di Moran) presenta valori tra “-1” e “1”, rappresentando il valore “1” la correlazione perfetta positiva. Il valore atteso in condizioni casuali (random) è vicino a “0.0”, il che significa mancanza di autocorrelazione. La distanza tra due punti viene chiamata sfasamento (lag). Per un’analisi con valore di sfasamento 1, la sequenza dei dati analizzati è proprio quella dei dati originali. Per un analisi dove il valore di sfasamento è 2 la distanza tra i dati da comparare è di due campioni e lo stesso per altri valori di sfasamento, 3, 4, ecc. Il correlogramma Diagramma nel quale vengono rappresentati i valori di autocorrelazione (es. indice di Moran sulle ascisse) come funzione della distanza (lag o distanza di sfasamento sulle ordinate). correlogramma del valore topografico di umidità calcolato per poco più di 400 campioni a caso di uno spartiacque di 1600 ettari di estensione. Le linee sottili nella figura rappresentano i limiti di confidenza stimati per permutazione. Il correlogramma Dimensione delle macchie Distanza tra macchie Le scale vengono indicate dai picchi dei valori di correlazione al di sopra dello 0. Per una struttura che si ripete a gruppi (macchie), la dimensione dei gruppi (dimensione media delle macchie) compare come un primo picco di autocorrelazione. Questo valore diminuisce per le distanze che superano la dimensione media delle macchie per poi incrementare fino ad un secondo picco che indica la distanza tra le macchie. Forme caratteristiche di correlogramma sono associabili a ben precise strutture Paesaggio spaziali. casuale I correlogrammi Paesaggio con gradiente Paesaggio con una struttura che si ripete più volte. l’analisi dell’autocorrelazione rappresenta uno strumento per individuare le possibili variazioni periodiche o ripetizioni nella struttura spaziale attraverso l’analisi della covarianza all’interno di un set di dati. * * * * SEMIVARIANZA SEMIVARIANZA Funzione che descrive la corrispondenza tra i valori che assume una variabile misurata in campioni presi a determinate distanze. La semivarianza permette di misurare il grado di dipendenza spaziale dei campioni ed esprime la varianza come una funzione continua della scala. L’analisi della semivarianza, come modo alternativo per individuare la struttura spaziale di un insieme di dati geostatistici, considera la dissomiglianza tra valori misurati in due punti separati tra di loro da una determinata distanza. L’analisi della semivarianza presenta due applicazioni fondamentali: •quello semplicemente descrittivo che permette la caratterizzazione spaziale di un insieme di dati geostatistici, •e quello predittivo nel quale i semivariogrammi vengono aggiustati e descritti secondo dei modelli parametrici teorici, modelli che permettono successivamente il calcolo dei valori della variabile per punti che originariamente non sono stati misurati. Il metodo di interpolazione Kriging rappresenta un esempio di questo ultimo approccio. SEMIVARIANZA Se seguiamo la notazione adoperata per la correlazione, yii è il valore di una variabile misurato nel punto i ed N è il numero totale dei punti, la semivarianza γ (gamma) ad una distanza d è definita 2 w y − y ∑ ij i j γ (d ) = (2Nd ) [ ( )] dove “j” è un punto ad una distanza “d” da “i”, ed “Ndd” è il numero di punti a quella distanza (o in quella classe di distanza). Osserviamo ad esempio che se due punti vicini presentano valori simili, il termine differenza del numeratore (y(j+d) (j+d) - y(j) (j)) è piccolo e dunque la semivariaza a quella distanza è bassa. Ad una distanza maggiore tra i punti, l’associazione tra i valori misurati spesso non differisce da quella di due punti casuali misurati in una griglia. Il semivariogramma Rappresentazione grafica del valore di semivarianza in rapporto alla distanza lag (o classi di distanza). Un semivariogramma è definito dal: valore asintotico (sill) ordinata all’origine della semivarianza (nugget) campo (range: distanza alla quale si raggiunge il valore asintotico) * * * Il semivariogramma Semivariogramma per il valore topografico di un versante. Per riportare i valori tra 0 ed 1 i valori di semivarianza vengono divisi per il valore di varianza media del campione intero. Ad una distanza 0 il valore di un punto viene comparato con sé stesso e quindi la semivarianza è 0. Quando la distanza incrementa, se i punti comparati sono diversi, la semivarianza cresce. Questo incremento continua fino a che i punti a quella distanza ed oltre non presentano nessuna dipendenza spaziale ed il quadrato della loro distanza si avvicina alla varianza media di tutto il set di dati e la pendenza della curva si annulla (sill). Campo (range): area o dimensione spaziale dove i campioni spazialmente dipendenti. I punti che presentano valori di semivarianza vicini alla soglia vengono considerati spazialmente indipendenti e quindi a quella distanza la variabile è indipendente Come tecnica di individuazione della scala: il campo (range) indica la scala caratteristica della variabile. L’ordinata all’origine (nugget) presenta un valore interpretativo dove un valore alto (non zero) indica la presenza di una struttura spaziale che si sviluppa ad una scala più dettagliata della risoluzione minima dell’insieme di dati campionati (ad esempio, il fenomeno studiato presenta una grana più piccola o fine della distanza minima tra campioni). Dunque se si vuole analizzare quel processo o struttura risulta indispensabile campionare con una maglia più di dettaglio. Come tecnica di interpolazione di dati : Una volta costruito il semivariogramma, è possibile cercare la funzione che meglio si adatta all’andamento della curva. Due gruppi di modelli: quelli che non arrivano mai ad una asintota o sill (Lineari) e quelli che presentano una sill (Sferici, Esponenziali, Gaussiano) E’ da sottolineare il fatto che l’applicazione dei metodi geostatistici rappresenta un ottimo strumento di indagine per svariati dati territoriali.. Il fatto che i dati territoriali spesso varino in funzione della distanza, li rende non adatti ad essere analizzati con i metodi classici della statistica parametrica che ha come premessa l’indipendenza dei valori misurati. Dunque sarebbe opportuno realizzare sempre in fase preliminare un’analisi della autocorrelazione prima di applicare un’analisi statistico parametrico ad un insieme di dati presi in aree territoriali vaste o associati ad una dimensione spaziale . Esempi: Analisi della semivarianza per dati floristici della città di Roma. Variabile: Ricchezza di specie vegetali (da 130: giallo a 440 verde scuro) Esempi: Analisi della semivarianza per dati NDVI primavera e state della Sardegna e per zone incendiate. AVHRR (advanced very high resolution radiometer) immagini giornaliere di 1.1 Km di risoluzione NDVI (Normalized difference vegetation index) NDVI=(NIR-RED)/NIR+RED) -1≥NDVI ≥1 riscalato tra 0 e 200. 100 assenza di biomassa dim pixel degradata a 5*5 km I valori di NDVI sono strettamente correlati alla presenza di biomassa fotosintetizzante e costituisce una misura indiretta della salute e crescita della vegetazione