ROMA 23 GIUGNO 2016
COMPORTAMENTI INDIVIDUALI
E RELAZIONI SOCIALI
IN TRASFORMAZIONE
UNA SFIDA PER LA
STATISTICA UFFICIALE
AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI
L’arricchimento del dato statistico con la dimensione geografica nella Statistica Ufficiale
INNOVAZIONI E SPERIMENTAZIONI
23 GIUGNO 2016
11.15 | 12.45
L’arricchimento del dato statistico con la
dimensione geografica nella Statistica Ufficiale
Alessandra Petrucci | Università degli Studi di Firenze
ROMA 23 GIUGNO 2016
AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI
L’arricchimento del dato statistico con la dimensione geografica nella Statistica Ufficiale
Premessa
Tutto ciò che
accade, accade da
qualche parte nello
spazio e nel tempo
2009 – Indagine sulla georeferenziazione dei dati nella
statistica ufficiale – Commissione per la Garanzia
dell’informazione statistica – Presidenza del Consiglio
dei Ministri (Gruppo di lavoro: Alessandra Petrucci,
Chiara Bocci, Riccardo Borgoni, Marisa Civardi, Nicola
Salvati, Silvana Salvini, Daniele Vignoli)
2010 – Conference of European Statisticians - Seminar
on Spatial Statistics: role of spatial dimension in official
statistics
2013 - High-Level Group for the Modernisation of
Official Statistics - The role of geospatial information in
the modernisation of statistical production and services
2016 …
2
ROMA 23 GIUGNO 2016
AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI
L’arricchimento del dato statistico con la dimensione geografica nella Statistica Ufficiale
Qualche riflessione iniziale
A partire dalla fine degli anni ’80 a oggi si è
assistito al crescente aumento di interesse
nei confronti dei dati riferiti al territorio e
in particolare ai dati a livello locale. Questo
anche grazie allo sviluppo contemporaneo
di strumenti informatici, quali i Sistemi
Informativi Geografici (Geographical
Information Systems – GIS), in grado di
gestire questo tipo di informazione.




Elaborazione dati territoriali  statistica spaziale: analisi delle
osservazioni statistiche tenendo conto della posizione in cui esse si
manifestano in un determinato spazio.
Tenere conto della dimensione spaziale:


Differenza fra scienze fisiche e scienze socio-economiche
Differenza fra dati aggregati e dati individuali
Problemi per l’analisi dei dati spaziali:




non indipendenza
cambiamenti di scala
dati categoriali in unità areali
…
Elevata attenzione nei confronti dell’analisi statistica dei dati
spaziali  riviste, numeri speciali, volumi, ecc.
3
ROMA 23 GIUGNO 2016
AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI
L’arricchimento del dato statistico con la dimensione geografica nella Statistica Ufficiale
Perché la
dimensione
geografica?
Perché i grafici statistici, i fogli di calcolo, i database e
le relazioni, non sono sufficienti per spiegare
pienamente il comportamento dei fenomeni fisici,
sociali e biologici che avvengono sulla terra.
4
ROMA 23 GIUGNO 2016
AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI
L’arricchimento del dato statistico con la dimensione geografica nella Statistica Ufficiale
…e il motivo?
Queste rappresentazioni statistiche:
- non visualizzano le informazioni relative alla
dimensione spaziale per identificare il "dove" di tali
dati
- non consentono di riconoscere il comportamento
sistemico tra i fatti statistici e l'ambiente; come sono
interconnessi e sono interdipendenti
5
ROMA 23 GIUGNO 2016
AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI
L’arricchimento del dato statistico con la dimensione geografica nella Statistica Ufficiale
…le conseguenze
considerare lo spazio in cui essi si manifestano
consente di estendere lo studio attraverso specifici
metodi statistici che si propongono di stabilire e
quantificare la presenza di forme di dipendenza fra le
osservazioni nello spazio
6
ROMA 23 GIUGNO 2016
AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI
L’arricchimento del dato statistico con la dimensione geografica nella Statistica Ufficiale
La soluzione?
Aggiungere la dimensione geografica nelle
statistiche ufficiali
7
ROMA 23 GIUGNO 2016
AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI
L’arricchimento del dato statistico con la dimensione geografica nella Statistica Ufficiale
Ma per i dati
riferiti al territorio
occorre verificare:
- Completezza
- Qualità
- Conseguenze della mancanza o effettiva necessità
8
ROMA 23 GIUGNO 2016
AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI
L’arricchimento del dato statistico con la dimensione geografica nella Statistica Ufficiale
Come aggiungere informazione?
abbiamo bisogno di strumenti efficaci per
la raccolta, l'elaborazione, la diffusione e la
comunicazione di informazioni statistiche



definire un ambiente affidabile per le statistiche spaziali, e
aumentare la nostra capacità di elaborazione e di analisi spaziale
creazione di un vero e proprio sistema di collaborazione tra le parti
interessate, per promuovere e facilitare il processo decisionale.
9
ROMA 23 GIUGNO 2016
AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI
L’arricchimento del dato statistico con la dimensione geografica nella Statistica Ufficiale
e cosa fare?


Per il primo, possiamo usare zone amministrative o griglie, e
poi, possiamo applicare diverse soluzioni che esistono sul mercato:
GPS, GIS, servizi web, Google, Internet, ecc. - Non dimenticare
soluzioni open
10
ROMA 23 GIUGNO 2016
AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI
L’arricchimento del dato statistico con la dimensione geografica nella Statistica Ufficiale
griglie?
Sono una buona scelta per la loro
flessibilità e adattabilità, possono essere
integrate con le statistiche tradizionali
basate sulle unità amministrative.
11
ROMA 23 GIUGNO 2016
AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI
L’arricchimento del dato statistico con la dimensione geografica nella Statistica Ufficiale
analisi spaziale?
GIS e statistica spaziale per creare nuova
informazione da quella originale
12
ROMA 23 GIUGNO 2016
AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI
L’arricchimento del dato statistico con la dimensione geografica nella Statistica Ufficiale
La rilevanza nella definizione dei disegni campionari
Il corretto riferimento territoriale degli
eventi che si manifestano nel territorio è
essenziale ai fini della pianificazione della
raccolta dell’informazione



Nell’ambito della pianificazione dei censimenti o di indagini
campionarie relative a individui, famiglie o aziende la corretta
collocazione sul territorio delle unità statistiche interessate
aumenta la buona riuscita dell’indagine stessa permettendo sia di
reperire più agevolmente i soggetti coinvolti nella rilevazione sia
maggiori controlli nelle operazioni di rilevazione.
Nelle indagini finalizzate alla rappresentazione delle dinamiche
spaziali consentono - tramite opportune tecniche di previsione
stocastica - di definire delle reti di monitoraggio con proprietà
ottimali.
Il piano campionario è costruito in modo da garantire la “migliore”
precisione possibile (in termini di una prescelta metrica o perdita)
alle previsioni d’interesse sia in fase di pianificazione dell’indagine
che nel caso si renda necessario un’integrazione o una riduzione
della rete di monitoraggio nel corso del tempo a seguito, per
esempio, di sopraggiunte esigenze informative o variazioni dei
budget connesse con la survey.
13
ROMA 23 GIUGNO 2016
AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI
L’arricchimento del dato statistico con la dimensione geografica nella Statistica Ufficiale
La rilevanza nell’integrazione di dati da fonti diverse
La georeferenziazione dei database fornisce
la possibilità di una loro integrazione grazie
al ricorso ai sistemi informativi geografici
(GIS). In primo luogo nell’ambito di un GIS è
possibile combinare dataset georeferenziati
sulla stessa regione in un'unica base di dati
tramite linkage basati sulla locazione degli
attributi rilevati. Ciò arricchisce
notevolmente l’analisi statistica in quanto il
dataset combinato può contenere un
potenziale informativo che nessuno dei
dataset di partenza singolarmente detiene.




Elevati livelli di precisione nel posizionamento dell’informazione
statistica forniscono un linkage accurato e oggettivo tra database
raccolti da agenzie o enti diversi con finalità, potenzialmente,
completamente diverse.
Un elevato dettaglio spaziale dell’informazione agevola il
riallineamento delle informazioni relative ad unità statistiche
rilevate da fonti diverse che, tipicamente, non fanno riferimento
agli stessi siti di rilevazione.
I dati contenuti in archivi diversi possono essere rilevati o resi
disponibili in riferimento a supporti spaziali diversi. Situazioni di
questo tipo sono note in letteratura con il nome di problemi di
cambio di supporto.
Il riferimento territoriale favorisce, inoltre, l’integrazione di dati da
fonti diverse fornendo informazioni ausiliare adatte
all’implementazione delle tecniche di record linkage molto
utilizzate, specie in campo economico, per l’impiego degli archivi
amministrativi a fini statistici
14
ROMA 23 GIUGNO 2016
AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI
L’arricchimento del dato statistico con la dimensione geografica nella Statistica Ufficiale
La dimensione spaziale come fattore esplicativo della
dinamica dei fenomeni
 La posizione relativa assunta sul territorio dagli eventi oggetto di
Molte analisi statistiche territoriali si
prefiggono la finalità di studiare i fenomeni
a livello di area geografica, evidenziando ed
eventualmente spiegando la variabilità
spaziale che li caratterizza.
Spesso, invece, l’obiettivo dell’analisi è di
tipo individuale, ovvero l’obiettivo è
spiegare i comportamenti delle singole
unità statistiche quali individui o famiglie.
analisi può essere uno strumento rilevante per spiegare la loro
variabilità spaziale.



L’interazione spaziale degli eventi si formalizza tramite concetti
geometrici quali la distanza (non necessariamente intesa come una
metrica in senso stretto), la direzione o l’adiacenza dei siti su cui gli
eventi si verificano.
Lo spazio costituisce una variabile rappresentativa di effetti
ambientali non misurati e, talvolta, non misurabili o difficilmente
misurabili ma, potenzialmente, altamente informativi. Haining
(2003) identifica due diverse fonti di influenze ambientale: l’effetto
di composizione della popolazione considerata e l’effetto
contestuale Il riferimento territoriale favorisce, inoltre,
l’integrazione di dati da fonti.
La variabilità spaziale nella composizione della popolazione target
può indurre una variabilità territoriale su quei fenomeni
economici, demografici, sanitari o sociali che da essa sono
influenzati. L’effetto contestuale è legato al fatto che unità locate in
aree diverse sono esposte in modo diverso a fattori
potenzialmente rilevanti per il fenomeno studiato.
15
ROMA 23 GIUGNO 2016
AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI
L’arricchimento del dato statistico con la dimensione geografica nella Statistica Ufficiale
L’informazione territoriale per la produzione di analisi ecologiche
L’analisi ecologica risulta essere importante
in molte situazioni quali:

a. casi in cui il dato individuale è
scarsamente affidabile o inaccessibile per
motivi di privacy;

b. casi in cui il dato individuale sia
eccessivamente “voluminoso” per poter
essere trattato e trasmesso, come nel caso
di dati di derivazione censuaria, ma anche
ricavati da archivi elettronici di aziende o
enti di grandi dimensioni;

c. nel calcolo dell’esposizione degli individui
a rischi ambientali nel momento in cui la
determinazione dell’esposizione richieda
misurazioni di grandezze caratterizzate da
elevate componenti antropiche oltre che
ambientali o da errori di misura.

Problema della fallacia ecologica: differenza esistente tra le
relazioni stimate utilizzando dati raggruppati e quelle
effettivamente presenti a livello individuale.
L’effetto dello spazio si può manifestare a scale diverse e la
localizzazione degli eventi può essere riferita ad oggetti spaziali di
dimensione (scale o aggregation effect) e forma (grouping o zoning
effect) diverse.
Con l’espressione “problema delle aree modificabili” (Modifiable
areal unit problem – MAUP) si intende il fatto che una statistica
calcolata per due diverse partizioni territoriali relative alla stessa
popolazione, o allo stesso campione, risulta essere diversa anche
se è stato utilizzato lo stesso insieme di dati per calcolarla.
In presenza di MAUP è difficile valutare se l’esito dell’analisi
statistica relativa al fenomeno considerato sia strutturale o un
artefatto del riferimento spaziale utilizzato. E questo a prescindere
dal fatto che l’analisi statistica avvenga in modo ecologico o
individuale tramite, per esempio, un’analisi ottenuta con modelli
gerarchici o multilivello.
16
ROMA 23 GIUGNO 2016
AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI
L’arricchimento del dato statistico con la dimensione geografica nella Statistica Ufficiale
Elevato dettaglio
territoriale
agevola l’analista che può comprovare i propri risultati
adottando riferimenti spaziali diversi.
17
ROMA 23 GIUGNO 2016
AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI
L’arricchimento del dato statistico con la dimensione geografica nella Statistica Ufficiale
Effetti sull’inferenza della dimensione geografica dei dati
La necessità di georiferire i dati nasce
dall’assunto che la locazione
dell’informazione è potenzialmente
rilevante per il fenomeno considerato che
tende, quindi, a mostrare delle regolarità
spaziali. La così detta prima legge della
geografia (Tobler, 1970) sintetizza questo
aspetto: everything is related to everything
else, but near things are more related than
distant things.




La presenza di correlazione (o autocorrelazione) spaziale richiede
di modificare le procedure inferenziali basate sull’assunto di
indipendenza fra le stesse.
Trattando dati correlati come se fossero indipendenti, questo
induce una sottostima degli standard error effettivi. Per esempio,
la sottostima degli standard error nel caso di correlazione positiva
comporta, come conseguenza diretta, intervalli di confidenza con
copertura nominale inferiore a quella effettiva e significatività
spurie nel caso di verifiche di ipotesi.
Intuitivamente, essendo le osservazioni correlate meno
informative di osservazioni indipendenti (la correlazione
rappresenta una sorta di ridondanza dell’informazione disponibile),
trascurare l’autocorrelazione spaziale implica un
“sopravvalutazione” della precisione relativa alle analisi condotte.
Nel caso di analisi più complesse la quantificazione dell’effetto
indotto dalla correlazione dipende dal tipo di analisi. È indubbio,
però, che un’analisi corretta richiede la possibilità di trattare la
struttura di correlazione in modo adeguato.
18
ROMA 23 GIUGNO 2016
AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI
L’arricchimento del dato statistico con la dimensione geografica nella Statistica Ufficiale
I metodi di previsione spaziale (kriging, point pattern analysis,…)

Richiedono di stimare preliminarmente la
struttura di autocorrelazione spaziale


Per tali tipi di analisi la geocodifica dell’informazione in termini di
aree risulta inadeguata.
L’aggregazione dell’informazione spaziale per codici di area
preclude sostanzialmente la possibilità di valutare le strutture di
correlazione ad una scala inferiore a quella dell’aggregato
territoriale considerato e quindi di valutare la variabilità spaziale al
livello del singolo individuo considerato nell’indagine.
Si osservi che la geocodifica risulta, per altro, adeguata a fornire
dataset che possano essere analizzati da un punto di vista spaziale
tramite un’analisi ecologica, di tipo multilevel e anche per larga
parte delle tecniche di regressione spaziale, note in letteratura
come modelli di autoregressione, nel momento in cui la scala
spaziale di riferimento sia giudicata appropriata per il fenomeno
analizzato.
19
ROMA 23 GIUGNO 2016
AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI
L’arricchimento del dato statistico con la dimensione geografica nella Statistica Ufficiale
Grazie
Il più grande contributo che la statistica
ufficiale insieme alla geografia può dare, è
supportare le decisioni per la creazione di
comunità sostenibili, ovvero ambienti
sociali, culturali, economici e naturali, dove
siamo in grado di soddisfare le nostre
esigenze e le aspirazioni senza
compromettere il futuro delle prossime
generazioni
20