XXVIII CONFERENZA ITALIANA DI SCIENZE REGIONALI
METODI E STRUMENTI PER L’ANALISI SOCIO-ECONOMICA MICROTERRITORIALE
Orietta GARGANO e Sandro CRUCIANI
Istituto Nazionale di Statistica, via Adolfo Ravà 150, 00142, Roma
SOMMARIO
Il poter associare ad un dato rilevato la sua collocazione fisica sul territorio permette di
condurre analisi a riferimento micro-territoriale. Altra condizione necessaria, ai fini
dell’efficienza dell’analisi, è poter disporre di una rappresentazione cartografica di unità
territoriali minime alle quali associare i dati georiferiti. Caratteristica che dà valore aggiunto
alla suddivisione del territorio in micro-aree è la disponibilità di griglie territoriali di livello
gerarchico superiore, deducibili per unione dalla suddivisione minima di base, in modo che
l’analisi possa essere condotta a diversi livelli di aggregazione a partire dal primo.
Nel presente lavoro sono descritte le tecniche di georeferenziazione dei dati e i metodi per la
loro associazione ad aree micro-territoriali, che possono essere aggregate a livelli
gerarchicamente superiori. Le zone micro-territoriali utilizzate sono le sezioni di censimento,
aree disegnate dall’Istat in accordo con i comuni in maniera funzionale per le fasi di raccolta e
di diffusione dei dati censuari. Il sistema di geocodifica adottato è il Sistema territoriale per il
riconoscimento e la normalizzazione di indirizzi (Sis.Te.R.), che permette di associare ad un
indirizzo la sezione di censimento in cui questo ricade e la coppia di coordinate geografiche
del centroide della sezione.
1
1
INTRODUZIONE
Un sistema informativo geografico rappresenta l’ambiente ideale per l’analisi dei dati socioeconomici sui quali misurare indicatori di potenziale territoriale. Inoltre offre la possibilità di
condividere con immediatezza risultati che godono della caratteristica della visibilità.
Il valore aggiunto della proposta contenuta in questo lavoro risiede nello sperimentare la
mappatura degli eventi a livello microterritoriale, sfruttando la sinergia di metodologie e
tecniche afferenti a diversi campi applicativi.
L’ambiente tecnologico di contesto consente di puntare su un metodo che permette di
analizzare e rappresentare i dati in modo diretto sul territorio. L’applicazione implementata
utilizza il supporto geografico come metodologia di base per la definizione degli ambiti
territoriali su cui condurre l’analisi e un sistema di geocodifica per il riferimento dei dati al
territorio.
La possibilità di analizzare i dati a livello microterritoriale ricalca le tecniche utilizzate nelle
analisi di mercato. Il dato deve poter essere riferito al territorio in modo puntuale, o perché se
ne conosce la collocazione geografica esatta o perché si conosce il suo riferimento ad un
elemento che a sua volta si colloca puntualmente sul territorio, come può esserlo un indirizzo.
L’indirizzo a sua volta deve poter essere geocodificato, ciò significa che, oltre alla descrizione
dei dati di tipo toponomastico che lo caratterizzano, ne è noto il riferimento territoriale.
L’associazione al territorio può essere espressa tramite una coppia di coordinate geografiche,
che ne permettono la sua rappresentazione puntuale su idonea cartografia espressa nello
stesso sistema di coordinate, oppure tramite un codice di micro-area.
2
LA GEOGRAFIA
Il territorio dei comuni è suddiviso in maniera esaustiva in aree minime di base, disegnate in
occasione dei censimenti generali secondo regole poste dall’Istat: le sezioni di censimento.
Inoltre alcune amministrazioni comunali prevedono suddivisioni sub-comunali di livello
superiore, ottenute dall’unione di intere sezioni di censimento: le aree sub-comunali di
valenza amministrativa o funzionale. Tutti i dati cartografici vettoriali sono gestiti dall’Istat
all’interno di un GIS che garantisce l’integrazione dei dati e il facile passaggio da un livello
territoriale all’altro.
Un ulteriore elemento che caratterizza le sezioni di censimento è l’itinerario della sezione,
ovvero l’insieme degli indirizzi che ricadono in quella sezione. L’itinerario di sezione di
censimento è l’oggetto che mette in relazione la geografia con l’altro strumento di analisi
utilizzato, il sistema territoriale di geocodifica.
2
3
IL SISTEMA DI NORMALIZZAZIONE E GEOCODIFICA
Il sistema utilizzato per il trattamento degli indirizzi integra i dati geo-territoriali e i dati
toponomastici a livello di disegno logico. Così applicando le funzioni principali di tale
sistema, che sono: il riconoscimento dell’indirizzo, la trasposizione in forma normalizzata
dello stesso e la successiva geocodifica, quando un indirizzo viene riconosciuto come
presente nell’archivio del sistema a questo vengono associati i dati territoriali con cui è
valorizzato nell’archivio master di riferimento. Convenzionalmente si dice che l’indirizzo
viene geocodificato. Di fatto, con questa tecnica vengono associati agli indirizzi riconosciuti,
ove il riconoscimento si intende esteso fino al numero civico, il codice della sezione di
censimento (il codice di una micro-area) ed una coppia di coordinate metriche x, y del
centroide della sezione stessa (un punto geografico).
4
APPLICAZIONE
Oggetto dell’analisi del presente lavoro sono gli eventi “furti in appartamento” occorsi e
rilevati dal Ministero dell’Interno nell’anno 2006 nelle principali città italiane (comuni con
oltre 250.000 abitanti). Per queste città l’Istat gestisce, in accordo con ciascuna,
un’articolazione territoriale in aree sub-comunali di tipo amministrativo o funzionale
(quartieri, circoscrizioni, municipi, ecc.). Le città trattate sono le prime dodici in ordine
decrescente per dimensione demografica: Roma, Milano, Napoli, Torino, Palermo, Genova,
Bologna, Firenze, Bari, Catania, Venezia, Verona.
L’informazione che deve essere necessariamente associata all’evento osservato è l’indirizzo
dell’appartamento in cui il furto si è verificato. Sulla base di questa informazione, e
applicando lo strumento software che effettua la geocodifica, l’evento può essere riferito al
territorio con una precisione corrispondente in modo inversamente proporzionale alla
dimensione della sezione di censimento in cui ricade l’indirizzo: minore è l’estensione
territoriale della sezione, maggiore è l’accuratezza del riferimento territoriale del dato. In ogni
caso l’esito positivo della geocodifica colloca l’indirizzo sul territorio: a partire da questo
stadio del processo di analisi la distribuzione dei dati osservati può essere riferita a differenti
suddivisioni areali.
5
OBIETTIVO
Scopo dello studio è stato analizzare la distribuzione sul territorio degli eventi osservati, con
riferimento alle suddivisioni sub-comunali di tipo amministrativo e/o funzionale disegnate
dalle singole amministrazioni comunali.
3
6
IL PROCESSO
L’applicativo di riconoscimento dell’indirizzo e geocodifica è stato applicato con riferimento
alle sezioni di censimento 2001 per i comuni per i quali è stato effettuato l’aggiornamento nel
database master. Tutti gli altri comuni sono stati processati con riferimento alle sezioni del
1991. Questo ha richiesto una procedura diversa per la fase di classificazione degli eventi
nelle aree sub-comunali. In particolare sono risultate strategiche funzioni derivate dal GIS per
attribuire ai punti individuati sulla cartografia la classificazione in un sistema di aree
qualsiasi, purché sovrapponibili alla copertura puntuale degli eventi.
6.1 La normalizzazione
Gli indirizzi relativi ai “furti in appartamento” sono stati geocodificati con riferimento alle
sezioni di censimento 2001 oppure del 1991, a seconda della disponibilità nel sistema. Gli
eventi, alla fine del processo di riconoscimento e geocodifica, sono risultati suddivisi in due
file, il primo contenente gli eventi-indirizzi riconosciuti e “normalizzati” e il secondo gli
eventi-indirizzi non riconosciuti.
A sua volta, nel primo file solo ad un sottoinsieme di eventi sono stati assegnati i codici e i
dati territoriali, poiché anche la funzione di geocodifica può dare esito negativo. Questo
accade quando il numero civico dell’indirizzo di input non è presente nell’archivio di
riferimento o non ne è noto il codice di micro-area. Nel caso trattato, il motivo più frequente
della non geocodifica si è rivelata la mancanza del numero civico nell’indirizzo processato.
6.2 Valutazioni sui risultati di riconoscimento e geocodifica
Il processo di normalizzazione applicato ai dati disponibili per i dodici comuni (Tavola 1) ha
dato come risultato percentuali di riconoscimento che vanno dal 59,8% (Venezia) al 93,1%
(Torino). Un lavoro accurato dovrebbe prevedere l’analisi degli indirizzi scartati per:
1.
capire quali sono definitivamente da scartare perché del tutto privi di validità, non
avendo nessun riferimento di tipo toponomastico (ad esempio “HOTEL”, “C/O LA
MIA ABITAZIONE”, ecc.);
2.
decidere quali possono essere facilmente corretti perché è possibile interpretare il
toponimo esatto, che può essere digitato prima di iterare il processo di
normalizzazione;
3.
cercare comunque nell’archivio del comune candidati più probabili con cui
correggere gli indirizzi scartati;
4
individuare quelli che non sono effettivamente presenti nell’archivio di riferimento
4.
del comune.
Tavola 1 - Risultati del processo di normalizzazione e geocodifica – Riepilogo generale
Codice Istat
del Comune
Valori assoluti
Comune
Disponibili
Normalizzati
Scartati
Valori percentuali
Geo-codificati
Non geocodificati
Disponibili
Normalizzati
Scartati
Geo-codificati
Non geocodificati
1272
Torino
3.558
3.313
245
2.299
1.014
100,0
93,1
6,9
64,6
28,5
10025
Genov a
1.270
1.137
133
553
584
100,0
89,5
10,5
43,5
46,0
15146
Milano
4.351
3.953
398
2.781
1.172
100,0
90,9
9,1
63,9
26,9
23091
Verona
598
459
139
280
179
100,0
76,8
23,2
46,8
29,9
27042
Venezia
665
398
267
284
114
100,0
59,8
40,2
42,7
17,1
37006
Bologna
1.960
1.717
243
915
802
100,0
87,6
12,4
46,7
40,9
48017
Firenze
853
733
120
385
348
100,0
85,9
14,1
45,1
40,8
58091
Roma
6.548
5.833
715
3.278
2.555
100,0
89,1
10,9
50,1
39,0
63049
Napoli
915
751
164
442
309
100,0
82,1
17,9
48,3
33,8
72006
Bari
1.116
801
315
563
238
100,0
71,8
28,2
50,4
21,3
82053
Palermo
804
700
104
512
188
100,0
87,1
12,9
63,7
23,4
87015
Catania
529
472
57
293
179
100,0
89,2
10,8
55,4
33,8
23.167
20.267
2.900
12.585
7.682
100,0
87,5
12,5
54,3
33,2
TOTALE
Fonte: Elaborazioni Istat su dati Ministero dell'Interno
Tavola 2 Riepilogo degli indirizzi scartati per motivo degli scarti
Valori assoluti
Comune
Via o CAP
Indirizzo
Indirizzo non
non trov ato
ambiguo
trov ato
Valori percentuali
Termini della
Via
Via assente
Totale indirizzi Via o CAP
scartati
insufficienti
non trov ato
Indirizzo
Indirizzo non
ambiguo
trov ato
Termini della
Via
Via assente
insufficienti
Totale indirizzi
scartati
Torino
3
11
193
1
37
245
1,2
4,5
78,8
0,4
15,1
100,0
Genova
0
18
94
0
21
133
0,0
13,5
70,7
0,0
15,8
100,0
Milano
3
42
280
0
73
398
0,8
10,6
70,4
0,0
18,3
100,0
Verona
0
1
35
0
103
139
0,0
0,7
25,2
0,0
74,1
100,0
Venezia
4
4
246
0
13
267
1,5
1,5
92,1
0,0
4,9
100,0
Bologna
0
4
68
0
171
243
0,0
1,6
28,0
0,0
70,4
100,0
Firenze
0
8
83
2
27
120
0,0
6,7
69,2
1,7
22,5
100,0
Roma
2
57
477
23
186
745
0,3
7,7
64,0
3,1
25,0
100,0
Napoli
1
11
125
0
27
164
0,6
6,7
76,2
0,0
16,5
100,0
Bari
3
18
212
0
82
315
1,0
5,7
67,3
0,0
26,0
100,0
Palermo
0
6
80
0
18
104
0,0
5,8
76,9
0,0
17,3
100,0
Catania
0
6
46
0
5
57
0,0
10,5
80,7
0,0
8,8
100,0
TOTALE
16
186
1.939
26
763
2.930
0,5
6,3
66,2
0,9
26,0
100,0
Fonte: Elaborazioni Istat su dati Ministero dell'Interno
Lo step di riciclo sui dati scartati richiede un lavoro manuale di ricerca e correzione sui
singoli indirizzi, al fine di incrementare la percentuale di indirizzi riconosciuti e normalizzati;
5
tale attività richiede tempo e impiego di risorse che tuttavia non sono state impegnati in
questo lavoro sperimentale.
Il processo di geocodifica ha restituito a sua volta un alto numero di indirizzi a cui non è stato
possibile assegnare il codice di sezione di censimento; come risulta sempre dalla Tavola 1, le
percentuali vanno dal 17,1% (Venezia) al 46,0% (Genova).
Osservando i motivi della non geocodifica (Tavola 3), il motivo in assoluto più frequente è la
mancanza nell’indirizzo in input del numero civico, a fronte di una strada multisezione: in
questo caso il sistema non riesce ad effettuare una assegnazione univoca, e in output non
viene valorizzato il codice della sezione.
Tavola 3 Riepilogo degli indirizzi non geocodificati per motivo della mancata geocodifca
Valori assoluti
Codice Istat
del Comune
Comune
Valori percentuali
Totale indirizzi
Cod. 250
Cod. 251
Cod. 252
Cod. 255
non geo-
Totale indirizzi
Cod. 250
Cod. 251
Cod. 252
Cod. 252
codificati
non geocodificati
1272
Torino
15
999
1.014
0,0
1,5
98,5
0,0
100,0
10025
Genov a
375
209
584
0,0
64,2
35,8
0,0
100,0
15146
Milano
58
1.111
1.172
0,0
4,9
94,8
0,3
100,0
23091
Verona
3
176
179
0,0
1,7
98,3
0,0
100,0
27042
Venezia
49
63
114
0,0
43,0
55,3
1,8
100,0
37006
Bologna
37
765
802
0,0
4,6
95,4
0,0
100,0
48017
Firenze
33
315
348
0,0
9,5
90,5
0,0
100,0
58091
Roma
60
2.410
31
2.555
2,1
2,3
94,3
1,2
100,0
63049
Napoli
40
265
4
309
0,0
12,9
85,8
1,3
100,0
72006
Bari
51
182
5
238
0,0
21,4
76,5
2,1
100,0
82053
Palermo
13
175
188
0,0
6,9
93,1
0,0
100,0
87015
Catania
22
154
3
179
0,0
12,3
86,0
1,7
100,0
756
6.824
48
7.682
0,7
9,8
88,8
0,6
100,0
TOTALE
54
54
3
2
Fonte: Elaborazioni Istat su dati Ministero dell'Interno
Legenda: Cod. 250 Dati microzona non attribuibili
Cod. 251 Via priva di microzona
Cod. 252 Civico assente - Via multi microzona
Cod. 255 Microzona con civico zero
6.3 Comuni geocodificati al 2001
Per i comuni geocodificati al 2001, i codici di sezione di censimento restituiti con il processo
di normalizzazione e geocodifica sono allineati con la base territoriale1 del comune in oggetto,
quindi può essere agevolmente applicata anche una procedura di tipo alfanumerico per
Con la locuzione “basi territoriali” si intende la suddivisione del territorio di un comune in sezioni di
censimento
1
6
associare i dati alla base cartografica su cui effettuare la rappresentazione e per calcolare gli
indicatori sugli strati territoriali di livello gerarchico superiore adottati, avendo
preventivamente classificato le sezioni rispetto a queste zone. La procedura suddetta è
possibile perché l’associazione (link) viene effettuata sul codice della sezione di censimento
Gli eventi devono dapprima essere raggruppati per sezione; successivamente possono essere
relazionati alle sezioni classificate per area sub-comunale per ottenere infine il numero dei
furti per area sub-comunale.
6.4 Comuni geocodificati al 1991
Per i comuni per i quali vengono utilizzati gli itinerari di sezione di censimento del 1991 i
codici delle sezioni di censimento restituiti dal processo di geocodifica sono relativi alle basi
territoriali del 1991. Per tale motivo non può essere condotta l’operazione di classificazione
adottata nel primo caso, ma si deve ricorrere all’ausilio della geometria. Il processo di
classificazione dei punti-evento nelle aree sub-comunali è stato condotto sfruttando le
relazioni topologiche tra gli oggetti gestite dal GIS.
I punti sulla cartografia valorizzati con il processo di geocodifica, che corrispondono ai
centroidi delle sezioni 1991, “pesati” con il numero di eventi che vi ricadono, sono stati
rappresentati sulla griglia delle aree sub-comunali aggiornate dopo i censimenti del 2001. E’
stato quindi applicato un procedimento di overlay spaziale che ha permesso di associare ai
punti-evento il codice di area sub-comunale nel quale ricadono. Solo a questo punto è stato
possibile derivare la distribuzione dei furti osservati per area sub-comunale.
I risultati ottenuti sono del tutto equivalenti a quelli ottenuti per i comuni del primo gruppo,
per i quali la geocodifica era allineata alle basi territoriali.
7
RISULTATI
Una volta classificate le osservazioni nelle aree sub-comunali, sono stati calcolati dei semplici
indicatori relativamente a questi sistemi di zone. Per tutte le dodici città sui sistemi di
zonizzazione adottati sono stati calcolati i furti in appartamento per mille abitanti e per mille
abitazioni. Gli stessi dati sono stati rappresentati anche su carte tematiche.
8
UN ESEMPIO: IL COMUNE DI BOLOGNA
Le elaborazioni effettuate vengono esemplificate rappresentando i risultati ottenuti per il
comune di Bologna. Per questo comune in particolare il processo è stato condotto con
riferimento ad entrambe le geocodifiche possibili, al fine di misurare la validità dell’ipotesi di
7
base. I due riferimenti temporali hanno restituito un numero diverso di indirizzi geocodificati,
rispettivamente 915 al 1991 e 927 al 2001, risultato peraltro atteso in virtù dell’aggiornamento
temporale effettuato.
Figura 1 La griglia delle sezioni di censimento 2001
I dati geocodificati possono essere riferiti ad entrambe le tipologie di aree sub-comunali
definite sul comune: i nove quartieri e le diciotto zone statistiche. Vengono tuttavia scelte le
seconde, poiché permettono una maggiore disaggregazione del dato.
La zona statistica dove occorrono più furti è la “H - Irnerio” posizionata nel centro della città
e circondata da altre zone con alta intensità del fenomeno (Figura 5 e Tavola 4). Quella dove
in assoluto se ne verificano meno è la “I – Lame” piuttosto periferica ma con insediamenti
abitativi tuttavia non al di sotto della media. La collocazione agli estremi opposti della
distribuzione di queste due zone è confermata anche dagli indicatori “furti per mille abitanti”
e “furti per mille abitazioni” (Tavola 4).
Interessante sarebbe analizzare la relazione con altri indicatori sociali o con altri elementi
infrastrutturali, ad esempio la distribuzione della rete stradale. Per gli scopi di questo lavoro
tali fattori non sono stati presi in considerazione, potrebbero essere oggetto di un futuro
approfondimento.
8
Figura 2 La distribuzione territoriale dei furti in appartamento geocodificati
Figura 3 La distribuzione dei punti-evento nei nove quartieri
1- Borgo Panigale
2- Navile
3- Porto
4- Reno
5 –San Donato
6- Santo Stefano
7- san Vitale
8- Saragozza
9- Savena
9
43
70
144
75
36
156
160
142
101
Figura 4 La distribuzione dei punti-evento nelle diciotto zone statistiche
Tavola 4 Furti in appartamento 2006 per Zone Statistiche
Valori assoluti
Codice area
sub-comunale
Denominazion
e delle zone
statistiche
Popolazione
Abitazioni
N. di furti in
residente
occupate in
appartamento
2001 (a)
totale 2001 (b) (geocodificati)
Furti per
1.000 abitanti
Furti per
1.000
abitazioni
A
Barca
20.423
9.324
52
2,5
5,6
B
Bolognina
31.736
16.082
44
1,4
2,7
23.924
10.728
43
1,8
4,0
C
Borgo
Panigale
D
Colli
E
Corticella
F
Costa
Saragozza
8.107
3.437
21
2,6
6,1
17.278
7.598
17
1,0
2,2
23.774
12.071
75
3,2
6,2
G
Galv ani
12.867
7.055
68
5,3
9,6
H
Irnerio
13.576
8.058
101
7,4
12,5
I
Lame
13.854
6.115
9
0,6
1,5
L
Malpighi
11.861
6.642
67
5,6
10,1
M
Marconi
13.932
7.627
77
5,5
10,1
N
Mazzini
38.440
17.828
62
1,6
3,5
O
Murri
28.327
14.208
67
2,4
4,7
P
Saffi
17.941
9.067
67
3,7
7,4
Q
San Donato
30.748
14.785
36
1,2
2,4
R
San Ruffillo
21.500
9.964
39
1,8
3,9
S
Santa Viola
11.519
5.710
23
2,0
4,0
T
San Vitale
31.397
15.788
59
1,9
3,7
371.204
182.087
927
2,5
5,1
TOTALE
10
Figura 5 I furti in appartamento per zona statistica – rappresentazione tematica
9 – 21
26 – 38
44 – 58
63 – 76
101
9
CONCLUSIONI
L’uso congiunto di metodi e tecniche afferenti a diversi campi applicativi conferisce valore
aggiunto all’informazione statistica, che si arricchisce così della sua componente geograficoterritoriale.
Inoltre il territorio stesso è visto in maniera dinamica, essendo i sistemi di zonizzazione
flessibili e deducibili l’uno dall’altro, a seconda del livello di finitezza dell’analisi che si ha
intenzione di condurre.
Importante è riuscire a riferire le informazioni statistiche al territorio con un livello di
precisione molto alto, come può esserlo quello di un indirizzo geocodificato. In questo senso
si coglie l’importanza del progetto che sta conducendo l’Istat di creazione e gestione di un
archivio nazionale di numeri civici georeferenziati.
11
ABSTRACT
When collected data may be linked exactly to a geographic point, then it’s possible to carry
out easily micro-territorial analysis. Geographic data must be available in a GIS that handles
togheter alphanumerical and cartographic data.
Different layers can be obtained starting from a basisc one so that representation itself may be
done on different levels.
Another technique applied in this paper is generally known as “address matching”, a method
that allows addresses geocoding.
Starting from data collected with reference to the address in which the events happen, the
applied methods allow to link microdata to small areas (the italian “census areas”) so that
analysis may be referred to whatever geographical layer coming out of the first.
In this paper we deal with data collected for the main big cities of Italy. Data refer to
burglaries that happen in apartments. Addresses of these apartments are known. Applying the
techniques above described, we are able to geo-code the collected data, in order to refer them
definitively to micro-zones. At end, analysis may be drawn with respect to any designed intracommunal areas.
Bibliografia
Falorsi P. D. e altri (2005) Principi guida per il miglioramento della qualità dei dati
toponomastici nella Pubblica Amministrazione, Istat, “Contributi” n. 12,
http://www.istat.it/dati/pubbsci/contributi
Vari (2000) Manuale tecnico-utente del Sistema di normalizzazione e Geocodifica Sis.Te.R.,
Seat Pagine gialle, Documento tecnico
Autori vari (1999) Le basi territoriali per i censimenti: il progetto Census 2000, Istat,
Documenti interni di progetto
Poletti A. (a cura di) (1999) GIS metodi e strumenti per un nuovo governo della città e del
territorio, Maggioli Editore, Rimini
12