XXVIII CONFERENZA ITALIANA DI SCIENZE REGIONALI METODI E STRUMENTI PER L’ANALISI SOCIO-ECONOMICA MICROTERRITORIALE Orietta GARGANO e Sandro CRUCIANI Istituto Nazionale di Statistica, via Adolfo Ravà 150, 00142, Roma SOMMARIO Il poter associare ad un dato rilevato la sua collocazione fisica sul territorio permette di condurre analisi a riferimento micro-territoriale. Altra condizione necessaria, ai fini dell’efficienza dell’analisi, è poter disporre di una rappresentazione cartografica di unità territoriali minime alle quali associare i dati georiferiti. Caratteristica che dà valore aggiunto alla suddivisione del territorio in micro-aree è la disponibilità di griglie territoriali di livello gerarchico superiore, deducibili per unione dalla suddivisione minima di base, in modo che l’analisi possa essere condotta a diversi livelli di aggregazione a partire dal primo. Nel presente lavoro sono descritte le tecniche di georeferenziazione dei dati e i metodi per la loro associazione ad aree micro-territoriali, che possono essere aggregate a livelli gerarchicamente superiori. Le zone micro-territoriali utilizzate sono le sezioni di censimento, aree disegnate dall’Istat in accordo con i comuni in maniera funzionale per le fasi di raccolta e di diffusione dei dati censuari. Il sistema di geocodifica adottato è il Sistema territoriale per il riconoscimento e la normalizzazione di indirizzi (Sis.Te.R.), che permette di associare ad un indirizzo la sezione di censimento in cui questo ricade e la coppia di coordinate geografiche del centroide della sezione. 1 1 INTRODUZIONE Un sistema informativo geografico rappresenta l’ambiente ideale per l’analisi dei dati socioeconomici sui quali misurare indicatori di potenziale territoriale. Inoltre offre la possibilità di condividere con immediatezza risultati che godono della caratteristica della visibilità. Il valore aggiunto della proposta contenuta in questo lavoro risiede nello sperimentare la mappatura degli eventi a livello microterritoriale, sfruttando la sinergia di metodologie e tecniche afferenti a diversi campi applicativi. L’ambiente tecnologico di contesto consente di puntare su un metodo che permette di analizzare e rappresentare i dati in modo diretto sul territorio. L’applicazione implementata utilizza il supporto geografico come metodologia di base per la definizione degli ambiti territoriali su cui condurre l’analisi e un sistema di geocodifica per il riferimento dei dati al territorio. La possibilità di analizzare i dati a livello microterritoriale ricalca le tecniche utilizzate nelle analisi di mercato. Il dato deve poter essere riferito al territorio in modo puntuale, o perché se ne conosce la collocazione geografica esatta o perché si conosce il suo riferimento ad un elemento che a sua volta si colloca puntualmente sul territorio, come può esserlo un indirizzo. L’indirizzo a sua volta deve poter essere geocodificato, ciò significa che, oltre alla descrizione dei dati di tipo toponomastico che lo caratterizzano, ne è noto il riferimento territoriale. L’associazione al territorio può essere espressa tramite una coppia di coordinate geografiche, che ne permettono la sua rappresentazione puntuale su idonea cartografia espressa nello stesso sistema di coordinate, oppure tramite un codice di micro-area. 2 LA GEOGRAFIA Il territorio dei comuni è suddiviso in maniera esaustiva in aree minime di base, disegnate in occasione dei censimenti generali secondo regole poste dall’Istat: le sezioni di censimento. Inoltre alcune amministrazioni comunali prevedono suddivisioni sub-comunali di livello superiore, ottenute dall’unione di intere sezioni di censimento: le aree sub-comunali di valenza amministrativa o funzionale. Tutti i dati cartografici vettoriali sono gestiti dall’Istat all’interno di un GIS che garantisce l’integrazione dei dati e il facile passaggio da un livello territoriale all’altro. Un ulteriore elemento che caratterizza le sezioni di censimento è l’itinerario della sezione, ovvero l’insieme degli indirizzi che ricadono in quella sezione. L’itinerario di sezione di censimento è l’oggetto che mette in relazione la geografia con l’altro strumento di analisi utilizzato, il sistema territoriale di geocodifica. 2 3 IL SISTEMA DI NORMALIZZAZIONE E GEOCODIFICA Il sistema utilizzato per il trattamento degli indirizzi integra i dati geo-territoriali e i dati toponomastici a livello di disegno logico. Così applicando le funzioni principali di tale sistema, che sono: il riconoscimento dell’indirizzo, la trasposizione in forma normalizzata dello stesso e la successiva geocodifica, quando un indirizzo viene riconosciuto come presente nell’archivio del sistema a questo vengono associati i dati territoriali con cui è valorizzato nell’archivio master di riferimento. Convenzionalmente si dice che l’indirizzo viene geocodificato. Di fatto, con questa tecnica vengono associati agli indirizzi riconosciuti, ove il riconoscimento si intende esteso fino al numero civico, il codice della sezione di censimento (il codice di una micro-area) ed una coppia di coordinate metriche x, y del centroide della sezione stessa (un punto geografico). 4 APPLICAZIONE Oggetto dell’analisi del presente lavoro sono gli eventi “furti in appartamento” occorsi e rilevati dal Ministero dell’Interno nell’anno 2006 nelle principali città italiane (comuni con oltre 250.000 abitanti). Per queste città l’Istat gestisce, in accordo con ciascuna, un’articolazione territoriale in aree sub-comunali di tipo amministrativo o funzionale (quartieri, circoscrizioni, municipi, ecc.). Le città trattate sono le prime dodici in ordine decrescente per dimensione demografica: Roma, Milano, Napoli, Torino, Palermo, Genova, Bologna, Firenze, Bari, Catania, Venezia, Verona. L’informazione che deve essere necessariamente associata all’evento osservato è l’indirizzo dell’appartamento in cui il furto si è verificato. Sulla base di questa informazione, e applicando lo strumento software che effettua la geocodifica, l’evento può essere riferito al territorio con una precisione corrispondente in modo inversamente proporzionale alla dimensione della sezione di censimento in cui ricade l’indirizzo: minore è l’estensione territoriale della sezione, maggiore è l’accuratezza del riferimento territoriale del dato. In ogni caso l’esito positivo della geocodifica colloca l’indirizzo sul territorio: a partire da questo stadio del processo di analisi la distribuzione dei dati osservati può essere riferita a differenti suddivisioni areali. 5 OBIETTIVO Scopo dello studio è stato analizzare la distribuzione sul territorio degli eventi osservati, con riferimento alle suddivisioni sub-comunali di tipo amministrativo e/o funzionale disegnate dalle singole amministrazioni comunali. 3 6 IL PROCESSO L’applicativo di riconoscimento dell’indirizzo e geocodifica è stato applicato con riferimento alle sezioni di censimento 2001 per i comuni per i quali è stato effettuato l’aggiornamento nel database master. Tutti gli altri comuni sono stati processati con riferimento alle sezioni del 1991. Questo ha richiesto una procedura diversa per la fase di classificazione degli eventi nelle aree sub-comunali. In particolare sono risultate strategiche funzioni derivate dal GIS per attribuire ai punti individuati sulla cartografia la classificazione in un sistema di aree qualsiasi, purché sovrapponibili alla copertura puntuale degli eventi. 6.1 La normalizzazione Gli indirizzi relativi ai “furti in appartamento” sono stati geocodificati con riferimento alle sezioni di censimento 2001 oppure del 1991, a seconda della disponibilità nel sistema. Gli eventi, alla fine del processo di riconoscimento e geocodifica, sono risultati suddivisi in due file, il primo contenente gli eventi-indirizzi riconosciuti e “normalizzati” e il secondo gli eventi-indirizzi non riconosciuti. A sua volta, nel primo file solo ad un sottoinsieme di eventi sono stati assegnati i codici e i dati territoriali, poiché anche la funzione di geocodifica può dare esito negativo. Questo accade quando il numero civico dell’indirizzo di input non è presente nell’archivio di riferimento o non ne è noto il codice di micro-area. Nel caso trattato, il motivo più frequente della non geocodifica si è rivelata la mancanza del numero civico nell’indirizzo processato. 6.2 Valutazioni sui risultati di riconoscimento e geocodifica Il processo di normalizzazione applicato ai dati disponibili per i dodici comuni (Tavola 1) ha dato come risultato percentuali di riconoscimento che vanno dal 59,8% (Venezia) al 93,1% (Torino). Un lavoro accurato dovrebbe prevedere l’analisi degli indirizzi scartati per: 1. capire quali sono definitivamente da scartare perché del tutto privi di validità, non avendo nessun riferimento di tipo toponomastico (ad esempio “HOTEL”, “C/O LA MIA ABITAZIONE”, ecc.); 2. decidere quali possono essere facilmente corretti perché è possibile interpretare il toponimo esatto, che può essere digitato prima di iterare il processo di normalizzazione; 3. cercare comunque nell’archivio del comune candidati più probabili con cui correggere gli indirizzi scartati; 4 individuare quelli che non sono effettivamente presenti nell’archivio di riferimento 4. del comune. Tavola 1 - Risultati del processo di normalizzazione e geocodifica – Riepilogo generale Codice Istat del Comune Valori assoluti Comune Disponibili Normalizzati Scartati Valori percentuali Geo-codificati Non geocodificati Disponibili Normalizzati Scartati Geo-codificati Non geocodificati 1272 Torino 3.558 3.313 245 2.299 1.014 100,0 93,1 6,9 64,6 28,5 10025 Genov a 1.270 1.137 133 553 584 100,0 89,5 10,5 43,5 46,0 15146 Milano 4.351 3.953 398 2.781 1.172 100,0 90,9 9,1 63,9 26,9 23091 Verona 598 459 139 280 179 100,0 76,8 23,2 46,8 29,9 27042 Venezia 665 398 267 284 114 100,0 59,8 40,2 42,7 17,1 37006 Bologna 1.960 1.717 243 915 802 100,0 87,6 12,4 46,7 40,9 48017 Firenze 853 733 120 385 348 100,0 85,9 14,1 45,1 40,8 58091 Roma 6.548 5.833 715 3.278 2.555 100,0 89,1 10,9 50,1 39,0 63049 Napoli 915 751 164 442 309 100,0 82,1 17,9 48,3 33,8 72006 Bari 1.116 801 315 563 238 100,0 71,8 28,2 50,4 21,3 82053 Palermo 804 700 104 512 188 100,0 87,1 12,9 63,7 23,4 87015 Catania 529 472 57 293 179 100,0 89,2 10,8 55,4 33,8 23.167 20.267 2.900 12.585 7.682 100,0 87,5 12,5 54,3 33,2 TOTALE Fonte: Elaborazioni Istat su dati Ministero dell'Interno Tavola 2 Riepilogo degli indirizzi scartati per motivo degli scarti Valori assoluti Comune Via o CAP Indirizzo Indirizzo non non trov ato ambiguo trov ato Valori percentuali Termini della Via Via assente Totale indirizzi Via o CAP scartati insufficienti non trov ato Indirizzo Indirizzo non ambiguo trov ato Termini della Via Via assente insufficienti Totale indirizzi scartati Torino 3 11 193 1 37 245 1,2 4,5 78,8 0,4 15,1 100,0 Genova 0 18 94 0 21 133 0,0 13,5 70,7 0,0 15,8 100,0 Milano 3 42 280 0 73 398 0,8 10,6 70,4 0,0 18,3 100,0 Verona 0 1 35 0 103 139 0,0 0,7 25,2 0,0 74,1 100,0 Venezia 4 4 246 0 13 267 1,5 1,5 92,1 0,0 4,9 100,0 Bologna 0 4 68 0 171 243 0,0 1,6 28,0 0,0 70,4 100,0 Firenze 0 8 83 2 27 120 0,0 6,7 69,2 1,7 22,5 100,0 Roma 2 57 477 23 186 745 0,3 7,7 64,0 3,1 25,0 100,0 Napoli 1 11 125 0 27 164 0,6 6,7 76,2 0,0 16,5 100,0 Bari 3 18 212 0 82 315 1,0 5,7 67,3 0,0 26,0 100,0 Palermo 0 6 80 0 18 104 0,0 5,8 76,9 0,0 17,3 100,0 Catania 0 6 46 0 5 57 0,0 10,5 80,7 0,0 8,8 100,0 TOTALE 16 186 1.939 26 763 2.930 0,5 6,3 66,2 0,9 26,0 100,0 Fonte: Elaborazioni Istat su dati Ministero dell'Interno Lo step di riciclo sui dati scartati richiede un lavoro manuale di ricerca e correzione sui singoli indirizzi, al fine di incrementare la percentuale di indirizzi riconosciuti e normalizzati; 5 tale attività richiede tempo e impiego di risorse che tuttavia non sono state impegnati in questo lavoro sperimentale. Il processo di geocodifica ha restituito a sua volta un alto numero di indirizzi a cui non è stato possibile assegnare il codice di sezione di censimento; come risulta sempre dalla Tavola 1, le percentuali vanno dal 17,1% (Venezia) al 46,0% (Genova). Osservando i motivi della non geocodifica (Tavola 3), il motivo in assoluto più frequente è la mancanza nell’indirizzo in input del numero civico, a fronte di una strada multisezione: in questo caso il sistema non riesce ad effettuare una assegnazione univoca, e in output non viene valorizzato il codice della sezione. Tavola 3 Riepilogo degli indirizzi non geocodificati per motivo della mancata geocodifca Valori assoluti Codice Istat del Comune Comune Valori percentuali Totale indirizzi Cod. 250 Cod. 251 Cod. 252 Cod. 255 non geo- Totale indirizzi Cod. 250 Cod. 251 Cod. 252 Cod. 252 codificati non geocodificati 1272 Torino 15 999 1.014 0,0 1,5 98,5 0,0 100,0 10025 Genov a 375 209 584 0,0 64,2 35,8 0,0 100,0 15146 Milano 58 1.111 1.172 0,0 4,9 94,8 0,3 100,0 23091 Verona 3 176 179 0,0 1,7 98,3 0,0 100,0 27042 Venezia 49 63 114 0,0 43,0 55,3 1,8 100,0 37006 Bologna 37 765 802 0,0 4,6 95,4 0,0 100,0 48017 Firenze 33 315 348 0,0 9,5 90,5 0,0 100,0 58091 Roma 60 2.410 31 2.555 2,1 2,3 94,3 1,2 100,0 63049 Napoli 40 265 4 309 0,0 12,9 85,8 1,3 100,0 72006 Bari 51 182 5 238 0,0 21,4 76,5 2,1 100,0 82053 Palermo 13 175 188 0,0 6,9 93,1 0,0 100,0 87015 Catania 22 154 3 179 0,0 12,3 86,0 1,7 100,0 756 6.824 48 7.682 0,7 9,8 88,8 0,6 100,0 TOTALE 54 54 3 2 Fonte: Elaborazioni Istat su dati Ministero dell'Interno Legenda: Cod. 250 Dati microzona non attribuibili Cod. 251 Via priva di microzona Cod. 252 Civico assente - Via multi microzona Cod. 255 Microzona con civico zero 6.3 Comuni geocodificati al 2001 Per i comuni geocodificati al 2001, i codici di sezione di censimento restituiti con il processo di normalizzazione e geocodifica sono allineati con la base territoriale1 del comune in oggetto, quindi può essere agevolmente applicata anche una procedura di tipo alfanumerico per Con la locuzione “basi territoriali” si intende la suddivisione del territorio di un comune in sezioni di censimento 1 6 associare i dati alla base cartografica su cui effettuare la rappresentazione e per calcolare gli indicatori sugli strati territoriali di livello gerarchico superiore adottati, avendo preventivamente classificato le sezioni rispetto a queste zone. La procedura suddetta è possibile perché l’associazione (link) viene effettuata sul codice della sezione di censimento Gli eventi devono dapprima essere raggruppati per sezione; successivamente possono essere relazionati alle sezioni classificate per area sub-comunale per ottenere infine il numero dei furti per area sub-comunale. 6.4 Comuni geocodificati al 1991 Per i comuni per i quali vengono utilizzati gli itinerari di sezione di censimento del 1991 i codici delle sezioni di censimento restituiti dal processo di geocodifica sono relativi alle basi territoriali del 1991. Per tale motivo non può essere condotta l’operazione di classificazione adottata nel primo caso, ma si deve ricorrere all’ausilio della geometria. Il processo di classificazione dei punti-evento nelle aree sub-comunali è stato condotto sfruttando le relazioni topologiche tra gli oggetti gestite dal GIS. I punti sulla cartografia valorizzati con il processo di geocodifica, che corrispondono ai centroidi delle sezioni 1991, “pesati” con il numero di eventi che vi ricadono, sono stati rappresentati sulla griglia delle aree sub-comunali aggiornate dopo i censimenti del 2001. E’ stato quindi applicato un procedimento di overlay spaziale che ha permesso di associare ai punti-evento il codice di area sub-comunale nel quale ricadono. Solo a questo punto è stato possibile derivare la distribuzione dei furti osservati per area sub-comunale. I risultati ottenuti sono del tutto equivalenti a quelli ottenuti per i comuni del primo gruppo, per i quali la geocodifica era allineata alle basi territoriali. 7 RISULTATI Una volta classificate le osservazioni nelle aree sub-comunali, sono stati calcolati dei semplici indicatori relativamente a questi sistemi di zone. Per tutte le dodici città sui sistemi di zonizzazione adottati sono stati calcolati i furti in appartamento per mille abitanti e per mille abitazioni. Gli stessi dati sono stati rappresentati anche su carte tematiche. 8 UN ESEMPIO: IL COMUNE DI BOLOGNA Le elaborazioni effettuate vengono esemplificate rappresentando i risultati ottenuti per il comune di Bologna. Per questo comune in particolare il processo è stato condotto con riferimento ad entrambe le geocodifiche possibili, al fine di misurare la validità dell’ipotesi di 7 base. I due riferimenti temporali hanno restituito un numero diverso di indirizzi geocodificati, rispettivamente 915 al 1991 e 927 al 2001, risultato peraltro atteso in virtù dell’aggiornamento temporale effettuato. Figura 1 La griglia delle sezioni di censimento 2001 I dati geocodificati possono essere riferiti ad entrambe le tipologie di aree sub-comunali definite sul comune: i nove quartieri e le diciotto zone statistiche. Vengono tuttavia scelte le seconde, poiché permettono una maggiore disaggregazione del dato. La zona statistica dove occorrono più furti è la “H - Irnerio” posizionata nel centro della città e circondata da altre zone con alta intensità del fenomeno (Figura 5 e Tavola 4). Quella dove in assoluto se ne verificano meno è la “I – Lame” piuttosto periferica ma con insediamenti abitativi tuttavia non al di sotto della media. La collocazione agli estremi opposti della distribuzione di queste due zone è confermata anche dagli indicatori “furti per mille abitanti” e “furti per mille abitazioni” (Tavola 4). Interessante sarebbe analizzare la relazione con altri indicatori sociali o con altri elementi infrastrutturali, ad esempio la distribuzione della rete stradale. Per gli scopi di questo lavoro tali fattori non sono stati presi in considerazione, potrebbero essere oggetto di un futuro approfondimento. 8 Figura 2 La distribuzione territoriale dei furti in appartamento geocodificati Figura 3 La distribuzione dei punti-evento nei nove quartieri 1- Borgo Panigale 2- Navile 3- Porto 4- Reno 5 –San Donato 6- Santo Stefano 7- san Vitale 8- Saragozza 9- Savena 9 43 70 144 75 36 156 160 142 101 Figura 4 La distribuzione dei punti-evento nelle diciotto zone statistiche Tavola 4 Furti in appartamento 2006 per Zone Statistiche Valori assoluti Codice area sub-comunale Denominazion e delle zone statistiche Popolazione Abitazioni N. di furti in residente occupate in appartamento 2001 (a) totale 2001 (b) (geocodificati) Furti per 1.000 abitanti Furti per 1.000 abitazioni A Barca 20.423 9.324 52 2,5 5,6 B Bolognina 31.736 16.082 44 1,4 2,7 23.924 10.728 43 1,8 4,0 C Borgo Panigale D Colli E Corticella F Costa Saragozza 8.107 3.437 21 2,6 6,1 17.278 7.598 17 1,0 2,2 23.774 12.071 75 3,2 6,2 G Galv ani 12.867 7.055 68 5,3 9,6 H Irnerio 13.576 8.058 101 7,4 12,5 I Lame 13.854 6.115 9 0,6 1,5 L Malpighi 11.861 6.642 67 5,6 10,1 M Marconi 13.932 7.627 77 5,5 10,1 N Mazzini 38.440 17.828 62 1,6 3,5 O Murri 28.327 14.208 67 2,4 4,7 P Saffi 17.941 9.067 67 3,7 7,4 Q San Donato 30.748 14.785 36 1,2 2,4 R San Ruffillo 21.500 9.964 39 1,8 3,9 S Santa Viola 11.519 5.710 23 2,0 4,0 T San Vitale 31.397 15.788 59 1,9 3,7 371.204 182.087 927 2,5 5,1 TOTALE 10 Figura 5 I furti in appartamento per zona statistica – rappresentazione tematica 9 – 21 26 – 38 44 – 58 63 – 76 101 9 CONCLUSIONI L’uso congiunto di metodi e tecniche afferenti a diversi campi applicativi conferisce valore aggiunto all’informazione statistica, che si arricchisce così della sua componente geograficoterritoriale. Inoltre il territorio stesso è visto in maniera dinamica, essendo i sistemi di zonizzazione flessibili e deducibili l’uno dall’altro, a seconda del livello di finitezza dell’analisi che si ha intenzione di condurre. Importante è riuscire a riferire le informazioni statistiche al territorio con un livello di precisione molto alto, come può esserlo quello di un indirizzo geocodificato. In questo senso si coglie l’importanza del progetto che sta conducendo l’Istat di creazione e gestione di un archivio nazionale di numeri civici georeferenziati. 11 ABSTRACT When collected data may be linked exactly to a geographic point, then it’s possible to carry out easily micro-territorial analysis. Geographic data must be available in a GIS that handles togheter alphanumerical and cartographic data. Different layers can be obtained starting from a basisc one so that representation itself may be done on different levels. Another technique applied in this paper is generally known as “address matching”, a method that allows addresses geocoding. Starting from data collected with reference to the address in which the events happen, the applied methods allow to link microdata to small areas (the italian “census areas”) so that analysis may be referred to whatever geographical layer coming out of the first. In this paper we deal with data collected for the main big cities of Italy. Data refer to burglaries that happen in apartments. Addresses of these apartments are known. Applying the techniques above described, we are able to geo-code the collected data, in order to refer them definitively to micro-zones. At end, analysis may be drawn with respect to any designed intracommunal areas. Bibliografia Falorsi P. D. e altri (2005) Principi guida per il miglioramento della qualità dei dati toponomastici nella Pubblica Amministrazione, Istat, “Contributi” n. 12, http://www.istat.it/dati/pubbsci/contributi Vari (2000) Manuale tecnico-utente del Sistema di normalizzazione e Geocodifica Sis.Te.R., Seat Pagine gialle, Documento tecnico Autori vari (1999) Le basi territoriali per i censimenti: il progetto Census 2000, Istat, Documenti interni di progetto Poletti A. (a cura di) (1999) GIS metodi e strumenti per un nuovo governo della città e del territorio, Maggioli Editore, Rimini 12