Integrazione delle fonti e utilizzo statistico degli archivi

Integrazione delle fonti e utilizzo statistico
degli archivi amministrativi nei comuni per
la conoscenza del territorio e il supporto
alle decisioni pubbliche:
archivi gestionali, basi dati di interesse nazionale, big data
URBES, ARCHIMEDE, Censimento permanente
I Comuni verso l’uso statistico degli archivi amministrativi
e dei sistemi di integrazione delle fonti
Napoli - 28 ottobre 2015
Marco Palamenghi
Comune di Brescia
Unità di staff Statistica
La buona statistica migliora la vita
Produrre statistiche e indicatori affidabili e
tempestivi a supporto dei processi di policy per
uno sviluppo sostenibile.
Innovare metodi, fonti e integrazione dei dati, per
una statistica più adeguata alle esigenze degli
utenti finali, accompagnata dalla riduzione dei
costi e del disturbo statistico
La funzione statistica
LA FUNZIONE STATISTICA COMUNALE
La statistica per conoscere e per deliberare
Supporto informativo-statistico ai decisori





Raccolta dati: reperimento e integrazione dei dati statistici esistenti, e
raccolta dati
Elaborazione dei dati amministrativi gestionali della propria
amministrazione
Reportistica (studi e ricerche)
elaborazione di dati amministrativi, provenienti da altre fonti organizzate
pubbliche e private appartenenti anche a soggetti non Sistan
realizzazione di rilevazioni sul campo
Promozione e diffusione della cultura statistica (sembra più
compito Istat)
Supporto per l’attuazione delle leggi di riforma della P.A.

controllo di gestione, costi standard, ecc.
La statistica comunale
LE TRE ANIME DELLA STATISTICA LOCALE

Ufficio dell’amministrazione: Soggetto attivo per conto dell'Ente
di appartenenza

Ufficio Sistan: Soggetto attivo/passivo in ambito SISTAN

Ufficio Istat: Soggetto passivo per conto dell'ISTAT
Le nuove tecnologie, lo sfruttamento massivo degli archivi
amministrativi nazionali e locali e i big data porteranno ad
un superamento di questo quadro
E’ prevedibile un sempre minor coinvolgimento dei Comuni
nella rilevazione dei dati, ma maggiore nello sfruttamento,
analisi e diffusioni dei dati a livello comunale e
subcomunale.
I principi della statistica pubblica
I principi, della statistica e del
trattamento dei dati individuali di
basi di dati amministrative
(e non solo)
etici
(rapporto mezzi/fini, protezione dei dati personali, imparzialità
obiettività, inattaccabilità metodologica)
•
giuridici (conoscere per deliberare e per controllare)
•economici (efficacia, efficienza ed economicità)
•
Le fonti di dati
Perché utilizzare le fonti amministrative

la PA definisce i propri criteri di intervento
sulla base di dati amministrativi (ad
esempio tasse tariffe ecc.)

La popolazione di riferimento (domanda
potenziale) è spesso quella residente

Costi ridotti

Disturbo statistico assente

Continuità nel tempo

Dettaglio territoriale

Dettaglio sulle unità di rilevazione
Le fonti di dati
Le fonti amministrative comunali
 Anagrafe della popolazione residente
 Archivi e Sistemi informativi gestionali
Le basi di dati di interesse nazionale
 Archivi statistici ISTAT
 Archivi statistici e gestionali SISTAN
I Big Data
Gli Archivi di dati
•
L'organizzazione dei dati



•
dal Modello Sequenziale
al Modello Relazionale
al Data warehouse
La gestione dei dati



dai Sistemi Informatici (trattamento di basi di dati)
ai Sistemi Informativi (integrazione di basi di dati)
alla Progettazione concettuale e al Modello EntitàRelazione per dati disaggregati
Fonti Amministrative
Natura degli archivi
Pregi



Dinamicità degli archivi
Aggiornamento
“automatico”
Organizzazione dei dati
Difetti




Immagini amministrative
dei fenomeni (pratiche e
non eventi)
Analisi delle fonti
giuridiche
Non sono implementate
per finalità statistiche
La popolazione di
riferimento non è quella
che incide effettivamente
sul territorio
Fonti Amministrative
Implementazione
Pregi


Immediata disponibilità dei dati
Costi molto bassi
Difetti




Progettazione e
implementazione da parte di
soggetti diversi e in tempi e
con metodologie diverse
Visione parziale e non unitaria
dei sistemi informativi
Scarsa attenzione alla
correlazione delle basi di dati
Viscosità dei sistemi informativi
Fonti Amministrative
Gestione
Pregi


Analiticità dei dati
Qualità elevata per le
informazioni certificate
Difetti



Completezza
Qualità variabile delle
informazioni
Coerenza -> normalizzazione
Fonti Amministrative
Organizzazione dei dati





Soggetto (chiave –-> CF)
Data dell’evento
Evento
Attributi dell’evento
Data di registrazione
Schema “biografico”
Fonti Amministrative
Ricadute organizzative
Impostazione a tavolino dell’indagine


Il quadro di riferimento
L’impianto metodologico
Le fonti dei dati

Individuazione delle fonti

Qualità delle fonti
Recupero dei dati

Parcellizzazione del lavoro

Standardizzazione dei dati

Qualità dei dati
Fonti Amministrative
Profili di privacy
Finalità istituzionali


accesso a tutte le fonti interne
accesso alle fonti a cui il Comune accede per
le finalità istituzionali
Tipi di dati utilizzati (comuni/sensibili)
Garanzie per gli interessati
Misure di sicurezza
Modalità del trattamento: Codice della
privacy e Codice deontologico
La statistica per deliberare
Progetti

Basi di dati Comunali
(Anagrafe, Servizi Sociali, Tributi,
ecc.)


Basi di dati ISTAT (Censimenti, ASIA, Incidenti stradali, ecc.)
Basi di dati SISTAN (Agenzia delle Dogane e dei Monopoli,
Banca data OMI, Agenzia delle Entrate, Ragioneria dello Stato,
Motorizzazione Civile-PRA)

Altre fonti
(dati di telefonia mobile)
Basi dati comunali
L'Anagrafe della popolazione
residente
Chiave di volta dei sistemi informativi comunali

il codice fiscale: chiave univoca di linkage
La matrice di contabilità: dalle storie individuali ai
comportamenti collettivi

Stock (popolazione al 31 dicembre)

Eventi (ingresso e uscita dall'Anagrafe)
L'integrazione con altre basi di dati comunali:

Il modello persona-famiglia-abitazione-automobile

Il modello persona-famiglia-tributi-servizi
Basi dati ISTAT
ASIA – Archivio Statistico Imprese
Attive (Unità Locali)
Il codice fiscale: chiave univoca di linkage con gli archivi
amministrativi comunali
Esaustiva anche se con alcune criticità
Poche informazioni
Grossi problemi di normalizzazione

difficoltà a ricostruire gli elementi per la geocodifica

difficoltà a ricostruire gli elementi per la
georeferenziazione
Basi dati ISTAT
ASIA – Geocodifica u. l. commercio – Brescia Città
Basi dati ISTAT
ASIA – Geocodifica u.l. commercio Centro Storico
Basi dati SISTAN
Agenzia delle Dogane e dei Monopoli
Il codice fiscale: chiave univoca di linkage con gli archivi
amministrativi comunali
Grossa difficoltà al recupero dei dati

Scarico manuale dal sito

Variabile di interesse locale distribuite in due archivi
distinti

Considerevole
lavoro
di
standardizzazione
e
normalizzazione per recuperare le variabili di interesse e
linkarle con gli archivi comunali
Basi dati SISTAN
Basi dati SISTAN
PRA – Pubblico Registro
Automobilistico
Il codice fiscale: chiave univoca di linkage con gli archivi
amministrativi comunali
Disponibilità dei dati a pagamento
(diversi anni fa)
Problemi di normalizzazione degli indirizzi per l'estrazione
dei dati di aree subcomunali
Problemi di geocodifica e georeferenziazione
Elevata qualità dei dati
Basi dati SISTAN
Big Data Telefonici per le
Analisi di Eventi
Obiettivo: Analizzare i dati statistici del traffico di telefonia
mobile per valutare l’impatto di (grandi) eventi promossi in
Città, integrandoli con dati provenienti da indagini statistiche
classiche (questionario)
Elaborazioni sperimentali dei dati (individuali e anonimi) delle
reti di monitoraggio del traffico mobile
Disponibili per tutta la Provincia a intervalli regolari di 15 minuti da
Maggio 2014 ad Aprile 2016
Numero di SIM agganciate alle rete di monitoraggio del traffico
mobile (compreso il roaming)
I dati di cella (antenna) vengono imputati (con un algoritmo
proprietario) ai pixel di una griglia regolare di 150m di lato (circa
17.000 pixel per Brescia)
Ogni utente viene assegnato all’ultima cella utilizzata al termine
dell’intervallo di 15 minuti
Big Data Telefonici per le
Analisi di Eventi
Brescia, 26 maggio 2013 ore 17:00
Big Data Telefonici per le
Analisi di Eventi
MEGAPIXEL CENTRO DI BRESCIA
Big Data Telefonici
Mille Miglia e Giro d’Italia 2013
MEGAPIXEL CENTRO DI BRESCIA
Big Data Telefonici
Mille Miglia e Giro d’Italia 2013
MEGAPIXEL CENTRO DI BRESCIA
Big Data Telefonici
Notte Bianca 2014
Profilo di densità SIM nel Centro di Brescia differenza
percentuale tra la media dei primi due weekend di maggio
2014 e weekend della Notte Bianca (dati in percentuale)
MEGAPIXEL CENTRO DI BRESCIA
Big Data Telefonici
Mille Miglia 2015 Profilazione presenze di stranieri
MEGAPIXEL CENTRO DI BRESCIA
BIG DATA & ANALYTICS
Social Media Analysis
Miglia 2015 – Il «sentiment» del pubblico