ROMA 23 GIUGNO 2016
COMPORTAMENTI INDIVIDUALI
E RELAZIONI SOCIALI
IN TRASFORMAZIONE
UNA SFIDA PER LA
STATISTICA UFFICIALE
AREA TEMATICA 4. NUOVE FONTI E DOMANDE
L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy
NUOVE FONTI E DOMANDE
23 GIUGNO 2016
00.00 | 00.00
L’integrazione di basi di dati per la statistica
pubblica: opportunità per la conoscenza e per
l’efficienza e garanzie per la privacy
G. Garofalo, M. R. Simeone| Istituto Nazionale di Statistica
ROMA 23 GIUGNO 2016
AREA TEMATICA 4. NUOVE FONTI E DOMANDE
L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy
50 anni dopo ……. Il SIM
SIM LUOGHI
INDIVIDUI
SIM LUOGHI
UNITA’
ECONOMICHE
SIM
INDIVIDUI
SIM UNITA’
ECONOMICHE
SIM
RELAZIONI
TRA
INDIVIDUI
SIM
RELAZIONI
INDIVIDUI
UNITA’
SIM RELAZIONI
TRA UNITA’
ECONOMICHE
Repository dei dati amministrativi e statistici integrati, organizzato con lo scopo di supportare i
processi di produzione statistica dell'Istat. Favorisce l’utilizzo di dati individuali, privi degli
identificativi diretti, mantenendo inalterate le potenzialità informative derivanti dal processo di
integrazione
2
ROMA 23 GIUGNO 2016
AREA TEMATICA 4. NUOVE FONTI E DOMANDE
L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy
Multiple
integrated data
collection
Da
Fonti Primarie
Indagini statistiche
…..a paradigm change in which statistical agencies design and update
their flagship programs by determining the best combination of data
sources and methods to serve user needs in a topic area of ongoing
importance. This multiple sources paradigm should apply to all
statistical programs, whether traditionally based on a survey,
administrative records, or another source (Costance Citro ,St. Canada)
a
………….
Indagini
statistiche
Fonti Secondarie
Fonti amministrative
Migl. Processi di produzione
Informazione ausiliaria nella
fase di controllo dei dati
Stima di singole variabili
BIG DATA
•
•
•
WEB Scraping
Scanner data
Call Details Record
Fonti
Ammin.
integrate
Informazioni
non
strutturate
3
ROMA 23 GIUGNO 2016
AREA TEMATICA 4. NUOVE FONTI E DOMANDE
L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy
La «conta» delle popolazioni
Uso dell’indagine censuaria (pop. Residente/pendolarismo):
• Costi
• Ritardi nella diffusione
• Comportamenti «anagrafici distorti» dei rispondenti
• Impossibilità di analisi longitudinali
Integrazione più fonti amministrative:
• Informazioni «amministrative distorte»
• Parzialità dell’informazione disponibile
• Difficoltà a stimare la «frequenza» dell’uso di un territorio
Call Detail Record:
• Incertezza della popolazione di riferimento
• Impossibilità nella «qualificazione»
• Impossibilità di stimare le incoerenze fra chi «possiede» e chi
«usa» il cellulare
4
ROMA 23 GIUGNO 2016
AREA TEMATICA 4. NUOVE FONTI E DOMANDE
L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy
Multiple integrated data collection
• Interviene sui processi produttivi e organizzativi
• Si inserisce in una fase di evoluzione culturale nell’uso delle statistiche
(Europa 2020, Beyond GDP,…)
• Determina la necessità, in atto ma ancora conclusa, di una profonda
revisione della metodologia statistica (in particolare nella
«interpretazione» e stima dell’errore)
• Permette una visione integrata di domini differenti e favorisce l’offerta di
nuove informazioni statistiche.
ROMA 23 GIUGNO 2016
AREA TEMATICA 4. NUOVE FONTI E DOMANDE
L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy
Cosa cambia nel processo produttivo statistico
Invesione delle fasi
Collassamento nelle fasi
Cosa cambia nel sistema organizzativo delle statistica pubblica
Specialized corporate-level services units : Approccio “per funzioni
centralizzate” a supporto di tutti i processi statistici e abbandono dei processi
a “silos” (per singoli domini stat.). Maggiore standardizzazione e
cooperazione.
6
ROMA 23 GIUGNO 2016
AREA TEMATICA 4. NUOVE FONTI E DOMANDE
L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy
Cosa cambia nell’approccio metodologico
Da un approccio da disegno
U
1
2
.
.
.
N
s
Sampling
1
2
.
.
n
Stima
Tˆ ( s )
๐‘€๐‘†๐ธ๐‘  (๐‘‡)
Valutazione errore
Ad un approccio da modello
๐น1
Realizzazione
๐‘“๐œƒ ( . )
U
๐น2
.
.
Stima
๐‘‡(๐น1 ,…, ๐น๐บ ; ๐‘“๐œƒ )
๐‘€๐‘†๐ธ๐‘“๐œƒ (๐‘‡)
๐น๐บ
7
ROMA 23 GIUGNO 2016
AREA TEMATICA 4. NUOVE FONTI E DOMANDE
L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy
Cosa cambia nella produzione statistica (pubblica!)
• Informazioni strutturate e complesse per intere popolazioni o sottopopolazioni
(relazioni familiari + redditi + lavoro + istruzione + mobilità + …..)
• Più informazioni, per domini territoriali limitati e con maggiore tempestività
• Integrazione informativa – in input – fra più domini
• Domanda vs. offerta
• Imprese vs. famiglie
• Redditi vs lavoro
• Sviluppo (finalmente!) delle analisi longitudinali e dei percorsi di vita (es.
istruzione/lavoro)
8
ROMA 23 GIUGNO 2016
AREA TEMATICA 4. NUOVE FONTI E DOMANDE
L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy
Multiple integrated data collection
• E’ un processo evolutivo…
• … ma non è un processo reversibile
• Non è un processo a costo zero !
• E’ un processo che presenta dei rischi
• «illusione informativa» / problema dei fiction data
• Moltiplicazione di rumori statistici non intercettati
• Garanzie per la privacy
ROMA 23 GIUGNO 2016
AREA TEMATICA 4. NUOVE FONTI E DOMANDE
L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy
Garanzie per la privacy: il contesto generale
L'ordinamento statistico (nazionale e europeo) promuove e favorisce l’utilizzo e l’integrazione di fonti
di dati alternative alle tradizionali rilevazioni statistiche, anche al fine di ridurre l'onere per i
rispondenti: si tratta di una scelta obbligata per tutti gli Istituti nazionali di statistica (cfr. Reg. UE
2015/759 del 29 aprile 2015).
e la specificità della statistica pubblica
recependo univoche indicazioni internazionali e comunitarie, il legislatore italiano ha riconosciuto
nell’attività statistica pubblica tratti peculiari che la differenziano, negli scopi e nei metodi, da altre
attività basate sul trattamento di dati personali, avendo come unico scopo quello di quantificare,
classificare e produrre modelli interpretativi della realtà e delle sue tendenze evolutive e non il
controllo degli individui. Da qui il riconoscimento ai produttori di statistiche ufficiali di una serie di
importanti “deroghe” a limiti e prescrizioni non giustificati da un effettivo rischio per i diritti e le
libertà degli interessati (ad esempio in materia di informativa, esercizio dei diritti degli interessati,
conservazione dei dati, legittimazione al trattamento di dati sensibili e giudiziari).
ROMA 23 GIUGNO 2016
AREA TEMATICA 4. NUOVE FONTI E DOMANDE
L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy
Garanzie per la privacy: quali rischi?....
«Attraverso l'utilizzo di dati amministrativi e fonti statistiche …vengono... ricostruite le
connessioni logiche esistenti fra le singole unità, sfruttando i codici d'identificazione univoci
delle persone fisiche……, arrivando così a profilare l'intera cittadinanza in relazione ad ogni
aspetto della vita quotidiana in prospettiva diacronica, ivi compresa la relativa posizione
geografica» (cfr. Parere del Garante per la protezione dei dati personali sullo schema di
Programma statistico nazionale - Psn 2014-2016 – del 29/10/2015)
ROMA 23 GIUGNO 2016
AREA TEMATICA 4. NUOVE FONTI E DOMANDE
L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy
Garanzie per la
privacy:
gli strumenti
messi in atto
Il complesso di misure fisiche, logiche, organizzative e procedurali messe in
atto nei processi di produzione statistica, in coerenza con il quadro normativo
vigente in materia di tutela del segreto statistico e protezione dei dati
personali, può offrire soluzioni idonee a fronteggiare tali maggiori rischi per la
riservatezza.
D’altra parte il processo «centralizzato» sviluppato dall’Istituto è garanzia per
la trasparenza delle procedure di conservazione, accesso e utilizzo dei dati,…..
…… ma non solo, permette un controllo volto a garantire un uso
«parsimonioso» di tali dati e proporzionato agli obiettivi che si intendono
perseguire.
e per i Big Data?
I BD non rappresentano una specifica categoria di informazioni assoggettata ad
una disciplina speciale. Pertanto, considerata la loro eterogeneità è necessario
verificare, di volta in volta, la sussistenza dei presupposti per il legittimo trattamento
dei dati e adottare le garanzie prescritte in relazione ai tipi di dati (ad esempio
sensibili), agli obiettivi che si intendono perseguire e alle modalità del trattamento.
ROMA 23 GIUGNO 2016
AREA TEMATICA 4. NUOVE FONTI E DOMANDE
L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy
Garanzie per la privacy: nuove opportunità nel quadro delle riforma
legislative in atto
Il sistema legislativo nazionale sulla privacy sarà sottoposto a rilevanti trasformazioni
per effetto del recente regolamento UE n. 2016/679 che aggiorna e modernizza i
principi contenuti nella direttiva sulla protezione dei dati personali del 1995 (Direttiva
95/46/CE).
L’ordinamento del Sistema Statistico Nazionale è in fase di revisione.
In questa nuova stagione di riforme potrebbero essere mature le condizioni per
ripensare e far evolvere alcune regole legate a meccanismi procedurali ormai obsoleti
e rivelatisi farraginosi (si pensi all’iter di approvazione del Psn) che rappresentano un
ostacolo alla gestione flessibile ed efficiente di processo di produzione e diffusione
dell’informazione statistica in forte rinnovamento.