ROMA 23 GIUGNO 2016 COMPORTAMENTI INDIVIDUALI E RELAZIONI SOCIALI IN TRASFORMAZIONE UNA SFIDA PER LA STATISTICA UFFICIALE AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy NUOVE FONTI E DOMANDE 23 GIUGNO 2016 00.00 | 00.00 L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy G. Garofalo, M. R. Simeone| Istituto Nazionale di Statistica ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy 50 anni dopo ……. Il SIM SIM LUOGHI INDIVIDUI SIM LUOGHI UNITA’ ECONOMICHE SIM INDIVIDUI SIM UNITA’ ECONOMICHE SIM RELAZIONI TRA INDIVIDUI SIM RELAZIONI INDIVIDUI UNITA’ SIM RELAZIONI TRA UNITA’ ECONOMICHE Repository dei dati amministrativi e statistici integrati, organizzato con lo scopo di supportare i processi di produzione statistica dell'Istat. Favorisce l’utilizzo di dati individuali, privi degli identificativi diretti, mantenendo inalterate le potenzialità informative derivanti dal processo di integrazione 2 ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy Multiple integrated data collection Da Fonti Primarie Indagini statistiche …..a paradigm change in which statistical agencies design and update their flagship programs by determining the best combination of data sources and methods to serve user needs in a topic area of ongoing importance. This multiple sources paradigm should apply to all statistical programs, whether traditionally based on a survey, administrative records, or another source (Costance Citro ,St. Canada) a …………. Indagini statistiche Fonti Secondarie Fonti amministrative Migl. Processi di produzione Informazione ausiliaria nella fase di controllo dei dati Stima di singole variabili BIG DATA • • • WEB Scraping Scanner data Call Details Record Fonti Ammin. integrate Informazioni non strutturate 3 ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy La «conta» delle popolazioni Uso dell’indagine censuaria (pop. Residente/pendolarismo): • Costi • Ritardi nella diffusione • Comportamenti «anagrafici distorti» dei rispondenti • Impossibilità di analisi longitudinali Integrazione più fonti amministrative: • Informazioni «amministrative distorte» • Parzialità dell’informazione disponibile • Difficoltà a stimare la «frequenza» dell’uso di un territorio Call Detail Record: • Incertezza della popolazione di riferimento • Impossibilità nella «qualificazione» • Impossibilità di stimare le incoerenze fra chi «possiede» e chi «usa» il cellulare 4 ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy Multiple integrated data collection • Interviene sui processi produttivi e organizzativi • Si inserisce in una fase di evoluzione culturale nell’uso delle statistiche (Europa 2020, Beyond GDP,…) • Determina la necessità, in atto ma ancora conclusa, di una profonda revisione della metodologia statistica (in particolare nella «interpretazione» e stima dell’errore) • Permette una visione integrata di domini differenti e favorisce l’offerta di nuove informazioni statistiche. ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy Cosa cambia nel processo produttivo statistico Invesione delle fasi Collassamento nelle fasi Cosa cambia nel sistema organizzativo delle statistica pubblica Specialized corporate-level services units : Approccio “per funzioni centralizzate” a supporto di tutti i processi statistici e abbandono dei processi a “silos” (per singoli domini stat.). Maggiore standardizzazione e cooperazione. 6 ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy Cosa cambia nell’approccio metodologico Da un approccio da disegno U 1 2 . . . N s Sampling 1 2 . . n Stima Tˆ ( s ) ๐๐๐ธ๐ (๐) Valutazione errore Ad un approccio da modello ๐น1 Realizzazione ๐๐ ( . ) U ๐น2 . . Stima ๐(๐น1 ,…, ๐น๐บ ; ๐๐ ) ๐๐๐ธ๐๐ (๐) ๐น๐บ 7 ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy Cosa cambia nella produzione statistica (pubblica!) • Informazioni strutturate e complesse per intere popolazioni o sottopopolazioni (relazioni familiari + redditi + lavoro + istruzione + mobilità + …..) • Più informazioni, per domini territoriali limitati e con maggiore tempestività • Integrazione informativa – in input – fra più domini • Domanda vs. offerta • Imprese vs. famiglie • Redditi vs lavoro • Sviluppo (finalmente!) delle analisi longitudinali e dei percorsi di vita (es. istruzione/lavoro) 8 ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy Multiple integrated data collection • E’ un processo evolutivo… • … ma non è un processo reversibile • Non è un processo a costo zero ! • E’ un processo che presenta dei rischi • «illusione informativa» / problema dei fiction data • Moltiplicazione di rumori statistici non intercettati • Garanzie per la privacy ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy Garanzie per la privacy: il contesto generale L'ordinamento statistico (nazionale e europeo) promuove e favorisce l’utilizzo e l’integrazione di fonti di dati alternative alle tradizionali rilevazioni statistiche, anche al fine di ridurre l'onere per i rispondenti: si tratta di una scelta obbligata per tutti gli Istituti nazionali di statistica (cfr. Reg. UE 2015/759 del 29 aprile 2015). e la specificità della statistica pubblica recependo univoche indicazioni internazionali e comunitarie, il legislatore italiano ha riconosciuto nell’attività statistica pubblica tratti peculiari che la differenziano, negli scopi e nei metodi, da altre attività basate sul trattamento di dati personali, avendo come unico scopo quello di quantificare, classificare e produrre modelli interpretativi della realtà e delle sue tendenze evolutive e non il controllo degli individui. Da qui il riconoscimento ai produttori di statistiche ufficiali di una serie di importanti “deroghe” a limiti e prescrizioni non giustificati da un effettivo rischio per i diritti e le libertà degli interessati (ad esempio in materia di informativa, esercizio dei diritti degli interessati, conservazione dei dati, legittimazione al trattamento di dati sensibili e giudiziari). ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy Garanzie per la privacy: quali rischi?.... «Attraverso l'utilizzo di dati amministrativi e fonti statistiche …vengono... ricostruite le connessioni logiche esistenti fra le singole unità, sfruttando i codici d'identificazione univoci delle persone fisiche……, arrivando così a profilare l'intera cittadinanza in relazione ad ogni aspetto della vita quotidiana in prospettiva diacronica, ivi compresa la relativa posizione geografica» (cfr. Parere del Garante per la protezione dei dati personali sullo schema di Programma statistico nazionale - Psn 2014-2016 – del 29/10/2015) ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy Garanzie per la privacy: gli strumenti messi in atto Il complesso di misure fisiche, logiche, organizzative e procedurali messe in atto nei processi di produzione statistica, in coerenza con il quadro normativo vigente in materia di tutela del segreto statistico e protezione dei dati personali, può offrire soluzioni idonee a fronteggiare tali maggiori rischi per la riservatezza. D’altra parte il processo «centralizzato» sviluppato dall’Istituto è garanzia per la trasparenza delle procedure di conservazione, accesso e utilizzo dei dati,….. …… ma non solo, permette un controllo volto a garantire un uso «parsimonioso» di tali dati e proporzionato agli obiettivi che si intendono perseguire. e per i Big Data? I BD non rappresentano una specifica categoria di informazioni assoggettata ad una disciplina speciale. Pertanto, considerata la loro eterogeneità è necessario verificare, di volta in volta, la sussistenza dei presupposti per il legittimo trattamento dei dati e adottare le garanzie prescritte in relazione ai tipi di dati (ad esempio sensibili), agli obiettivi che si intendono perseguire e alle modalità del trattamento. ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy Garanzie per la privacy: nuove opportunità nel quadro delle riforma legislative in atto Il sistema legislativo nazionale sulla privacy sarà sottoposto a rilevanti trasformazioni per effetto del recente regolamento UE n. 2016/679 che aggiorna e modernizza i principi contenuti nella direttiva sulla protezione dei dati personali del 1995 (Direttiva 95/46/CE). L’ordinamento del Sistema Statistico Nazionale è in fase di revisione. In questa nuova stagione di riforme potrebbero essere mature le condizioni per ripensare e far evolvere alcune regole legate a meccanismi procedurali ormai obsoleti e rivelatisi farraginosi (si pensi all’iter di approvazione del Psn) che rappresentano un ostacolo alla gestione flessibile ed efficiente di processo di produzione e diffusione dell’informazione statistica in forte rinnovamento.