Sommario Introduzione .......................................................................................................................... 4 Promuovere gli Open Data oggi: dalla creazione alla valorizzazione ...................... 9 L’esperienza AgID ............................................................................................................................... 9 Lo scenario internazionale per lo sviluppo degli Open Data: la carta internazionale degli Open Data .. 10 L’Open Data in Europa ...................................................................................................................... 11 Open Data in Italia: il ruolo di AgID ................................................................................................... 11 Come si pubblicano i dati: il nuovo portale nazionale dati.gov ........................................................... 12 Metodi e principi per la valorizzazione degli Open Data ..................................................................... 14 I modelli per la classificazione dei dati aperti .................................................................................... 16 Come si calcola l’impatto: da portali a indicatori ............................................................................... 16 Le sfide per la Pubblica Amministrazione .......................................................................................... 17 La sperimentazione di framework evoluti per la consultazione e l’utilizzo dei Linked Government Open Data ....................................................................................... 19 L’esperienza di Sogei ........................................................................................................................ 19 Geolocalizzazione dinamica: problematiche legate alla sicurezza del dato di posizionamento ............. 20 Gli “open data” per la calibrazione e il controllo delle politiche di prevenzione dei rischi sul lavoro. L’esperienza dell’Inail ................................................................. 22 Breve storia dell’esperienza .............................................................................................................. 22 Alla ricerca di un’informazione “agile” .............................................................................................. 22 Definire il “linguaggio speciale” ........................................................................................................ 23 Il modello di lettura .......................................................................................................................... 25 I dati in formato aperto, il calendario di pubblicazione ...................................................................... 25 La soluzione tecnologica ................................................................................................................... 26 Il “data challenge”, il club degli utilizzatori, gli incontri con i giornalisti .............................................. 26 Un mezzo per collaborare tra istituzioni. Verso il “grappolo degli open data”? ................................... 26 Utilizzazioni interne ............................................................................................................................... 26 Collaborare con le altre istituzioni....................................................................................................... 27 Appendici ......................................................................................................................................... 28 L’importanza della geografia come elemento di integrazione e raccordo degli Open Data ed i processi per assicurare la qualità dei dati ....................................... 41 L’esperienza della Regione Emilia-Romagna ...................................................................................... 41 Il modello di gestione ed apertura dei dati geografici in Regione Emilia-Romagna .............................. 42 Le linee guida per la decertificazione in Emilia-Romagna ................................................................... 45 Il modello di circolarità ed aggiornamento dell’informazioni geografica di riferimento ....................... 46 Gli Open Data geografici come uno dei fattori abilitanti la Smart Community .................................... 47 Considerazioni conclusive ................................................................................................................. 47 L’esperienza Open Data in Roma Servizi per la Mobilità .......................................... 49 Gli Open Data per l’infomobilità ....................................................................................................... 49 L’accesso ai dati dell’Agenzia ............................................................................................................ 50 Gli utenti degli Open Data ................................................................................................................ 50 Le sfide per il prossimo futuro .......................................................................................................... 51 2 Un Modello dinamico per la gestione, lo sviluppo, l’utilizzo e la valorizzazione degli Open Data .................................................................................................................. 53 L’esperienza di Dedagroup ICT Network ............................................................................................ 53 Open Data per l’interno della PA come presupposto per l’apertura verso l’esterno ............................ 53 Le banche dati di riferimento ............................................................................................................ 54 La decertificazione............................................................................................................................ 55 Il grado di interesse per la formulazione delle policy ......................................................................... 55 Una proposta di modello per valutare il grado di maturità di una PA rispetto ai temi dell’Open Government ..................................................................................................................................... 56 Trasparenza (adempimento normativo) ............................................................................................ 57 Coinvolgimento ...................................................................................................................................... 57 Collaborazione........................................................................................................................................ 58 Partecipazione........................................................................................................................................ 58 Gli Aspetti chiave da curare .............................................................................................................. 59 La georeferenziazione........................................................................................................................... 59 Ontologie comuni .................................................................................................................................. 59 Semplificare la comprensione degli Open Data ................................................................................ 59 Open Data e Open Services ................................................................................................................. 59 La qualità dei dati .................................................................................................................................. 60 Considerazioni conclusive ................................................................................................ 61 Il gruppo di lavoro che ha collaborato alla redazione del Paper è stato coordinato da Giovanni Aliverti. Hanno collaborato: Marco Bani (AgID), Antonio Bottaro (Sogei), Massimo Fustini (Regione EmiliaRomagna), Patrizio Galasso (Inail), Stefano Giovenali (Roma Servizi per la Mobilità), Rosaria Mosca (Inail), Lorenzo Orlando (Glocus), Valentina Tonti (Glocus), Massimiliano Veltroni (Inail), Luigi Zanella (Dedagroup ICT Network). 3 Introduzione A cura di Glocus Tra i tanti temi connessi all’Agenda Digitale e alla digitalizzazione, quello degli Open Data (soprattutto in ambito pubblico) è forse uno di quelli verso cui addetti ai lavori, analisti e parte dell’opinione pubblica ripongono maggiori aspettative. I dati aperti, oramai comunemente noti come Open Data anche nel contesto italiano e come definiti dall’Open Knowledge Foundation, sono quelle tipologie di dati liberamente accessibili a ogni tipologia di utenza, privi di restrizioni legate a diritti e copyright “che possono essere liberamente utilizzati, riutilizzati e ridistribuiti da chiunque, soggetti eventualmente alla necessità di citarne la fonte e di condividerli con lo stesso tipo di licenza con cui sono stati originariamente rilasciati”. Applicabile ad ogni tipo di database, il concetto di apertura assume particolare rilevanza quando legato ai dati prodotti e utilizzati dalle Pubbliche Amministrazioni e che costituiscono Informazioni di Pubblico Interesse. In questo caso, infatti, gli Open Data diventano un elemento importante, sebbene non unico, di un percorso di rinnovamento più generale della cosa pubblica, che rappresenta un vero e proprio cambio di paradigma che, potenzialmente, coinvolge tutti i soggetti della nostra società, a partire dalle Pubbliche Amministrazioni stesse, che sono titolate a produrre ed utilizzare i dati e a cui spetta anche il compito di facilitarne la condivisione. Figura 1 Schema descrittivo dell’Open Government. Dal punto di vista degli amministratori, abbracciare la filosofia dell’Openness (di cui gli Open Data sono elemento principale) vuol dire aprirsi alla partecipazione, alla trasparenza e alla collaborazione (Figura 1), attivando un nuovo modello di governo ispirato al cosiddetto Open Government, secondo cui l’Amministrazione deve essere trasparente, a tutti i livelli, consentendo il monitoraggio e la valutazione continua del proprio operato, avvalendosi anche delle possibilità offerte dalle tecnologie ICT e dalla Rete e che costituisce un punto di contatto reale e continuo con 4 il cittadino. In particolare, il tema della trasparenza è quello in relazione al quale, in Italia, si stanno concentrando le esperienze principali di valorizzazione degli Open Data, nonché quello verso cui il legislatore si è mostrato più attivo. Già l’articolo 50, comma 1 del D.lgs. n, 82 del 2005 specificava come “i dati delle Pubbliche Amministrazioni sono formati, raccolti, conservati, resi disponibili e accessibili con l’uso delle tecnologie dell’informazione e della comunicazione che ne consentono la fruizione e riutilizzazione, alle condizioni fissate dall’ordinamento, da parte delle altre Pubbliche Amministrazioni e dei Privati”. Successivamente, l’ art. 11 D. Lgs. n. 150/2009 definisce la trasparenza come “accessibilità totale, anche attraverso lo strumento della pubblicazione sui siti istituzionali delle Amministrazioni Pubbliche, delle informazioni concernenti ogni aspetto delle organizzazioni, degli indicatori relativi agli andamenti gestionali e all’utilizzo delle risorse per il perseguimento delle funzioni istituzionali, dei risultati dell’attività di misurazione e valutazione svolta dagli organi competenti, allo scopo di favorire forme diffuse di controllo del rispetto dei principi di buon andamento e imparzialità”. Un ultimo intervento sul tema arriva, infine, nel 2013, col decreto legislativo n.33 del 14 marzo 2013, c.d. “riordino della disciplina riguardante gli obblighi di pubblicità, trasparenza e diffusione di informazioni da parte delle Pubbliche Amministrazioni”. La normativa conferisce all’Agenzia Per l’Italia Digitale (AgID) il compito di promuovere le politiche nazionali per la valorizzazione del patrimonio informativo pubblico e di indirizzare le amministrazioni verso un processo di produzione e rilascio dei dati pubblici standardizzato e interoperabile su scala nazionale ai fini di favorirne l’utilizzo per la creazione di nuovi servizi. Moltissimi, infatti, sono gli ambiti di applicazione e le tipologie di dati la cui apertura può portare a nuove forme di analisi e, successivamente, confronto e partecipazione: dai dati legati alla spesa pubblica a quelli demografici, dai dati ambientali ai dati territoriali, con particolare riferimento al dato geografico e al monitoraggio di attività produttive sul territorio. Come detto, il tema mostra notevoli implicazioni in diversi ambiti di azione: partecipazione, comunicazione, politica, ma anche cultura, formazione e lavoro, coinvolgendo sia il settore pubblico che quello privato, che insieme possono e devono concorrere nel creare modelli di sviluppo che garantiscano crescita sia economica che sociale. Ma rilevanti sono anche i benefici che essi comportano in termini di coinvolgimento delle imprese, che possono utilizzare i dati per creare e offrire servizi innovati e aprire nuove forme di mercato, per un impatto economico globale che la Casa Bianca, al momento, stima tra i 3 e i 5 mila miliardi di dollari all’anno per i Governi nazionali, 900 miliardi dei quali solo in Europa1. Perché ciò avvenga, però, è importante che si crei un ecosistema di condivisione dove si garantisca parità di accesso e totale interoperabilità tra banche dati. Il valore dei dati, infatti, aumenta sensibilmente quando dataset differenti, prodotti e pubblicati in modo indipendente da diversi soggetti, possono essere incrociati liberamente da soggetti terzi, cui spetta il compito di trarne il valore aggiunto attraverso la creazione di prodotti, servizi o applicazioni sempre nuovi e meglio rispondenti alle esigenze dei propri utenti, secondo forme e modalità che possono non essere state previste dai singoli enti e soggetti titolati alla pubblicazione dei “dati grezzi”. A tal fine, le “Linee guida nazionali per la valorizzazione del patrimonio informativo pubblico” emanate nel giugno del 2014 hanno l’obiettivo di supportare il processo di liberazione e rilascio dei dati pubblici fornendo un modello operativo per la metadatazione e la condivisione degli stessi2. 1 Corriere della Sera, “Meyer, gli Open Data voluti da Obama «Bene pubblico da 5 mila miliardi»”, 25 febbraio 2015. Esse fanno seguito alle “Linee guida per la stesura di convenzioni per la fruibilità di dati delle Pubbliche Amministrazioni” emanate nel giugno del 2013 da DigitPA con l’obiettivo di rimarcare quanto stabilito all’ articolo 50 e 58 del Codice dell’Amministrazione Digitale. Nell’art. 50, infatti, si precisa che, nel rispetto della normativa in materia di protezione dei dati personali, qualunque dato trattato da una Pubblica Amministrazione è reso accessibile e fruibile alle altre amministrazioni, in funzione dello svolgimento dei compiti istituzionali di 2 5 Inoltre, il nuovo art. 58 del CAD3, denominato “Comunicazioni tra le Pubbliche Amministrazioni”, sancisce l’obbligo per le PPAA di comunicare tra loro, attraverso la messa a disposizione a titolo gratuito degli accessi alle proprie basi di dati alle altre amministrazioni mediante la cooperazione applicativa disciplinata dal CAD4. Sono inoltre previste sanzioni per le Pubbliche Amministrazioni che non ottemperano all'obbligo di erogazione dei servizi in rete e di accesso telematico alle basi di dati5. In attuazione di tali disposizioni, entro settembre 2014 tutte le Pubbliche Amministrazioni e le società partecipate hanno trasmesso all'AgID "l'elenco delle basi di dati in loro gestione e degli applicativi che le utilizzano". Successivamente l’Agenzia per l’Italia Digitale ha reso disponibile online il Catalogo nazionale dei dati della Pubblica Amministrazione6, strumento che vuole supportare le attività di valorizzazione e coordinamento del patrimonio informativo pubblico. In Italia, come noto, si registra ancora una diffusa resistenza alla liberazione dei dati in possesso delle Pubbliche Amministrazioni. Secondo i dati diffusi dal Politecnico di Milano nel mese di marzo 2015, nel rapporto “Gli Open Data e i Comuni”, solo il 41% dei Comuni italiani pubblica i dati. Secondo il rapporto, le motivazioni principali di questo ritardo sono indicate dalle amministrazioni stesse, che denunciano la mancanza di personale competente e adeguatamente formato e la scarsezza di risorse economiche; criticità, queste, inquadrate in uno scenario di sostanziale indifferenza del sistema politico (figura 2). Figura 2 Principali ragioni che hanno impedito la pubblicazione di Open Data. Fonte: Politecnico di Milano, marzo 2015. Dei diversi dataset fin oggi pubblicati in formato open per il libero riutilizzo da parte di cittadini e imprese, la maggior parte riguarda temi legati ai trend della popolazione e fenomeni ambientali, seguiti poi da dati territoriali, cartografie e statistiche demografiche. Seguono poi le tematiche del turismo e dell'agricoltura, mentre sono meno presenti (seppur in crescita) dataset su salute, lavoro, trasporti, viabilità e conti pubblici (anche se in tale ambito è stato di recente creato un apposito portale online, www.soldipubblici.it). Peraltro, nelle amministrazioni più avanzate, dopo una prima fase nella quale l’attenzione è stata posta essenzialmente all’apertura dei dati, si è aperta una seconda fase, tuttora in corso, nella quest’ultime. Il successivo articolo 58, nel porre l’attenzione sulla fruibilità dei dati, prevedeva che le amministrazioni titolari di banche dati accessibili per via telematica predisponessero apposite convenzioni finalizzate ad assicurare la fruibilità dei dati medesimi. 3 Come modificato dall’art. 24-quinquies del D.L. 24 giugno 2014, n. 90, convertito, con modificazioni, dalla Legge 11 agosto 2014, n. 114, recante “Misure Urgenti per la semplificazione e la trasparenza amministrativa e per l'efficienza degli uffici giudiziari”. 4 La cooperazione applicativa di cui all’art. 72, comma 1, lettera e) del CAD, è finalizzata all'interazione tra i sistemi informatici delle Pubbliche Amministrazioni per garantire l'integrazione dei metadati, delle informazioni e dei procedimenti amministrativi. 5 Così come prescritto dall'art. 63 e dall'art. 52 del CAD. 6 www.basidati.agid.gov.it. 6 quale il focus si è spostato sulla qualità e sulla manutenibilità dei dati resi pubblici e sui processi che essi possono generare Proprio sul tema della “qualità del dato” occorre concentrarsi per favorire, come si diceva in apertura, il coinvolgimento diretto del mondo delle imprese, che hanno bisogno di dati qualitativamente impeccabili per poter sviluppare analisi e applicazioni di valore: Forse questo è uno dei motivi per cui ancora non si sviluppa un vero e proprio mercato indotto dai dati aperti e dunque una conseguente crescita del settore ICT che, invece, avrebbe tanto bisogno di svilupparsi al ritmo di altri paesi europei dove, proseguendo il percorso iniziato con gli Open Data, le amministrazioni più dinamiche stanno modificando i loro processi in modo partecipativo e cominciano a fornire i primi Open Services, creando così i presupposti di un vero e proprio Open Government. Obiettivo di questo documento è fornire indicazioni alla politica ed alla classe dirigente per realizzare iniziative di qualità, portando a sistema esempi di esperienza di soggetti rilevanti sul panorama nazionale (AgId, Inail, Ministero dell'Ambiente, Sogei, Regione Emilia-Romagna, Roma Mobilità) cercando di dare un contributo sul tema che esca dall’ambito accademico o degli esperti per guardare invece alle sue implicazioni nella società civile, nell’impresa e nell’Amministrazione, sia negli aspetti più pratici e operativi sia nelle capacità di generare un cambiamento reale nei processi, nella governante, nella qualità dei servizi e nella loro capacità di generare valore aggiunto. Il paper stesso nasce dall’impegno congiunto di diversi enti e amministrazioni, da tempo attive sul tema dell’Open Data, che hanno costituito un vero e proprio gruppo di lavoro che ha cercato, in un continuo e reciproco confronto delle proprie esperienze più significative, di individuare alcune linee di sviluppo affinché gli Open Data possano essere un vero fattore abilitante di una nuova Amministrazione più efficiente e partecipe. Ci si propone, dunque, di fornire una guida alla lettura di alcune rilevanti iniziative in ambito Open Data che vedono coinvolti gli enti partecipanti al gruppo di lavoro, in riferimento a quattro dimensioni principali: 1. l'utilizzo delle metodologie e dei processi di creazione degli Open Data per un uso interno alla Pubblica Amministrazione: in un mondo in cui la catena del valore dei servizi pubblici è sempre più ibrida e coinvolge attori ed enti diversi, gli Open Data non sono solo un elemento di trasparenza delle procedure ma costituiscono un vero e proprio agente di integrazione, semplificazione e innovazione dei processi. L’apertura dei dati all’interno della singola PA e fra PA diverse è una condizione necessaria, ma non sufficiente per la realizzazione dell’Open Government. È dunque opportuno chiedersi quale strada occorra intraprendere per realizzare tale obiettivo. Il paper illustrerà come l’integrazione di dati provenienti da Enti diversi possa consentire l’integrazione dei processi di diverse Amministrazioni per portare così allo sviluppo di veri e propri Open Services; 2. gli strumenti, i processi e le metodologie per assicurare la qualità degli Open Data: in tale ambito sarà considerata la dimensione geografica come elemento di integrazione, confronto e validazione dei dati, l'importanza di banche dati certificate e certificanti di riferimento e le modalità per assicurare la qualità dei dati nel tempo; 3. Open Data per soggetti esterni: l’apertura di dati di qualità della PA verso l’esterno della macchina pubblica è la condizione necessaria per valorizzare il patrimonio informativo pubblico e farne il motore di iniziative imprenditoriali (applicazioni mobile, data journalism, data analysis) e civiche (quando realizzate da cittadini e associazioni per fini di pubblica utilità, anche sotto forma di iniziative di civic hacking); 7 4. valutazione degli impatti e delle ricadute degli Open Data: occorre spingere verso la definizione di chiari e oggettivi metodologie di valutazione e misurazione dei risultati delle iniziative di apertura e condivisione di Open Data, sia all’interno dell’Amministrazione sia all’esterno, andando oltre la mera rispondenza all'obbligo normativo di pubblicizzazione dei dati, definendo con chiarezza gli obiettivi e prevedendo i relativi strumenti di valutazione e benchmarking. Il paper si interrogherà su cosa possano fare gli enti, sia pubblici che privati, per sfruttare questo capitale di dati affidabili ed aggiornati, su come il mercato possa sfruttare realmente questa nuova opportunità e su come attivare, in linea con le indicazioni internazionali, un circolo virtuoso fra PA e sistema economico-sociale che veda il patrimonio informativo ed i processi della PA come motore di sviluppo. Sulla base delle quattro dimensioni d'analisi elencate, i contributi raccolti nel paper cercano di rispondere agli interrogativi ancora aperti e condividere esperienze e criticità, con un focus sugli obiettivi attesi, quelli eventualmente già raggiunti e come questi possano concorrere a definire un nuovo modello dinamico per la gestione, lo sviluppo, l’utilizzo e la valorizzazione degli Open Data. 8 Promuovere gli Open Data oggi: dalla creazione alla valorizzazione A cura di Marco Bani, Capo Segreteria tecnica dell'Agenzia per l'Italia Digitale L’esperienza AgID Nella società moderna si assiste quotidianamente ad una proliferazione di dati come mai era accaduto in passato. Non si tratta solo di dati scientifici, ma anche e soprattutto di dati che riguardano la vita ordinaria dei cittadini e delle comunità. Questo è stato possibile grazie all’incremento dell’utilizzo di smartphone e altri dispositivi mobili, che raccolgono informazioni sulle nostre scelte, su ciò che vediamo, dove andiamo e quello che stiamo facendo, Ogni singola persona diventa un potenziale fornitore/erogatore di dati e questo aumenterà sempre di più nei prossimi anni, con la possibilità di ottimizzare l’offerta di servizi scolastici, ridurre i costi sanitari e facilitare l'accesso ai servizi finanziari. Il progresso è destinato a crescere grazie all’Internet delle cose, meglio conosciuto nella dicitura inglese “Internet of Things” – IoT, tecnologia che estende internet al mondo degli oggetti, permettendogli di acquisire intelligenza grazie al fatto di poter comunicare dati su se stessi e accedere ad informazioni aggregate da parte di altri, con un linguaggio “machine to machine”. I vantaggi derivanti dall’utilizzo di queste informazioni, affinché possano avere un effetto concreto sulla collettività, richiedono un accesso a dati di alta qualità anche da parte dei singoli. I dati, difatti, già svolgono un ruolo cruciale nel guidare il processo decisionale e assumeranno una funzione ancor più rilevante nel corso del tempo. Al contrario, se gli individui non hanno consapevolezza che i loro dati sono raccolti, distribuiti o utilizzati, potrebbero subire conseguenze negative sia dal punto di vista sociale che economico. In questo contesto si inserisce il digital divide, termine con il quale si definisce il divario esistente tra chi ha accesso effettivo alle tecnologie dell'informazione (in particolare personal computer e Internet) e chi ne è escluso, in modo parziale o totale. Il digital divide limita i benefici dell’innovazione ed i vantaggi dell'era digitale moderna per un'ampia fascia della popolazione, e per tale ragione meriterebbe maggiore considerazione nelle politiche nazionali. Inoltre, occorre anche considerare che l’utilizzo dei dati, se da un lato offre una grande opportunità per il progresso scientifico, con benefici per la collettività e per il settore privato, dall’altro rischia di invadere la privacy e di limitare i diritti individuali. Come accennato sopra, oltre che per i singoli, i dati hanno un peso importante nel settore privato. Le aziende, difatti, li pongono alla base della propria offerta di servizi e li utilizzano per prendere decisioni sia strategiche che di routine. Ad esempio, alcune società che offrono servizi finanziari si servono di dati “non tradizionali”, come la rete sociale di un individuo, per valutare il rischio di credito e prendere decisioni di prestito. Altro esempio sono le assicurazioni che lavorano in campo sanitario e le farmacie che offrono sconti ai clienti che utilizzano sistemi, studiati ad hoc, di raccolta e monitoraggio dei dati in merito alla loro salute. Nel settore pubblico i dati sono al centro di politiche importanti tese, tra gli altri obiettivi, a migliorare la sicurezza dei cittadini, ridurre gli sprechi del governo e ottimizzare l’offerta formativa nelle scuole. Si è assistito, ad esempio, in diversi Stati, tra cui l’America, ad investimenti consistenti per la costituzione di basi dati finalizzate al monitoraggio della spesa sanitaria come parte integrante delle politiche tese a sfruttare i dati per il miglioramento della cosa pubblica. Ciò premesso è importante fare riferimento, alla disuguaglianza a cui si sta assistendo a seconda dell’area geografica di riferimento. Purtroppo, mentre molte comunità hanno adottato nuove tecnologie e politiche che favoriscono la raccolta di dati, beneficiando dei vantaggi che ne 9 derivano, altre comunità sono rimaste indietro. Questo fenomeno è stato evidenziato dall'emergere delle Città Intelligenti (o Smart Cities), che hanno contribuito a creare uno scenario disarmonico, composto da zone con uno stadio di avanzamento tecnologico di raccolta dati ed aree definibili come vere e proprie "deserti di dati", con conseguente effetto negativo per gli abitanti di quei territori, ad esempio nell’offerta di servizi sanitari, settore che grazie all’utilizzo dei dati sta facendo dei progressi consistenti. Non esiste una soluzione semplice a questo problema, ma ci sono alcuni rimedi di breve termine. In primo luogo, la raccolta dei dati condotta dai governi nazionali e locali dovrebbe concentrarsi maggiormente sulle fasce della popolazione sottorappresentate e difficili da raggiungere per garantire che tutte le comunità possano beneficiare delle tecnologie e dai processi scaturite da politiche data-driven (guidate dai dati). In secondo luogo si dovrebbero supportare, attraverso sovvenzioni a ciò destinate, la proliferazione di Città Intelligenti anche nelle comunità più disagiate, impegnandosi con i leader locali a capire come integrare soluzioni che utilizzano dati. Infine, ci si dovrebbe avvalere di ricercatori per identificare le aree dove il divario dati è considerevole e pianificare su questa base gli interventi da attuare. La lotta alla povertà dei dati non porrà, certamente, fine alle disuguaglianze sociali ed economiche, ma la costruzione di comunità ricche di dati costituisce un passo importante verso la riduzione di queste disparità. Per questo governi e comunità internazionali stanno moltiplicando gli sforzi per sostenere e promuovere politiche legate agli Open Data. Lo scenario internazionale per lo sviluppo degli Open Data: la carta internazionale degli Open Data “To achieve the goals of sustainable development, critical data must be open and available for reuse by anyone, anywhere, anytime”. Sir Tim Berners Lee, inventore del World Wide Web. Dopo il passo storico dell’adozione dell'Agenda per lo sviluppo sostenibile 20307 occorre tradurre in realtà gli obiettivi di sviluppo sostenibile (suistainable development goals – SDGs) previsti nel documento. Gli Open Data in questo contesto hanno un ruolo chiave: i dati aperti possono, infatti, aiutare le aziende e gli imprenditori a creare valore economico e consentire ai governi di fornire servizi vitali in modo più efficiente, migliorando il rapporto tra cittadino e Stato. In altri termini, gli Open Data possono aiutare la nascita di società prospere e fiorenti e saranno, per tale ragione, un elemento chiave per affrontare e monitorare il raggiungimento degli obiettivi sostenibili. Per favorire le sfide sociali e sostenere programmi e politiche finalizzate allo sviluppo sostenibile attraverso gli Open Data, si rende necessario articolare e adottare principi comuni e condividere le buone pratiche. Ciò può essere fatto attraverso l’attuazione dei principi fissati dall'International Open Data Charter (IODC)8 documento che detta regole comuni a sostegno dei dati aperti che consentono ai governi di tutto il mondo di aumentare l'accessibilità, la comparabilità, l'utilità e l'impatto dei dati aperti, nonché di promuovere gli Open Data come veicolo per lo sviluppo sostenibile. Istituito da un gruppo di campioni digitali indicati dai governi, organizzazioni della società civile e imprese private, l'International Open Data Charter (IODC) definisce alcuni principi di base per guidare i Governi nell’apertura dei propri dati, tra cui: 7 8 https://sustainabledevelopment.un.org/post2015/transformingourworld. http://opendatacharter.net. 10 • • • • • Open By Default; Quantità e Qualità dei dati aperti; Accessibilità per tutti; Rilascio dei Dati per migliorare la Governance pubblica e la partecipazione dei cittadini; Rilascio dei Dati per promuovere l’innovazione. Ai cinque principi appena elencati seguono, all’interno del documento, altrettanti impegni precisi e dettagliati che riguardano: i tempi di attuazione; la quantità e qualità dei dati; i formati e le metadatazioni comuni da adottare; la valorizzazione delle best practices; la promozione dei dati presso cittadini, imprese e società civile. L’obiettivo è quello di accrescere la consapevolezza dei cittadini e favorire la collaborazione tra gli Stati per l’adozione e attuazione di principi efficaci e comuni sugli Open Data. Come ha recentemente dichiarato il Professore Tim Berners-Lee, informatico britannico, coinventore insieme a Robert Cailliau del World Wide Web: "l'International Open Data Charter (IODC) ha il potenziale per accelerare il progresso mettendo dati fruibili nelle mani della gente"9. L’Open Data in Europa L’importanza degli Open Data è riconosciuta anche a livello europeo, ne è testimone l’inclusione nell’ambito dell’Agenda Digitale Europea di azioni programmatiche che evidenziano il ruolo fondamentale degli Open Data. Si fa riferimento ad esempio all’azione 3 che si riferisce al mercato unico digitale, all’interoperabilità (azione 26) e all’uso delle ICT per migliorare i servizi da offrire alla società (azione 89)10. La Commissione Europea, è intervenuta in materia di riutilizzo dell'informazione nel settore pubblico con l’adozione della direttiva 2013/37/UE. Tra i principi espressi nella direttiva, viene ribadito che un’adeguata gestione del patrimonio informativo pubblico contribuisce a: supportare la creazione di servizi innovativi da parte di imprese, startup, comunità, associazioni, organizzazioni e singoli cittadini, per il miglioramento della vita sociale ed economica dell’intero Paese; supportare il legislatore e gli organi di governo nelle loro decisioni. La Commissione Europea ha sviluppato il portale Open Data dell'UE11 che offre, attraverso un catalogo di metadati, un punto unico di accesso ad una serie sempre più ampia di dati prodotti dalle istituzioni e da altri organi dell'Unione europea. I dati possono essere liberamente utilizzati, riutilizzati, collegati tramite link e ridistribuiti a fini commerciali o non commerciali. Open Data in Italia: il ruolo di AgID Il Piano Crescita Digitale, la strategia sulle politiche digitali del Governo Italiano, approvato dal Consiglio dei Ministri il 3 marzo del 2015, definisce gli Open Data come “piattaforma abilitante” per lo sviluppo dell’innovazione e la trasparenza amministrativa. L’Agenzia per l’Italia Digitale sostiene il piano di Crescita Digitale e in particolare le politiche di Open Data con diversi interventi, tra cui l’adozione di linee guida che supportano le amministrazioni nel processo di valorizzazione del patrimonio informativo pubblico, definendo gli interventi principali da compiere per l’attuazione della strategia dettata dall’agenda nazionale. Più precisamente, l’art. 9 del D.L. n. 179/2012 (che ha interamente riscritto l’art. 52 del Codice 9 Open Government Partnership meeting durante l’Assemblea Generale delle Nazioni Unite del 27 Settembre 2015. 10 11 https://ec.europa.eu/digital-agenda/en/digital-agenda-scoreboard. https://open-data.europa.eu/en/data/. 11 dell’Amministrazione Digitale) stabilisce che “i dati e i documenti che le amministrazioni titolari pubblicano senza l'espressa adozione di una licenza si intendono rilasciati come dati di tipo aperto” (principio dell’Open Data by default”) e che l’Agenzia per l’Italia Digitale, in tale contesto, “promuove le politiche di valorizzazione del patrimonio informativo pubblico nazionale” e presenta all’inizio di ogni anno “al Presidente del Consiglio dei Ministri o al Ministro delegato per l'innovazione tecnologica, che li approva entro il mese successivo, un'agenda nazionale in cui definisce contenuti e gli obiettivi delle politiche di valorizzazione del patrimonio informativo pubblico e un rapporto annuale sullo stato del processo di valorizzazione in Italia”. La stessa norma prevede, inoltre, che l’Agenzia definisca e aggiorni annualmente “le linee guida nazionali che individuano gli standard tecnici, compresa la determinazione delle ontologie dei servizi e dei dati, le procedure e le modalità di attuazione delle disposizioni del Capo V del CAD con l'obiettivo di rendere il processo omogeneo a livello nazionale, efficiente ed efficace”. In merito alla valorizzazione del patrimonio informativo pubblico l’Agenda Nazionale per il 2014 prevedeva un percorso di valorizzazione delineato lungo tre direttrici principali: banche dati di interesse nazionale, convenzioni aperte tra Amministrazioni e dati di tipo aperto. Tuttavia, i cambiamenti normativi intervenuti con il DL 90 dell’Agosto 2014, che hanno portato all’abrogazione delle convenzioni aperte tra Amministrazioni (revisione dell’articolo 58 del Codice dell’Amministrazione Digitale), hanno imposto un cambiamento nelle azioni previste dall’agenda nazionale. Figura 3 Processo di valorizzazione del Patrimonio Informativo Pubblico. Come si pubblicano i dati: il nuovo portale nazionale dati.gov L’Agenzia per l’Italia Digitale, oltre a quanto sopra evidenziato, gestisce il portale nazionale dei dati aperti dati.gov.it in cui sono pubblicati i dati di tutte le Pubbliche Amministrazioni italiane (ministeri, regioni, comuni, ecc.) e il catalogo delle applicazioni che ne fanno utilizzo. Inoltre, cura ed aggiorna il repertorio nazionale delle basi dati della Pubblica Amministrazione e gestisce il catalogo nazionale (Repertorio Nazionale Dati Territoriali – RNDT). 12 AgID ha recentemente provveduto al potenziamento del Portale Nazionale degli Open Data: dati.gov.it. L’intervento si è reso necessario a causa della bassa qualità dei dati pubblicati e delle scarse possibilità di riutilizzo degli stessi e per la presenza di licenze che ostacolavano il riuso dei dati per fini commerciali. AgID, per ottimizzare e potenziare il portale, ha configurato, all’interno dello stesso, una nuova catalogazione dei dataset e ha sottoposto il portale ad una profonda revisione dell’architettura interna. In particolare, al fine di promuovere la qualità dei dati pubblicati, in questa nuova versione, l’Agenzia ha deciso di: ● ● assicurare un’uniformità dei contenuti del catalogo, che include ora solo metadati che descrivono i dati aperti disponibili presso le Pubbliche Amministrazioni; pubblicare sul nuovo portale solo metadati di dati disponibili in formati riconosciuti come aperti e con associate licenze aperte compatibili con la definizione di Open Data (i.e., pubblico dominio, attribuzione, attribuzione e condivisione allo stesso modo). Tali decisioni si riflettono inevitabilmente sul numero complessivo di dataset del catalogo che risulta quindi inferiore rispetto al passato, ma ne incrementa drasticamente la qualità. Per assicurare la qualità e l’uniformità dei contenuti del catalogo, il portale include solo metadati che: ● ● ● descrivono i dati aperti disponibili presso le Pubbliche Amministrazioni; possiedono formati riconosciuti come aperti; hanno licenze compatibili con la definizione di Open Data; Il nuovo sistema è stato pensato partendo dalla richiesta iniziale di rendere i dataset quanto più accessibili e fruibili ai target di utenza primari identificati dall’Agenzia (cittadini, imprese, professionisti e Pubblica Amministrazione), il lavoro iniziale è stato quello di analizzare il contesto di riferimento e le modalità di accesso consolidate tra le diverse tipologie di utenza. I dataset delle PA centrali e locali sono stati riorganizzati comparando le classificazioni di riferimento usate dalla Comunità Europea e dai migliori portali Open Data a livello mondiale: oltre a Territori, Organizzazioni, Formati e Licenze, le due nuove classificazioni, Tema e Genere, permettono di ordinare, filtrare e aggregare i dataset con nuove modalità. I Temi raggruppano i dataset in modo verticale, mentre i filtri per Genere sono trasversali alle classificazioni e raccolgono dataset relativi a dati simili. Un’ulteriore classificazione identificata col termine “Focus” completa i filtri dell’archivio di dataset. I Focus sono sezioni dedicate a specifici argomenti di rilievo, anche a supporto dei professionisti del settore. In particolare: ● Geo Dati che costituisce un punto di accesso unificato ai dati geografici presenti sul territorio nazionale; ● Occupazione e lavoro che offre un approfondimento sulle dinamiche e le evoluzione del ● mondo del lavoro; Data For All: contenitore virtuale di dati open accessibili e riusabili anche per i non addetti ai lavori che racchiude i tre portali tematici ItaliaSicura, Soldipubblici e OpenExpo12. 12 http://www.dati.gov.it/dataset?f%5B0%5D=field_focus%3A4496. 13 Ciò rende Dati.gov.it la cornice di una più ampia strategia volta a favorire attività che promuovano la cultura della trasparenza e l’accountability nella Pubblica Amministrazione, stimolando la diffusione e il riutilizzo dei dati aperti. Il portale nazionale contiene al suo interno anche le tre piattaforme tematiche (SoldiPubblici, ItaliaSicura e OpenExpo) che rendono disponibile materiale in modalità Open Data e open content con licenza aperta. I portali tematici sono stati creati al fine di monitorare e analizzare le informazioni finanziarie provenienti dagli enti pubblici, tra i quali bilanci, spese e appalti pubblici. Più precisamente, con lo sviluppo della piattaforma SoldiPubblici si è reso possibile consultare e raffrontare i dati (aggiornati mensilmente) della spesa pubblica di tutte le amministrazioni locali. Grazie a questa piattaforma i cittadini possono interrogare le spese delle amministrazioni sulla base della banca dati SIOPE. SoldiPubblici, difatti, si basa su un motore di ricerca semantico che è in grado di associare ente a voce di pagamento, sulla base delle codifica gestionale di SIOPE. ItaliaSicura, invece, è il sistema di monitoraggio degli interventi del Governo per il contrasto al rischio idrogeologico che fornisce un quadro delle aree per le quali è stato dichiarato lo stato di emergenza nazionale. Il portale dà accesso agli Open Data su emergenze (ad esempio frane e alluvioni) e sui relativi lavori effettuati da parte del Governo. OpenExpo raccoglie i dati sulla gestione, progettazione e organizzazione e svolgimento di Expo 2015, a supporto della correttezza e trasparenza delle procedure connesse alla realizzazione dell’evento. Il modello utilizzato oltre a catturare l’attenzione del pubblico sugli Open Data si è rivelato particolarmente interessante a causa della sua potenziale riutilizzabilità per altri grandi eventi. In questo contesto, è stato, inoltre, ideato #Data4all, contenitore dei tre portali tematici (SoldiPubblici, ItaliaSicura e OpenExpo), che è stato candidato dall’Italia agli OGP awards del 2015. #Data4all viene definito un frame narrativo utilizzato per la comunicazione esterna rivolta a cittadini, addetti ai lavori e amministrazioni. Il motore che muove il portale è DKAN13, una piattaforma Open Data basata su Drupal che replica il design e le funzionalità di Ckan, la piattaforma più utilizzata attualmente. I vantaggi di Dkan rispetto a ckan sono molteplici: l’utilizzo di un linguaggio di codice più semplice (PHP) e l’utilizzo di uno dei CMS più avanzati e utilizzati (Drupal). Uno degli obiettivi di progettazione di DKAN è rendere più facile per chiunque la possibilità di creare un ambiente di hosting economico per installare un catalogo di dati, avvalendosi anche della popolarità di Drupal che si traduce in un’ampia disponibilità di risorse software per aiutare e supportare lo sviluppo di una piattaforma DKAN: DKAN integra funzionalità di catalogo Open Data in un CMS esistente, dove i dataset sono trattati come contenuto che possono confluire in flussi di lavoro più strutturati; Drupal, inoltre, offre una interfaccia utente semplificata per molte attività di gestione del sito. Metodi e principi per la valorizzazione degli Open Data Come accennato sopra, l’Agenzia per l’Italia Digitale è chiamata a promuovere le politiche nazionali per la valorizzazione del patrimonio informativo pubblico secondo gli indirizzi strategici del governo, tenendo conto delle esigenze manifestate da cittadini, professionisti e imprese, secondo i principi dell’Open Data e nel rispetto del contesto normativo vigente. Le opportunità connesse all'attuazione dell’Agenda Nazionale, infatti, possono contribuire a evidenziare la trasparenza dell’azione amministrativa e accountability del governo del Paese: alcune azioni quali, la condivisione dei dati tra le amministrazioni, la messa a disposizione di dati aperti e accessibili, il rinnovamento dell’azione delle amministrazioni grazie alla partecipazione della 13 http://www.nucivic.com/dkan/. 14 società civile, agevolano il dialogo con quest’ultima e contribuiscono a far comprendere ai cittadini e alle imprese come le amministrazioni operano nell’interesse pubblico. A tal fine, l'Agenzia attiva i necessari meccanismi di aggiornamento continuo degli obiettivi fissati con l'Agenda e del relativo stato di attuazione, dandone conoscenza diretta e immediata a tutti gli interessati. Alla base dell’Agenda Nazionale si identificano una serie di principi guida, studiati per valorizzare gli Open Data: 1. Fruibilità: i dati sono fruibili attraverso le tecnologie dell’informazione e della comunicazione, ivi comprese le reti telematiche pubbliche e private; 2. Interoperabilità: per favorire il massimo riutilizzo dei dati e la massima integrazione di processi amministrativi, le amministrazioni privilegiano l’uso di standard condivisi e aperti; 3. Qualità: per favorire la massima fruibilità e il massimo riutilizzo dei dati deve essere garantito un adeguato livello di qualità nella produzione, gestione e pubblicazione dei dati. In generale, le amministrazioni seguono le indicazioni dello standard ISO/IEC 25012 “Data quality model” per la qualità dei dati; in particolare, si evidenziano i seguenti requisiti di qualità: a. Completezza: i dati sono esaustivi per tutti i loro valori attesi e rispetto alle entità relative (fonti) che concorrono alla definizione del procedimento, al fine di garantire l’autoconsistenza della fonte informativa; b. Accuratezza: i dati, e i loro attributi, rappresentano correttamente il valore reale del concetto o evento cui si riferiscono; c. Coerenza: i dati, e i loro attributi, non presentano contraddittorietà rispetto ad altri dati del contesto d’uso dell'Amministrazione titolare; d. Metadatazione: dati parzialmente descritti o totalmente non descritti sono di difficile comprensione sia per le persone, sia per gli agenti automatici. I dati sono quindi provvisti di metadati e sono descritti con opportuni schemi/vocabolari. In particolare, un insieme minimo e comune di metadati accompagna i dati. Inoltre, possono essere utilizzati metadati più specifici scelti sulla base della tipologia di dati da descrivere; e. Originalità: i dati sono riferibili a quelli raccolti e gestiti da o per conto dell’Amministrazione titolare affinché possano rispondere alle caratteristiche di credibilità o autenticità della fonte; f. Attualità (o tempestività di aggiornamento): i dati, e i loro attributi, sono del “giusto tempo” (sono aggiornati) rispetto ai procedimenti cui si riferiscono; g. Disaggregazione: per un loro uso più puntuale, i dati si presentano in forma disaggregata, fermi restando i limiti alla conoscibilità dei dati previsti dall'ordinamento ed il rispetto della normativa comunitaria in materia di riutilizzo delle informazioni del settore pubblico. 4. Accessibilità: l’accesso ai dati non deve essere discriminatorio; pertanto essi sono accessibili anche nel rispetto dei requisiti tecnici di accessibilità di cui all’art. 11 della legge 9 gennaio 2004, n. 4; 5. Gratuità: i dati sono resi disponibili gratuitamente oppure sono resi disponibili ai costi marginali sostenuti per la loro riproduzione e divulgazione, salvo casi eccezionali individuati preventivamente secondo criteri oggettivi, trasparenti e verificabili. Nel contesto invece della fruibilità dei dati tra amministrazioni per finalità istituzionali, i dati sono resi disponibili senza oneri a carico delle amministrazioni fruitrici. 6. Riutilizzabilità: l’imposizione di una licenza associata al dato pubblico che ne limiti il riutilizzo rappresenta una barriera per l’uso del dato stesso. Pertanto, i dati sono resi 15 disponibili secondo i termini di una licenza che ne permetta il massimo utilizzo da parte di chiunque, anche per finalità commerciali (art. 68 comma 3 lettera b) – 1, del CAD). I modelli per la classificazione dei dati aperti Il modello adottato per la classificazione e la guida all'apertura dei dati è quello proposto da Tim Berners-Lee, ampiamente riconosciuto e accettato a livello internazionale. Esso individua alcuni principi di qualità che consentono ai dati di tipo aperto di rispondere a requisiti di leggibilità e accesso. Ne risulta una classificazione a 5 livelli, mostrata nella figura che segue. Tale figura, oltre a fornire una categorizzazione del tipo di informazione e accesso, pone enfasi sulla qualità dei servizi che i dati, ai diversi livelli, possono abilitare. Una descrizione dettagliata del modello per i dati di tipo aperto che si propone è inclusa nelle Linee guida nazionali per la valorizzazione del patrimonio informativo pubblico. Figura 4: modelli per la classificazione dei dati aperti Come si calcola l’impatto: da portali a indicatori Per favorire la crescita di questo settore è fondamentale conoscere e misurare l’impatto delle politiche di Open Data e l’uso reale che si può fare dei dati. In merito, ci sono alcuni punti chiave da affrontare, come ad esempio: che cosa si intende per impatto; quali obiettivi si vogliono raggiungere; valutare se sia possibile partire dalle aree in cui il successo iniziale è stato notevole (come ad esempio la crescita economica) per accelerare i progressi nelle aree in cui i risultati finora sono stati meno importanti del previsto (come il rafforzamento della responsabilità politica). È opportuno chiarire che per migliorare l'impatto delle politiche di Open Data, si deve partire dal misurare quanto fatto sino ad ora. Il punto di partenza potrebbe essere quello di verificare: ● il numero di dataset aperti; ● le caratteristiche dei Portali nazionali e locali; ● il numero di dipendenti pubblici con una formazione adeguata in Open Data. 16 Altre misure che potrebbero svolgere un ruolo importante sono quelle che vedono il coinvolgimento diretto dei cittadini, come ad esempio azioni tese a: ● educare i cittadini in modo che possano fare scelte più informate; ● promuovere l'impegno civico diretto e aumentare la partecipazione dei cittadini ai processi democratici; ● raccogliere feedback per i decisori politici e/o del settore privato; ● monitorare le azioni dei funzionari e/o il responsabile di azienda responsabili/e degli Open Data. Un dato interessante da rilevare è come i progetti Open Data abbiano effetti più impattanti quando, oltre al coinvolgimento di singole organizzazioni o agenzie governative, nascono dalla partnership di organizzazioni ed enti appartenenti a diversi settori. A tal proposito il ruolo di intermediari (quali ad esempio, i media e i gruppi della società civile) si sono rivelati sino ad ora particolarmente importanti. L’esigenza di misurare l’impatto è finalizzata ad una maggiore diffusione e ad un miglior utilizzo degli Open Data. Difatti, la misurazione dell’impatto, attirando l’attenzione sui benefici che possono trarsi dallo sfruttamento dei dati aperti, accelererebbe il processo di diffusione degli stessi anticipando i vantaggi che ne derivano. Tuttavia, al momento non vi sono evidenze concrete circa l'impatto a lungo termine delle iniziative di Open Data. La mancanza di prove convincenti è in parte dovuta alle difficoltà insite nella misurazione delle pratiche di buon governo e del cambiamento sociale, ma in parte si sconta anche il fatto che solo recentemente si è data attenzione a questo particolare settore. Per ovviare a questo ritardo, molte organizzazioni stanno avviando iniziative sul tema, come ad esempio la World Wide Web Foundation che ha, recentemente, sperimentato l'uso di indicatori di impatto insieme a indicatori di preparazione e di attuazione14: un filone perseguito anche da Sunlight Foundation che, in uno studio di recente pubblicazione, si è concentrata in maniera approfondita proprio sull’impatto degli Open Data15. Si rende, ora, necessario un impegno concreto anche da parte dei governi e decisori politici, cui spetta un ruolo importante nella creazione di un sistema giuridico flessibile che consenta di includere meccanismi strutturati per la valutazione dei progetti di Open Data. A tal fine, la politica deve tenere conto di come, dall’analisi delle diverse esperienze pregresse, sia nazionali che straniere, sia emerso come che i progetti Open Data di maggior successo siano quelli che affrontano tematiche specifiche o problemi ben definiti che rispondono ad una vera necessità dei cittadini. Prima di concludere, si ritiene opportuno specificare come gli Open Data, per quanto efficaci possano essere, restano un complemento e non un sostituto unico per ottenere un cambiamento positivo delle istituzioni e dei processi delle Pubbliche Amministrazioni. Le sfide per la Pubblica Amministrazione L’impatto che le politiche di Open Data possono avere è naturalmente condizionato dagli ostacoli e dalle sfide che le amministrazioni devono affrontare a seconda del contesto locale ed ambientale in cui le attività si inseriscono. Nonostante le difficoltà siano molteplici e diverse tra loro, ci sono alcune problematiche ricorrenti, a cui devono far fronte tutte le amministrazioni. Si è constatato, ad esempio, che le politiche ed i progetti sugli Open Data hanno un impatto quasi nullo quando: 14 15 http://opendatabarometer.org/. https://sunlightfoundation.com/blog/2015/05/05/a-new-approach-to-measuring-the-impact-of-open-data/. 17 ● i cittadini hanno una disponibilità limitata di informazioni e mezzi. Ad esempio in Paesi caratterizzati da un basso tasso di raggiungibilità di Internet o da ambienti politici ostili; ● non rispondono alle esigenze degli utenti; ● non prendono in considerazione la sicurezza degli utenti e non mirano ad attenuare i rischi legati alla restrizione della privacy; ● non vengono allocate risorse umane ed economiche sufficienti per la fase successiva al lancio del progetto. In Italia, a livello nazionale, invece, al fine di ottenere un uso più consistente ed efficace degli Open Data, la prima sfida da affrontare è quella della costituzione di un modello unico di riferimento seguito da tutta la PA. A tal proposito si evidenzia che, per quanto attiene all’uso dei dati, le Amministrazioni tendono a privilegiare i dati resi disponibili sulla base delle indicazioni rilevabili attraverso il portale nazionale degli Open Data dati.gov.it, dalle relazioni fornite dalle amministrazioni, e dal rapporto annuale; in merito, invece, all’effettiva pubblicazione dei dati, nonostante essa risulti oramai consistente, persistono ancora casi di dati rilasciati in formati proprietari o in formati per cui la rielaborazione richiede un significativo sforzo, sia tecnologico che umano di comprensione, indicizzazione e conversione. dati più efficacemente interoperabili, rappresentati seguendo standard internazionali, sono ancora poco presenti, e riferibili ad alcune realtà più virtuose; molto spesso i dati non risultano adeguatamente descritti attraverso i relativi meta dati e spesso non vengono aggiornati con la dovuta frequenza o periodicità. Permangono problemi di riuso legati alle licenze adottate, non sempre aperte e compatibili, che impediscono l’emergere di esperienze importanti di soluzioni e servizi che si poggino sul requisito di interoperabilità dei dati stessi, relegati nei pochi esempi virtuosi che nascono tipicamente a seguito di hackathon o contest organizzati a tale scopo. Tutti questi elementi costituiscono ancora forti ostacoli che rallentano pesantemente le iniziative di riutilizzo dei dati stessi. Tuttavia, seppur in percentuale ancora molto bassa, grazie agli impegni assunti con l’Agenda 2014 che prevedeva il rilascio di specifici dataset prioritari secondo il paradigma dei Linked Open Data, la suddetta tipologia di dati sta emergendo anche nello scenario italiano. Le sfide sono ancora tante, ma l’Agenzia per l’Italia Digitale ha il mandato e le possibilità di supportare le Pubbliche Amministrazioni nel difficile percorso di rilascio dei dati e nella loro governance. 18 La sperimentazione di framework evoluti per la consultazione e l’utilizzo dei Linked Government Open Data A cura di Antonio Bottaro, Responsabile Unità Organizzativa Ricerca e Sviluppo Sogei L’esperienza di Sogei Sogei ha realizzato il framework GEOPOI® (GEOcoding Points Of Interest), framework che, ad oggi, vede una trentina di applicazioni sviluppate nei diversi ambiti del MEF. GEOPOI è sviluppato nell’ambito delle diverse attività in capo all’unità Ricerca & Sviluppo, che ha il compito di sperimentare approcci innovativi nelle diverse nicchie tecnologiche. Geopoi nasce dalla volontà di sperimentare un framework di community per la progettazione condivisa di interventi sul territorio in grado di mettere a disposizione di più settori della Pubblica Amministrazione la stessa rappresentazione territoriale, sulla quale possano coesistere e interoperare sia strati di dati open sia dati “privati” propri dello specifico dominio applicativo di ciascun singolo utente. Nell’ambito della progettualità condivisa di interventi sul territorio e specificatamente nelle applicazioni di Location intelligence, infatti, sono state sperimentate forme di condivisione avanzata di interfacciamento verso dati georiferiti al territorio che può rappresentare un approccio estremamente interessante, anche per un utilizzo evoluto di Linked Government Open Data. Questa nuova e moderna modalità operativa rappresenta un salto di qualità anche rispetto all’attuale “livello 5” di gestione degli Open Data, che richiede comunque operatori che sappiano comporre servizi attraverso l’uso di un linguaggio di interrogazione (SPARQL) per dati rappresentati in Resource Description Framework (RDF). L’idea originale alla base dell’esperienza Sogei trae ispirazione dal mondo delle diverse istallazioni artistiche multimediali ad oggi sempre più diffuse, e nasce dalla constatazione che i meccanismi che consentono agli artisti di manipolare le numerose e complesse fonti di dati multimediali, necessarie ai fini della creazione delle proprie installazioni offrono il massimo della semplificazione tecnologica riuscendo nello stesso tempo, a ridurre drasticamente la distanza tra l’idea primigenia e la sua realizzazione pratica. Il progetto ha visto la progettazione di un apposito framework, facilmente programmabile attraverso semplici operazioni di drag&drop di icone autoesplicative (widget grafici) in grado di comporre classi di servizi: il programmatore opera alla stregua di un bambino che monta il suo “treno” con i mattoncini delle ‘costruzioni’ prefabbricate. Quando sull’area di lavoro sono state portate tutte le icone che servono all’ottenimento del servizio voluto, e sono state opportunamente collegate tra loro secondo una logica ad alto livello che le “lega” logicamente con semplici connessioni operate da “simboli di freccia” tra icona sorgente ed icona destinazione - attraverso una sessione di programmazione che può durare al massimo qualche minuto – allora, basterà premere il tasto “codice” ed il ”listato”, prodotto automaticamente, ove inserito su un qualsiasi browser – implementerà la soluzione appena programmata. Tutto ciò avviene senza alcuna conoscenza di informatica specialistica ed è immediatamente operativo. Questo modo di operare si sta affermando anche in ambito IoT (Internet of Things) perché risponde ad una facile programmabilità degli oggetti, consentendo un agevole settaggio dei diversi attributi degli oggetti da portare in rete. È interessante anche sottolineare come questa filosofia si 19 vada affermando perché si presta ad essere inserita e ad implementare logiche di controllo e di governance essenziali, sia nell’uso degli Open Data che, soprattutto, in ambito IoT. Geolocalizzazione dinamica: problematiche legate alla sicurezza del dato di posizionamento L'uso di queste modalità evolute consente di incorporare servizi per la verifica della integrità e consistenza del dato di posizionamento in sé, che rappresenta, ad oggi, un tema particolarmente sottovalutato. Quando ci si riferisce ad applicazioni che prevedono il monitoraggio di dati di posizionamento in tempo reale, oppure la comunicazione di dati statici ai quali riferire misurazioni di particolare rilevanza e per le quali l'attinenza alla posizione diventa strategica (quali, ad esempio, i dati di centraline di sensori che comunicano lo stato degli inquinanti, che alimentano modelli di previsione utili a formare le decisioni relative alla mobilità) la necessità di avere certezza del dato di posizionamento è un tema fortemente connesso alla sicurezza. Vi sono classi di applicazione dove il dato di posizionamento assume una valenza fondamentale (si pensi al tracciamento di una merce pericolosa) e le relative problematiche di affidabilità e di sicurezza del dato assumono un carattere di particolare sensibilità. In un mondo in continua evoluzione, in cui la sicurezza informatica e fisica stanno assumendo un ruolo preponderante, non è più possibile affidare la gestione dei dati a servizi di tipo puramente commerciale, senza poterne verificare l'integrità della sorgente dei dati. Già sono evidenti i sintomi di una vera e propria “guerra” del tipo “Virus-Antivirus” che si riproporrà parallelamente a ciò che è accaduto nell’ICT, sul dato di posizionamento. Le tecniche di Jamming e di Spoofing consentono attualmente, infatti, l’accecamento del segnale GNSS o di trasmettere ai ricevitori utente segnali falsi, in grado di portare alla determinazione di una posizione “falsificata”. È evidente cosa ciò possa comportare in applicazioni di tracciamento istituzionale e di antifrode (si pensi alle deviazioni di percorso predefinito per un operatore del trasporto o ad operazioni di carico e scarico non autorizzate in ambito doganale). Si tenga conto che la forma più rudimentale di “spoofer” è costituita da un semplice cavo di alcuni metri, che, una volta condotto il segnale ricevuto a Radio-frequenza da un’antenna e ritrasmesso, introduce un ritardo sufficiente a deteriorare le prestazioni, pur mantenendo la struttura primigenia del formato del segnale corretta. Sull’onda del programma Galileo, che fornirà segnali di posizionamento criptati e servizi protetti dedicati esclusivamente ad utenti governativi denominati PRS (Public Regulated Services), il mondo scientifico e della Ricerca sta correndo ai ripari sviluppando tecniche innovative di AntiJamming ed Anti-Spoofing. In particolare, i metodi di Anti-Spoofing possono essere ricondotti di massima a tre tipologie: 1. metodi autonomi: ricevitori intelligenti in grado di analizzare la qualità del segnale e determinare eventuali anomalie (rapporto Segnale/Rumore, direzione di arrivo del segnale univoca per tutti i satelliti, phased array di antenne, etc...); 2. metodi crittografici con autenticazione (ad esempio Navigation Message Authentication, NMA): il messaggio trasmesso dai satelliti GNSS contiene una chiave di criptatura che consente di determinare se il segnale ricevuto provenga da un satellite o sia “falsificato”; il sistema Galileo introdurrà la tecnica di autenticazione nei Commercial Services; 3. correlazione con codici criptati tramite reti di Ricevitori di Riferimento: tramite l’utilizzo di una rete di Ricevitori di Riferimento GNSS collocati in luoghi sicuri sul territorio nazionale, è possibile effettuare una correlazione fra il segnale criptato (es. codice P o PRS Galileo) ricevuto dalle stazioni di Riferimento con quello ricevuto dal ricevitore su campo e determinare l’autenticità del segnale ricevuto. 20 Per rispondere ad una sfida globale è necessaria una risposta globale. Una soluzione che possa garantire la sicurezza ed affidabilità necessarie ad un servizio istituzionale deve garantire un controllo centralizzato degli attacchi sull’intero territorio nazionale. Mentre i primi due metodi saranno applicabili a livello utente e forniranno una prima risposta alla necessità di difesa da tali attacchi, la terza soluzione permette un controllo da parte di un Centro di Controllo a livello Nazionale. Una Rete di Ricevitori di Riferimento GNSS di Monitoraggio consente di erigere una vera barriera istituzionale contro tali attacchi e di non lasciare la difesa e protezione dei dati di posizionamento nelle mani di produttori privati (si pensi al monopolio delle aziende di antivirus in campo informatico ed ai costi di aggiornamento delle relative licenze). Tali Ricevitori di Riferimento fungeranno da vere e proprie “sonde” sul territorio e dovranno essere flessibili, riconfigurabili, adattabili e pronte a rispondere ad ogni tipo di attacco Spoofing. A tale scopo, tali stazioni dovranno basarsi su tecnologia multi-costellazione SDR (Software Defined Radio). Potrebbe essere inoltre pensabile, similmente a quanto in altri paesi, l'istituzione di un Agenzia Board sulla Sicurezza del dato di posizionamento che si occupi anche di tutti gli aspetti correlati (fornitura di chiavi per l’accesso a segnali autenticati, privacy, aspetti legali). 21 Gli “open data” per la calibrazione e il controllo delle politiche di prevenzione dei rischi sul lavoro. L’esperienza dell’Inail A cura di Rosaria Mosca e Massimiliano Veltroni, con la collaborazione di Patrizio Galasso Breve storia dell’esperienza Nel 2012 l’Inail ha avviato un “progetto dati” finalizzato all’identificazione di un insieme “agile” di grandezze necessarie per descrivere il fenomeno degli infortuni sul lavoro e delle malattie professionali. L’insieme fu qualificato “agile” per trasmettere l’idea della facile utilizzazione. E’ stato reso pubblico nel senso dell’“open data”; è stato utilizzato per finalità gestionali (la prima utilizzazione ha fornito l’“appendice statistica” alla relazione annuale del presidente); ha consentito più agevole l’azione di completamento e di scambio della base informativa richiesta da centri di ricerca e da istituzioni. L’identificazione dell’insieme di dati, la loro architettura logica e la costruzione di chiavi di lettura ha richiesto un lavoro di analisi statistica esplorativa e di impostazione metodologica che è documentato nei tre quaderni di ricerca: [1] Ciriello, G., De Felice, M., Mosca, R., Veltroni, M., Infortuni sul lavoro. Un modello di lettura (della numerosità) sugli “open data” dell’Inail, Inail, Quaderni di ricerca, 1, maggio 2013; [2] De Felice, M., Goggiamani, A., Mosca, R., Veltroni, M., Malattie professionali. Un modello di lettura (della numerosità) sugli “open data” dell’Inail, Inail, Quaderni di ricerca, 4, dicembre 2014. [3] De Felice, M., Mosca, R., Rosso, L., Veltroni, M., I vantaggi della prevenzione. Un modello di lettura del costo degli infortuni sugli “open data” dell’Inail, Inail, Quaderni di ricerca, 10, in corso di redazione. Il lavoro è stato svolto da un “gruppo di progetto” coordinato dalla presidenza; i risultati sono stati trasferiti alla tecnostruttura per l’“industrializzazione” e la gestione “a regime” dei processi informatici. Gli “open data” sono disponibili all’indirizzo dati.inail.it Alla ricerca di un’informazione “agile” L’insieme delle grandezze significative è stato identificato procedendo per ambiti (e fasi): gli infortuni, le malattie, i costi. L’identificazione delle grandezze è stata guidata da un’analisi statistica esplorativa, applicata all’insieme dei dati rilevati dall’Inail per le finalità istituzionali (disponibili nei diversi data base di gestione)16. Infortuni – Per rappresentare il fenomeno degli infortuni sul lavoro sono state individuate 25 grandezze caratteristiche, raggruppate in 7 insiemi tematici: A – localizzazione temporale dell’infortunio; B – localizzazione geografica dell’infortunio; C – caratteristiche dell’infortunato; D – 16 Ad esempio, per gli infortuni, sono stati studiati gli andamenti dei ritardi tra accadimento e denuncia; per le malattie sono stati analizzati gli andamenti dei casi denunciati vs i casi attribuibili a causa di lavoro, la distribuzione degli anni trascorsi tra anno di morte e anno di protocollo della denuncia, analisi per classe di età alla denuncia. 22 modalità dell’infortunio; E – caratteristiche amministrative dell’infortunio; F – caratteristiche medico-legali dell’infortunio; G – caratteristiche del datore di lavoro. Malattie – Le malattie professionali sono descritte da 24 grandezze, raggruppate in anch’esse in 7 insiemi tematici: A – localizzazione temporale del caso di malattia; B – localizzazione geografica del caso di malattia; C – caratteristiche del lavoratore; D – caratteristiche nosologiche della malattia; E – caratteristiche amministrative; F – caratteristiche medico-legali della malattia; G – caratteristiche del datore di lavoro. L’elenco completo dei dati e nell’appendice 1. Grandezze di costo – E’ in corso l’analisi dei processi amministrativi delle prestazioni, per individuare le grandezze caratteristiche che consentano di descrivere i vantaggi economici della prevenzione, misurando i costi indotti da infortuni e malattie professionali. Questa fase di attività è previsto si concluda entro il 2015. L’insieme degli assicurati – L’ultima fase del progetto riguarda la costruzione della base informativa dell’insieme dei lavoratori assicurati: per poter misurare – per ciascuna testa assicurata – il “tempo di lavoro nell’anno” e quindi poter calcolare in modo adeguato l’“indice di sinistrosità”. Ne potrà derivare uno strumento di grande efficacia, per calibrare le politiche di prevenzione, per valutarne gli esiti, per decidere di eventuali aggiustamenti. (Una prima sperimentazione ha fornito gli indici presentati sui dati rilevati sino al 2014 per artigiani autonomi, lavoratori parasubordinati, lavoratori “interinali”17). Definire il “linguaggio speciale” Per garantire contenuto informativo ai dati è stato necessario costruire un vocabolario, e controllare la coerenza dei lemmi con la tecnica del thesaurus; definire i principî di “data quality” da rispettare e da formalizzare nei protocolli della “politica dei dati”; è stato progettato il collegamento con insiemi di dati “esterni”, e consentire (con connessioni coerenti) l’arricchimento dei quadri informativi. Il vocabolario – I dati dell’Inail (sugli infortuni e sulle malattie) sono raccolti nelle varie fasi del processo amministrativo e sanitario. Sono caratterizzati da definizioni tipiche di un “linguaggio speciale o settoriale”18, è un linguaggio che deriva da “ceppi” diversi: amministrativo, assicurativo, contabile, giuridico, medico-legale, normativo, statistico; deve tener conto delle convenzioni in uso. Vi si trovano vocaboli e espressioni polirematiche (“frasi”) specifiche19; nel tempo alcune qualificazioni hanno cambiato significato a seguito di modifiche della normativa20. Per garantire che gli “open data” abbiano “forma chiara e comprensibile” (come richiesto dal principio 15 del Codice italiano delle statistiche ufficiali21), siano davvero trasparenti e utilizzabili in modo non ambiguo è stato necessario avviare la costruzione di un vocabolario del “linguaggio 17 Inail, Relazione del presidente, Roma, luglio 2015, pagine 2-3. Un “linguaggio speciale o settoriale” (di “certi mestieri o categorie o professioni”) – come definito in De Mauro, T., Nota linguistica aggiuntiva, in Bocciarelli, R., Ciocca, P., Scrittori italiani di economia, Bari, Laterza, 1994, pagina 410 – “adopera vocaboli assai comuni, ma in accezioni specifiche”. 19 “modalità di accadimento” (dell’infortunio); per quale modalità l’infortunio sul lavoro può essere classificato “in occasione di lavoro” o “in itinere”; “definizione amministrativa” del “caso d’infortunio” (“positivo” se l’infortunio rientra nella “tutela assicurativa”, altrimenti “negativo”, o “in istruttoria” se non è ancora concluso l’iter istruttorio per l’accertamento dei presupposti di ammissione a tutela); “grado di menomazione”, “classe di menomazione”. Lo stesso caso può cambiare “definizione amministrativa” nel tempo (a seguito dei processi di revisione, di riesame per contenzioso amministrativo o giudiziario, o di nuovi eventi esterni) 20 E’ stato particolarmente rilevante (anche per gli effetti sulla base statistica) il cambiamento indotto dal Decreto legislativo 38/2000 per cui, nella valutazione del danno permanente, si è passati dal concetto di ridotta attitudine al lavoro a quello di “danno biologico”, definito come “lesione all’integrità psicofisica, suscettibile di valutazione medico-legale, della persona”. 21 Sistan, Codice italiano delle statistiche ufficiali, emanato dal Comstat con la direttiva n. 10 del 17 marzo 2010. 18 23 speciale dell’Inail”, che perfezioni i glossari e le “avvertenze tecniche per la corretta interpretazione” dei dati, già in uso22. Nella redazione dei lemmi si è seguito il principio della definizione “operazionale”, fondata sui criteri di rilevazione misurazione e calcolo23. Il nucleo del linguaggio speciale è composto da vocaboli e frasi (e organizzato nella forma del vocabolario). Alcune frasi sono in relazione gerarchica (nel senso delle “voci” e “sotto-voci”). Nei lemmi del vocabolario sono rappresentate le ascendenze (da sotto-voce a voce) e le discendenze; sono riportati anche i riferimenti normativi più rilevanti. In questa fase del progetto sono disponibili i vocabolari costruiti per ambito (su infortuni, su malattie); l’unificazione – che è programmato venga conclusa entro marzo 2016 – porterà l’accorpamento di alcuni lemmi e la loro articolazione in “accezioni”. Le potenzialità del thesaurus – Il thesaurus, composto da elenchi di vocaboli, è servito a mettere in collegamento vocaboli e lemmi; è stato mezzo efficace, con la individuazione delle relazioni, per verificare la coerenza logica delle definizioni e dei significati (delle grandezze considerate caratteristiche per la descrizione del fenomeno)24. Insieme al vocabolario costituisce l’ossatura del “modello di lettura” dei dati. Anche il thesaurus è stato costruito “per ambiti” (infortuni e malattie) e dovrà essere unificato. La “data quality” – Per la definizione e costruzione dei processi di data quality si è fatto riferimento agli International standard25 e alla Direttiva europea 2009/138/CE “in materia di accesso ed esercizio delle attività di assicurazione e di riassicurazione” (detta “Solvency II”)26. La politica dei dati – Sempre in riferimento alla Direttiva “Solvency II” è stata impostata la “politica dei dati”. La Direttiva impone la definizione (da parte degli organi responsabili delle imprese) di “a comprehensive policy on data quality”. Perché la “politica dei dati” sia definita in modo “highly efficient” è richiesto che le azioni finalizzate alla tutela della qualità siano formalizzate in protocolli di comportamento: ove siano specificate le tecniche di misurazione della qualità, i criteri da applicare per validare i dati, i ruoli di responsabilità nel processo di “validazione”. Nella Direttiva la politica dei dati è finalizzata innanzitutto alla “sana e prudente gestione” (in particolare a garantire l’affidabilità dei dati necessari per i calcoli delle grandezze tecniche). La definizione precisa e il rispetto rigoroso dei protocolli a tutela della “data quality” è apparsa ancora più rilevante per quelle istituzioni che debbano utilizzare i dati, oltre che per fini gestionali, per informazione pubblica. 22 Un esempio di glossario disponibile, che definisce lo stile anche delle successive edizioni, è in Inail, Centenario inail. Statistiche storiche, Roma, 1983, pagina 9 . 23 Il termine “operazionale” è di Bridgman, che lo utilizzò in The Logic of Modern Physics (New York, 1927); “operationalism” è stato ripreso successivamente (ne La critica operazionale della scienza, Torino, Boringhieri, 1969, alle pagine 232, 240-241), nel senso di “dare la descrizione delle condizioni d'uso della parola”, il “sapere come usarla” (“know how with regard to its usage”). 24 Sono stati seguiti finalità e principî definiti anche in Information and documentation – Thesauri and interoperability with other vocabularies – Part 1: Thesauri for information retrieval, International Standard ISO 25964-1, 2011-08-15, in particolare nelle pagine 12, 103-115, 116. 25 Nel documento Software engineering – Software product Quality Requirements and Evaluation (SQuaRE) – Data quality model, International Standard ISO/IEC 25012:2008(E), alle pagine 4-10, sono individuate 15 caratteristiche rilevanti: “1 – accuracy, 2 – completeness, 3 – consistency, 4 – credibility, 5 – currentness, 6 – accessibility, 7 – compliance, 8 – confidentiality, 9 – efficiency, 10 – precision, 11 – traceability, 12 – understandability, 13 – availability, 14 – portability, 15 – recoverability”. Le caratteristiche da 1 a 5 sono soltanto specifiche del dato (inherent); le 13, 14 e 15 dipendono soltanto dal sistema informatico di riferimento (system dependent) ; le caratteristiche da 6 a 12 hanno entrambe le qualificazioni: “inherent” e “system dependent”. 26 La qualità dei dati è definita nella Direttiva (nell’articolo 86f ) anche in riferimento ai problemi di responsabilità e di governance (approfondimenti su questo aspetto sono in De Felice, M., Moriconi, F., Una nuova finanza d’impresa. Le imprese di assicurazione, Solvency II, le Autorità di vigilanza, Bologna, il Mulino, 2011, pagine 82-88). 24 Il modello di lettura Perché un modello di lettura – Per i dati di tipo statistico, non ha senso pratico parlare di “open data” se non si definisce e si rende esplicito (e quindi trasparente) il “modello di lettura” dei dati27. Definire il modello significa esprimere un’opinione sui modi di rappresentazione del fenomeno (i fatti), cui i dati si riferiscono: quali sono le grandezze ultime necessarie per descrivere in modo adeguato il fenomeno; e poi, come organizzarle in tabelle per agevolarne il confronto, quali sono le definizioni non ambigue (“operazionali”) delle grandezze, quali criteri sono utilizzati per rilevarle o quali formule (algoritmi) servono per calcolarle, quali dati elementari servono per “alimentare” le formule (e realizzare le tabelle). Con questo processo si identifica l’insieme dei dati necessari, e le loro “condizioni d’uso”. Il livello di granularità con cui rendere pubblici i dati dipende poi dai vincoli di privacy, o da altri criteri di opportunità. Definire l’adeguatezza del “modello di lettura” è impegno delicato. Il modello deve soddisfare una sorta di “opinione media” del pubblico degli utilizzatori; perciò, nel caso specifico (della sicurezza nei luoghi di lavoro), è stato verificato – e dovrà continuare a esserlo – con i corpi politici, le istituzioni, le parti sociali, i giornalisti, i ricercatori. La struttura del modello – Il modello di lettura è costituito da tabelle, raggruppate in ambiti: infortuni, malattie, valutazione economica. Ciascuna tabella (“vista”) è organizzata “su temi” e “a strati”, per livello di approfondimento. Possono essere definiti percorsi orizzontali tra temi, sullo stesso strato; linee di approfondimento tematico (a partire dal livello zero, nella logica del “drill down”); letture trasversali, guidate dalle classi di raggruppamento dei dati. Il “modello di lettura” dei dati sugli infortuni è definito su un insieme di 58 tabelle (è descritto nell’appendice 2A). Il “modello di lettura” delle malattie è organizzato in due “blocchi”, composto complessivamente da 104 tabelle (è descritto nell’appendice 2B). Considerata la struttura temporale dei fenomeni, nella sua interezza il modello è applicabile a serie storiche annuali; porzioni di modello sono state applicate alle rilevazioni mensili dei dati raccolti per mese di denuncia. I dati in formato aperto, il calendario di pubblicazione Quali dati – Sono resi pubblici (nel rispetto dei principî della privacy) i dati per singolo caso di infortuni e malattie professionali. Gli insiemi dei dati sono descritti nell’appendice A1 e A2. È in fase di predisposizione l’insieme dei dati sulle caratteristiche economiche dei fenomeni. Il calendario – Con cadenza mensile, per ciascun mese dell’anno aaaa, vengono resi disponibili i dati relativi alle denunce d’infortunio e di malattia registrate dall’inizio dell’anno al mese di riferimento, per gli anni aaaa e aaaa-1. Nel mese di luglio dell’anno aaaa, è resa pubblica la serie storica dei dati (di infortuni e malattie) relativa all’intervallo [aaaa-5, aaaa-1]. Il corredo – I dati sono corredati dal vocabolario, dal thesaurus, dall’insieme delle tabelle dei “modelli di lettura” frazionate per singola regione, e sul totale nazionale (questo insieme costituisce l’“appendice statistica” alla relazione annuale del presidente). 27 Il riferimento al “modello di lettura” richiama, in grande, il problema fondamentale dell’inferenza statistica. Per giudicare i fenomeni (e utilizzare i dati che li descrivono) oltre ai dati serve altro: “occorre in più anche una qualche opinione per interpretarli e per utilizzarli sensatamente” (de Finetti, B., Probabilità di una teoria e probabilità dei fatti, in AA.VV., Studi di probabilità, statistica e ricerca operativa in onore di Giuseppe Pompilj, Gubbio, Oderisi, 1971, pagina 97). D’altra parte il dibattito recente sulle grandi quantità di dati da lavorare con l’“agnostic statistics” (sintetizzato in Anderson, C., The end of theory: will the data deluge makes the scientific method obsolete? , http://www.edge.org, 2008) è solo una rilettura modernista di vecchi dialoghi; e l’idea di una “epistemologia con la forza bruta” pone la domanda: con una ricerca guidata da nessuna ipotesi teorica, non ispirata da alcuna intuizione, “che conoscenza possiamo ottenere?” (Casati, R., Prima lezione di filosofia, Bari, Laterza, 2011, pagina 173). 25 La soluzione tecnologica I dati elaborabili sono pubblicati nel formato CSV, nel formato XML e nel formato RDF. I dati in forma testuale e i testi sono resi disponibili nel formato PDF. È disponibile una sezione SPARQL per consentire interrogazioni sui file RDF. I dati sono regolamentati con licenza IODL v.2.0. Il “data challenge”, il club degli utilizzatori, gli incontri con i giornalisti Data challenge – Il patrimonio informativo reso pubblico è già imponente, e consente analisi di dettaglio che possano integrare e specificare le informazioni del “modello di lettura”. Il Comitato scientifico (per la ricerca) dell’Inail sta valutando come costruire una rete tra i migliori dipartimenti delle migliori università italiane, per proporre un concorso di “data challenge”. I temi aperti sono vari e numerosi: di tecnica informatica (interoperabilità); sulla definizione e applicazione di criteri e metriche di “data quality”; di analisi finanziaria e attuariale; di progettazione di ontologie. E ovviamente di statistica: le tecniche possono andare dalla statistica descrittiva, alla geo-statistica, alle analisi di causalità. Il club – Nella sezione “casi d’uso” del sito, l’Inail raccoglie le comunicazioni degli utenti-utilizzatori (suggerimenti di miglioramento, motivazioni, caratteristiche di elaborazione e eventuali esiti) relative all’utilizzazione degli “open data”. E’ un modo per costituire un “gruppo d’interesse”, per agevolare lo scambio di esperienze e di soluzioni tecniche, e per migliorare le modalità di comunicazione. Con i giornalisti – Al miglioramento della qualità della comunicazione sono finalizzati anche gli incontri con i giornalisti: la presentazione dei dati e il dibattito sugli andamenti dei fenomeni ha consentito di precisare linguaggio e punti di vista, per rendere più efficaci le chiavi di lettura. Un mezzo per collaborare tra istituzioni. Verso il “grappolo degli open data”? La logica degli “open data” – con la tecnica dei metadati – agevola attività interne e la collaborazione tra istituzioni. Utilizzazioni interne La relazione annuale del presidente – Gli “open data” costituiscono gran parte delle informazioni utilizzate per la relazione annuale del presidente. In particolare per la redazione del capitolo su “la situazione del mondo del lavoro nei dati dell’Inail, infortuni e malattie professionali”, e per l’“appendice statistica”. L’“appendice statistica” riporta le tabelle del modello di lettura degli infortuni, e il “blocco 1” del modello applicato ai dati delle malattie. I rapporti regionali – Anche la redazione dei rapporti regionali dell’Inail è stata riorganizzata utilizzando come base informativa preminente l’insieme degli “open data”. Il menabò dei rapporti prevede cinque sezioni: 1. La situazione nel mondo del lavoro nei dati Inail; 2. Infortuni; 3. Malattie professionali; 4. Cura, riabilitazione, reinserimento; 5. Azioni e servizi. I dati sono rappresentati in 23 tabelle. 26 Il dettaglio di sezioni e tabelle è nell’appendice 2. Prospezioni e analisi ad hoc – La struttura degli “open data” rende agevole la realizzazione di “viste” sui dati per l’analisi e lo studio di fenomeni specifici. A questo fine si stanno sperimentando strumenti di data discovery e di visualizzazione interattiva dei dati. E’ una strumentazione che potrà dare sostegno al processo di scelta e pianificazione delle attività, e alla verifica degli esiti. L’aggiornamento mensile di sottoinsiemi significativi di dati consente di curare anche l’aspetto tattico (consapevoli la tattica non è un’appendice della strategia, ma ne costituisce fattore essenziale). Collaborare con le altre istituzioni Il progetto dati è stato inserito tra le attività svolte nell’ambito del Gruppo di Lavoro per la Valorizzazione del Patrimonio Informativo Pubblico (coordinato da AgID). In particolare, il rilascio degli open data relativi alle malattie professionali è stato programmato nell’Agenda Nazionale 2014. La sperimentazione in corso su tecniche di Linked Open Data e la pubblicazione di open data tramite servizi applicativi di tipo Service Oriented potranno consentire più agevole integrazione con dati di altre amministrazioni, favorendo l’interoperabilità e il riuso dei dati. La collaborazione con l’Istat, col Ministero del Lavoro e delle Politiche Sociali, e con l’Inps conferma prospettive, efficacia e potenzialità del progetto. 27 Appendici Appendice 1 Insiemi dei dati resi pubblici A1 – Infortuni In dettaglio si ha: A – localizzazione temporale dell’infortunio: 1 – data di rilevazione: è la data di estrazione dei dati (registrati e validati) dagli archivi; qualifica temporalmente la base informativa; 2 – data di protocollo (del caso): è la data di protocollo del caso; 3 – data di accadimento: è la data in cui si è verificato l’infortunio; 4 – data di definizione: è la data della definizione amministrativa prevalente; 5 – data di morte: è la data di morte dell’infortunato a seguito di infortunio; B – localizzazione geografica dell’infortunio 6 – luogo di accadimento: è il codice ISTAT del comune ove è accaduto l’infortunio; C – caratteristiche dell’infortunato: 7 – identificativo dell’infortunato: codice interno (per analisi longitudinali); 8 – genere: è il genere dell’infortunato; 9 – età: è l’età dell’infortunato alla “data di accadimento”, espressa in anni compiuti; 10 – luogo di nascita: codice catastale del luogo di nascita dell’infortunato; D – modalità dell’infortunio: 11 – modalità di accadimento: codice della modalità (se “in occasione di lavoro”, “in itinere”) 12 – con/senza mezzo di trasporto (coinvolto): codice della modalità ( se “con” o “senza”); E – caratteristiche amministrative dell’infortunio: 13 – identificativo del caso: codice interno (per analisi longitudinali); 14 – definizione amministrativa: codice che caratterizza la situazione amministrativa del caso d’infortunio (se “positivo” o “negativo”) o l’esito “in franchigia” o la situazione “in istruttoria”; 15 – definizione amministrativa dell’esito mortale: codice che caratterizza la situazione amministrativa del caso d’infortunio con esito mortale (se “positivo” o “negativo”) o la situazione “in istruttoria”; 16 – indennizzo: codice della tipologia di indennizzo (se “in temporanea”, “in capitale”, “in rendita diretta”, “in rendita a superstiti”); 17 – causa di negatività per l’esito mortale: codice della causa per cui il caso d’infortunio con esito mortale è definito negativo (se “attività non tutelata”, per “carenza di documentazione valida”, se per “difetto della condizione in itinere”, per “difetto della condizione in occasione di lavoro”, se per “esito mortale non riconducibile all’evento”, se “persona non tutelata”, se per “altre cause di negatività”). F – caratteristiche medico-legali dell’infortunio: 18 – grado di menomazione: grado complessivo della menomazione dell’integrità psicofisica dell’infortunato; 19 – giorni indennizzati: numero dei giorni indennizzati; G – caratteristiche del datore di lavoro 20 – datore di lavoro: codice interno identificativo del datore di lavoro (per analisi longitudinali); 21 – posizione amministrativa territoriale: codice interno; 22 – settore di attività economica: è il codice ATECO primario dell’assicurante; 23 – gestione: se “agricoltura”, “industria e servizi”, “per conto dello Stato”; 24 – gestione tariffaria: se “industria”, “artigianato”, “terziario”, “altre attività”; 25 – grande gruppo tariffario: codice del grande gruppo tariffario (se “lavorazioni agricole e alimenti”; “chimica, carta e cuoi”; “costruzioni e impianti”; “energia e comunicazioni”; “legno e affini”; “metalli e macchinari”; “mineraria rocce e vetro”; “tessile e confezioni”; “trasporti e magazzini”; “attività varie”). A2 – Malattie A – localizzazione temporale del caso di malattia: 1 – data di rilevazione: è la data di estrazione dei dati (registrati e validati) dagli archivi; qualifica temporalmente la base informativa; 2 – data di protocollo (del caso): è la data di protocollo del caso; 3 – data della definizione amministrativa: è 28 la data della definizione amministrativa prevalente; 4 – data di morte: è la data di morte del lavoratore a seguito di malattia; B – localizzazione geografica del caso di malattia: 5 – sede Inail competente: indica la provincia di trattazione del caso di malattia professionale; C – caratteristiche del lavoratore: 6 – identificativo del lavoratore: codice interno (per analisi longitudinali); 7 – genere: è il genere del lavoratore; 8 – luogo di nascita: codice catastale del luogo di nascita del lavoratore; 9 – settore lavorativo: è una classificazione dell’Inail per attribuire la malattia professionale ad un settore di attività lavorativa; 10 – sub-settore lavorativo: è il sottosettore lavorativo cui è riconducibile l’insorgenza della malattia (classificazione dell’Inail); D – caratteristiche nosologiche della malattia: 11 – ICD-10 denunciato: codifica la patologia denunciata secondo la decima revisione della “classificazione internazionale delle malattie e dei problemi sanitari correlati” ; 12 – ICD-10 accertato: codifica la patologia accertata secondo la decima revisione della “classificazione internazionale delle malattie e dei problemi sanitari correlati”; 13 – agente causale accertato: è l’agente, lavorazione o esposizione che può essere causa o concausa di malattia; 14 – qualificazione di legge: indica se la malattia è “tabellata” o “non tabellata” ; 15 – se malattia asbesto-correlata: indica se la patologia è asbesto correlata; E – caratteristiche amministrative: 16 – identificativo del caso: codice interno (per analisi longitudinali); 17 – definizione amministrativa del caso: codice che caratterizza la situazione amministrativa del caso di malattia (se “positivo” o “negativo”) o la situazione “in istruttoria”; 18 – definizione amministrativa del lavoratore: codice che caratterizza la situazione amministrativa prevalente dei casi di malattia denunciati dal lavoratore; 19 – definizione amministrativa dell’esito mortale: codice che caratterizza la situazione amministrativa dell’esito mortale (se “positivo”, “negativo”, o “in istruttoria”) di un caso di malattia professionale; 20 – indennizzo: codice della tipologia di indennizzo (se “in temporanea”, “in capitale”, “in rendita diretta”, “in rendita a superstiti”); F – caratteristiche medico-legali della malattia: 21 – grado di menomazione del lavoratore: grado complessivo della menomazione dell’integrità psicofisica del lavoratore; 22 – grado di menomazione del caso: grado di menomazione dell’integrità psicofisica relativo all’evento attuale; 23 – giorni indennizzati: numero dei giorni di inabilità (temporanea assoluta) indennizzati a seguito della malattia professionale; G – caratteristiche del datore di lavoro: 24 – gestione: se “agricoltura”, “industria e servizi”, “per conto dello Stato”. 29 Appendice 2 2A – Il modello di lettura degli infortuni Nella tavola 1 è schematizzata la struttura dell’insieme delle tabelle su cui è costruito il “modello di lettura” del numero degli infortuni. Tavola 1 – Temi e linee di approfondimento linea: B1 B2 B3 B4 B5 B6 B7 livello 0: B1 B2 B3 B4 B5 B6 B7 B1.1 B2.1 B3.1 B4.1 B5.1 B6.1 B7.1 B1.1.1 B2.1.1 B3.1.1 B4.1.1 B5.1.1 B6.1.1 B7.1.1 B1.1.2 B2.1.2 B3.1.2 B4.1.2 B5.1.2 B6.1.2 B1.1.3 B2.1.3 B3.1.3 B4.1.3 B5.1.3 B6.1.3 1: B4.1.4 B1.2 B2.2 B3.2 B4.2 B5.2 B6.2 B1.3 B2.3 B3.3 B4.3 B5.3 B6.3 B1.4 B2.4 B3.4 B4.4 B5.4 B6.4 B1.5 B2.5 B3.5 B4.5 B5.5 B6.5 2: 3: 4: 5: Linea B1 B1 Denunce d’infortunio per modalità di accadimento e anno di accadimento B1.1 Denunce d’infortunio per gestione, modalità di accadimento e anno di accadimento B1.1.1 Denunce d’infortunio per gestione tariffaria, modalità di accadimento e anno di accadimento B1.1.2 Denunce d’infortunio in occasione di lavoro per settore di attività economica e anno di accadimento. Gestione industria e servizi B1.1.3 Denunce d’infortunio in occasione di lavoro per gestione tariffaria, grande gruppo tariffario e anno di accadimento B1.2 Denunce d’infortunio per luogo di accadimento e anno di accadimento B1.3 Denunce d’infortunio per luogo di nascita dell’infortunato, modalità di accadimento e anno di accadimento B1.4 Denunce d’infortunio per genere dell’infortunato, modalità di accadimento e anno di accadimento B1.5 Denunce d’infortunio per classe d’età dell’infortunato e anno di accadimento 30 Linea B2 B2 Denunce d’infortunio con esito mortale per modalità di accadimento e anno di accadimento B2.1 Denunce d’infortunio con esito mortale per gestione, modalità di accadimento e anno di accadimento B2.1.1 Denunce d’infortunio con esito mortale per gestione tariffaria, modalità di accadimento e anno di accadimento B2.1.2 Denunce d’infortunio con esito mortale in occasione di lavoro per settore di attività economica e anno di accadimento. Gestione industria e servizi B2.1.3 Denunce d’infortunio con esito mortale in occasione di lavoro per gestione tariffaria, grande gruppo tariffario e anno di accadimento B2.2 Denunce d’infortunio con esito mortale per luogo di accadimento e anno di accadimento B2.3 Denunce d’infortunio con esito mortale per luogo di nascita dell’infortunato, modalità di accadimento e anno di accadimento B2.4 Denunce d’infortunio con esito mortale per genere dell’infortunato, modalità di accadimento e anno di accadimento B2.5 Denunce d’infortunio con esito mortale per classe d’età dell’infortunato e anno di accadimento Linea B3 B3 Denunce d’infortunio per anno di accadimento, modalità di accadimento e definizione amministrativa B3.1 Denunce d’infortunio per gestione, modalità di accadimento e definizione amministrativa. Anno di accadimento 2011 B3.1.1 Denunce d’infortunio per gestione tariffaria, modalità di accadimento e definizione amministrativa. Anno di accadimento 2011 B3.1.2 Denunce d’infortunio in occasione di lavoro per settore di attività economica e definizione amministrativa. Gestione industria e servizi, anno di accadimento 2011 B3.1.3 Denunce d’infortunio in occasione di lavoro per gestione tariffaria, grande gruppo tariffario e definizione amministrativa. Anno di accadimento 2011 B3.2 Denunce d’infortunio per luogo di accadimento e definizione amministrativa. Anno di accadimento 2011 B3.3 Denunce d’infortunio per luogo di nascita dell’infortunato, modalità di accadimento e definizione amministrativa. Anno di accadimento 2011 B3.4 Denunce d’infortunio per genere dell’infortunato, modalità di accadimento e definizione amministrativa. Anno di accadimento 2011 B3.5 Denunce d’infortunio per classe d’età dell’infortunato e definizione amministrativa. Anno di accadimento 2011 Linea B4 B4 Denunce d’infortunio con esito mortale per anno di accadimento, modalità di accadimento e definizione amministrativa B4.1 Denunce d’infortunio con esito mortale per gestione, modalità di accadimento e definizione amministrativa. Anno di accadimento 2011 B4.1.1 Denunce d’infortunio con esito mortale per gestione tariffaria, modalità di accadimento e definizione amministrativa. Anno di accadimento 2011 31 B4.1.2 Denunce d’infortunio con esito mortale in occasione di lavoro per settore di attività economica e definizione amministrativa. Gestione industria e servizi, anno di accadimento 2011 B4.1.3 Denunce d’infortunio con esito mortale in occasione di lavoro per gestione tariffaria, grande gruppo tariffario e definizione amministrativa. Anno di accadimento 2011 B4.1.4 Denunce d’infortunio con esito mortale. Analisi delle cause della definizione amministrativa “negativo”. Anno di accadimento 2011 B4.2 Denunce d’infortunio con esito mortale per luogo di accadimento e definizione amministrativa. Anno di accadimento 2011 B4.3 Denunce d’infortunio con esito mortale per luogo di nascita dell’infortunato, modalità di accadimento e definizione amministrativa. Anno di accadimento 2011 B4.4 Denunce d’infortunio con esito mortale per genere dell’infortunato, modalità di accadimento e definizione amministrativa. Anno di accadimento 2011 B4.5 Denunce d’infortunio con esito mortale per classe d’età dell’infortunato e definizione amministrativa. Anno di accadimento 2011 Linea B5 B5 Infortuni accertati positivi per anno di accadimento, modalità di accadimento e classe di menomazione B5.1 Infortuni accertati positivi per gestione, modalità di accadimento e classe di menomazione. Anno di accadimento 2011 B5.1.1 Infortuni accertati positivi per gestione tariffaria, modalità di accadimento e classe di menomazione. Anno di accadimento 2011 B5.1.2 Infortuni in occasione di lavoro accertati positivi per settore di attività economica e classe di menomazione. Gestione industria e servizi, anno di accadimento 2011 B5.1.3 Infortuni in occasione di lavoro accertati positivi per gestione tariffaria, grande gruppo tariffario e anno di accadimento. Anno di accadimento 2011 B5.2 Infortuni accertati positivi per luogo di accadimento e classe di menomazione. Anno di accadimento 2011 B5.3 Infortuni accertati positivi per luogo di nascita dell’infortunato, modalità di accadimento e classe di menomazione. Anno di accadimento 2011 B5.4 Infortuni accertati positivi per genere dell’infortunato, modalità di accadimento e classe di menomazione. Anno di accadimento 2011 B5.5 Infortuni accertati positivi per classe d’età dell’infortunato e classe di menomazione. Anno di accadimento 2011 Linea B6 B6 Infortuni accertati positivi con esito mortale per modalità di accadimento e anno di accadimento B6.1 Infortuni accertati positivi con esito mortale per gestione, modalità di accadimento e anno di accadimento B6.1.1 Infortuni accertati positivi con esito mortale per gestione tariffaria, modalità di accadimento e anno di accadimento B6.1.2 Infortuni accertati positivi con esito mortale per settore di attività economica e anno di accadimento. Gestione industria e servizi B6.1.3 Infortuni accertati positivi con esito mortale in occasione di lavoro per gestione tariffaria, grande gruppo tariffario e anno di accadimento 32 B6.2 B6.3 B6.4 B6.5 Infortuni accertati positivi con esito mortale per luogo di accadimento e anno di accadimento Infortuni accertati positivi con esito mortale per luogo di nascita dell’infortunato, modalità di accadimento e anno di accadimento Infortuni accertati positivi con esito mortale per genere dell’infortunato, modalità di accadimento e anno di accadimento Infortuni accertati positivi con esito mortale per classe d’età dell’infortunato e anno di accadimento Linea B7 B7 Infortuni indennizzati per anno di accadimento, modalità di accadimento e tipo di indennizzo B7.1 Giorni d’inabilità temporanea assoluta per anno di accadimento, modalità di accadimento e classe di menomazione B7.1.1 Giorni medi d’inabilità temporanea assoluta per anno di accadimento, modalità di accadimento e classe di menomazione 33 2B – La lettura delle malattie Nella tavola 2 è schematizzata la struttura dell’insieme delle tabelle del “blocco 1”. Tavola 2 – Temi e linee di approfondimento. La struttura del “blocco 1” linea: M1 M2 M3 M4 M5 M6 M7 livello 0: M1 M2 M3 M4 M5 M6 M7 M1.1 M2.1 M3.1 M4.1 M5.1 1: M7.1 M7.1.1 M1.2 M2.2 M3.2 M4.2 M1.3 M2.3 M3.3 M4.3 M5.2 2: 3: M1.4 4: La struttura dell’insieme delle tabelle del “blocco 2” è schematizzata nella tavola 3. Linea M1 M1 Denunce M1.1 Denunce M1.2 Denunce M1.3 Denunce M1.4 Denunce di di di di di malattie malattie malattie malattie malattie professionali per genere e anno di protocollo professionali per gestione, genere e anno di protocollo professionali per luogo di nascita, genere e anno di protocollo professionali per regione e anno di protocollo professionali per settore ICD-10 denunciato e anno di protocollo Linea M2 M2 Lavoratori e casi di malattie professionali amministrativa. M2.1 Lavoratori e casi di malattie professionali amministrativa. Anno di protocollo 2013 M2.2 Lavoratori e casi di malattie professionali amministrativa. Anno di protocollo 2013 M2.3 Lavoratori e casi di malattie professionali protocollo 2013 per anno di protocollo, genere e definizione per gestione, genere e definizione per luogo di nascita, genere e definizione per regione e definizione amministrativa. Anno di Linea M3 M3 Lavoratori con malattie professionali riconosciute per anno di protocollo, genere e classe di menomazione M3.1 Lavoratori con malattie professionali riconosciute per gestione, genere e classe di menomazione. Anno di protocollo 2013 M3.2 Lavoratori con malattie professionali riconosciute per luogo di nascita, genere e classe di 34 menomazione. Anno di protocollo 2013 M3.3 Lavoratori con malattie professionali riconosciute per regione e classe di menomazione. Anno di protocollo 2013 Linea M4 M4 Lavoratori con malattie professionali asbesto correlate riconosciute per anno di protocollo, genere e classe di menomazione M4.1 Lavoratori con malattie professionali asbesto correlate riconosciute per gestione, genere e classe di menomazione. Anno di protocollo 2013 M4.2 Lavoratori con malattie professionali asbesto correlate riconosciute per luogo di nascita, genere e classe di menomazione. Anno di protocollo 2013 M4.3 Lavoratori con malattie professionali asbesto correlate riconosciute per regione e classe di menomazione. Anno di protocollo 2013 Linea M5 M5 Lavoratori deceduti con riconoscimento di malattia professionale per gestione, genere e anno di decesso M5.1 Lavoratori deceduti con riconoscimento di malattia professionale per luogo di nascita, genere e anno di decesso M5.2 Lavoratori deceduti con riconoscimento di malattia professionale per tipo di malattia, classe di età e anno di decesso Linea M6 M6 Malattie professionali per settore ICD-10 accertato e anno di protocollo Linea M7 M7 Lavoratori con malattie professionali riconosciute per anno di protocollo, genere e tipo indennizzo M7.1 Giorni d’inabilità temporanea assoluta per anno di protocollo, genere e classe di menomazione M7.1.1 Giorni medi d’inabilità temporanea assoluta per anno di protocollo, genere e classe di menomazione 35 Tavola 3 – Temi e linee di approfondimento. La struttura del “blocco 2” linea: MM1 MM2 MM3 MM4 MM5 MM6 MM7 MM8 livello 0: MM1 MM2 MM3 MM4 MM5 MM6 MM7 MM8 MM1.1 MM2.1 MM3.1 MM4.1 MM5.1 MM6.1 MM7.1 MM8.1 MM1.2 MM2.2 MM3.2 MM4.2 MM5.2 MM6.2 MM7.2 MM8.2 1: 2: MM1.2.1 MM2.2.1 MM3.2.1 MM4.2.1 MM5.2.1 MM6.2.1 MM7.2.1 MM8.2.1 MM1.3 MM2.3 MM3.3 MM4.3 MM5.3 MM6.3 MM7.3 MM8.3 3: MM1.3.1 MM2.3.1 MM3.3.1 MM4.3.1 MM5.3.1 MM6.3.1 MM7.3.1 MM8.3.1 MM1.4 MM2.4 MM3.4 MM4.4 MM5.4 MM6.4 MM7.4 MM8.4 4: MM1.4.1 MM2.4.1 MM3.4.1 MM4.4.1 MM5.4.1 MM6.4.1 MM7.4.1 MM8.4.1 MM1.4.2 MM2.4.2 MM3.4.2 MM4.4.2 MM5.4.2 MM6.4.2 MM7.4.2 MM8.4.2 MM1.5 MM2.5 MM3.5 MM4.5 MM5.5 MM6.5 MM7.5 MM8.5 5: Linea MM1 MM1 Tumori (C00-D48) per anno di protocollo, genere e classe ICD-10 MM1.1 Tumori (C00-D48) per anno di protocollo, qualificazione di legge e classe ICD-10 MM1.2 Tumori (C00-D48) per territorio e classe ICD-10. Anno di protocollo 2013 MM1.2.1 Tumori (C00-D48) per territorio e ICD-10. Anno di protocollo 2013 MM1.3 Tumori (C00-D48) per settore, subsettore e classe ICD-10. Anno di protocollo 2013 MM1.3.1 Tumori (C00-D48). Anno di protocollo 2013 MM1.4 Tumori (C00-D48) per anno di protocollo, grande gruppo agente causale e classe ICD10 MM1.4.1 Tumori (C00-D48) per grande gruppo agente causale, gruppo agente causale e classe ICD-10. Anno di protocollo 2013 MM1.4.2 Tumori (C00-D48) a maggior frequenza per ICD-10 e gruppo agente causale. Anno di protocollo 2013 MM1.5 Tumori (C00-D48) per anno di protocollo, grado di menomazione attuale e classe ICD10 Linea MM2 MM2 Malattie del sistema nervoso (G00-G99) per anno di protocollo, genere e classe ICD10 MM2.1 Malattie del sistema nervoso (G00-G99) per anno di protocollo, qualificazione di legge e classe ICD-10 MM2.2 Malattie del sistema nervoso (G00-G99) per territorio e classe ICD-10. Anno di 36 MM2.2.1 MM2.3 MM2.3.1 MM2.4 MM2.4.1 MM2.4.2 MM2.5 protocollo 2013 Malattie del sistema nervoso (G00-G99) per territorio e ICD-10. Anno di protocollo 2013 Malattie del sistema nervoso (G00-G99) per settore, subsettore e classe ICD-10. Anno di protocollo 2013 Malattie del sistema nervoso (G00-G99). Anno di protocollo 2013 Malattie del sistema nervoso (G00-G99) per anno di protocollo, grande gruppo agente causale e classe ICD-10 Malattie del sistema nervoso (G00-G99) per grande gruppo agente causale, gruppo agente causale e classe ICD-10. Anno di protocollo 2013 Malattie del sistema nervoso (G00-G99) a maggior frequenza per ICD-10 e gruppo agente causale. Anno di protocollo 2013 Malattie del sistema nervoso (G00-G99) per anno di protocollo, grado di menomazione attuale e classe ICD-10 Linea MM3 MM3 Malattie dell'orecchio e dell'apofisi mastoide (H60-H95) per anno di protocollo, genere e classe ICD-10 MM3.1 Malattie dell'orecchio e dell'apofisi mastoide (H60-H95) per anno di protocollo, qualificazione di legge e classe ICD-10 MM3.2 Malattie dell'orecchio e dell'apofisi mastoide (H60-H95) per territorio e classe ICD- 10. Anno di protocollo 2013 MM3.2.1 Malattie dell'orecchio e dell'apofisi mastoide (H60-H95) per territorio e ICD-10. Anno di protocollo 2013 MM3.3 Malattie dell'orecchio e dell'apofisi mastoide (H60-H95) per settore, subsettore e classe ICD-10. Anno di protocollo 2013 MM3.3.1 Malattie dell'orecchio e dell'apofisi mastoide (H60-H95). Anno di protocollo 2013 MM3.4 Malattie dell'orecchio e dell'apofisi mastoide (H60-H95) per anno di protocollo, grande gruppo agente causale e classe ICD-10 MM3.4.1 Malattie dell'orecchio e dell'apofisi mastoide (H60-H95) per grande gruppo agente causale, gruppo agente causale e classe ICD-10. Anno di protocollo 2013 MM3.4.2 Malattie dell'orecchio e dell'apofisi mastoide (H60-H95) a maggior frequenza per ICD10 e gruppo agente causale. Anno di protocollo 2013 MM3.5 Malattie dell'orecchio e dell'apofisi mastoide (H60-H95) per anno di protocollo, grado di menomazione attuale e classe ICD-10 Linea MM4 MM4 Malattie del sistema circolatorio 10 MM4.1 Malattie del sistema circolatorio legge e classe ICD-10 MM4.2 Malattie del sistema circolatorio protocollo 2013 MM4.2.1 Malattie del sistema circolatorio 2013 MM4.3 Malattie del sistema circolatorio Anno di protocollo 2013 (I00-I99) per anno di protocollo, genere e classe ICD(I00-I99) per anno di protocollo, qualificazione di (I00-I99) per territorio e classe ICD-10. Anno di (I00-I99) per territorio e ICD-10. Anno di protocollo (I00-I99) per settore, subsettore e classe ICD-10. 37 MM4.3.1 Malattie del sistema circolatorio (I00-I99). Anno di protocollo 2013 MM4.4 Malattie del sistema circolatorio (I00-I99) per anno di protocollo, grande gruppo agente causale e classe ICD-10 MM4.4.1 Malattie del sistema circolatorio (I00-I99) per grande gruppo agente causale, gruppo agente causale e classe ICD-10. Anno di protocollo 2013 MM4.4.2 Malattie del sistema circolatorio (I00-I99) a maggior frequenza per ICD-10 e gruppo agente causale. Anno di protocollo 2013 MM4.5 Malattie del sistema circolatorio (I00-I99) per anno di protocollo, grado di menomazione attuale e classe ICD-10 Linea MM5 MM5 Malattie del sistema respiratorio (J00-J99) per anno di protocollo, genere e classe ICD-10 MM5.1 Malattie del sistema respiratorio (J00-J99) per anno di protocollo, qualificazione di legge e classe ICD-10 MM5.2 Malattie del sistema respiratorio (J00-J99) per territorio e classe ICD-10. Anno di protocollo 2013 MM5.2.1 Malattie del sistema respiratorio (J00-J99) per territorio e ICD-10. Anno di protocollo 2013 MM5.3 Malattie del sistema respiratorio (J00-J99) per settore, subsettore e classe ICD-10. Anno di protocollo 2013 MM5.3.1 Malattie del sistema respiratorio (J00-J99). Anno di protocollo 2013 MM5.4 Malattie del sistema respiratorio (J00-J99) per anno di protocollo, grande gruppo agente causale e classe ICD-10 MM5.4.1 Malattie del sistema respiratorio (J00-J99) per grande gruppo agente causale, gruppo agente causale e classe ICD-10. Anno di protocollo 2013 MM5.4.2 Malattie del sistema respiratorio (J00-J99) a maggior frequenza per ICD-10 e gruppo agente causale. Anno di protocollo 2013 MM5.5 Malattie del sistema respiratorio (J00-J99) per anno di protocollo, grado di menomazione attuale e classe ICD-10 Linea MM6 MM6 Malattie della cute e del tessuto sottocutaneo (L00-L99) per anno di protocollo, genere e classe ICD-10 MM6.1 Malattie della cute e del tessuto sottocutaneo (L00-L99) per anno di protocollo, qualificazione di legge e classe ICD-10 MM6.2 Malattie della cute e del tessuto sottocutaneo (L00-L99) per territorio e classe ICD-10. Anno di protocollo 2013 MM6.2.1 Malattie della cute e del tessuto sottocutaneo (L00-L99) per territorio e ICD-10. Anno di protocollo 2013 MM6.3 Malattie della cute e del tessuto sottocutaneo (L00-L99) per settore, subsettore e classe ICD-10. Anno di protocollo 2013 MM6.3.1 Malattie della cute e del tessuto sottocutaneo (L00-L99). Anno di protocollo 2013 MM6.4 Malattie della cute e del tessuto sottocutaneo (L00-L99) per anno di protocollo, grande gruppo agente causale e classe ICD-10 MM6.4.1 Malattie della cute e del tessuto sottocutaneo (L00-L99) per grande gruppo agente causale, gruppo agente causale e classe ICD-10. Anno di protocollo 2013 38 MM6.4.2 Malattie della cute e del tessuto sottocutaneo (L00-L99) a maggior frequenza per ICD10 e gruppo agente causale. Anno di protocollo 2013 MM6.5 Malattie della cute e del tessuto sottocutaneo (L00-L99) per anno di protocollo, grado di menomazione attuale e classe ICD-10 Linea MM7 MM7 Malattie del sistema osteomuscolare e del tessuto connettivo (M00-M99) per anno di protocollo, genere e classe ICD-10 MM7.1 Malattie del sistema osteomuscolare e del tessuto connettivo (M00-M99) per anno di protocollo, qualificazione di legge e classe ICD-10 MM7.2 Malattie del sistema osteomuscolare e del tessuto connettivo (M00-M99) per territorio e classe ICD-10. Anno di protocollo 2013 MM7.2.1 Malattie del sistema osteomuscolare e del tessuto connettivo (M00-M99) per territorio e ICD-10. Anno di protocollo 2013 MM7.3 Malattie del sistema osteomuscolare e del tessuto connettivo (M00-M99) per settore, subsettore e classe ICD-10. Anno di protocollo 2013 MM7.3.1 Malattie del sistema osteomuscolare e del tessuto connettivo (M00-M99). Anno di protocollo 2013 MM7.4 Malattie del sistema osteomuscolare e del tessuto connettivo (M00-M99) per anno di protocollo, grande gruppo agente causale e classe ICD-10 MM7.4.1 Malattie del sistema osteomuscolare e del tessuto connettivo (M00-M99) per grande gruppo agente causale, gruppo agente causale e classe ICD-10. Anno di protocollo 2013 MM7.4.2 Malattie del sistema osteomuscolare e del tessuto connettivo (M00-M99) a maggior frequenza per ICD-10 e gruppo agente causale. Anno di protocollo 2013 MM7.5 Malattie del sistema osteomuscolare e del tessuto connettivo (M00-M99) per anno di protocollo, grado di menomazione attuale e classe ICD-10 Linea MM8 MM8 Malattie asbesto correlate per anno di protocollo, genere e classe ICD-10 MM8.1 Malattie asbesto correlate per anno di protocollo, qualificazione di legge e classe ICD10 MM8.2 Malattie asbesto correlate per territorio e classe ICD-10. Anno di protocollo 2013 MM8.2.1 Malattie asbesto correlate per territorio e ICD-10. Anno di protocollo 2013 MM8.3 Malattie asbesto correlate per settore, subsettore e classe ICD-10. Anno di protocollo 2013 MM8.3.1 Malattie asbesto correlate. Anno di protocollo 2013 MM8.4 Malattie asbesto correlate per anno di protocollo, grande gruppo agente causale e classe ICD-10 MM8.4.1 Malattie asbesto correlate per grande gruppo agente causale, gruppo agente causale e classe ICD-10. Anno di protocollo 2013 MM8.4.2. Malattie asbesto correlate a maggior frequenza per ICD-10 e gruppo agente causale Anno di protocollo 2013 MM8.5 Malattie asbesto correlate per anno di protocollo, grado di menomazione attuale e classe ICD-10 39 Appendice 2 I dati quantitativi dei rapporti regionali 1. La situazione nel mondo del lavoro nei dati Inail: 1.1 – Posizioni assicurative (Gestione Industria e Servizi); 1.2 – Premi accertati e incassati (Gestione Industria e Servizi); 1.3 – Rateazioni in autoliquidazione; 1.4 – Rateazioni ordinarie; 1.5 – Indennizzi in temporanea; 1.6 – Indennizzi in capitale; 1.7 – Rendite. 2. Infortuni: 2.1 – Denunce di infortunio per modalità e anno di accadimento; 2.2 – Denunce di infortunio con esito mortale per modalità e anno di accadimento; 2.3 – Infortuni accertati positivi per modalità e anno di accadimento; 2.4 – Infortuni accertati positivi per esito e anno di accadimento; 2.5 – Giornate di inabilità temporanea per esito e anno di accadimento. 3. Malattie professionali: 3.1 – Malattie professionali denunciate e riconosciute per anno di protocollo; 3.2 – Lavoratori che hanno denunciato malattie professionali e casi, per definizione amministrativa; 3.3 – Malattie professionali riconosciute con esito mortale per anno di decesso. 4. Cura, riabilitazione, reinserimento: 4.1 – Prestazioni sanitarie per prime cure e tipologia di accadimento; 4.2 – Lavoratori assistiti da équipe multidisciplinari; 4.3 – Progetti di reinserimento; 4.4 – Spese di produzione e acquisto per protesi, ortesi e ausili. 5. Azioni e servizi: 5.1 – Attività di vigilanza; 5.2 – Incentivi per la sicurezza; 5.3 – Riduzione del tasso per prevenzione: numero di istanze accolte e minor importo pagato; 5.4 – Servizi omologativi e certificativi richiesti e resi. 40 L’importanza della geografia come elemento di integrazione e raccordo degli Open Data ed i processi per assicurare la qualità dei dati A cura di Massimo Fustini, Direzione Generale Organizzazione, personale, sistemi informativi e telematica Regione Emilia-Romagna L’esperienza della Regione Emilia-Romagna I dataset geografici sono sicuramente tra quelli più richiesti. I contatori di download dei principali siti Open Data della Pubblica Amministrazione dimostrano che il dato geografico è tra quelli di maggior interesse. Ma come viene utilizzato il dato geografico scaricato? Sostanzialmente in tre diversi modi: 1. come lettura dei fenomeni che avvengono sul territorio (la mappa dell’uso del suolo classifica il territorio dell’intera regione sulla base dell’utilizzazione del territorio ad una certa data); 2. come base di riferimento da utilizzare per mappare informazioni proprie (dai percorsi turistici, agli studi per la localizzazione di nuovi insediamenti, per studiare fenomeni legati all’ambiente, ecc..); 3. come base sulla quale eseguire analisi e fare confronti (ad esempio studiare la copertura territoriale di un determinato servizio). Il dato geografico all’interno della Pubblica Amministrazione gioca un ruolo fondamentale per indirizzare tre aspetti chiave per il successo degli Open Data: 1. possibilità di georiferire Open Data non geografici (es. strutture ricettive, le imprese, i lavori pubblici, i dati sanitari, i dati ambientali, …); 2. raccordo ed armonizzazione dei dati della Amministrazione che pubblica Open Data rispetto alla dimensione geografica; 3. elemento di raccordo fra Open Data provenienti da Pubbliche Amministrazioni diverse. È ormai ampiamente condiviso il principio che il coinvolgimento di cittadini, imprese, ma anche delle diverse divisioni in cui è organizzata la Pubblica Amministrazione nelle decisioni e gestione partecipata del territorio passa attraverso la condivisione della conoscenza. Gli Open Data sono il mezzo principe di questa condivisione, se a fronte di ogni decisione, norma, indirizzo venissero messi a disposizione i dati utilizzati per arrivare a quella decisione la discussione e la socializzazione sarebbero molto più rapide e i conflitti basati sulla non conoscenza condivisa della realtà verrebbero ridotti se non annullati. È qui che l’informazione geografica gioca un ruolo decisivo. Se tutti i dati riguardanti direttamente o indirettamente il territorio (e per gli enti locali questi dati rappresentano la parte più significativa delle informazioni trattate) raccolti e gestiti nell’ambito dei processi della Pubblica Amministrazione fossero correttamente raccordati al territorio sarebbe possibile pubblicare dati georefernziati e di qualità. Il processo di geocodifica delle informazioni gestionali può avvenire in due modi o attraverso il processo di georeferenziazione diretta (assegnando coordinate esplicite alle informazioni trattate) o attraverso il processo di georeferenziazione indiretta, usando nelle banche dati gestionali chiavi geografiche come gli indirizzi, i riferimenti catastali, i nomi dei comuni, i nomi delle strade, i numeri delle sezioni di censimento ISTAT che permettono in modo indiretto di assegnare coordinate geografiche alle entità trattate. Il dato georeferenziato ha una capacità espressiva molto maggiore del semplice dato alfanumerico perché amplia le possibilità di analisi abilitando funzioni geostatistiche come la correlazione 41 territoriale, le analisi di densità, ecc. L’Open Data geografico permette alle imprese di porre domande del tipo: “voglio aprire un nuovo esercizio commerciale a Bologna, dove sono gli altri negozi dello stesso tipo, dove si concentra la mia clientela d’elezione, ci sono in zona immobili commerciali liberi, la zona è servita da mezzi pubblici, in zona ci sono strutture pubbliche che possono attrarre la mia potenziale clientela, ci sono parcheggi a pagamento con cui potrei fare una convenzione, ecc.”; se riusciamo a mettere a disposizione dati di qualità, affidabili ed aggiornati che siano in grado di descrivere il territorio o ciò che vi avviene (sempre nel rispetto della privacy) allora si attiva il mercato, i cittadini, le imprese, gli studiosi e si abilitano anche quelle nuove professioni che all’estero si stanno man mano formando di specialisti che conoscendo il patrimonio informativo sanno dare risposte qualificate a domande complesse come quella dell’esempio precedente. Gli Open Data geografici hanno quindi un forte ruolo di spinta per il coinvolgimento degli utilizzatori esterni ma ha anche un ruolo chiave nella condivisione dei dati all’interno delle singole Pubbliche Amministrazioni e fra Pubbliche Amministrazioni diverse. Sempre con un esempio, si pensi ad una unione di comuni che deve ottimizzare il servizio di polizia municipale o un’area vasta che deve programmare il trasporto locale o la regione che deve programmare iniziative a sostegno delle aree interne, fino all’istruttore di una pratica edilizia o di una pratica SUAP che deve verificare l’ammissibilità di un intervento. Tutti questi soggetti per svolgere il proprio lavoro devono interagire con informazioni riferite al territorio prodotte da enti diversi, tutti hanno l’esigenza di superare i confine degli enti che hanno prodotto i dati e di avere una visione complessiva del dato sull’intero territorio di interesse e soprattutto deve disporre del dato nel momento in cui gli serve (evitando di fare convenzioni, accordi, richieste ad altri enti ma semplicemente prelevando i dati che gli altri enti hanno aperto e messo a disposizione delle altre amministrazioni). Perché tutto questo sia possibile è necessario che i dati geografici di riferimento siano di qualità, affidabili e costantemente aggiornati, per fare questo la Regione Emilia-Romagna ha: creato una infrastruttura di dati territoriali, per la raccolta, l’aggiornamento, la condivisione dei dati geografici; ha definito linee guida per la decertificazione e l’apertura di banche dati per una progressiva apertura dei dati all’interno della PA e verso l’esterno; nell’ambito del processo di decertificazione ha definito e condiviso con gli enti locali un modello di Anagrafe Comunale degli Immobili all’interno della quale vengono gestite le chiavi territoriali di riferimento; ha impostato lo sviluppo delle nuove applicazioni per la digitalizzazione dei processi su un modello di Pubblica Amministrazione digitale che vede la condivisione dei dati e dei documenti come il mezzo per la semplificazione del rapporto con il cittadino. La qualità della dimensione geografica dei dati alfanumerici è quindi la chiave di volta, l’ingrediente di base di una apertura di qualità dei dati. Il modello di gestione ed apertura dei dati geografici in Regione Emilia-Romagna La regione Emilia-Romagna per abilitare il processo di miglioramento continuo dell’informazione geografica come base di raccordo delle altre informazioni prodotte dal sistema degli enti locali ha prodotto un modello di riferimento e implementato degli strumenti per lo sviluppo della conoscenza della geografica del territorio: 1. l’infrastruttura di dati territoriali della regione Emilia-Romagna; 42 2. il sistema dell’Anagrafe Comunale degli Immobili e la gestione del ciclo dell’edilizia unitario per l’intera regione; 3. la pubblicazione come Open Data dei dati geografici di riferimento e la creazione di un insieme di servizi di accesso alle banche dati di riferimento. Il modello è stato sviluppato per rendere interoperabili e confrontabili le fonti dati geografiche gestite ai diversi livelli (regionale e locale) ed alla costituzione di una base di conoscenza condivisa del territorio. All'interno degli enti (siano essi enti locali o direzioni regionali) l'informazione territoriale può essere classificata, ai fini del modello, nelle seguenti categorie: immagini da satellite o foto aeree che forniscono una restituzione fotografica in scala del territorio; oggetti topografici che delimitano e classificano gli elementi fisici e riconoscibili del territorio (edifici, strade, fiumi); il data base topografico contiene tutti gli oggetti topografici e nel suo insieme fornisce una descrizione completa del territorio; oggetti tematici utilizzati per rappresentare sul territorio elementi specifici dei diversi domini; appartengono a questa categoria gli elaborati di una piano urbanistico, la carta dell'uso del suolo, la mappa delle aziende agricole, la mappa delle farmacie, le linee di trasporto pubblico, le reti tecnologiche, la mappa catastale; oggetti di riferimento: sono quegli oggetti territoriali utilizzati per riferire al territorio le informazioni alfanumeriche; appartengono a questa categoria ad esempio i numeri civici, le particelle catastali, le sezioni di censimento, i limiti amministrativi, ecc. A queste si accompagna una modalità standard di definizione dei metadati descrittivi delle informazioni (che per quanto riguarda i dati territoriali è particolarmente importante in quanto definisce per ogni fonte le modalità di costruzione dei dati, l'estensione spaziale e temporale, gli uffici di riferimento, ecc..) tutti dati necessari per poter stabilire se e come il dato può essere utilizzato. L'obiettivo del modello è quello di definire il modo in cui gli enti, a prescindere dalle modalità con cui vengono gestiti internamente, possa rendere fruibili ed interoperabili i dati territoriali in modo da creare una base di conoscenza completa e condivisa dell'intero territorio regionale. I principi che stanno alla base del modello sono quelli della non duplicazione del dato territoriale ma del suo riuso attraverso servizi standard perseguendo in questo modo l'obiettivo della integrità, qualità e quindi affidabilità del dato. I comuni, le direzioni regionali ed altri enti territoriali nell'ambito dei propri compiti di istituto, producono e gestiscono sia oggetti geografici di riferimento fondamentali per il modello (per i comuni le anagrafi comunali degli immobili) che oggetti tematici (p.e. piani urbanistici) e riferiscono le proprie banche dati gestionali agli oggetti di riferimento estendendo in questo modo l'insieme di strati informativi della propria infrastruttura di dati geografici. I dati prodotti sono nella maggior parte dei casi di interesse generale. Il modello ha definito la modalità con la quale la Regione rende disponibili i dati geografici. Le modalità adottate sono standard, devono essere adottate dagli enti locali per la fruizione dei dati geografici prodotti dalla regione e possono essere utilizzate per la pubblicazione dei dati degli enti locali verso la regione e più in generale verso il mondo esterno. I servizi territoriali previsti dal modello sono rappresentati nella figura seguente e successivamente descritti in maggior dettaglio: 43 Figura 5 Modello di gestione ed apertura dei dati geografici in Regione Emilia-Romagna Questa la descrizione del modello: Servizi di catalogo: si tratta di servizi che consentono di scoprire di quali risorse cartografiche dispone un ente e delle modalità con le quali l'ente le rende disponibili sia in forma cartacea che in forma digitale. Se le fonti cartografiche sono pubblicate in forma digitale il catalogo specifica le modalità di accesso. Questi servizi si basano sulla consultazione dei metadati; Servizi di visualizzazione delle mappe: fanno parte di questo insieme i servizi standard OGC per la pubblicazione di immagini georeferenziate create dinamicamente attraverso l’interrogazione delle banche dati geografiche e servizi di pubblicazione di mappe statiche che hanno la caratteristica di essere veloci e fluide come le mappe di Google; Servizi di geocodifica: comprendono tutti i servizi necessari per collegare informazioni alfanumeriche tramite l'utilizzo di chiavi territoriali (via e numero civico, foglio e mappale, UUID) al territorio, fanno parte di questo insieme i servizi per la ricerca in mappa utilizzando toponimi (nomi di località, fiumi, monti, case), per ottenere i nomi dei luoghi date le coordinate e per la geocodifica di banche dati alfanumeriche; Servizi di accesso ai dati geografici, fanno parte di questo insieme i servizi che consentono di estrarre i dati dai db geografici. I servizi sono standard OGC e permettono, con un apposito linguaggio, di estrarre dati geografici e un insieme di servizi per l'estrazione dei dati nei formati standard più diffusi. A questo ambito appartengono anche i servizi per la pubblicazione come Open Data e Linked Open Data dei dati geografici. Vengono ricompresi in questo insieme anche i servizi di analisi di prossimità e di routing; Servizi di aggiornamento dei dati geografici: fanno parte di questo insieme i servizi per l'aggiornamento del db topografico, di conferimento di nuove informazioni geografiche nei db dell'ente e di editing via web; 44 Servizi di conversione di coordinate: I servizi che fanno parte del modello sono per la maggior parte standard ISO supportati sia da prodotti di mercato, sia da prodotti Open Source ai quali si aggiunge, per i servizi specifici regionali, la disponibilità di software a riuso che possono essere utilizzati per l'erogazione dei servizi. I servizi che fanno parte del modello sono indipendenti fra loro e garantiscono la fruizione delle singole funzionalità secondo le interfacce standard definite dal modello, indipendentemente dalla presenza degli altri servizi. Le linee guida per la decertificazione in Emilia-Romagna In coda a queste premesse va fatto cenno al “Modello di Amministrazione Digitale - MAD” che la Regione ha delineato con la D.G.R. n. 983/2012 (allegato 2B: “Disegno della PA Digitale: dematerializzata, interconnessa e cooperativa”). Il MAD rappresenta il modello concettuale cui la regione guarda al fine di ripensare la propria organizzazione e azione amministrativa in un’ottica di transizione verso il digitale. In questa sede va tenuto presente che, per la visione di insieme con cui è stato concepito, il MAD supporta il concetto di decertificazione, sia promuovendo la pubblicazione di servizi standard sulle banche dati fondamentali della Pubblica Amministrazione, sia definendo opportune interfacce di accesso che permettano, nello specifico, “una completa decertificazione nei rapporti fra PA e privati attraverso l'acquisizione diretta dei dati presso le amministrazioni certificanti da parte delle amministrazioni procedenti o, in alternativa, la produzione da parte degli interessati solo di dichiarazioni sostitutive di certificazione o dell'atto di notorietà”. Solo se i diversi sistemi parlano un linguaggio comune sarà possibile per ogni PA rendere disponibile il proprio patrimonio informativo alle altre PA e viceversa. L’apertura di anagrafi certificanti all’interno della PA e, nei limiti del rispetto della privacy, verso cittadini, è visto come fattore abilitante di una PA digitale di qualità ed efficiente. Al fine di accelerare il processo di decertificazione e quindi di apertura delle banche dati di riferimento della PA è stato prodotto un insieme di linee guida di natura normativa, tecnica ed organizzativa finalizzate a rendere accessibili le anagrafi certificanti presenti all’interno della Pubblica Amministrazione della Regione Emilia-Romagna. Le linee guida delineano un percorso di individuazione, verifica documentazione ed apertura delle anagrafi certificanti. Le linee guida sono state applicate alle quattro banche dati fondamentali per il funzionamento delle amministrazioni locali e sono stati implementati e messi in produzione i servizi di accesso ai dati stessi i quali, salvo eventuali limitazioni o impedimenti specifici, sono stati pubblicati come Open Data: Anagrafe della popolazione residente; Anagrafe delle imprese; Anagrafe comunale degli immobili; Database topografico; Particolarmente rilevante il sistema di gestione dell'anagrafe comunale degli immobili che costituisce l'elemento chiave per il raccordo dei dati relativi agli immobili: l’anagrafe permette di rispondere tempestivamente a domande relative agli immobili, quali: Dove è? Come è fatto? Cosa è legittimo? Cosa è abusivo? Chi ha diritti? Quali interventi sono ammessi? Quale l’efficienza energetica? Dove riqualificare? Dove ricostruire? Quali attività economiche vi sono? Quante persone vi abitano? Quali i consumi? Il sistema è una banca dati certificante che gestisce le chiavi territoriali fondamentali e che garantisce la correlazione alla fonte delle informazioni catastali con quelle comunali e descrive compiutamente gli immobili sotto tutti i profili previsti dalle norme 45 vigenti ed abilita la possibilità di decertificare le informazioni relative agli immobili. I dati relativi agli immobili, ai numeri civici ed alla loro collocazione sono pubblicati, come Open Data, Linked Open Data e Open Services, e resi disponibili per poter essere utilizzati, riferiti, integrati con informazioni provenienti da altri soggetti pubblici e privati. I dati correlati agli identificativi territoriali e pubblicati come Open Data o attraverso Open Services sono in questo modo fra loro confrontabili rispetto al territorio perché condividono un unico modello aperto di georeferenziazione delle informazioni. Il modello di circolarità ed aggiornamento dell’informazioni geografica di riferimento Diventa quindi di fondamentale importanza mettere a disposizione della PA dei cittadini e delle imprese informazioni geografiche di base costantemente aggiornate, di alta qualità ed affidabilità. La regione e diversi comuni da tempo rendono disponibili le proprie basi di dati geografiche ai privati (professionisti, studiosi, imprese) che le utilizzano per la propria attività professionale. Alcuni enti hanno visto in questa azione un mezzo per creare una fonte affidabile e continua di aggiornamento della propria cartografia, ricevendo dai professionisti, nell'ambito del processo di gestione delle pratiche edilizie, elaborati cartografici già correttamente georiferiti. La logica open sottesa consente di creare un circolo virtuoso di aggiornamento dei dati geografici: gli enti mettono a disposizione i propri dati geografici, il mondo esterno li usa per i propri scopi, così generando nuove informazioni correttamente georiferite e linkate al territorio. Quindi gli enti locali acquisiscono nell’ambito dei propri processi istituzionali le nuove informazioni, le consolidano nelle proprie basi geografiche complessive e ne certificano la qualità. Si alimenta così un processo di co-aggiornamento della conoscenza del territorio. Da questo punto di vista, gli strati informativi più importanti fra quelli che possono essere sono i riferimenti territoriali: numeri civici, mappali catastali, toponomastica. Essi rappresentano le chiavi di raccordo con il territorio dei diversi Open Data pubblicati non solo dagli enti locali ma anche da altri soggetti che operano sullo stesso territorio (utilities e gestori delle reti, regione, provincia, associazioni, l’elenco è virtualmente infinito con gli opportuni strumenti). Questi riferimenti, laddove esista un sistema informativo territoriale comunale, sono contenuti nelle banche dati gestite dal comune per i propri compiti istituzionali e per questo normalmente caratterizzati da un livello di qualità e affidabilità elevato e non raggiungibile da altri soggetti produttori di dati geografici (i big vendor di grafi stradali o i portali globali come Google o Microsoft). La regione ha messo a fattor comune la modalità di gestione ed aggiornamento delle chiavi territoriali che deve essere collocato al livello dei comuni (solo i comuni governano le fonti informative necessarie per tenere aggiornata la numerazione civica e la toponomastica), in modo che si arrivi anche alla standardizzazione delle modalità di gestione e di pubblicazione delle chiavi di riferimento. È stato inoltre definito un “modello dati operazionale” ed un “modello di gestione dei dati relativi agli immobili” (che ricomprende anche la gestione della toponomastica e della numerazione civica) e sono state realizzate delle componenti software riusabili, con lo scopo di diffondere in tutti gli enti un modello uniforme di creazione e gestione dell'anagrafe degli immobili (in regione Emilia-Romagna la quasi totalità dei comuni ha aderito al progetto). I dati degli immobili, omogenei fra loro, certificati e di alta qualità, previa opportuna valutazione di effettiva possibilità, vengono pubblicati come Open Data, Open Services e Linked Open Data e messi a disposizione delle città. Il modello estende quanto realizzato nell'ambito del progetto SigmaTER, modello oggi in uso in diverse regioni italiane, andando ad aggiungere alla porzione di anagrafe degli immobili gestita dall'Agenzia delle Entrate (ex Agenzia del Territorio) le componenti informative di origine comunale (come ad esempio la numerazione civica) creando in questo modo l'Anagrafe Comunale degli 46 Immobili. Il modello prevede che l'Anagrafe Comunale degli Immobili venga aggiornata con il flusso di dati generato dalle pratiche edilizie presentate in forma digitale dai professionisti (in regione Emilia-Romagna, come in altre regioni d’Italia, la modulistica per l’edilizia è stata unificata). Dai flussi di aggiornamento dell’anagrafe degli immobili nascono anche i flussi di aggiornamento di alcuni strati del database topografico regionale che, in questo modo viene anch’esso mantenuto aggiornato. La pubblicazione dei dati geografici come Open Data e Open Services attiva un circolo virtuoso che si conclude con la produzione di nuovi dati geografici utili per aggiornare le banche dati geografiche degli enti. Gli Open Data geografici come uno dei fattori abilitanti la Smart Community La Smart Community è una comunità che si fonda su una forte interconnessione basata su un continuo scambio di informazioni fra i diversi attori (Pubblica Amministrazione, multi utilities, società di trasporti, associazioni, cittadini, imprese, università, protezione civile, professionisti) che interagendo ne determinano il funzionamento. Un modello integrato è piattaforma abilitante in quanto offre servizi, anagrafi di riferimento sempre aggiornate e di qualità e un sistema di interconnessione fra le diverse Pubbliche Amministrazioni sul quale si fondano le future applicazioni per la Smart Community. La condivisione delle anagrafi fondanti e dei loro sistemi di chiavi ed identificativi crea la base di conoscenza comune ed omogenea del territorio e di ciò che vi insiste con una estensione che va al di la dei confini della singola città, tale estensione mette in condizione il pubblico e il privato di poter realizzare sistemi di gestione della città nella sua forma reale, sistemi che mettendo in correlazione informazioni provenienti anche dal mondo privato e dai sistemi di sensori con quelle provenienti dalle anagrafi e dai servizi territoriali, possono permettere di affrontare temi anche molto complessi legati alla sicurezza, al risparmio energetico ed in generale al benessere della popolazione e così via. Il processo di semplificazione in atto fa sicuramente parte del processo di creazione della Smart Community nella quale la Pubblica Amministrazione diventa leggera per il cittadino e l'impresa, senza rinunciare ai propri compiti di istituto di governo e di controllo; la circolarità e disponibilità delle informazioni ed una conoscenza sempre aggiornata del territorio permette all'impresa ed al cittadino di concentrare l'interazione con la Pubblica Amministrazione sul merito delle questioni annullando il tempo e lo sforzo necessario per recuperare quello che l'Amministrazione già conosce. Il modello di PA digitale che si sta consolidando a livello internazionale fa leva sulla standardizzazione di Open Services e Open Data visti sia come mezzo per l’integrazione interna fra le diverse componenti della PA che come elemento abilitante per la realizzazione di applicazioni innovative per la Smart Community che ci si aspetta verranno realizzate principalmente dal mondo privato. La Pubblica Amministrazione aprendo Dati e Servizi di qualità introduce standardizzazione e uniformità abilitando in questo modo la realizzazione di servizi (prevalentemente mobile) che integrando nei servizi esposti dalla PA informazioni provenienti dal settore privato rispondono alle specifiche esigenze del singolo attore della Smart Community. Considerazioni conclusive La disponibilità di Open Data della Pubblica Amministrazione ha come fini primari la valorizzazione del patrimonio informativo pubblico, e l’abilitazione e “l’essere motore” di iniziative imprenditoriali (es: creazione servizi mobile, data journalism, data analysis) e civiche (cittadini, associazioni, civic hacking). Tale disponibilità di dati non deve essere intesa esclusivamente rivolta verso l’esterno ma anche alle dimensioni interne della specifica Amministrazione e tra Pubbliche Amministrazioni, vista come mezzo per l’integrazione interna fra le diverse componenti della PA, innescando anche 47 meccanismi di miglioramento in termini di efficienza. A tal fine, è necessario predisporre modelli e sistemi (in termini di processi) “sostenibili” che abilitino la creazione di Open Data di qualità in termini di omogeneità, riferimenti comuni, ecc. Tali modelli e sistemi devono prevedere il coinvolgimento attivo di tutti gli attori (Pubbliche Amministrazioni principalmente, ma anche privati) coinvolti nella generazione e gestione dei dati. L’Open Data e l’Open Government generano quindi impatti sia all’interno dell’Amministrazione (sulle strutture organizzative, fino anche ai “rapporti di potere”), sia all’esterno; per questo motivo è di fondamentale importanza definire chiaramente gli obiettivi che ci si pone con queste azioni e individuare i relativi strumenti di valutazione e benchmarking. La “dimensione” geografica dei dati è elemento di integrazione, confronto e validazione; gli Open Data e in particolare gli Open Data geografici, sono uno dei fattori abilitanti la Smart Community. La disponibilità di banche dati certificate e certificanti è fattore di primaria importanza per l’assicurazione della qualità dei dati nel tempo. 48 L’esperienza Open Data in Roma Servizi per la Mobilità A cura di Stefano Giovenali, Responsabile della Struttura Organizzativa Servizi della Mobilità, Roma Servizi per la Mobilità Gli Open Data per l’infomobilità L’Agenzia Roma Servizi per la Mobilità dispone dal 2007 di una piattaforma di infomobilità che eroga servizi di ausilio agli spostamenti per cittadini, turisti e city-users. Attraverso sistemi di monitoraggio eterogenei, l’Agenzia “fotografa” e storicizza lo stato del traffico cittadino e la posizione puntuale dei veicoli del trasporto pubblico locale. I dati sono poi forniti agli utenti attraverso diversi canali e servizi. Tra i servizi maggiormente utilizzati si ricordano: Cerca linea: il servizio permette di cercare le linee del trasporto pubblico locale e mostrarne le informazioni statiche (percorsi, fermate, mappe) e dinamiche (tempi di percorrenza misurati, posizione dei veicoli, tempi di attesa alle fermate); Cerca percorso: è un route planner multimodale dinamico. Attraverso la conoscenza dello stato effettivo della rete, il servizio suggerisce istante per istante l’itinerario migliore per raggiungere la destinazione. I modi di trasporto considerati sono: trasporto pubblico (Autobus e tram urbani, metropolitana, ferrovie suburbane e regionali), trasporto privato e mobilità sostenibile (bike and ride, park and ride, car sharing, car pooling); News: il servizio fornisce notizie sulla mobilità pubblica e privata. L’intera piattaforma di infomobilità è stata progettata, sviluppata e mantenuta internamente da “Roma Servizi per la Mobilità”; l’Università di Roma “Tor Vergata” ha validato l’approccio dinamico del route planner, confrontando gli itinerari suggeriti da esso con quelli proposti da un route planner statico commerciale (Google Transit) e misurando il miglioramento della qualità delle soluzioni. I servizi di infomobilità della piattaforma sono erogati sui seguenti canali: il sito web mobile muovi.roma.it, ottimizzato per i dispositivi mobili anche di vecchia generazione; i siti web curati dall’Agenzia, agenziamobilita.roma.it e muoversiaroma.it, tramite una web app interattiva; l’app ufficiale “Muoversi a Roma”, per smartphone Android e iOS. A partire dal 2012 i principali dati e servizi della piattaforma di infomobilità sono esposti pubblicamente come Open Data. La licenza adottata dall’Agenzia è di tipo Creative Commons Attribuzione 3.0 Italia. Inoltre, è pubblicato il codice sorgente della maggior parte della piattaforma di infomobilità, con licenza GNU General Public License v2. Allo stato attuale, l’Agenzia pubblica in modo aperto i seguenti elementi: dati statici o dati che cambiano lentamente nel tempo: struttura della rete del trasporto pubblico locale, collocazione degli impianti semaforici, confini e varchi di accesso a zone a traffico limitato e aree interessate da particolari discipline di traffico, parcheggi di scambio; servizi dinamici: i servizi Cerca Linea e Cerca Percorso permettono di conoscere lo stato della rete del trasporto pubblico locale in tempo reale e di pianificare gli spostamenti. Il servizio Tempi di percorrenza misura il tempo di percorrenza con mezzo privato delle principali arterie cittadine. Il servizio News fornisce informazioni sulla mobilità pubblica o 49 privata. Il servizio ZTL informa sulla programmazione e sullo stato attuale delle zone a traffico limitato; codice sorgente: la piattaforma di infomobilità dell’Agenzia è sviluppata internamente. Gran parte del codice realizzato è pubblicato con licenza aperta sulla piattaforma di condivisione del codice Bitbucket. L’obiettivo della condivisione è duplice: permettere il riutilizzo e la modifica del codice da parte di enti terzi, istituzioni e organizzazioni; e innescare un processo di partecipazione attiva dei cittadini, che hanno la possibilità di apportare modifiche migliorative al software, e proporne l’adozione all’Agenzia stessa. In particolare l’Agenzia pubblica il codice della parte algoritmica (cerca percorso in tempo reale, stima dei tempi di percorrenza), del sito web mobile, della web app e dell’app Androiod/iOS. L’Agenzia, infine, consente e incoraggia l’inclusione dei propri servizi di infomobilità all’interno di siti web di terze parti non solo attraverso gli Open Data, ma anche tramite strumenti per webmaster, permettendo anche la personalizzazione dei servizi offerti. L’accesso ai dati dell’Agenzia Il punto di partenza per l’accesso agli Open Data dell’Agenzia è il sito web http://dati.muovi.roma.it. Le modalità di accesso variano a seconda della tipologia di dato esposto, e sono le seguenti: dati statici: i dataset statici sono esposti attraverso file (es. il file GTFS con la descrizione della rete del trasporto pubblico locale), oppure mediante un sistema GIS che offre i dati geografici attraverso il protocollo GeoServices REST. Non è necessaria alcuna registrazione per scaricare i dati statici; servizi dinamici: L’API dei servizi di infomobilità è esposta mediante web service XML-RPC. Per accedere ai servizi è necessaria la registrazione come sviluppatore. La registrazione è gratuita e non richiede l’approvazione da parte dell’Agenzia; permette all’Agenzia di controllare il corretto utilizzo dei servizi, in conformità alla licenza CC-BY-3.0-IT e secondo un criterio di “fair usage”. Sul sito web è presente la documentazione completa dell’API, e alcuni esempi di utilizzo dei dati; codice sorgente: Il codice sorgente della piattaforma è pubblicato su Bitbucket. È possibile scaricare direttamente il codice, oppure effettuare un fork del repository Mercurial e apportare modifiche. Un sistema di trouble ticketing consente di segnalare malfunzionamenti. È anche possibile scaricare un’immagine di una macchina virtuale con una copia della piattaforma pronta all’uso (previo riallineamento del codice e dei dati). Gli utenti degli Open Data Alla data odierna risultano registrati come sviluppatori 447 soggetti. Tra questi, diversi soggetti sono impegnati nella realizzazione e nel rilascio di servizi che sfruttano i dati dell’agenzia per offrire un servizio proprio, di solito catalogabile nelle seguenti categorie: App “locali” per la mobilità romana: rientrano in questa categoria applicazioni come Autobus Roma, Probus Roma, Roma Bus, Roma Giorno&Notte (il Messaggero), ecc; App internazionali: Citymapper, Moovit, Transit App, Google Maps (solo dati statici), Ricerca e sviluppo da parte di università (es. Tor Vergata), partner di progetti europei (es. IBM Research), ecc. 50 Tramite gli strumenti per webmaster, la web app di RSM è inclusa in diversi siti istituzionali e non, come ad esempio i siti di Roma Capitale e i siti del quotidiano Leggo, oltre ad essere incorporata nei siti intranet di aziende romane come servizio per il mobility management. Le sfide per il prossimo futuro Come fin ora descritto, l’esperienza di Roma Servizi della Mobilità nello sviluppo di politiche sugli Open Data è da considerarsi sicuramente un caso di successo, in particolar modo per il livello di riutilizzo da parte di soggetti terzi dei dati pubblicati. Rimangono tuttavia grandi margini di miglioramento che stanno peraltro già guidando le attività in corso. Le risorse necessarie all’adeguato funzionamento delle architetture tecnologiche alla base dell’erogazione dei servizi open crescono, evidentemente, di pari passo con la diffusione dei servizi stessi: ciò pone un problema di sostenibilità economica della piattaforma informativa che sta portando alla rivisitazione del modello stesso di condivisione. Fino ad oggi, infatti, nella fase iniziale dell’operazione, si è partiti dal presupposto che le risorse di calcolo a cui gli stakeholders potevano attingere per il riutilizzo dei servizi dovessero essere messe a disposizione da Roma Servizi per la Mobilità. Un modello diverso è più sostenibile potrebbe prevedere che siano proprio gli stakeholders ad assumersi l’onere dei costi computazionali. Ciò – data ormai per acquisita la maturità dei servizi – corrisponderebbe anche ad un criterio di maggiore equità per il sistema visto nel suo complesso. Per il raggiungimento di tale obiettivo si possono intravedere diverse soluzioni organizzative e tecnologiche e, a ben vedere, si potrebbe immaginare una strada analoga a quella percorsa dai diversi soggetti erogatori di servizi di cloud computing: un provider – in questo caso Roma Servizi per la Mobilità – metterebbe a disposizione liberamente le tecnologie ma farebbe pagare le risorse necessarie al loro funzionamento. Una soluzione di questo tipo può presentare diverse criticità: in primo luogo non si può non notare che la complessità nella gestione di un servizio di cloud computing è alta e che una simile ipotesi implicherebbe necessariamente un’organizzazione interna che rischierebbe di assorbire eccessive energie rispetto ai benefici tangibili che potrebbe portare. In secondo luogo, l’introduzione di un rapporto contrattuale monetizzato con gli stakeholders potrebbe inquinare il valore culturale dell’operazione e finirebbe con ogni probabilità per far apparire ridotta la natura open della condivisione. È auspicabile, tuttavia, che su tali aspetti venga effettuata un’azione di coordinamento a livello centrale, da un soggetto istituzionale, perché è del tutto evidente che con l’aumentare dei dati disponibili e delle tecnologie sottostanti, il requisito di sostenibilità economica delle piattaforma di pubblicazione diventerà sempre più prioritario. Un modello alternativo prevede invece che i singoli stakeholders possano singolarmente installare in maniera autonoma su dei propri server i motori di calcolo finalizzati alla erogazione dei servizi. Si prospetta quindi uno scenario in cui si materializza una rete di provider che erogano i servizi in maniera indipendente, connessi soltanto dalla fonte originaria del dato che rimarrebbe in Roma Servizi per la Mobilità. Il punto di forza più immediato per Roma Servizi per la Mobilità consisterebbe nell’abbattimento degli oneri computazionali, visto che le richieste da servire si limiterebbero a clienti diretti e ai singoli stakeholders, e non alle richieste dei clienti di questi ultimi. Non sono poche le criticità da tenere in considerazione: una di queste è la perdita del controllo diretto sul monitoraggio degli accessi ai servizi: mentre ora, infatti, ogni richiesta passa per i server di Roma Servizi per la Mobilità, domani le richieste dei clienti finali sarebbero gestite unicamente dagli stakeholders. Perdere la misura della diffusione di questi servizi implica, per esempio, una maggiore difficoltà nella valutazione degli impatti delle politiche sugli Open Data nel loro complesso. Va detto tuttavia che nell’insieme degli stakeholders stanno naturalmente emergendo dei soggetti più forti, in numero assai limitato, con cui è ragionevole riuscire ad instaurare rapporti 51 strutturati per accedere a queste informazioni. Da notare anche che un provvedimento di questo tipo scarica (o meglio sarebbe dire “distribuisce”) una parte della complessità sugli altri provider. Ciò significa che alcuni di questi dovranno dotarsi di infrastrutture proprie con il relativo esborso economico. In ogni caso, per sua stessa natura, una simile politica è graduabile: piccoli provider potranno necessitare di un piccolo server, provider più importanti dovranno sostenere spese più ingenti che tuttavia risulterebbero giustificate dalla numerosità dei propri clienti. Ancora, sarà possibile introdurre sin dall’inizio una gradualità nella distribuzione, ciò potrebbe essere fatto proprio sulla base degli accessi richiesti da ogni applicazione: fino ad un certo numero potrebbero essere accettati, oltre dovrebbero essere presi in carico per intero. Il rischio è che il totale del carico sia così parcellizzato da impedire quest’ultimo accorgimento, e ciò dovrà essere valutato nella fase attuativa. Un prerequisito non così intuitivo per poter attuare questa strategia è l’adozione di tecnologie che siano non semplicemente open source, bensì siano riconosciute come soluzioni standard. Roma Servizi per la Mobilità ha già rilasciato tutto il codice sorgente della propria piattaforma con licenza open source, tuttavia la scelta che è stata fatta negli anni passati – anche per mancanza di alternative open con il giusto livello di maturità – è stata quella di uno sviluppo ex novo dei software alla base dei servizi open. Il progetto, per quanto accessibile, non risulta nei fatti davvero mantenibile, in quanto gli stakeholders dovrebbero farsi carico di installare e mantenere una soluzione unica per cui non esiste una vera e propria community di sviluppatori in grado di dare un’assistenza adeguata e di instaurare quel circuito virtuoso di condivisione della conoscenza alla base della filosofia open source, indispensabile per garantire un carattere di sostenibilità al software così sviluppato. Due sono le novità – in tal senso – emerse negli ultimi anni: da un lato la promozione da parte di Google dello standard (de facto) GTFS (General Transit Feed Specification) e il consolidamento del progetto Open Trip Planner. Il primo riguarda il modo in cui rappresentare una rete del Trasporto Pubblico e gli aggiornamenti in tempo reale del suo stato (posizione dei veicoli, tempi di arrivo alle fermate, variazioni estemporanee del servizio). Il secondo è un progetto correlato all’assai più famosa piattaforma Open Street Map e consiste in un motore dinamico e multimodale di calcolo del percorso, proprio basato sullo standard GTFS. La presenza di queste due nuove alternative dà forza e concretezza all’approccio ipotizzato: è ragionevole proporre agli sviluppatori di installare per proprio conto un prodotto standard ed utilizzare formati standard per mantenere le proprie applicazioni, sia pur con le criticità evidenziate poco sopra. Da notare, anzi, che il recente arrivo nell’ambito degli stakeholders di soggetti internazionali che per loro natura si trovano a dover integrare dati dalle realtà più svariate, ha prodotto stimoli molto forti in tal senso. Infine anche la recente introduzione delle Aree Metropolitane ha reso ancora più evidente come il sistema urbano di Roma non possa non essere considerato, a sua volta, come l’integrazione di molti sottosistemi complessi che devono essere presi in considerazione nelle scelta di viaggio pianificate e che necessitano perciò di standard realmente interoperabili per poter essere messi in comunicazione gli uni con gli altri (si pensi in primo luogo al ruolo delle ferrovie in ambito urbano). Da questo punto di vista, il Giubileo della Misericordia di prossimo inizio si sta rivelando una grande opportunità, avendo impresso una forte accelerazione su tutti i processi di integrazione di cui sopra. Per ultimo, ma non in ordine di importanza, non deve essere sottovalutata la sfida implicita nel cambiamento delle policy di utilizzo di questi dati, che imporrà una gestione della community sin dal momento della formalizzazione di una simile proposta: ci si attende infatti un contributo ed un momento di confronto con gli stakeholders che potrebbe portare anche a modificare i ragionamenti sin qui sviluppati e illustrati nel presente documento. 52 Un Modello dinamico per la gestione, lo sviluppo, l’utilizzo e la valorizzazione degli Open Data Luigi Zanella, Direttore Consulting e Business Development Divisione PA Dedagroup ICT Network L’esperienza di Dedagroup ICT Network Dedagroup ha sviluppato le proprie competenze grazie alle concrete esperienze con la Pubblica Amministrazione italiana in particolare con le regioni Lazio (Open Data Lazio) ed Emilia-Romagna (processo di decertificazione), diverse amministrazioni locali e dal confronto con le migliori pratiche a livello Europeo ed internazionale sviluppate nell’ambito di progetti Europei sul tema ma soprattutto dal faticosissimo lavoro fatto nella PA locale (soprattutto nei Comuni) per far si che questi usino nei propri processi dati prodotti da altre Pubbliche Amministrazioni per prendere decisioni e per evadere in modo più efficiente le pratiche. L’esperienza di apertura di banche dati all’interno della PA risale a oltre 10 anni fa con il progetto SIGMATER di creazione del sistema di interscambio dei dati catastali, realizzato con Regione Emilia-Romagna, Regione Liguria, l’Agenzia del Territorio e Sogei. All’epoca la realizzazione del sistema fu lunga e complessa per i problemi legati ai limiti tecnologici dell’epoca e soprattutto alla la mancanza di un sistema regolamentare. Oggi la situazione è molto diversa sia dal punto di vista regolamentare, il CAD all’art 58 dice che le banche dati devono essere rese accessibili all’interno della PA, che dal punto di vista tecnologico. Oggi possiamo utilizzare la tecnologia sottesa alla pubblicazione degli Open Data come acceleratore per aprire i dati della PA verso l’interno affiancandola al costoso e complesso metodo della cooperazione applicativa. In tempi brevi si possono aprire le banche dati metterle in condivisione creando così una spinta alla trasformazione verso il digitale della Pubblica Amministrazione. Come più volte sottolineato in queste pagine, la Pubblica Amministrazione dispone di un patrimonio informativo straordinario e, ad ogni livello istituzionale, è un importante produttore di dati, siano essi “ufficiali e certificati” oppure derivati indirettamente dall’attività istituzionale. In linea con i principi della PSI (Public Sector Information) questo patrimonio non solo può costituire la “piattaforma abilitante” per l’integrazione e l’elaborazione dei dati, ma anche una risorsa per lo sviluppo socio economico del Paese. Dagli scambi avvenuti nel corso dei tavoli di confronto del gruppo di lavoro emergono in modo chiaro i potenziali di miglioramento dell’efficienza della Pubblica Amministrazione derivanti dall’apertura delle banche dati non solo per l’esterno ma prima di tutto per l’interno. Open Data per l’interno della PA come presupposto per l’apertura verso l’esterno L’idea di condividere dati all’interno della PA non è certo nuova, risale ai tempi del disegno del Sistema Pubblico di Connettività (SPC). Il CAD all’art. 58 sancisce l’obbligo per le PA di comunicare tra loro, attraverso la messa a disposizione degli accessi alle proprie basi di dati mediante la cooperazione applicativa. Alla base del disegno dell’SPC c’è l’idea di creare un modello di Pubblica Amministrazione che coopera attraverso meccanismi di interoperabilità che, salvaguardando la validità giuridica delle comunicazioni, permette alle Pubbliche Amministrazioni di collaborare. Rispetto agli obiettivi iniziali le implementazioni reali e funzionanti sono poche e concentrate nella Pubblica Amministrazione centrale. I motivi di questa limitata diffusione di servizi di cooperazione applicativa sono riconducibili a due fattori: 53 1. la complessità tecnologica sottesa, che può essere sostenuta economicamente solo dalle Pubbliche Amministrazioni più grandi e strutturate; 2. la necessità di creare accordi di servizio bilaterali fra le Pubbliche Amministrazioni che intendono scambiarsi dati per cooperare. Se è vero che la condivisione di dati nella PA ha un grande valore, come fare per accelerare il processo di circolarità del dato? La soluzione, che si vuole suggerire con questo contributo, può essere quella di utilizzare i principi, strumenti e metodologie caratteristiche degli Open Data anche per la diffusione dei dati all’interno della PA. Da quando negli USA è iniziato il processo di apertura dei dati, sono stati messi a punto strumenti e metodi per l’apertura al pubblico di Open Data, strumenti che oggi hanno raggiunto un discreto grado di solidità e diffusione. A livello nazionale è già stato fatto un censimento generale delle banche dati presenti nelle Pubbliche Amministrazioni, censimento che ha portato alla creazione di un catalogo nazionale pubblicato in Open Data28. Di nuovo, però, anche questo censimento è stato vissuto dalle amministrazioni locali come un adempimento e non come un’occasione per “mettersi in rete” con le altre amministrazioni. Questo atteggiamento ha portato a un qualità molto disomogenea dei contributi e quindi a una visione complessiva non completa. Bisogna far scattare la molla dell’interesse di una PA nella catalogazione e apertura delle banche dati, prima di tutto per se stessa (per abbattere le divisioni interne) poi per rendere disponibili i dati verso altre PA e verso i cittadini. Se l’azione di apertura è finalizzata alla revisione dei processi interni, allora la qualità del risultato sarà adeguata. È quindi opportuno che ogni PA avvii un processo di ricognizione delle proprie banche dati andando poi a creare un catalogo costruito secondo le logiche Open Data (ad esempio utilizzando la piattaforma Open Source CKAN) che verrà poi aperto verso l’interno, verso tutte le altre PA e successivamente, per un sottoinsieme, anche verso l’esterno. Per fare questo è necessario darsi delle priorità: quali banche dati aprire per prime? Tre sono i fattori da tenere in considerazione: 1. centralità delle banche dati (dati di riferimento); 2. le banche dati che certificano lo stato di soggetti, oggetti e fatti (decertificazione); 3. il grado di interesse dei dati per la formulazione delle policy. Le banche dati di riferimento Sicuramente le banche dati che producono un maggiore effetto sul sistema complessivo sono le banche dati di riferimento (i reference data) ovvero quelle banche dati che rappresentano il tessuto connettivo attraverso il quale mettere in relazione anche tutte le altre banche dati. Fanno sicuramente parte di questo insieme: 28 l’anagrafe delle persone fisiche (per la quale è già in corso un processo di unificazione e condivisione a livello nazionale - ANPR); l’anagrafe delle Imprese (già disponibile ma ancora non aperta e accessibile in forma gratuita alle Pubbliche Amministrazioni); l’anagrafe degli Immobili; lo stradario e gli indirizzi georiferiti (ANSC); la cartografia di riferimento (Database topografico e cartografia catastale). http://basidati.agid.gov.it/catalogo/index.html 54 La centralizzazione e l’apertura (all’interno della PA) abilita la condivisione di queste banche dati e permette a tutte le amministrazioni che trattano dati relativi a cittadini, imprese, immobili e territorio di intraprendere un percorso di armonizzazione dei propri dati rispetto alle banche dati di riferimento con l’obiettivo di collegare correttamente i propri dati al soggetto/oggetto di interesse e quindi di rendere coerenti e confrontabili i dati. L’armonizzazione, la coerenza e la confrontabilità dei dati rende possibile per il cittadino il tanto auspicato attraversamento di più Pubbliche Amministrazioni in modo trasparente: se tutte le PA riconoscono il cittadino, l’impresa, l’immobile nello stesso modo e condividendo lo stesso insieme di dati anagrafici allora è possibile anche condividere in modo certo le altre informazioni che ad essi si riferiscono. L’apertura e la condivisione all’interno della PA delle banche dati oggi disponibili può essere un fattore chiave per il completamento e il miglioramento della qualità dei dati. Tutti gli attori della PA sono interessati ad avere dati di riferimento corretti e certificati. L’apertura stimola una azione di crowdsourcing di segnalazione di incongruenze da parte di tutte le PA coinvolte volta a migliorare e consolidare il dato. La decertificazione Il secondo elemento da tenere in considerazione è il grado di interesse di una banca dati per le altre amministrazioni, per i cittadini e per le imprese dal il punto di vista della gestione dei procedimenti amministrativi. Alcune banche dati vengono regolarmente utilizzate per certificare lo stato di persone, oggetti, fatti ad altre amministrazioni o a cittadini ed imprese nell’ambito dei procedimenti amministrativi codificati per l’esercizio delle funzioni della singola PA. Le banche dati che vengono consultate per produrre tali certificazioni devono essere aperte per arrivare a sostituire la produzione di un certificato con una consultazione on line. L’apertura di queste banche dati attua la decertificazione. Aprire questa categoria di dati verso imprese e cittadini ha inoltre l’importante effetto di contribuire alla riduzione degli oneri amministrativi a carico di cittadini ed imprese per la presentazione di pratiche: buona parte dei costi amministrativi che un professionista deve sostenere per presentare una pratica edilizia, una richiesta di apertura di una impresa o un’autorizzazione ambientale sono legate agli oneri informativi (le informazioni che il professionista deve comunicare alla Pubblica Amministrazione per ottenere l’autorizzazione). Una parte importante delle informazioni richieste sono già nella disponibilità della PA (in senso allargato), spesso non lo sono nella disponibilità dell’ente specifico cui si chiede l’autorizzazione. Si pensi, ad esempio, ai dati catastali, ai dati ambientali, allo stato legale degli immobili, ai dati relativi agi impianti preesistenti. L’apertura di dati che riducano i tempi di recupero delle informazioni da parte dei professionisti può essere il mezzo con il quale individuare celermente quali dati non chiedere più perché già in possesso della PA. Il grado di interesse per la formulazione delle policy L’aumento della complessità della nostra società in tutte le branche (sicurezza, clima, trasporti, ambiente, salute, welfare, economia) pone alla politica sfide sempre più grandi. È evidente che per la definizione di policy adeguate sia sempre più necessario disporre di una conoscenza accurata dello stato di fatto e di modelli che aiutino a simulare l’effetto delle decisioni. Anche se stanno aumentando in modo esponenziale i dati prodotti in modo automatico attraverso reti di sensori (IOT) o dalle persone (social network, dispositivi indossabili, ecc…) i dati prodotti all’interno delle PA restano la fonte oggi più importante per la creazione di un sistema di conoscenze su cui creare modelli interpretativi e sistemi di misurazione dell’effetto delle policy. 55 Un potenziale, come già detto, che soffre ancora delle forti problematiche legate alla mancata circolarità dei dati all’interno della PA stessa, nonché della visione limitata, per chi produce una banca dati, dell’effettivo interesse che può suscitare una propria fonte dati verso l’esterno. Solo da tavoli di studio e di confronto multidisciplinari può emergere l’importanza e la validità di una fonte dati piuttosto che di un’altra. Tuttavia, ci preme sottolineare come sia sufficiente attivare momenti di confronto e dialogo tra soggetti diversi perché emergano possibilità e scenari futuri di utilizzo degli Open Data che possono rispondere con puntualità alle esigenze di enti e cittadini. Gli incontri del tavolo informale costituito per la realizzazione di questo lavoro, ad esempio, hanno messo a fuoco decine di casi di possibile condivisione di dati con effetti di grande interesse e utilità. A titolo di esempio, si riporta come dal tavolo sia emerso come, ai fini della progettazione delle linee di trasporto pubblico locale, sia importante conoscere le caratteristiche della popolazione che risiede e lavora nelle zone da servire: a questa esigenza informativa (che se non soddisfatta, comporta o decisioni approssimate o costi notevoli per indagini campionarie) si può rispondere attingendo a dati dell’Agenzia delle Entrate, all’Osservatorio dei valori immobiliari, ai dati di INPS, ai dati anagrafici, ai dati delle imprese, alle mappe: tutte informazioni detenute da PA diverse ma spesso non accessibili o, comunque, molto complicate da raggiungere. Inutile aggiungere che, se i dati fossero aperti e disponibili all’interno della PA, i tempi di produzione di modelli di analisi si ridurrebbero e le decisioni sarebbero più accurate. Aprire i dati all’interno della PA ha quindi un importante effetto: quello di mettere in condizione le diverse PA di conoscere il patrimonio informativo disponibile. Infatti è molto più rapido un processo di innovazione che parte dalla possibilità di accedere direttamente ai dati, di provare e testare la qualità delle informazioni, verificare le possibili interconnessioni con il proprio sistema informativo che procedere top down, con uno studio dei modelli dati per poi progettare i servizi ed infine scoprire che il livello qualitativo dei dati di partenza non è adeguato ad implementare lo scenario ipotizzato. Un processo di catalogazione e apertura sistematico della banche dati all’interno della PA crea i presupposti per aprirsi verso l’esterno: una volta preparati, catalogati e verificata la reale utilità e gli usi incrociati che se ne possono fare i dati possono essere aperti verso i cittadini e le imprese attivando i meccanismi di coinvolgimento e condivisione delle informazioni che sono la base dell’Open Government. Una proposta di modello per valutare il grado di maturità di una PA rispetto ai temi dell’Open Government La logica degli Open Data va ripensata non solo come mero adempimento ai fini della trasparenza dell’ente ma come un modello di funzionamento e trasformazione del modo di lavorare della Pubblica Amministrazione. Oggi, diverse sono le iniziative di Open Government sul territorio nazionale. Si va da iniziative di apertura dei dati nel sito trasparenza, visto come adempimento normativo fino a iniziative di collaborazione e partecipazione attiva dei cittadini alle scelte della città. Per avere uno schema di valutazione si propone questo modello su quattro livelli di maturità che può essere utilizzato per classificare e valutare le iniziative delle PA in questo campo e può essere preso come base di partenza per la costruzione di un sistema di misurazione delle iniziative nelle diverse PA. 56 Figura 6 I quattro livelli di maturità che possono essere utilizzati per definire il livello raggiunto da una PA in relazione ai temi dell’Open Government. Trasparenza (adempimento normativo) A questo primo livello la Pubblica Amministrazione “informa” i propri cittadini: la sezione trasparenza del sito contiene informazioni che descrivono ciò che la Pubblica Amministrazione sta facendo, come è organizzata, quali contratti ha in corso, ecc. La pubblicazione di informazioni e dati è, di fatto, un semplice adempimento normativo. A questo livello i Dati pubblicati, anche quando in formato open, sono statici; raramente sono stati predisposti automatismi per l’aggiornamento dei dati o sono presenti Open Services. I dipartimenti titolari dei dati non vengono coinvolti in modo attivo e la qualità del dato costituisce un elemento secondario. In questo caso, dunque, raramente i dati utilizzati possono costituire un valore o una fonte attendibile perché non si garantiscono coerenza e di continuità dell’aggiornamento. I dati pubblicati, in questi casi, sono di fatto una copia scollegata dalle fonti e dai processi di origine, e dunque di difficile aggiornamento. Nei casi peggiori i dati sono pubblicati una tantum al momento dell’apertura del sito e poi non più aggiornati, come è facile notare con una rapida ricerca in Rete nelle sezioni trasparenza o Open Data di moltissime Pubbliche Amministrazioni. Questi dati, inutile sottolinearlo, non servono, non hanno valore e, come tali, vengono utilizzati pochissimo. Coinvolgimento A questo livello l’Amministrazione cerca di “ascoltare” i cittadini, raccogliendo informazioni su temi e problematiche della città, pubblicando i dati e cercando di promuoverne l’utilizzo. A questo livello l’Amministrazione si attiva con iniziative di coinvolgimento di cittadini e imprese in diverse forme: attiva laboratori su utilizzo ed interpretazione degli Open Data; organizza iniziative di formazione anche all’interno delle scuole; organizza convegni pubblici; promuove premi per le migliori app che sfruttino i propri dati. 57 In questa fase l’azione della PA è rivolta verso il “proprio pubblico” e sui propri dati, si raccolgono feedback dai cittadini e dalle imprese, si lavora per mettere in condizione i cittadini di poter controllare l’azione della PA aprendo un canale dai cittadini e imprese verso la PA. In questa fase gli Open Data possono essere ancora in dataset statici ma si lavora maggiormente sulla qualità e si cerca di selezionare quei dati che possono essere di interesse e adatti ad avviare confronti sulle questioni aperte con la cittadinanza. Normalmente a questo livello si coinvolgono in modo attivo solo i soggetti più sensibili alla partecipazione, i civic hacker e persone specializzate, mentre difficilmente si riesce a raggiungere il grande pubblico. Collaborazione A questo livello l’Amministrazione, oltre che “ascoltare” i cittadini, si impegna a avviare adeguate azioni e iniziative sulla base delle opinioni e delle segnalazioni che arrivano dai cittadini. L’Amministrazione si apre al dialogo con l’obiettivo di raccogliere elementi per arrivare a decisioni più efficaci. Il principio base è quello che per fare buone scelte è importante mettere a disposizione le conoscenze e le informazioni disponibili alla discussione collettiva. La decisione, l’azione, resta comunque sempre nelle mani della Pubblica Amministrazione che ad essa è preposta. A questo livello si innestano anche le azioni volte a favorire la collaborazione tra PA diverse, si coinvolgono le direzioni che hanno aperto le proprie banche dati, l’Amministrazione cerca di rendere disponibili i propri dati ad altre PA finalizzati alla decertificazione ed all’efficientamento della “macchina amministrativa”. La PA utilizza i propri dati aperti e quelli provenienti dall’esterno per ridisegnare i propri processi. Anziché chiedere i dati al cittadino si usano i dati aperti da altre PA. Si utilizzano i dati aperti per la pianificazione partecipata del territorio, per la progettazione multilivello; Si realizzano nuove applicazioni basate sugli Open Data per favorirne la comprensione. In questo caso le Amministrazioni attivano servizi di accesso diretto ai dati, la cui pubblicazione è dinamica e sempre aggiornata. Partecipazione A questo livello l’Amministrazione coinvolge cittadini e le diverse PA operative sul territorio nella definizione delle proprie policy, cooperando nella costruzione di soluzioni innovative e condivise. In questo caso è possibile parlare di Politiche Data Driven. L’apertura dei dati permette alle PA che hanno in carico i diversi aspetti di gestione del territorio (protezione dell’ambiente, pianificazione urbanistica, sicurezza delle persone e del territorio, sicurezza del lavoro, protezione e valorizzazione del paesaggio e delle risorse culturali, programmazione e gestione dei servizi sociali, sviluppo economico, salute, lavoro) di disporre di dati oggettivi, certificati e condivisi che diventano il metro di misura e il mezzo principale di rendicontazione delle politiche. Tale disponibilità è alla base di tutti i processi di governance partecipata: essa favorisce la crescita del sistema sulle politiche di riordino attraverso monitoraggio e diffusione di indicatori, metodologie e strumenti comuni, programmazione e pianificazione multilivello; permette la creazione di sistemi di misurazione condivisi che inquadrano l’operato delle diverse Pubbliche Amministrazioni verso gli obiettivi comuni definiti dalle politiche di livello nazionale e regionale. La disponibilità di dati aperti, infine, abilita la cooperazione “con i cittadini” e “fra cittadini” per innovare il modo in cui le città funzionano. Così come la velocità con cui si fa innovazione nel campo medico dipende molto dalla velocità con cui circolano i dati e le scoperte fatte da altri, così l’apertura dei dati della PA può portare ad un coinvolgimento attivo dei dipendenti pubblici e dei talenti, spesso nascosti, creando le condizioni per una innovazione anche dal basso della PA. 58 Gli Aspetti chiave da curare A chiusura del lavoro si riassumono alcuni aspetti chiave che derivano dalle esperienze descritte in questo paper che sarebbe opportuno curare nella definizione di un modello di apertura delle banche dati all’interno della Pubblica Amministrazione. La georeferenziazione L’informazione geografica è elemento di riferimento per l’integrazione e l’armonizzazione dei dati rispetto alla dimensione territoriale; deve essere considerata come la Piattaforma “unificante” dei dati e uno strumento trasversale di verifica della qualità dei dati. Tutti gli Open Data devono riferirsi in modo corretto e uniforme al territorio con l’obiettivo di creare una visione d’insieme delle fonti informative che via via andranno ad integrarsi. La dimensione geografica deve, a tendere, essere elemento “costitutivo” del dato e non attributo opzionale. La granularità geografica del dato deve essere almeno quella del Comune di riferimento. Se il dato è disponibile anche ad un livello più fine (ad esempio quello delle sezioni di censimento o dei numeri civici) è auspicabile che l’informazione venga pubblicata. Nei casi in cui un dettaglio geografico troppo fine rischi di violare la privacy, la sua diffusione andrebbe limitata unicamente all’interno della PA, mentre per il pubblico sarà rilasciato con una granularità minore. Ontologie comuni La coerenza e confrontabilità dei dati passa anche attraverso l’uso di ontologie comuni e relativi metadati secondo le modalità e standard di fatto (RDF, DCAT-AP, etc.) e le relative implementazioni realizzate a livello nazionale da iniziative governative e non. Oggi in rete esiste una grande disponibilità di ontologie e modelli già definiti, per cui è opportuno che si riducano allo stretto indispensabile la creazione di nuovi modelli limitandosi a riferirsi con coerenza a quelli esistenti. Semplificare la comprensione degli Open Data Seppur sempre più spesso oggetto di studio e analisi, gli Open Data sono, tutt’oggi, spesso difficili da comprendere, specialmente per specifiche categorie di cittadini, inclusi dipendenti stessi della PA. La mancata comprensione si lega, ovviamente, alle difficoltà di lettura degli stessi, che si traduce nell’impossibilità di trarne informazioni di valore nonché di coglierne i possibili riutilizzi. Per risolvere questo problema è necessario accompagnare la pubblicazione dei dati con modelli di lettura (v. lavoro Inail) e/o applicazioni di consultazione che ne semplifichino l’interpretazione. Sono esempi di queste applicazioni iniziative nazionali (quali OpenBilanci, OpenCoesione, SoldiPubblici) o regionali, ad esempio quelle realizzate da Regione Lazio (OpenProgetti e OpenSpesa): iniziative e progetti che oltre a permettere l’accesso diretto ai dati mettono a disposizione applicazioni per la consultazione immediata e semplificata, al fine di avvicinare all’utilizzo dei dati non solo i tecnici e gli esperti, ma anche i cittadini. Open Data e Open Services I cataloghi di Open Data sono, di consueto, copie derivanti da estrazioni dei dati conservati nelle banche dati gestionali degli enti. Ciò espone al rischio di duplicazione e di mancato aggiornamento dei dati pubblicati poiché, nel momento stesso in cui si crea una copia dei dati, non si garantisce che essa sia aggiornata e allineata con l’originale. Gli Open Services, al contrario, sono servizi aperti di accesso diretto alle banche dati originali (ne è un esempio il servizio “Cerca Percorso” esposto dall’Agenzia Roma Servizi per la Mobilità). 59 Per tutte le banche dati caratterizzate da un’alta dinamicità e per le quali è necessario disporre del dato aggiornato all’ultima versione disponibile, sono indicati gli Open Services. La realizzazione di Open Services richiede, però, lo sviluppo di software specifico, con un costo di gestione maggiore rispetto alla semplice pubblicazione di Open Data. Costo che però trova giustificazione nelle possibilità di utilizzo dei dati in ottica di innovazione e creazione di nuovi servizi. Gli Open Services dovrebbero quindi essere creati per l’accesso a tutte le banche dati di riferimento (Anagrafe, Imprese, Immobili, Archivi Geografici) e per quelle fonti caratterizzata da un’elevatissima dinamicità come i dati provenienti da sensori. Per le banche dati di riferimento gli Open Services dovrebbero essere allineati secondo standard comuni di funzionalità (servizi di ricerca, consultazione, movimentazione, estrazione) su tutto il territorio nazionale, così da agevolarne l’utilizzo da parte degli sviluppatori di applicazioni. Un’indicazione è dunque quella di usare la logica degli Open Services sugli Open Data non solo per pubblicare verso l’esterno me, forse soprattutto, per condividere i dati fra Pubbliche Amministrazioni, favorendo così anche lo sviluppo di applicazioni di consultazione, fruizione e integrazione dei dati da parte di soggetti terzi: altre amministrazioni, aziende private, associazioni e società civile; si pensi ad esempio alla possibilità di integrare fonti dati diverse in apposite App. La qualità dei dati Per attuare il principio dell’“open by default” è necessario risalire all’origine del dato e gestire e prevedere già nella fase di generazione il processo di successiva apertura dello stesso, con tutte le relative caratteristiche (formati, metadati). Se è necessario anonimizzare o aggregare dati affinché non si violino la privacy o i diritti di soggetti pubblici e privati la cosa va decisa a monte, nel momento in cui si creano i dati, in collaborazione con il titolare che deve giustificare i motivi di una eventuale limitazione nell’ apertura della banca dati. Per fare questo è necessario il coinvolgimento del personale interessato sin dal principio del processo di creazione e archiviazione del dato. Per far ciò è necessario che il personale della PA sia adeguatamente formato su tutte le fasi del processo di creazione, rilascio e gestione di banche dati in formato Open. L’apertura dei dati deve essere integrata nei processi gestionali dei dati stessi e in linea di principio i dati aperti dovrebbero poter essere estratti dalla banca dati di origine in qualsiasi momento attraverso Open Services o richieste di estrazione massiva asincrone. L’utilizzatore, sia esso un’altra PA o un soggetto esterno, deve essere certo dell’attendibilità e della qualità della banca dati. L’obiettivo cui tendere è che diventi prassi che i dati pubblicati siano gli stessi sui quali i tecnici interni alla PA operano quotidianamente. 60 Considerazioni conclusive L’apertura dei dati è la prima e fondamentale azione per realizzare i principi dell’Open Government e poter così ridisegnare il funzionamento operativo della Pubblica Amministrazione, sfruttando la disponibilità in forma digitale di dati forniti anche da altri enti. Ancora oggi, però, nella PA Italiana non esiste un modello di gestione ed organizzazione dei dati unitario, e vista la complessità e l’articolazione dell’azione amministrativa probabilmente non ci potrà mai essere. In questa complessità, però, si può pensare di definire un modello comune di “apertura” che gradualmente e in modo dinamico ci porti ad avere una PA complessivamente aperta, che condivida i dati fondamentali di riferimento e che metta a disposizione dei suoi utenti, siano essi cittadini o imprese, un sistema di conoscenza completo (a livello di intera nazione e non frammentato per singolo territorio), affidabile (con dati di qualità) e coerente (tutti chiamiamo le stesse cose con gli stessi nomi). Oggi sono sempre di più le imprese e i professionisti che si dichiarano pronti a interagire con la Pubblica Amministrazione principalmente attraverso i canali digitali. Perché ciò avvenga, però, è necessario che si eviti il rischio di limitarsi a replicare in digitale i processi oggi basati sulla carta (come la maggior parte delle realizzazioni di grandi sistemi IT hanno fatto nel corso degli ultimi venti anni) ma rimodellando, semplificando riducendo i passaggi e sfruttando il digitale in modo nativo. In questa transizione l’apertura delle banche fra PA ha un ruolo decisivo per abbattere tempi, costi e ridurre il rischio di pratiche ostruzionistiche figlie di vecchi modi di operare tristemente noti. La realizzazione di iniziative per la condivisione dei dati all’interno ed all’esterno della PA comporta ovviamente dei costi in termini di tecnologie, competenze e formazione del personale coinvolto: costi che, però, in un’ottica di medio-lungo termine, saranno velocemente recuperati, anche alla luce del semplice confronto con i tempi e i costi tipici delle attuali modalità di operare della PA: si pensi quanto lavoro e tempo comportino le attività di ricerca, condivisione ed raccolta di informazioni e dati nell’ambito dei procedimenti che coinvolgono amministrazioni diverse, nonché allo sforzo che occorre affrontare ogni qual volta si crea la necessità di creare e gestire banche dati realizzate sulla base di esigenze specifiche. Inoltre, va considerato il risparmio in termini di costi e tempi a carico di cittadini, professionisti ed imprese nel recupero dei dati necessari e di come esso possa generare un’accelerazione nella semplificazione nell’espletamento degli step amministrativi, legati alla raccolta, verifica e predisposizione di documentazione e alla comunicazione di informazioni molto spesso già in possesso della PA. Un altro elemento non direttamente quantificabile in termini economici è rappresentato dai benefici legati al miglioramento della qualità dei dati in possesso della PA una volta che le pratiche di aggiornamento dei dataset saranno sempre più diffuse e coordinate nell’ottica dell’interoperabilità: un approccio partecipativo basato su condivisione, integrazione e relativa bonifica incrociata delle banche dati, che permetterà di migliorare la qualità generale dei servizi pubblici, nella loro totalità. Il potenziale innovativo degli Open Data è cruciale non solo per procedimenti puntuali, ma anche per la possibilità di fare da fondamento nella definizione di policy e scelte politiche e gestionali, ancora oggi spesso basate su stime e valutazioni approssimative (e non su banche dati certificate ed affidabili) con evidenti ricadute in fase di monitoraggio, che riducono in maniera drammatica la reale accountability dell’azione politica ed amministrativa. 61 L’apertura dei dati diventa veicolo per trasmettere anche conoscenza e metodi di lavoro fra enti con funzioni simili ma lontani dal punto di vista territoriale: i comuni, le agenzie, le aree vaste, gli istituti di ricerca pubblici, hanno bisogni simili ma per territori diversi. L’apertura dei dati stimola la condivisione dei metodi utilizzati per elaborarli e alimenta un circolo virtuoso di scambio di buone pratiche basate sugli stessi presupposti di partenza: i dati. La condivisione delle pratiche ha anche un altro importante effetto, aiuta le PA Centrali a conoscere i bisogni informativi delle PA locali, indirizza le scelte su quali dati aprire, in questo modo si ottiene un aumento dell’efficacia dei dati aperti e quindi del ritorno degli investimenti. I tempi sono certamente maturi per smettere di parlare al futuro e trasformare tutte queste promesse in un percorso comune da percorrere immediatamente. Come abbiamo cercato di mostrare in queste pagine, l’apertura dei dati e la disposizione alla collaborazione sta già mostrando i suoi effetti positivi. Siamo di fronte alla grande opportunità di rigenerare decisamente il modo di operare di tutta la Pubblica Amministrazione: gli Open Data sono il carburante di questo cambiamento. 62