OPEN DATA: DALLE PAROLE AI FATTI – Trasparenza e

Sommario
Introduzione .......................................................................................................................... 4
Promuovere gli Open Data oggi: dalla creazione alla valorizzazione ...................... 9
L’esperienza AgID ............................................................................................................................... 9
Lo scenario internazionale per lo sviluppo degli Open Data: la carta internazionale degli Open Data .. 10
L’Open Data in Europa ...................................................................................................................... 11
Open Data in Italia: il ruolo di AgID ................................................................................................... 11
Come si pubblicano i dati: il nuovo portale nazionale dati.gov ........................................................... 12
Metodi e principi per la valorizzazione degli Open Data ..................................................................... 14
I modelli per la classificazione dei dati aperti .................................................................................... 16
Come si calcola l’impatto: da portali a indicatori ............................................................................... 16
Le sfide per la Pubblica Amministrazione .......................................................................................... 17
La sperimentazione di framework evoluti per la consultazione e l’utilizzo dei
Linked Government Open Data ....................................................................................... 19
L’esperienza di Sogei ........................................................................................................................ 19
Geolocalizzazione dinamica: problematiche legate alla sicurezza del dato di posizionamento ............. 20
Gli “open data” per la calibrazione e il controllo delle politiche di prevenzione
dei rischi sul lavoro. L’esperienza dell’Inail ................................................................. 22
Breve storia dell’esperienza .............................................................................................................. 22
Alla ricerca di un’informazione “agile” .............................................................................................. 22
Definire il “linguaggio speciale” ........................................................................................................ 23
Il modello di lettura .......................................................................................................................... 25
I dati in formato aperto, il calendario di pubblicazione ...................................................................... 25
La soluzione tecnologica ................................................................................................................... 26
Il “data challenge”, il club degli utilizzatori, gli incontri con i giornalisti .............................................. 26
Un mezzo per collaborare tra istituzioni. Verso il “grappolo degli open data”? ................................... 26
Utilizzazioni interne ............................................................................................................................... 26
Collaborare con le altre istituzioni....................................................................................................... 27
Appendici ......................................................................................................................................... 28
L’importanza della geografia come elemento di integrazione e raccordo degli
Open Data ed i processi per assicurare la qualità dei dati ....................................... 41
L’esperienza della Regione Emilia-Romagna ...................................................................................... 41
Il modello di gestione ed apertura dei dati geografici in Regione Emilia-Romagna .............................. 42
Le linee guida per la decertificazione in Emilia-Romagna ................................................................... 45
Il modello di circolarità ed aggiornamento dell’informazioni geografica di riferimento ....................... 46
Gli Open Data geografici come uno dei fattori abilitanti la Smart Community .................................... 47
Considerazioni conclusive ................................................................................................................. 47
L’esperienza Open Data in Roma Servizi per la Mobilità .......................................... 49
Gli Open Data per l’infomobilità ....................................................................................................... 49
L’accesso ai dati dell’Agenzia ............................................................................................................ 50
Gli utenti degli Open Data ................................................................................................................ 50
Le sfide per il prossimo futuro .......................................................................................................... 51
2
Un Modello dinamico per la gestione, lo sviluppo, l’utilizzo e la valorizzazione
degli Open Data .................................................................................................................. 53
L’esperienza di Dedagroup ICT Network ............................................................................................ 53
Open Data per l’interno della PA come presupposto per l’apertura verso l’esterno ............................ 53
Le banche dati di riferimento ............................................................................................................ 54
La decertificazione............................................................................................................................ 55
Il grado di interesse per la formulazione delle policy ......................................................................... 55
Una proposta di modello per valutare il grado di maturità di una PA rispetto ai temi dell’Open
Government ..................................................................................................................................... 56
Trasparenza (adempimento normativo) ............................................................................................ 57
Coinvolgimento ...................................................................................................................................... 57
Collaborazione........................................................................................................................................ 58
Partecipazione........................................................................................................................................ 58
Gli Aspetti chiave da curare .............................................................................................................. 59
La georeferenziazione........................................................................................................................... 59
Ontologie comuni .................................................................................................................................. 59
Semplificare la comprensione degli Open Data ................................................................................ 59
Open Data e Open Services ................................................................................................................. 59
La qualità dei dati .................................................................................................................................. 60
Considerazioni conclusive ................................................................................................ 61
Il gruppo di lavoro che ha collaborato alla redazione del Paper è stato coordinato da Giovanni
Aliverti.
Hanno collaborato: Marco Bani (AgID), Antonio Bottaro (Sogei), Massimo Fustini (Regione EmiliaRomagna), Patrizio Galasso (Inail), Stefano Giovenali (Roma Servizi per la Mobilità), Rosaria Mosca
(Inail), Lorenzo Orlando (Glocus), Valentina Tonti (Glocus), Massimiliano Veltroni (Inail), Luigi
Zanella (Dedagroup ICT Network).
3
Introduzione
A cura di Glocus
Tra i tanti temi connessi all’Agenda Digitale e alla digitalizzazione, quello degli Open Data
(soprattutto in ambito pubblico) è forse uno di quelli verso cui addetti ai lavori, analisti e parte
dell’opinione pubblica ripongono maggiori aspettative.
I dati aperti, oramai comunemente noti come Open Data anche nel contesto italiano e come
definiti dall’Open Knowledge Foundation, sono quelle tipologie di dati liberamente accessibili a ogni
tipologia di utenza, privi di restrizioni legate a diritti e copyright “che possono essere liberamente
utilizzati, riutilizzati e ridistribuiti da chiunque, soggetti eventualmente alla necessità di citarne la
fonte e di condividerli con lo stesso tipo di licenza con cui sono stati originariamente rilasciati”.
Applicabile ad ogni tipo di database, il concetto di apertura assume particolare rilevanza quando
legato ai dati prodotti e utilizzati dalle Pubbliche Amministrazioni e che costituiscono Informazioni
di Pubblico Interesse. In questo caso, infatti, gli Open Data diventano un elemento importante,
sebbene non unico, di un percorso di rinnovamento più generale della cosa pubblica, che
rappresenta un vero e proprio cambio di paradigma che, potenzialmente, coinvolge tutti i soggetti
della nostra società, a partire dalle Pubbliche Amministrazioni stesse, che sono titolate a produrre
ed utilizzare i dati e a cui spetta anche il compito di facilitarne la condivisione.
Figura 1 Schema descrittivo dell’Open Government.
Dal punto di vista degli amministratori, abbracciare la filosofia dell’Openness (di cui gli Open Data
sono elemento principale) vuol dire aprirsi alla partecipazione, alla trasparenza e alla
collaborazione (Figura 1), attivando un nuovo modello di governo ispirato al cosiddetto Open
Government, secondo cui l’Amministrazione deve essere trasparente, a tutti i livelli, consentendo il
monitoraggio e la valutazione continua del proprio operato, avvalendosi anche delle possibilità
offerte dalle tecnologie ICT e dalla Rete e che costituisce un punto di contatto reale e continuo con
4
il cittadino.
In particolare, il tema della trasparenza è quello in relazione al quale, in Italia, si stanno
concentrando le esperienze principali di valorizzazione degli Open Data, nonché quello verso cui il
legislatore si è mostrato più attivo. Già l’articolo 50, comma 1 del D.lgs. n, 82 del 2005 specificava
come “i dati delle Pubbliche Amministrazioni sono formati, raccolti, conservati, resi disponibili e
accessibili con l’uso delle tecnologie dell’informazione e della comunicazione che ne consentono la
fruizione e riutilizzazione, alle condizioni fissate dall’ordinamento, da parte delle altre Pubbliche
Amministrazioni e dei Privati”.
Successivamente, l’ art. 11 D. Lgs. n. 150/2009 definisce la trasparenza come “accessibilità totale,
anche attraverso lo strumento della pubblicazione sui siti istituzionali delle Amministrazioni
Pubbliche, delle informazioni concernenti ogni aspetto delle organizzazioni, degli indicatori relativi
agli andamenti gestionali e all’utilizzo delle risorse per il perseguimento delle funzioni istituzionali,
dei risultati dell’attività di misurazione e valutazione svolta dagli organi competenti, allo scopo di
favorire forme diffuse di controllo del rispetto dei principi di buon andamento e imparzialità”. Un
ultimo intervento sul tema arriva, infine, nel 2013, col decreto legislativo n.33 del 14 marzo 2013,
c.d. “riordino della disciplina riguardante gli obblighi di pubblicità, trasparenza e diffusione di
informazioni da parte delle Pubbliche Amministrazioni”.
La normativa conferisce all’Agenzia Per l’Italia Digitale (AgID) il compito di promuovere le politiche
nazionali per la valorizzazione del patrimonio informativo pubblico e di indirizzare le
amministrazioni verso un processo di produzione e rilascio dei dati pubblici standardizzato e
interoperabile su scala nazionale ai fini di favorirne l’utilizzo per la creazione di nuovi servizi.
Moltissimi, infatti, sono gli ambiti di applicazione e le tipologie di dati la cui apertura può portare a
nuove forme di analisi e, successivamente, confronto e partecipazione: dai dati legati alla spesa
pubblica a quelli demografici, dai dati ambientali ai dati territoriali, con particolare riferimento al
dato geografico e al monitoraggio di attività produttive sul territorio.
Come detto, il tema mostra notevoli implicazioni in diversi ambiti di azione: partecipazione,
comunicazione, politica, ma anche cultura, formazione e lavoro, coinvolgendo sia il settore
pubblico che quello privato, che insieme possono e devono concorrere nel creare modelli di
sviluppo che garantiscano crescita sia economica che sociale. Ma rilevanti sono anche i benefici
che essi comportano in termini di coinvolgimento delle imprese, che possono utilizzare i dati per
creare e offrire servizi innovati e aprire nuove forme di mercato, per un impatto economico globale
che la Casa Bianca, al momento, stima tra i 3 e i 5 mila miliardi di dollari all’anno per i Governi
nazionali, 900 miliardi dei quali solo in Europa1.
Perché ciò avvenga, però, è importante che si crei un ecosistema di condivisione dove si garantisca
parità di accesso e totale interoperabilità tra banche dati. Il valore dei dati, infatti, aumenta
sensibilmente quando dataset differenti, prodotti e pubblicati in modo indipendente da diversi
soggetti, possono essere incrociati liberamente da soggetti terzi, cui spetta il compito di trarne il
valore aggiunto attraverso la creazione di prodotti, servizi o applicazioni sempre nuovi e meglio
rispondenti alle esigenze dei propri utenti, secondo forme e modalità che possono non essere state
previste dai singoli enti e soggetti titolati alla pubblicazione dei “dati grezzi”.
A tal fine, le “Linee guida nazionali per la valorizzazione del patrimonio informativo pubblico”
emanate nel giugno del 2014 hanno l’obiettivo di supportare il processo di liberazione e rilascio dei
dati pubblici fornendo un modello operativo per la metadatazione e la condivisione degli stessi2.
1
Corriere della Sera, “Meyer, gli Open Data voluti da Obama «Bene pubblico da 5 mila miliardi»”, 25 febbraio 2015.
Esse fanno seguito alle “Linee guida per la stesura di convenzioni per la fruibilità di dati delle Pubbliche Amministrazioni” emanate nel
giugno del 2013 da DigitPA con l’obiettivo di rimarcare quanto stabilito all’ articolo 50 e 58 del Codice dell’Amministrazione Digitale.
Nell’art. 50, infatti, si precisa che, nel rispetto della normativa in materia di protezione dei dati personali, qualunque dato trattato da una
Pubblica Amministrazione è reso accessibile e fruibile alle altre amministrazioni, in funzione dello svolgimento dei compiti istituzionali di
2
5
Inoltre, il nuovo art. 58 del CAD3, denominato “Comunicazioni tra le Pubbliche Amministrazioni”,
sancisce l’obbligo per le PPAA di comunicare tra loro, attraverso la messa a disposizione a titolo
gratuito degli accessi alle proprie basi di dati alle altre amministrazioni mediante la cooperazione
applicativa disciplinata dal CAD4. Sono inoltre previste sanzioni per le Pubbliche Amministrazioni
che non ottemperano all'obbligo di erogazione dei servizi in rete e di accesso telematico alle basi di
dati5.
In attuazione di tali disposizioni, entro settembre 2014 tutte le Pubbliche Amministrazioni e le
società partecipate hanno trasmesso all'AgID "l'elenco delle basi di dati in loro gestione e degli
applicativi che le utilizzano". Successivamente l’Agenzia per l’Italia Digitale ha reso disponibile
online il Catalogo nazionale dei dati della Pubblica Amministrazione6, strumento che vuole
supportare le attività di valorizzazione e coordinamento del patrimonio informativo pubblico.
In Italia, come noto, si registra ancora una diffusa resistenza alla liberazione dei dati in possesso
delle Pubbliche Amministrazioni. Secondo i dati diffusi dal Politecnico di Milano nel mese di marzo
2015, nel rapporto “Gli Open Data e i Comuni”, solo il 41% dei Comuni italiani pubblica i dati.
Secondo il rapporto, le motivazioni principali di questo ritardo sono indicate dalle amministrazioni
stesse, che denunciano la mancanza di personale competente e adeguatamente formato e la
scarsezza di risorse economiche; criticità, queste, inquadrate in uno scenario di sostanziale
indifferenza del sistema politico (figura 2).
Figura 2 Principali ragioni che hanno impedito la pubblicazione di Open Data. Fonte: Politecnico di Milano, marzo 2015.
Dei diversi dataset fin oggi pubblicati in formato open per il libero riutilizzo da parte di cittadini e
imprese, la maggior parte riguarda temi legati ai trend della popolazione e fenomeni ambientali,
seguiti poi da dati territoriali, cartografie e statistiche demografiche. Seguono poi le tematiche del
turismo e dell'agricoltura, mentre sono meno presenti (seppur in crescita) dataset su salute,
lavoro, trasporti, viabilità e conti pubblici (anche se in tale ambito è stato di recente creato un
apposito portale online, www.soldipubblici.it).
Peraltro, nelle amministrazioni più avanzate, dopo una prima fase nella quale l’attenzione è stata
posta essenzialmente all’apertura dei dati, si è aperta una seconda fase, tuttora in corso, nella
quest’ultime. Il successivo articolo 58, nel porre l’attenzione sulla fruibilità dei dati, prevedeva che le amministrazioni titolari di banche
dati accessibili per via telematica predisponessero apposite convenzioni finalizzate ad assicurare la fruibilità dei dati medesimi.
3
Come modificato dall’art. 24-quinquies del D.L. 24 giugno 2014, n. 90, convertito, con modificazioni, dalla Legge 11 agosto 2014, n.
114, recante “Misure Urgenti per la semplificazione e la trasparenza amministrativa e per l'efficienza degli uffici giudiziari”.
4
La cooperazione applicativa di cui all’art. 72, comma 1, lettera e) del CAD, è finalizzata all'interazione tra i sistemi informatici delle
Pubbliche Amministrazioni per garantire l'integrazione dei metadati, delle informazioni e dei procedimenti amministrativi.
5
Così come prescritto dall'art. 63 e dall'art. 52 del CAD.
6
www.basidati.agid.gov.it.
6
quale il focus si è spostato sulla qualità e sulla manutenibilità dei dati resi pubblici e sui processi
che essi possono generare Proprio sul tema della “qualità del dato” occorre concentrarsi per
favorire, come si diceva in apertura, il coinvolgimento diretto del mondo delle imprese, che hanno
bisogno di dati qualitativamente impeccabili per poter sviluppare analisi e applicazioni di valore:
Forse questo è uno dei motivi per cui ancora non si sviluppa un vero e proprio mercato indotto dai
dati aperti e dunque una conseguente crescita del settore ICT che, invece, avrebbe tanto bisogno
di svilupparsi al ritmo di altri paesi europei dove, proseguendo il percorso iniziato con gli Open
Data, le amministrazioni più dinamiche stanno modificando i loro processi in modo partecipativo e
cominciano a fornire i primi Open Services, creando così i presupposti di un vero e proprio Open
Government.
Obiettivo di questo documento è fornire indicazioni alla politica ed alla classe dirigente per
realizzare iniziative di qualità, portando a sistema esempi di esperienza di soggetti rilevanti sul
panorama nazionale (AgId, Inail, Ministero dell'Ambiente, Sogei, Regione Emilia-Romagna, Roma
Mobilità) cercando di dare un contributo sul tema che esca dall’ambito accademico o degli esperti
per guardare invece alle sue implicazioni nella società civile, nell’impresa e nell’Amministrazione,
sia negli aspetti più pratici e operativi sia nelle capacità di generare un cambiamento reale nei
processi, nella governante, nella qualità dei servizi e nella loro capacità di generare valore
aggiunto.
Il paper stesso nasce dall’impegno congiunto di diversi enti e amministrazioni, da tempo attive sul
tema dell’Open Data, che hanno costituito un vero e proprio gruppo di lavoro che ha cercato, in un
continuo e reciproco confronto delle proprie esperienze più significative, di individuare alcune linee
di sviluppo affinché gli Open Data possano essere un vero fattore abilitante di una nuova
Amministrazione più efficiente e partecipe.
Ci si propone, dunque, di fornire una guida alla lettura di alcune rilevanti iniziative in ambito Open
Data che vedono coinvolti gli enti partecipanti al gruppo di lavoro, in riferimento a quattro
dimensioni principali:
1. l'utilizzo delle metodologie e dei processi di creazione degli Open Data per un
uso interno alla Pubblica Amministrazione: in un mondo in cui la catena del valore
dei servizi pubblici è sempre più ibrida e coinvolge attori ed enti diversi, gli Open Data non
sono solo un elemento di trasparenza delle procedure ma costituiscono un vero e proprio
agente di integrazione, semplificazione e innovazione dei processi. L’apertura dei dati
all’interno della singola PA e fra PA diverse è una condizione necessaria, ma non sufficiente
per la realizzazione dell’Open Government. È dunque opportuno chiedersi quale strada
occorra intraprendere per realizzare tale obiettivo. Il paper illustrerà come l’integrazione di
dati provenienti da Enti diversi possa consentire l’integrazione dei processi di diverse
Amministrazioni per portare così allo sviluppo di veri e propri Open Services;
2. gli strumenti, i processi e le metodologie per assicurare la qualità degli Open
Data: in tale ambito sarà considerata la dimensione geografica come elemento di
integrazione, confronto e validazione dei dati, l'importanza di banche dati certificate e
certificanti di riferimento e le modalità per assicurare la qualità dei dati nel tempo;
3. Open Data per soggetti esterni: l’apertura di dati di qualità della PA verso l’esterno
della macchina pubblica è la condizione necessaria per valorizzare il patrimonio informativo
pubblico e farne il motore di iniziative imprenditoriali (applicazioni mobile, data journalism,
data analysis) e civiche (quando realizzate da cittadini e associazioni per fini di pubblica
utilità, anche sotto forma di iniziative di civic hacking);
7
4. valutazione degli impatti e delle ricadute degli Open Data: occorre spingere verso
la definizione di chiari e oggettivi metodologie di valutazione e misurazione dei risultati
delle iniziative di apertura e condivisione di Open Data, sia all’interno dell’Amministrazione
sia all’esterno, andando oltre la mera rispondenza all'obbligo normativo di pubblicizzazione
dei dati, definendo con chiarezza gli obiettivi e prevedendo i relativi strumenti di
valutazione e benchmarking.
Il paper si interrogherà su cosa possano fare gli enti, sia pubblici che privati, per sfruttare questo
capitale di dati affidabili ed aggiornati, su come il mercato possa sfruttare realmente questa nuova
opportunità e su come attivare, in linea con le indicazioni internazionali, un circolo virtuoso fra PA
e sistema economico-sociale che veda il patrimonio informativo ed i processi della PA come motore
di sviluppo.
Sulla base delle quattro dimensioni d'analisi elencate, i contributi raccolti nel paper cercano di
rispondere agli interrogativi ancora aperti e condividere esperienze e criticità, con un focus sugli
obiettivi attesi, quelli eventualmente già raggiunti e come questi possano concorrere a definire un
nuovo modello dinamico per la gestione, lo sviluppo, l’utilizzo e la valorizzazione degli Open Data.
8
Promuovere gli Open Data oggi: dalla creazione alla valorizzazione
A cura di Marco Bani, Capo Segreteria tecnica dell'Agenzia per l'Italia Digitale
L’esperienza AgID
Nella società moderna si assiste quotidianamente ad una proliferazione di dati come mai era
accaduto in passato. Non si tratta solo di dati scientifici, ma anche e soprattutto di dati che
riguardano la vita ordinaria dei cittadini e delle comunità. Questo è stato possibile grazie
all’incremento dell’utilizzo di smartphone e altri dispositivi mobili, che raccolgono informazioni sulle
nostre scelte, su ciò che vediamo, dove andiamo e quello che stiamo facendo, Ogni singola
persona diventa un potenziale fornitore/erogatore di dati e questo aumenterà sempre di più nei
prossimi anni, con la possibilità di ottimizzare l’offerta di servizi scolastici, ridurre i costi sanitari e
facilitare l'accesso ai servizi finanziari.
Il progresso è destinato a crescere grazie all’Internet delle cose, meglio conosciuto nella dicitura
inglese “Internet of Things” – IoT, tecnologia che estende internet al mondo degli oggetti,
permettendogli di acquisire intelligenza grazie al fatto di poter comunicare dati su se stessi e
accedere ad informazioni aggregate da parte di altri, con un linguaggio “machine to machine”.
I vantaggi derivanti dall’utilizzo di queste informazioni, affinché possano avere un effetto concreto
sulla collettività, richiedono un accesso a dati di alta qualità anche da parte dei singoli. I dati,
difatti, già svolgono un ruolo cruciale nel guidare il processo decisionale e assumeranno una
funzione ancor più rilevante nel corso del tempo. Al contrario, se gli individui non hanno
consapevolezza che i loro dati sono raccolti, distribuiti o utilizzati, potrebbero subire conseguenze
negative sia dal punto di vista sociale che economico. In questo contesto si inserisce il digital
divide, termine con il quale si definisce il divario esistente tra chi ha accesso effettivo alle
tecnologie dell'informazione (in particolare personal computer e Internet) e chi ne è escluso, in
modo parziale o totale. Il digital divide limita i benefici dell’innovazione ed i vantaggi dell'era
digitale moderna per un'ampia fascia della popolazione, e per tale ragione meriterebbe maggiore
considerazione nelle politiche nazionali.
Inoltre, occorre anche considerare che l’utilizzo dei dati, se da un lato offre una grande opportunità
per il progresso scientifico, con benefici per la collettività e per il settore privato, dall’altro rischia di
invadere la privacy e di limitare i diritti individuali.
Come accennato sopra, oltre che per i singoli, i dati hanno un peso importante nel settore privato.
Le aziende, difatti, li pongono alla base della propria offerta di servizi e li utilizzano per prendere
decisioni sia strategiche che di routine. Ad esempio, alcune società che offrono servizi finanziari si
servono di dati “non tradizionali”, come la rete sociale di un individuo, per valutare il rischio di
credito e prendere decisioni di prestito. Altro esempio sono le assicurazioni che lavorano in campo
sanitario e le farmacie che offrono sconti ai clienti che utilizzano sistemi, studiati ad hoc, di raccolta
e monitoraggio dei dati in merito alla loro salute.
Nel settore pubblico i dati sono al centro di politiche importanti tese, tra gli altri obiettivi, a
migliorare la sicurezza dei cittadini, ridurre gli sprechi del governo e ottimizzare l’offerta formativa
nelle scuole. Si è assistito, ad esempio, in diversi Stati, tra cui l’America, ad investimenti consistenti
per la costituzione di basi dati finalizzate al monitoraggio della spesa sanitaria come parte
integrante delle politiche tese a sfruttare i dati per il miglioramento della cosa pubblica.
Ciò premesso è importante fare riferimento, alla disuguaglianza a cui si sta assistendo a seconda
dell’area geografica di riferimento. Purtroppo, mentre molte comunità hanno adottato nuove
tecnologie e politiche che favoriscono la raccolta di dati, beneficiando dei vantaggi che ne
9
derivano, altre comunità sono rimaste indietro. Questo fenomeno è stato evidenziato dall'emergere
delle Città Intelligenti (o Smart Cities), che hanno contribuito a creare uno scenario disarmonico,
composto da zone con uno stadio di avanzamento tecnologico di raccolta dati ed aree definibili
come vere e proprie "deserti di dati", con conseguente effetto negativo per gli abitanti di quei
territori, ad esempio nell’offerta di servizi sanitari, settore che grazie all’utilizzo dei dati sta
facendo dei progressi consistenti.
Non esiste una soluzione semplice a questo problema, ma ci sono alcuni rimedi di breve termine.
In primo luogo, la raccolta dei dati condotta dai governi nazionali e locali dovrebbe concentrarsi
maggiormente sulle fasce della popolazione sottorappresentate e difficili da raggiungere per
garantire che tutte le comunità possano beneficiare delle tecnologie e dai processi scaturite da
politiche data-driven (guidate dai dati).
In secondo luogo si dovrebbero supportare, attraverso sovvenzioni a ciò destinate, la proliferazione
di Città Intelligenti anche nelle comunità più disagiate, impegnandosi con i leader locali a capire
come integrare soluzioni che utilizzano dati. Infine, ci si dovrebbe avvalere di ricercatori per
identificare le aree dove il divario dati è considerevole e pianificare su questa base gli interventi da
attuare. La lotta alla povertà dei dati non porrà, certamente, fine alle disuguaglianze sociali ed
economiche, ma la costruzione di comunità ricche di dati costituisce un passo importante verso la
riduzione di queste disparità.
Per questo governi e comunità internazionali stanno moltiplicando gli sforzi per sostenere e
promuovere politiche legate agli Open Data.
Lo scenario internazionale per lo sviluppo degli Open Data: la carta internazionale degli Open
Data
“To achieve the goals of sustainable development, critical data must be open and available for
reuse by anyone, anywhere, anytime”. Sir Tim Berners Lee, inventore del World Wide Web.
Dopo il passo storico dell’adozione dell'Agenda per lo sviluppo sostenibile 20307 occorre tradurre in
realtà gli obiettivi di sviluppo sostenibile (suistainable development goals – SDGs) previsti nel
documento. Gli Open Data in questo contesto hanno un ruolo chiave: i dati aperti possono, infatti,
aiutare le aziende e gli imprenditori a creare valore economico e consentire ai governi di fornire
servizi vitali in modo più efficiente, migliorando il rapporto tra cittadino e Stato. In altri termini, gli
Open Data possono aiutare la nascita di società prospere e fiorenti e saranno, per tale ragione, un
elemento chiave per affrontare e monitorare il raggiungimento degli obiettivi sostenibili.
Per favorire le sfide sociali e sostenere programmi e politiche finalizzate allo sviluppo sostenibile
attraverso gli Open Data, si rende necessario articolare e adottare principi comuni e condividere le
buone pratiche.
Ciò può essere fatto attraverso l’attuazione dei principi fissati dall'International Open Data Charter
(IODC)8 documento che detta regole comuni a sostegno dei dati aperti che consentono ai governi
di tutto il mondo di aumentare l'accessibilità, la comparabilità, l'utilità e l'impatto dei dati aperti,
nonché di promuovere gli Open Data come veicolo per lo sviluppo sostenibile.
Istituito da un gruppo di campioni digitali indicati dai governi, organizzazioni della società civile e
imprese private, l'International Open Data Charter (IODC) definisce alcuni principi di base per
guidare i Governi nell’apertura dei propri dati, tra cui:
7
8
https://sustainabledevelopment.un.org/post2015/transformingourworld.
http://opendatacharter.net.
10
•
•
•
•
•
Open By Default;
Quantità e Qualità dei dati aperti;
Accessibilità per tutti;
Rilascio dei Dati per migliorare la Governance pubblica e la partecipazione dei cittadini;
Rilascio dei Dati per promuovere l’innovazione.
Ai cinque principi appena elencati seguono, all’interno del documento, altrettanti impegni precisi e
dettagliati che riguardano: i tempi di attuazione; la quantità e qualità dei dati; i formati e le metadatazioni comuni da adottare; la valorizzazione delle best practices; la promozione dei dati presso
cittadini, imprese e società civile.
L’obiettivo è quello di accrescere la consapevolezza dei cittadini e favorire la collaborazione tra gli
Stati per l’adozione e attuazione di principi efficaci e comuni sugli Open Data.
Come ha recentemente dichiarato il Professore Tim Berners-Lee, informatico britannico, coinventore insieme a Robert Cailliau del World Wide Web: "l'International Open Data Charter
(IODC) ha il potenziale per accelerare il progresso mettendo dati fruibili nelle mani della gente"9.
L’Open Data in Europa
L’importanza degli Open Data è riconosciuta anche a livello europeo, ne è testimone l’inclusione
nell’ambito dell’Agenda Digitale Europea di azioni programmatiche che evidenziano il ruolo
fondamentale degli Open Data. Si fa riferimento ad esempio all’azione 3 che si riferisce al mercato
unico digitale, all’interoperabilità (azione 26) e all’uso delle ICT per migliorare i servizi da offrire
alla società (azione 89)10. La Commissione Europea, è intervenuta in materia di riutilizzo
dell'informazione nel settore pubblico con l’adozione della direttiva 2013/37/UE. Tra i principi
espressi nella direttiva, viene ribadito che un’adeguata gestione del patrimonio informativo
pubblico contribuisce a:

supportare la creazione di servizi innovativi da parte di imprese, startup, comunità,
associazioni, organizzazioni e singoli cittadini, per il miglioramento della vita sociale ed
economica dell’intero Paese;

supportare il legislatore e gli organi di governo nelle loro decisioni.
La Commissione Europea ha sviluppato il portale Open Data dell'UE11 che offre, attraverso un
catalogo di metadati, un punto unico di accesso ad una serie sempre più ampia di dati prodotti
dalle istituzioni e da altri organi dell'Unione europea. I dati possono essere liberamente utilizzati,
riutilizzati, collegati tramite link e ridistribuiti a fini commerciali o non commerciali.
Open Data in Italia: il ruolo di AgID
Il Piano Crescita Digitale, la strategia sulle politiche digitali del Governo Italiano, approvato dal
Consiglio dei Ministri il 3 marzo del 2015, definisce gli Open Data come “piattaforma abilitante” per
lo sviluppo dell’innovazione e la trasparenza amministrativa.
L’Agenzia per l’Italia Digitale sostiene il piano di Crescita Digitale e in particolare le politiche di
Open Data con diversi interventi, tra cui l’adozione di linee guida che supportano le
amministrazioni nel processo di valorizzazione del patrimonio informativo pubblico, definendo gli
interventi principali da compiere per l’attuazione della strategia dettata dall’agenda nazionale. Più
precisamente, l’art. 9 del D.L. n. 179/2012 (che ha interamente riscritto l’art. 52 del Codice
9
Open Government Partnership meeting durante l’Assemblea Generale delle Nazioni Unite del 27 Settembre 2015.
10
11
https://ec.europa.eu/digital-agenda/en/digital-agenda-scoreboard.
https://open-data.europa.eu/en/data/.
11
dell’Amministrazione Digitale) stabilisce che “i dati e i documenti che le amministrazioni titolari
pubblicano senza l'espressa adozione di una licenza si intendono rilasciati come dati di tipo aperto”
(principio dell’Open Data by default”) e che l’Agenzia per l’Italia Digitale, in tale contesto,
“promuove le politiche di valorizzazione del patrimonio informativo pubblico nazionale” e presenta
all’inizio di ogni anno “al Presidente del Consiglio dei Ministri o al Ministro delegato per
l'innovazione tecnologica, che li approva entro il mese successivo, un'agenda nazionale in cui
definisce contenuti e gli obiettivi delle politiche di valorizzazione del patrimonio informativo
pubblico e un rapporto annuale sullo stato del processo di valorizzazione in Italia”. La stessa norma
prevede, inoltre, che l’Agenzia definisca e aggiorni annualmente “le linee guida nazionali che
individuano gli standard tecnici, compresa la determinazione delle ontologie dei servizi e dei dati,
le procedure e le modalità di attuazione delle disposizioni del Capo V del CAD con l'obiettivo di
rendere il processo omogeneo a livello nazionale, efficiente ed efficace”. In merito alla
valorizzazione del patrimonio informativo pubblico l’Agenda Nazionale per il 2014 prevedeva un
percorso di valorizzazione delineato lungo tre direttrici principali: banche dati di interesse
nazionale, convenzioni aperte tra Amministrazioni e dati di tipo aperto. Tuttavia, i cambiamenti
normativi intervenuti con il DL 90 dell’Agosto 2014, che hanno portato all’abrogazione delle
convenzioni aperte tra Amministrazioni (revisione dell’articolo 58 del Codice dell’Amministrazione
Digitale), hanno imposto un cambiamento nelle azioni previste dall’agenda nazionale.
Figura 3 Processo di valorizzazione del Patrimonio Informativo Pubblico.
Come si pubblicano i dati: il nuovo portale nazionale dati.gov
L’Agenzia per l’Italia Digitale, oltre a quanto sopra evidenziato, gestisce il portale nazionale dei dati
aperti dati.gov.it in cui sono pubblicati i dati di tutte le Pubbliche Amministrazioni italiane
(ministeri, regioni, comuni, ecc.) e il catalogo delle applicazioni che ne fanno utilizzo. Inoltre, cura
ed aggiorna il repertorio nazionale delle basi dati della Pubblica Amministrazione e gestisce il
catalogo nazionale (Repertorio Nazionale Dati Territoriali – RNDT).
12
AgID ha recentemente provveduto al potenziamento del Portale Nazionale degli Open Data:
dati.gov.it. L’intervento si è reso necessario a causa della bassa qualità dei dati pubblicati e delle
scarse possibilità di riutilizzo degli stessi e per la presenza di licenze che ostacolavano il riuso dei
dati per fini commerciali. AgID, per ottimizzare e potenziare il portale, ha configurato, all’interno
dello stesso, una nuova catalogazione dei dataset e ha sottoposto il portale ad una profonda
revisione dell’architettura interna. In particolare, al fine di promuovere la qualità dei dati pubblicati,
in questa nuova versione, l’Agenzia ha deciso di:
●
●
assicurare un’uniformità dei contenuti del catalogo, che include ora solo metadati che
descrivono i dati aperti disponibili presso le Pubbliche Amministrazioni;
pubblicare sul nuovo portale solo metadati di dati disponibili in formati riconosciuti
come aperti e con associate licenze aperte compatibili con la definizione di Open Data
(i.e., pubblico dominio, attribuzione, attribuzione e condivisione allo stesso modo).
Tali decisioni si riflettono inevitabilmente sul numero complessivo di dataset del catalogo che
risulta quindi inferiore rispetto al passato, ma ne incrementa drasticamente la qualità. Per
assicurare la qualità e l’uniformità dei contenuti del catalogo, il portale include solo metadati che:
●
●
●
descrivono i dati aperti disponibili presso le Pubbliche Amministrazioni;
possiedono formati riconosciuti come aperti;
hanno licenze compatibili con la definizione di Open Data;
Il nuovo sistema è stato pensato partendo dalla richiesta iniziale di rendere i dataset quanto più
accessibili e fruibili ai target di utenza primari identificati dall’Agenzia (cittadini, imprese,
professionisti e Pubblica Amministrazione), il lavoro iniziale è stato quello di analizzare il contesto
di riferimento e le modalità di accesso consolidate tra le diverse tipologie di utenza.
I dataset delle PA centrali e locali sono stati riorganizzati comparando le classificazioni di
riferimento usate dalla Comunità Europea e dai migliori portali Open Data a livello mondiale: oltre
a Territori, Organizzazioni, Formati e Licenze, le due nuove classificazioni, Tema e Genere,
permettono di ordinare, filtrare e aggregare i dataset con nuove modalità. I Temi raggruppano i
dataset in modo verticale, mentre i filtri per Genere sono trasversali alle classificazioni e raccolgono
dataset relativi a dati simili.
Un’ulteriore classificazione identificata col termine “Focus” completa i filtri dell’archivio di dataset. I
Focus sono sezioni dedicate a specifici argomenti di rilievo, anche a supporto dei professionisti del
settore. In particolare:
●
Geo Dati che costituisce un punto di accesso unificato ai dati geografici presenti sul
territorio nazionale;
●
Occupazione e lavoro che offre un approfondimento sulle dinamiche e le evoluzione del
●
mondo del lavoro;
Data For All: contenitore virtuale di dati open accessibili e riusabili anche per i non
addetti ai lavori che racchiude i tre portali tematici ItaliaSicura, Soldipubblici e
OpenExpo12.
12
http://www.dati.gov.it/dataset?f%5B0%5D=field_focus%3A4496.
13
Ciò rende Dati.gov.it la cornice di una più ampia strategia volta a favorire attività che promuovano
la cultura della trasparenza e l’accountability nella Pubblica Amministrazione, stimolando la
diffusione e il riutilizzo dei dati aperti.
Il portale nazionale contiene al suo interno anche le tre piattaforme tematiche (SoldiPubblici,
ItaliaSicura e OpenExpo) che rendono disponibile materiale in modalità Open Data e open content
con licenza aperta. I portali tematici sono stati creati al fine di monitorare e analizzare le
informazioni finanziarie provenienti dagli enti pubblici, tra i quali bilanci, spese e appalti pubblici.
Più precisamente, con lo sviluppo della piattaforma SoldiPubblici si è reso possibile consultare e
raffrontare i dati (aggiornati mensilmente) della spesa pubblica di tutte le amministrazioni locali.
Grazie a questa piattaforma i cittadini possono interrogare le spese delle amministrazioni sulla base
della banca dati SIOPE. SoldiPubblici, difatti, si basa su un motore di ricerca semantico che è in
grado di associare ente a voce di pagamento, sulla base delle codifica gestionale di SIOPE.
ItaliaSicura, invece, è il sistema di monitoraggio degli interventi del Governo per il contrasto al
rischio idrogeologico che fornisce un quadro delle aree per le quali è stato dichiarato lo stato di
emergenza nazionale. Il portale dà accesso agli Open Data su emergenze (ad esempio frane e
alluvioni) e sui relativi lavori effettuati da parte del Governo.
OpenExpo raccoglie i dati sulla gestione, progettazione e organizzazione e svolgimento di Expo
2015, a supporto della correttezza e trasparenza delle procedure connesse alla realizzazione
dell’evento. Il modello utilizzato oltre a catturare l’attenzione del pubblico sugli Open Data si è
rivelato particolarmente interessante a causa della sua potenziale riutilizzabilità per altri grandi
eventi.
In questo contesto, è stato, inoltre, ideato #Data4all, contenitore dei tre portali tematici
(SoldiPubblici, ItaliaSicura e OpenExpo), che è stato candidato dall’Italia agli OGP awards del 2015.
#Data4all viene definito un frame narrativo utilizzato per la comunicazione esterna rivolta a
cittadini, addetti ai lavori e amministrazioni.
Il motore che muove il portale è DKAN13, una piattaforma Open Data basata su Drupal che replica
il design e le funzionalità di Ckan,
la piattaforma più utilizzata attualmente.
I vantaggi di Dkan rispetto a ckan sono molteplici: l’utilizzo di un linguaggio di codice più semplice
(PHP) e l’utilizzo di uno dei CMS più avanzati e utilizzati (Drupal).
Uno degli obiettivi di progettazione di DKAN è rendere più facile per chiunque la possibilità di
creare un ambiente di hosting economico per installare un catalogo di dati, avvalendosi anche
della popolarità di Drupal che si traduce in un’ampia disponibilità di risorse software per aiutare e
supportare lo sviluppo di una piattaforma DKAN: DKAN integra funzionalità di catalogo Open Data
in un CMS esistente, dove i dataset sono trattati come contenuto che possono confluire in flussi di
lavoro più strutturati; Drupal, inoltre, offre una interfaccia utente semplificata per molte attività di
gestione del sito.
Metodi e principi per la valorizzazione degli Open Data
Come accennato sopra, l’Agenzia per l’Italia Digitale è chiamata a promuovere le politiche nazionali
per la valorizzazione del patrimonio informativo pubblico secondo gli indirizzi strategici del
governo, tenendo conto delle esigenze manifestate da cittadini, professionisti e imprese, secondo i
principi dell’Open Data e nel rispetto del contesto normativo vigente.
Le opportunità connesse all'attuazione dell’Agenda Nazionale, infatti, possono contribuire a
evidenziare la trasparenza dell’azione amministrativa e accountability del governo del Paese:
alcune azioni quali, la condivisione dei dati tra le amministrazioni, la messa a disposizione di dati
aperti e accessibili, il rinnovamento dell’azione delle amministrazioni grazie alla partecipazione della
13
http://www.nucivic.com/dkan/.
14
società civile, agevolano il dialogo con quest’ultima e contribuiscono a far comprendere ai cittadini
e alle imprese come le amministrazioni operano nell’interesse pubblico. A tal fine, l'Agenzia attiva i
necessari meccanismi di aggiornamento continuo degli obiettivi fissati con l'Agenda e del relativo
stato di attuazione, dandone conoscenza diretta e immediata a tutti gli interessati.
Alla base dell’Agenda Nazionale si identificano una serie di principi guida, studiati per valorizzare gli
Open Data:
1. Fruibilità: i dati sono fruibili attraverso le tecnologie dell’informazione e della
comunicazione, ivi comprese le reti telematiche pubbliche e private;
2. Interoperabilità: per favorire il massimo riutilizzo dei dati e la massima integrazione di
processi amministrativi, le amministrazioni privilegiano l’uso di standard condivisi e
aperti;
3. Qualità: per favorire la massima fruibilità e il massimo riutilizzo dei dati deve essere
garantito un adeguato livello di qualità nella produzione, gestione e pubblicazione dei
dati. In generale, le amministrazioni seguono le indicazioni dello standard ISO/IEC
25012 “Data quality model” per la qualità dei dati; in particolare, si evidenziano i
seguenti requisiti di qualità:
a. Completezza: i dati sono esaustivi per tutti i loro valori attesi e rispetto alle entità
relative (fonti) che concorrono alla definizione del procedimento, al fine di garantire
l’autoconsistenza della fonte informativa;
b. Accuratezza: i dati, e i loro attributi, rappresentano correttamente il valore reale del
concetto o evento cui si riferiscono;
c. Coerenza: i dati, e i loro attributi, non presentano contraddittorietà rispetto ad altri
dati del contesto d’uso dell'Amministrazione titolare;
d. Metadatazione: dati parzialmente descritti o totalmente non descritti sono di difficile
comprensione sia per le persone, sia per gli agenti automatici. I dati sono quindi
provvisti di metadati e sono descritti
con
opportuni
schemi/vocabolari.
In
particolare, un insieme minimo e comune di metadati accompagna i dati. Inoltre,
possono essere utilizzati metadati più specifici scelti sulla base della tipologia di dati
da descrivere;
e. Originalità: i dati sono riferibili a quelli raccolti e gestiti da o per conto
dell’Amministrazione titolare affinché possano rispondere alle caratteristiche di
credibilità o autenticità della fonte;
f. Attualità (o tempestività di aggiornamento): i dati, e i loro attributi, sono del “giusto
tempo” (sono aggiornati) rispetto ai procedimenti cui si riferiscono;
g. Disaggregazione: per un loro uso più puntuale, i dati si presentano in forma
disaggregata, fermi restando i limiti alla conoscibilità dei dati previsti
dall'ordinamento ed il rispetto della normativa comunitaria in materia di riutilizzo
delle informazioni del settore pubblico.
4. Accessibilità: l’accesso ai dati non deve essere discriminatorio; pertanto essi sono
accessibili anche nel rispetto dei requisiti tecnici di accessibilità di cui all’art. 11 della
legge 9 gennaio 2004, n. 4;
5. Gratuità: i dati sono resi disponibili gratuitamente oppure sono resi disponibili ai costi
marginali sostenuti per la loro riproduzione e divulgazione, salvo casi eccezionali
individuati preventivamente secondo criteri oggettivi, trasparenti e verificabili. Nel
contesto invece della fruibilità dei dati tra amministrazioni per finalità istituzionali, i
dati sono resi disponibili senza oneri a carico delle amministrazioni fruitrici.
6. Riutilizzabilità: l’imposizione di una licenza associata al dato pubblico che ne limiti il
riutilizzo rappresenta una barriera per l’uso del dato stesso. Pertanto, i dati sono resi
15
disponibili secondo i termini di una licenza che ne permetta il massimo utilizzo da parte
di chiunque, anche per finalità commerciali (art. 68 comma 3 lettera b) – 1, del CAD).
I modelli per la classificazione dei dati aperti
Il modello adottato per la classificazione e la guida all'apertura dei dati è quello proposto da Tim
Berners-Lee, ampiamente riconosciuto e accettato a livello internazionale. Esso individua alcuni
principi di qualità che consentono ai dati di tipo aperto di rispondere a requisiti di leggibilità e
accesso. Ne risulta una classificazione a 5 livelli, mostrata nella figura che segue. Tale figura, oltre
a fornire una categorizzazione del tipo di informazione e accesso, pone enfasi sulla qualità dei
servizi che i dati, ai diversi livelli, possono abilitare. Una descrizione dettagliata del modello per i
dati di tipo aperto che si propone è inclusa nelle Linee guida nazionali per la valorizzazione del
patrimonio informativo pubblico.
Figura 4: modelli per la classificazione dei dati aperti
Come si calcola l’impatto: da portali a indicatori
Per favorire la crescita di questo settore è fondamentale conoscere e misurare l’impatto delle
politiche di Open Data e l’uso reale che si può fare dei dati. In merito, ci sono alcuni punti chiave
da affrontare, come ad esempio:



che cosa si intende per impatto;
quali obiettivi si vogliono raggiungere;
valutare se sia possibile partire dalle aree in cui il successo iniziale è stato notevole (come
ad esempio la crescita economica) per accelerare i progressi nelle aree in cui i risultati
finora sono stati meno importanti del previsto (come il rafforzamento della responsabilità
politica).
È opportuno chiarire che per migliorare l'impatto delle politiche di Open Data, si deve partire dal
misurare quanto fatto sino ad ora. Il punto di partenza potrebbe essere quello di verificare:
● il numero di dataset aperti;
● le caratteristiche dei Portali nazionali e locali;
● il numero di dipendenti pubblici con una formazione adeguata in Open Data.
16
Altre misure che potrebbero svolgere un ruolo importante sono quelle che vedono il
coinvolgimento diretto dei cittadini, come ad esempio azioni tese a:
● educare i cittadini in modo che possano fare scelte più informate;
● promuovere l'impegno civico diretto e aumentare la partecipazione dei cittadini ai processi
democratici;
● raccogliere feedback per i decisori politici e/o del settore privato;
● monitorare le azioni dei funzionari e/o il responsabile di azienda responsabili/e degli Open
Data.
Un dato interessante da rilevare è come i progetti Open Data abbiano effetti più impattanti
quando, oltre al coinvolgimento di singole organizzazioni o agenzie governative, nascono dalla
partnership di organizzazioni ed enti appartenenti a diversi settori. A tal proposito il ruolo di
intermediari (quali ad esempio, i media e i gruppi della società civile) si sono rivelati sino ad ora
particolarmente importanti.
L’esigenza di misurare l’impatto è finalizzata ad una maggiore diffusione e ad un miglior utilizzo
degli Open Data. Difatti, la misurazione dell’impatto, attirando l’attenzione sui benefici che possono
trarsi dallo sfruttamento dei dati aperti, accelererebbe il processo di diffusione degli stessi
anticipando i vantaggi che ne derivano.
Tuttavia, al momento non vi sono evidenze concrete circa l'impatto a lungo termine delle iniziative
di Open Data. La mancanza di prove convincenti è in parte dovuta alle difficoltà insite nella
misurazione delle pratiche di buon governo e del cambiamento sociale, ma in parte si sconta anche
il fatto che solo recentemente si è data attenzione a questo particolare settore. Per ovviare a
questo ritardo, molte organizzazioni stanno avviando iniziative sul tema, come ad esempio la World
Wide Web Foundation che ha, recentemente, sperimentato l'uso di indicatori di impatto insieme a
indicatori di preparazione e di attuazione14: un filone perseguito anche da Sunlight Foundation che,
in uno studio di recente pubblicazione, si è concentrata in maniera approfondita proprio
sull’impatto degli Open Data15.
Si rende, ora, necessario un impegno concreto anche da parte dei governi e decisori politici, cui
spetta un ruolo importante nella creazione di un sistema giuridico flessibile che consenta di
includere meccanismi strutturati per la valutazione dei progetti di Open Data.
A tal fine, la politica deve tenere conto di come, dall’analisi delle diverse esperienze pregresse, sia
nazionali che straniere, sia emerso come che i progetti Open Data di maggior successo siano quelli
che affrontano tematiche specifiche o problemi ben definiti che rispondono ad una vera necessità
dei cittadini.
Prima di concludere, si ritiene opportuno specificare come gli Open Data, per quanto efficaci
possano essere, restano un complemento e non un sostituto unico per ottenere un cambiamento
positivo delle istituzioni e dei processi delle Pubbliche Amministrazioni.
Le sfide per la Pubblica Amministrazione
L’impatto che le politiche di Open Data possono avere è naturalmente condizionato dagli ostacoli e
dalle sfide che le amministrazioni devono affrontare a seconda del contesto locale ed ambientale in
cui le attività si inseriscono. Nonostante le difficoltà siano molteplici e diverse tra loro, ci sono
alcune problematiche ricorrenti, a cui devono far fronte tutte le amministrazioni. Si è constatato,
ad esempio, che le politiche ed i progetti sugli Open Data hanno un impatto quasi nullo quando:
14
15
http://opendatabarometer.org/.
https://sunlightfoundation.com/blog/2015/05/05/a-new-approach-to-measuring-the-impact-of-open-data/.
17
● i cittadini hanno una disponibilità limitata di informazioni e mezzi. Ad esempio in Paesi
caratterizzati da un basso tasso di raggiungibilità di Internet o da ambienti politici ostili;
● non rispondono alle esigenze degli utenti;
● non prendono in considerazione la sicurezza degli utenti e non mirano ad attenuare i rischi
legati alla restrizione della privacy;
● non vengono allocate risorse umane ed economiche sufficienti per la fase successiva al
lancio del progetto.
In Italia, a livello nazionale, invece, al fine di ottenere un uso più consistente ed efficace degli
Open Data, la prima sfida da affrontare è quella della costituzione di un modello unico di
riferimento seguito da tutta la PA.
A tal proposito si evidenzia che, per quanto attiene all’uso dei dati, le Amministrazioni tendono a
privilegiare i dati resi disponibili sulla base delle indicazioni rilevabili attraverso il portale nazionale
degli Open Data dati.gov.it, dalle relazioni fornite dalle amministrazioni, e dal rapporto annuale; in
merito, invece, all’effettiva pubblicazione dei dati, nonostante essa risulti oramai consistente,
persistono ancora casi di dati rilasciati in formati proprietari o in formati per cui la rielaborazione
richiede un significativo sforzo, sia tecnologico che umano di comprensione, indicizzazione e
conversione. dati più efficacemente interoperabili, rappresentati seguendo standard internazionali,
sono ancora poco presenti, e riferibili ad alcune realtà più virtuose; molto spesso i dati non
risultano adeguatamente descritti attraverso i relativi meta dati e spesso non vengono aggiornati
con la dovuta frequenza o periodicità. Permangono problemi di riuso legati alle licenze adottate,
non sempre aperte e compatibili, che impediscono l’emergere di esperienze importanti di soluzioni
e servizi che si poggino sul requisito di interoperabilità dei dati stessi, relegati nei pochi esempi
virtuosi che nascono tipicamente a seguito di hackathon o contest organizzati a tale scopo.
Tutti questi elementi costituiscono ancora forti ostacoli che rallentano pesantemente le iniziative di
riutilizzo dei dati stessi.
Tuttavia, seppur in percentuale ancora molto bassa, grazie agli impegni assunti con l’Agenda 2014
che prevedeva il rilascio di specifici dataset prioritari secondo il paradigma dei Linked Open Data,
la suddetta tipologia di dati sta emergendo anche nello scenario italiano.
Le sfide sono ancora tante, ma l’Agenzia per l’Italia Digitale ha il mandato e le possibilità di
supportare le Pubbliche Amministrazioni nel difficile percorso di rilascio dei dati e nella loro
governance.
18
La sperimentazione di framework evoluti per la consultazione e
l’utilizzo dei Linked Government Open Data
A cura di Antonio Bottaro, Responsabile Unità Organizzativa Ricerca e Sviluppo Sogei
L’esperienza di Sogei
Sogei ha realizzato il framework GEOPOI® (GEOcoding Points Of Interest), framework che, ad
oggi, vede una trentina di applicazioni sviluppate nei diversi ambiti del MEF.
GEOPOI è sviluppato nell’ambito delle diverse attività in capo all’unità Ricerca & Sviluppo, che ha il
compito di sperimentare approcci innovativi nelle diverse nicchie tecnologiche.
Geopoi nasce dalla volontà di sperimentare un framework di community per la progettazione
condivisa di interventi sul territorio in grado di mettere a disposizione di più settori della Pubblica
Amministrazione la stessa rappresentazione territoriale, sulla quale possano coesistere e
interoperare sia strati di dati open sia dati “privati” propri dello specifico dominio applicativo di
ciascun singolo utente.
Nell’ambito della progettualità condivisa di interventi sul territorio e specificatamente nelle
applicazioni di Location intelligence, infatti, sono state sperimentate forme di condivisione avanzata
di interfacciamento verso dati georiferiti al territorio che può rappresentare un approccio
estremamente interessante, anche per un utilizzo evoluto di Linked Government Open Data.
Questa nuova e moderna modalità operativa rappresenta un salto di qualità anche rispetto
all’attuale “livello 5” di gestione degli Open Data, che richiede comunque operatori che sappiano
comporre servizi attraverso l’uso di un linguaggio di interrogazione (SPARQL) per dati
rappresentati in Resource Description Framework (RDF).
L’idea originale alla base dell’esperienza Sogei trae ispirazione dal mondo delle diverse istallazioni
artistiche multimediali ad oggi sempre più diffuse, e nasce dalla constatazione che i meccanismi
che consentono agli artisti di manipolare le numerose e complesse fonti di dati multimediali,
necessarie ai fini della creazione delle proprie installazioni offrono il massimo della semplificazione
tecnologica riuscendo nello stesso tempo, a ridurre drasticamente la distanza tra l’idea primigenia
e la sua realizzazione pratica.
Il progetto ha visto la progettazione di un apposito framework, facilmente programmabile
attraverso semplici operazioni di drag&drop di icone autoesplicative (widget grafici) in grado di
comporre classi di servizi: il programmatore opera alla stregua di un bambino che monta il suo
“treno” con i mattoncini delle ‘costruzioni’ prefabbricate. Quando sull’area di lavoro sono state
portate tutte le icone che servono all’ottenimento del servizio voluto, e sono state opportunamente
collegate tra loro secondo una logica ad alto livello che le “lega” logicamente con semplici
connessioni operate da “simboli di freccia” tra icona sorgente ed icona destinazione - attraverso
una sessione di programmazione che può durare al massimo qualche minuto – allora, basterà
premere il tasto “codice” ed il ”listato”, prodotto automaticamente, ove inserito su un qualsiasi
browser – implementerà la soluzione appena programmata.
Tutto ciò avviene senza alcuna conoscenza di informatica specialistica ed è immediatamente
operativo.
Questo modo di operare si sta affermando anche in ambito IoT (Internet of Things) perché
risponde ad una facile programmabilità degli oggetti, consentendo un agevole settaggio dei diversi
attributi degli oggetti da portare in rete. È interessante anche sottolineare come questa filosofia si
19
vada affermando perché si presta ad essere inserita e ad implementare logiche di controllo e di
governance essenziali, sia nell’uso degli Open Data che, soprattutto, in ambito IoT.
Geolocalizzazione dinamica: problematiche legate alla sicurezza del dato di posizionamento
L'uso di queste modalità evolute consente di incorporare servizi per la verifica della integrità e
consistenza del dato di posizionamento in sé, che rappresenta, ad oggi, un tema particolarmente
sottovalutato.
Quando ci si riferisce ad applicazioni che prevedono il monitoraggio di dati di posizionamento in
tempo reale, oppure la comunicazione di dati statici ai quali riferire misurazioni di particolare
rilevanza e per le quali l'attinenza alla posizione diventa strategica (quali, ad esempio, i dati di
centraline di sensori che comunicano lo stato degli inquinanti, che alimentano modelli di previsione
utili a formare le decisioni relative alla mobilità) la necessità di avere certezza del dato di
posizionamento è un tema fortemente connesso alla sicurezza.
Vi sono classi di applicazione dove il dato di posizionamento assume una valenza fondamentale (si
pensi al tracciamento di una merce pericolosa) e le relative problematiche di affidabilità e di
sicurezza del dato assumono un carattere di particolare sensibilità. In un mondo in continua
evoluzione, in cui la sicurezza informatica e fisica stanno assumendo un ruolo preponderante, non
è più possibile affidare la gestione dei dati a servizi di tipo puramente commerciale, senza poterne
verificare l'integrità della sorgente dei dati.
Già sono evidenti i sintomi di una vera e propria “guerra” del tipo “Virus-Antivirus” che si riproporrà
parallelamente a ciò che è accaduto nell’ICT, sul dato di posizionamento. Le tecniche di Jamming e
di Spoofing consentono attualmente, infatti, l’accecamento del segnale GNSS o di trasmettere ai
ricevitori utente segnali falsi, in grado di portare alla determinazione di una posizione “falsificata”.
È evidente cosa ciò possa comportare in applicazioni di tracciamento istituzionale e di antifrode (si
pensi alle deviazioni di percorso predefinito per un operatore del trasporto o ad operazioni di carico
e scarico non autorizzate in ambito doganale). Si tenga conto che la forma più rudimentale di
“spoofer” è costituita da un semplice cavo di alcuni metri, che, una volta condotto il segnale
ricevuto a Radio-frequenza da un’antenna e ritrasmesso, introduce un ritardo sufficiente a
deteriorare le prestazioni, pur mantenendo la struttura primigenia del formato del segnale corretta.
Sull’onda del programma Galileo, che fornirà segnali di posizionamento criptati e servizi protetti
dedicati esclusivamente ad utenti governativi denominati PRS (Public Regulated Services), il
mondo scientifico e della Ricerca sta correndo ai ripari sviluppando tecniche innovative di AntiJamming ed Anti-Spoofing. In particolare, i metodi di Anti-Spoofing possono essere ricondotti di
massima a tre tipologie:
1. metodi autonomi: ricevitori intelligenti in grado di analizzare la qualità del segnale e
determinare eventuali anomalie (rapporto Segnale/Rumore, direzione di arrivo del segnale
univoca per tutti i satelliti, phased array di antenne, etc...);
2. metodi crittografici con autenticazione (ad esempio Navigation Message Authentication,
NMA): il messaggio trasmesso dai satelliti GNSS contiene una chiave di criptatura che
consente di determinare se il segnale ricevuto provenga da un satellite o sia “falsificato”; il
sistema Galileo introdurrà la tecnica di autenticazione nei Commercial Services;
3. correlazione con codici criptati tramite reti di Ricevitori di Riferimento: tramite l’utilizzo di
una rete di Ricevitori di Riferimento GNSS collocati in luoghi sicuri sul territorio nazionale, è
possibile effettuare una correlazione fra il segnale criptato (es. codice P o PRS Galileo)
ricevuto dalle stazioni di Riferimento con quello ricevuto dal ricevitore su campo e
determinare l’autenticità del segnale ricevuto.
20
Per rispondere ad una sfida globale è necessaria una risposta globale. Una soluzione che possa
garantire la sicurezza ed affidabilità necessarie ad un servizio istituzionale deve garantire un
controllo centralizzato degli attacchi sull’intero territorio nazionale. Mentre i primi due metodi
saranno applicabili a livello utente e forniranno una prima risposta alla necessità di difesa da tali
attacchi, la terza soluzione permette un controllo da parte di un Centro di Controllo a livello
Nazionale. Una Rete di Ricevitori di Riferimento GNSS di Monitoraggio consente di erigere una vera
barriera istituzionale contro tali attacchi e di non lasciare la difesa e protezione dei dati di
posizionamento nelle mani di produttori privati (si pensi al monopolio delle aziende di antivirus in
campo informatico ed ai costi di aggiornamento delle relative licenze).
Tali Ricevitori di Riferimento fungeranno da vere e proprie “sonde” sul territorio e dovranno essere
flessibili, riconfigurabili, adattabili e pronte a rispondere ad ogni tipo di attacco Spoofing. A tale
scopo, tali stazioni dovranno basarsi su tecnologia multi-costellazione SDR (Software Defined
Radio). Potrebbe essere inoltre pensabile, similmente a quanto in altri paesi, l'istituzione di un
Agenzia Board sulla Sicurezza del dato di posizionamento che si occupi anche di tutti gli aspetti
correlati (fornitura di chiavi per l’accesso a segnali autenticati, privacy, aspetti legali).
21
Gli “open data” per la calibrazione e il controllo delle politiche di
prevenzione dei rischi sul lavoro. L’esperienza dell’Inail
A cura di Rosaria Mosca e Massimiliano Veltroni, con la collaborazione di Patrizio Galasso
Breve storia dell’esperienza
Nel 2012 l’Inail ha avviato un “progetto dati” finalizzato all’identificazione di un insieme “agile” di
grandezze necessarie per descrivere il fenomeno degli infortuni sul lavoro e delle malattie
professionali. L’insieme fu qualificato “agile” per trasmettere l’idea della facile utilizzazione. E’ stato
reso pubblico nel senso dell’“open data”; è stato utilizzato per finalità gestionali (la prima
utilizzazione ha fornito l’“appendice statistica” alla relazione annuale del presidente); ha consentito
più agevole l’azione di completamento e di scambio della base informativa richiesta da centri di
ricerca e da istituzioni.
L’identificazione dell’insieme di dati, la loro architettura logica e la costruzione di chiavi di lettura
ha richiesto un lavoro di analisi statistica esplorativa e di impostazione metodologica che è
documentato nei tre quaderni di ricerca:
[1] Ciriello, G., De Felice, M., Mosca, R., Veltroni, M., Infortuni sul lavoro. Un modello di
lettura (della numerosità) sugli “open data” dell’Inail, Inail, Quaderni di ricerca, 1, maggio
2013;
[2] De Felice, M., Goggiamani, A., Mosca, R., Veltroni, M., Malattie professionali. Un
modello di lettura (della numerosità) sugli “open data” dell’Inail, Inail, Quaderni di ricerca,
4, dicembre 2014.
[3] De Felice, M., Mosca, R., Rosso, L., Veltroni, M., I vantaggi della prevenzione. Un
modello di lettura del costo degli infortuni sugli “open data” dell’Inail, Inail, Quaderni di
ricerca, 10, in corso di redazione.
Il lavoro è stato svolto da un “gruppo di progetto” coordinato dalla presidenza; i risultati sono stati
trasferiti alla tecnostruttura per l’“industrializzazione” e la gestione “a regime” dei processi
informatici. Gli “open data” sono disponibili all’indirizzo dati.inail.it
Alla ricerca di un’informazione “agile”
L’insieme delle grandezze significative è stato identificato procedendo per ambiti (e fasi): gli
infortuni, le malattie, i costi. L’identificazione delle grandezze è stata guidata da un’analisi statistica
esplorativa, applicata all’insieme dei dati rilevati dall’Inail per le finalità istituzionali (disponibili nei
diversi data base di gestione)16.
Infortuni – Per rappresentare il fenomeno degli infortuni sul lavoro sono state individuate 25
grandezze caratteristiche, raggruppate in 7 insiemi tematici: A – localizzazione temporale
dell’infortunio; B – localizzazione geografica dell’infortunio; C – caratteristiche dell’infortunato; D –
16
Ad esempio, per gli infortuni, sono stati studiati gli andamenti dei ritardi tra accadimento e denuncia; per le malattie sono stati
analizzati gli andamenti dei casi denunciati vs i casi attribuibili a causa di lavoro, la distribuzione degli anni trascorsi tra anno di morte e
anno di protocollo della denuncia, analisi per classe di età alla denuncia.
22
modalità dell’infortunio; E – caratteristiche amministrative dell’infortunio; F – caratteristiche
medico-legali dell’infortunio; G – caratteristiche del datore di lavoro.
Malattie – Le malattie professionali sono descritte da 24 grandezze, raggruppate in anch’esse in 7
insiemi tematici: A – localizzazione temporale del caso di malattia; B – localizzazione geografica del
caso di malattia; C – caratteristiche del lavoratore; D – caratteristiche nosologiche della malattia; E
– caratteristiche amministrative; F – caratteristiche medico-legali della malattia; G – caratteristiche
del datore di lavoro.
L’elenco completo dei dati e nell’appendice 1.
Grandezze di costo – E’ in corso l’analisi dei processi amministrativi delle prestazioni, per
individuare le grandezze caratteristiche che consentano di descrivere i vantaggi economici della
prevenzione, misurando i costi indotti da infortuni e malattie professionali.
Questa fase di attività è previsto si concluda entro il 2015.
L’insieme degli assicurati – L’ultima fase del progetto riguarda la costruzione della base informativa
dell’insieme dei lavoratori assicurati: per poter misurare – per ciascuna testa assicurata – il “tempo
di lavoro nell’anno” e quindi poter calcolare in modo adeguato l’“indice di sinistrosità”. Ne potrà
derivare uno strumento di grande efficacia, per calibrare le politiche di prevenzione, per valutarne
gli esiti, per decidere di eventuali aggiustamenti. (Una prima sperimentazione ha fornito gli indici
presentati sui dati rilevati sino al 2014 per artigiani autonomi, lavoratori parasubordinati,
lavoratori “interinali”17).
Definire il “linguaggio speciale”
Per garantire contenuto informativo ai dati è stato necessario costruire un vocabolario, e
controllare la coerenza dei lemmi con la tecnica del thesaurus; definire i principî di “data quality”
da rispettare e da formalizzare nei protocolli della “politica dei dati”; è stato progettato il
collegamento con insiemi di dati “esterni”, e consentire (con connessioni coerenti) l’arricchimento
dei quadri informativi.
Il vocabolario – I dati dell’Inail (sugli infortuni e sulle malattie) sono raccolti nelle varie fasi del
processo amministrativo e sanitario. Sono caratterizzati da definizioni tipiche di un “linguaggio
speciale o settoriale”18, è un linguaggio che deriva da “ceppi” diversi: amministrativo, assicurativo,
contabile, giuridico, medico-legale, normativo, statistico; deve tener conto delle convenzioni in uso.
Vi si trovano vocaboli e espressioni polirematiche (“frasi”) specifiche19; nel tempo alcune
qualificazioni hanno cambiato significato a seguito di modifiche della normativa20.
Per garantire che gli “open data” abbiano “forma chiara e comprensibile” (come richiesto dal
principio 15 del Codice italiano delle statistiche ufficiali21), siano davvero trasparenti e utilizzabili in
modo non ambiguo è stato necessario avviare la costruzione di un vocabolario del “linguaggio
17
Inail, Relazione del presidente, Roma, luglio 2015, pagine 2-3.
Un “linguaggio speciale o settoriale” (di “certi mestieri o categorie o professioni”) – come definito in De Mauro, T., Nota linguistica
aggiuntiva, in Bocciarelli, R., Ciocca, P., Scrittori italiani di economia, Bari, Laterza, 1994, pagina 410 – “adopera vocaboli assai comuni,
ma in accezioni specifiche”.
19
“modalità di accadimento” (dell’infortunio); per quale modalità l’infortunio sul lavoro può essere classificato “in occasione di lavoro” o
“in itinere”; “definizione amministrativa” del “caso d’infortunio” (“positivo” se l’infortunio rientra nella “tutela assicurativa”, altrimenti
“negativo”, o “in istruttoria” se non è ancora concluso l’iter istruttorio per l’accertamento dei presupposti di ammissione a tutela); “grado
di menomazione”, “classe di menomazione”. Lo stesso caso può cambiare “definizione amministrativa” nel tempo (a seguito dei processi
di revisione, di riesame per contenzioso amministrativo o giudiziario, o di nuovi eventi esterni)
20
E’ stato particolarmente rilevante (anche per gli effetti sulla base statistica) il cambiamento indotto dal Decreto legislativo 38/2000
per cui, nella valutazione del danno permanente, si è passati dal concetto di ridotta attitudine al lavoro a quello di “danno biologico”,
definito come “lesione all’integrità psicofisica, suscettibile di valutazione medico-legale, della persona”.
21
Sistan, Codice italiano delle statistiche ufficiali, emanato dal Comstat con la direttiva n. 10 del 17 marzo 2010.
18
23
speciale dell’Inail”, che perfezioni i glossari e le “avvertenze tecniche per la corretta
interpretazione” dei dati, già in uso22. Nella redazione dei lemmi si è seguito il principio della
definizione “operazionale”, fondata sui criteri di rilevazione misurazione e calcolo23.
Il nucleo del linguaggio speciale è composto da vocaboli e frasi (e organizzato nella forma del
vocabolario). Alcune frasi sono in relazione gerarchica (nel senso delle “voci” e “sotto-voci”). Nei
lemmi del vocabolario sono rappresentate le ascendenze (da sotto-voce a voce) e le discendenze;
sono riportati anche i riferimenti normativi più rilevanti.
In questa fase del progetto sono disponibili i vocabolari costruiti per ambito (su infortuni, su
malattie); l’unificazione – che è programmato venga conclusa entro marzo 2016 – porterà
l’accorpamento di alcuni lemmi e la loro articolazione in “accezioni”.
Le potenzialità del thesaurus – Il thesaurus, composto da elenchi di vocaboli, è servito a mettere in
collegamento vocaboli e lemmi; è stato mezzo efficace, con la individuazione delle relazioni, per
verificare la coerenza logica delle definizioni e dei significati (delle grandezze considerate
caratteristiche per la descrizione del fenomeno)24. Insieme al vocabolario costituisce l’ossatura del
“modello di lettura” dei dati.
Anche il thesaurus è stato costruito “per ambiti” (infortuni e malattie) e dovrà essere unificato.
La “data quality” – Per la definizione e costruzione dei processi di data quality si è fatto riferimento
agli International standard25 e alla Direttiva europea 2009/138/CE “in materia di accesso ed
esercizio delle attività di assicurazione e di riassicurazione” (detta “Solvency II”)26.
La politica dei dati – Sempre in riferimento alla Direttiva “Solvency II” è stata impostata la “politica
dei dati”. La Direttiva impone la definizione (da parte degli organi responsabili delle imprese) di “a
comprehensive policy on data quality”. Perché la “politica dei dati” sia definita in modo “highly
efficient” è richiesto che le azioni finalizzate alla tutela della qualità siano formalizzate in protocolli
di comportamento: ove siano specificate le tecniche di misurazione della qualità, i criteri da
applicare per validare i dati, i ruoli di responsabilità nel processo di “validazione”. Nella Direttiva la
politica dei dati è finalizzata innanzitutto alla “sana e prudente gestione” (in particolare a garantire
l’affidabilità dei dati necessari per i calcoli delle grandezze tecniche). La definizione precisa e il
rispetto rigoroso dei protocolli a tutela della “data quality” è apparsa ancora più rilevante per
quelle istituzioni che debbano utilizzare i dati, oltre che per fini gestionali, per informazione
pubblica.
22
Un esempio di glossario disponibile, che definisce lo stile anche delle successive edizioni, è in Inail, Centenario inail. Statistiche
storiche, Roma, 1983, pagina 9 .
23
Il termine “operazionale” è di Bridgman, che lo utilizzò in The Logic of Modern Physics (New York, 1927); “operationalism” è stato
ripreso successivamente (ne La critica operazionale della scienza, Torino, Boringhieri, 1969, alle pagine 232, 240-241), nel senso di
“dare la descrizione delle condizioni d'uso della parola”, il “sapere come usarla” (“know how with regard to its usage”).
24
Sono stati seguiti finalità e principî definiti anche in Information and documentation – Thesauri and interoperability with other
vocabularies – Part 1: Thesauri for information retrieval, International Standard ISO 25964-1, 2011-08-15, in particolare nelle pagine
12, 103-115, 116.
25
Nel documento Software engineering – Software product Quality Requirements and Evaluation (SQuaRE) – Data quality model,
International Standard ISO/IEC 25012:2008(E), alle pagine 4-10, sono individuate 15 caratteristiche rilevanti: “1 – accuracy, 2 –
completeness, 3 – consistency, 4 – credibility, 5 – currentness, 6 – accessibility, 7 – compliance, 8 – confidentiality, 9 – efficiency, 10 –
precision, 11 – traceability, 12 – understandability, 13 – availability, 14 – portability, 15 – recoverability”. Le caratteristiche da 1 a 5
sono soltanto specifiche del dato (inherent); le 13, 14 e 15 dipendono soltanto dal sistema informatico di riferimento (system
dependent) ; le caratteristiche da 6 a 12 hanno entrambe le qualificazioni: “inherent” e “system dependent”.
26
La qualità dei dati è definita nella Direttiva (nell’articolo 86f ) anche in riferimento ai problemi di responsabilità e di governance
(approfondimenti su questo aspetto sono in De Felice, M., Moriconi, F., Una nuova finanza d’impresa. Le imprese di assicurazione,
Solvency II, le Autorità di vigilanza, Bologna, il Mulino, 2011, pagine 82-88).
24
Il modello di lettura
Perché un modello di lettura – Per i dati di tipo statistico, non ha senso pratico parlare di “open
data” se non si definisce e si rende esplicito (e quindi trasparente) il “modello di lettura” dei dati27.
Definire il modello significa esprimere un’opinione sui modi di rappresentazione del fenomeno (i
fatti), cui i dati si riferiscono: quali sono le grandezze ultime necessarie per descrivere in modo
adeguato il fenomeno; e poi, come organizzarle in tabelle per agevolarne il confronto, quali sono le
definizioni non ambigue (“operazionali”) delle grandezze, quali criteri sono utilizzati per rilevarle o
quali formule (algoritmi) servono per calcolarle, quali dati elementari servono per “alimentare” le
formule (e realizzare le tabelle). Con questo processo si identifica l’insieme dei dati necessari, e le
loro “condizioni d’uso”. Il livello di granularità con cui rendere pubblici i dati dipende poi dai vincoli
di privacy, o da altri criteri di opportunità.
Definire l’adeguatezza del “modello di lettura” è impegno delicato. Il modello deve soddisfare una
sorta di “opinione media” del pubblico degli utilizzatori; perciò, nel caso specifico (della sicurezza
nei luoghi di lavoro), è stato verificato – e dovrà continuare a esserlo – con i corpi politici, le
istituzioni, le parti sociali, i giornalisti, i ricercatori.
La struttura del modello – Il modello di lettura è costituito da tabelle, raggruppate in ambiti:
infortuni, malattie, valutazione economica. Ciascuna tabella (“vista”) è organizzata “su temi” e “a
strati”, per livello di approfondimento. Possono essere definiti percorsi orizzontali tra temi, sullo
stesso strato; linee di approfondimento tematico (a partire dal livello zero, nella logica del “drill
down”); letture trasversali, guidate dalle classi di raggruppamento dei dati.
Il “modello di lettura” dei dati sugli infortuni è definito su un insieme di 58 tabelle (è descritto
nell’appendice 2A). Il “modello di lettura” delle malattie è organizzato in due “blocchi”, composto
complessivamente da 104 tabelle (è descritto nell’appendice 2B).
Considerata la struttura temporale dei fenomeni, nella sua interezza il modello è applicabile a serie
storiche annuali; porzioni di modello sono state applicate alle rilevazioni mensili dei dati raccolti per
mese di denuncia.
I dati in formato aperto, il calendario di pubblicazione
Quali dati – Sono resi pubblici (nel rispetto dei principî della privacy) i dati per singolo caso di
infortuni e malattie professionali. Gli insiemi dei dati sono descritti nell’appendice A1 e A2. È in fase
di predisposizione l’insieme dei dati sulle caratteristiche economiche dei fenomeni.
Il calendario – Con cadenza mensile, per ciascun mese dell’anno aaaa, vengono resi disponibili i
dati relativi alle denunce d’infortunio e di malattia registrate dall’inizio dell’anno al mese di
riferimento, per gli anni aaaa e aaaa-1. Nel mese di luglio dell’anno aaaa, è resa pubblica la serie
storica dei dati (di infortuni e malattie) relativa all’intervallo [aaaa-5, aaaa-1].
Il corredo – I dati sono corredati dal vocabolario, dal thesaurus, dall’insieme delle tabelle dei
“modelli di lettura” frazionate per singola regione, e sul totale nazionale (questo insieme costituisce
l’“appendice statistica” alla relazione annuale del presidente).
27
Il riferimento al “modello di lettura” richiama, in grande, il problema fondamentale dell’inferenza statistica. Per giudicare i fenomeni (e
utilizzare i dati che li descrivono) oltre ai dati serve altro: “occorre in più anche una qualche opinione per interpretarli e per utilizzarli
sensatamente” (de Finetti, B., Probabilità di una teoria e probabilità dei fatti, in AA.VV., Studi di probabilità, statistica e ricerca operativa
in onore di Giuseppe Pompilj, Gubbio, Oderisi, 1971, pagina 97). D’altra parte il dibattito recente sulle grandi quantità di dati da lavorare
con l’“agnostic statistics” (sintetizzato in Anderson, C., The end of theory: will the data deluge makes the scientific method obsolete? ,
http://www.edge.org, 2008) è solo una rilettura modernista di vecchi dialoghi; e l’idea di una “epistemologia con la forza bruta” pone la
domanda: con una ricerca guidata da nessuna ipotesi teorica, non ispirata da alcuna intuizione, “che conoscenza possiamo ottenere?”
(Casati, R., Prima lezione di filosofia, Bari, Laterza, 2011, pagina 173).
25
La soluzione tecnologica
I dati elaborabili sono pubblicati nel formato CSV, nel formato XML e nel formato RDF.
I dati in forma testuale e i testi sono resi disponibili nel formato PDF.
È disponibile una sezione SPARQL per consentire interrogazioni sui file RDF.
I dati sono regolamentati con licenza IODL v.2.0.
Il “data challenge”, il club degli utilizzatori, gli incontri con i giornalisti
Data challenge – Il patrimonio informativo reso pubblico è già imponente, e consente analisi di
dettaglio che possano integrare e specificare le informazioni del “modello di lettura”. Il Comitato
scientifico (per la ricerca) dell’Inail sta valutando come costruire una rete tra i migliori dipartimenti
delle migliori università italiane, per proporre un concorso di “data challenge”. I temi aperti sono
vari e numerosi: di tecnica informatica (interoperabilità); sulla definizione e applicazione di criteri e
metriche di “data quality”; di analisi finanziaria e attuariale; di progettazione di ontologie. E
ovviamente di statistica: le tecniche possono andare dalla statistica descrittiva, alla geo-statistica,
alle analisi di causalità.
Il club – Nella sezione “casi d’uso” del sito, l’Inail raccoglie le comunicazioni degli utenti-utilizzatori
(suggerimenti di miglioramento, motivazioni, caratteristiche di elaborazione e eventuali esiti)
relative all’utilizzazione degli “open data”. E’ un modo per costituire un “gruppo d’interesse”, per
agevolare lo scambio di esperienze e di soluzioni tecniche, e per migliorare le modalità di
comunicazione.
Con i giornalisti – Al miglioramento della qualità della comunicazione sono finalizzati anche gli
incontri con i giornalisti: la presentazione dei dati e il dibattito sugli andamenti dei fenomeni ha
consentito di precisare linguaggio e punti di vista, per rendere più efficaci le chiavi di lettura.
Un mezzo per collaborare tra istituzioni. Verso il “grappolo degli open data”?
La logica degli “open data” – con la tecnica dei metadati – agevola attività interne e la
collaborazione tra istituzioni.
Utilizzazioni interne
La relazione annuale del presidente – Gli “open data” costituiscono gran parte delle informazioni
utilizzate per la relazione annuale del presidente. In particolare per la redazione del capitolo su “la
situazione del mondo del lavoro nei dati dell’Inail, infortuni e malattie professionali”, e per
l’“appendice statistica”.
L’“appendice statistica” riporta le tabelle del modello di lettura degli infortuni, e il “blocco 1” del
modello applicato ai dati delle malattie.
I rapporti regionali – Anche la redazione dei rapporti regionali dell’Inail è stata riorganizzata
utilizzando come base informativa preminente l’insieme degli “open data”. Il menabò dei rapporti
prevede cinque sezioni: 1. La situazione nel mondo del lavoro nei dati Inail; 2. Infortuni; 3.
Malattie professionali; 4. Cura, riabilitazione, reinserimento; 5. Azioni e servizi. I dati sono
rappresentati in 23 tabelle.
26
Il dettaglio di sezioni e tabelle è nell’appendice 2.
Prospezioni e analisi ad hoc – La struttura degli “open data” rende agevole la realizzazione di
“viste” sui dati per l’analisi e lo studio di fenomeni specifici. A questo fine si stanno sperimentando
strumenti di data discovery e di visualizzazione interattiva dei dati. E’ una strumentazione che
potrà dare sostegno al processo di scelta e pianificazione delle attività, e alla verifica degli esiti.
L’aggiornamento mensile di sottoinsiemi significativi di dati consente di curare anche l’aspetto
tattico (consapevoli la tattica non è un’appendice della strategia, ma ne costituisce fattore
essenziale).
Collaborare con le altre istituzioni
Il progetto dati è stato inserito tra le attività svolte nell’ambito del Gruppo di Lavoro per la
Valorizzazione del Patrimonio Informativo Pubblico (coordinato da AgID). In particolare, il rilascio
degli open data relativi alle malattie professionali è stato programmato nell’Agenda Nazionale
2014.
La sperimentazione in corso su tecniche di Linked Open Data e la pubblicazione di open data
tramite servizi applicativi di tipo Service Oriented potranno consentire più agevole integrazione con
dati di altre amministrazioni, favorendo l’interoperabilità e il riuso dei dati.
La collaborazione con l’Istat, col Ministero del Lavoro e delle Politiche Sociali, e con l’Inps conferma
prospettive, efficacia e potenzialità del progetto.
27
Appendici
Appendice 1
Insiemi dei dati resi pubblici
A1 – Infortuni
In dettaglio si ha: A – localizzazione temporale dell’infortunio: 1 – data di rilevazione: è la data di
estrazione dei dati (registrati e validati) dagli archivi; qualifica temporalmente la base informativa;
2 – data di protocollo (del caso): è la data di protocollo del caso;
3 – data di accadimento: è la data in cui si è verificato l’infortunio; 4 – data di definizione: è la
data della definizione amministrativa prevalente; 5 – data di morte: è la data di morte
dell’infortunato a seguito di infortunio; B – localizzazione geografica dell’infortunio
6 – luogo di accadimento: è il codice ISTAT del comune ove è accaduto l’infortunio; C –
caratteristiche dell’infortunato: 7 – identificativo dell’infortunato: codice interno (per analisi
longitudinali); 8 – genere: è il genere dell’infortunato; 9 – età: è l’età dell’infortunato alla “data di
accadimento”, espressa in anni compiuti; 10 – luogo di nascita: codice catastale del luogo di
nascita dell’infortunato; D – modalità dell’infortunio: 11 – modalità di accadimento: codice della
modalità (se “in occasione di lavoro”, “in itinere”) 12 – con/senza mezzo di trasporto (coinvolto):
codice della modalità ( se “con” o “senza”); E – caratteristiche amministrative dell’infortunio: 13 –
identificativo del caso: codice interno (per analisi longitudinali); 14 – definizione amministrativa:
codice che caratterizza la situazione amministrativa del caso d’infortunio (se “positivo” o
“negativo”) o l’esito “in franchigia” o la situazione “in istruttoria”; 15 – definizione amministrativa
dell’esito mortale: codice che caratterizza la situazione amministrativa del caso d’infortunio con
esito mortale (se “positivo” o “negativo”) o la situazione “in istruttoria”; 16 – indennizzo: codice
della tipologia di indennizzo (se “in temporanea”, “in capitale”, “in rendita diretta”, “in rendita a
superstiti”); 17 – causa di negatività per l’esito mortale: codice della causa per cui il caso
d’infortunio con esito mortale è definito negativo (se “attività non tutelata”, per “carenza di
documentazione valida”, se per “difetto della condizione in itinere”, per “difetto della condizione in
occasione di lavoro”, se per “esito mortale non riconducibile all’evento”, se “persona non tutelata”,
se per “altre cause di negatività”).
F – caratteristiche medico-legali dell’infortunio: 18 – grado di menomazione: grado complessivo
della menomazione dell’integrità psicofisica dell’infortunato; 19 – giorni indennizzati: numero dei
giorni indennizzati; G – caratteristiche del datore di lavoro 20 – datore di lavoro: codice interno
identificativo del datore di lavoro (per analisi longitudinali); 21 – posizione amministrativa
territoriale: codice interno; 22 – settore di attività economica: è il codice ATECO primario
dell’assicurante; 23 – gestione: se “agricoltura”, “industria e servizi”, “per conto dello Stato”; 24 –
gestione tariffaria: se “industria”, “artigianato”, “terziario”, “altre attività”; 25 – grande gruppo
tariffario: codice del grande gruppo tariffario (se “lavorazioni agricole e alimenti”; “chimica, carta e
cuoi”; “costruzioni e impianti”; “energia e comunicazioni”; “legno e affini”; “metalli e macchinari”;
“mineraria rocce e vetro”; “tessile e confezioni”; “trasporti e magazzini”; “attività varie”).
A2 – Malattie
A – localizzazione temporale del caso di malattia: 1 – data di rilevazione: è la data di estrazione dei
dati (registrati e validati) dagli archivi; qualifica temporalmente la base informativa; 2 – data di
protocollo (del caso): è la data di protocollo del caso; 3 – data della definizione amministrativa: è
28
la data della definizione amministrativa prevalente; 4 – data di morte: è la data di morte del
lavoratore a seguito di malattia; B – localizzazione geografica del caso di malattia: 5 – sede Inail
competente: indica la provincia di trattazione del caso di malattia professionale; C – caratteristiche
del lavoratore: 6 – identificativo del lavoratore: codice interno (per analisi longitudinali); 7 –
genere: è il genere del lavoratore; 8 – luogo di nascita: codice catastale del luogo di nascita del
lavoratore; 9 – settore lavorativo: è una classificazione dell’Inail per attribuire la malattia
professionale ad un settore di attività lavorativa; 10 – sub-settore lavorativo: è il sottosettore
lavorativo cui è riconducibile l’insorgenza della malattia (classificazione dell’Inail); D –
caratteristiche nosologiche della malattia: 11 – ICD-10 denunciato: codifica la patologia denunciata
secondo la decima revisione della “classificazione internazionale delle malattie e dei problemi
sanitari correlati” ; 12 – ICD-10 accertato: codifica la patologia accertata secondo la decima
revisione della “classificazione internazionale delle malattie e dei problemi sanitari correlati”; 13 –
agente causale accertato: è l’agente, lavorazione o esposizione che può essere causa o concausa
di malattia; 14 – qualificazione di legge: indica se la malattia è “tabellata” o “non tabellata” ; 15 –
se malattia asbesto-correlata: indica se la patologia è asbesto correlata; E – caratteristiche
amministrative: 16 – identificativo del caso: codice interno (per analisi longitudinali); 17 –
definizione amministrativa del caso: codice che caratterizza la situazione amministrativa del caso di
malattia (se “positivo” o “negativo”) o la situazione “in istruttoria”; 18 – definizione amministrativa
del lavoratore: codice che caratterizza la situazione amministrativa prevalente dei casi di malattia
denunciati dal lavoratore; 19 – definizione amministrativa dell’esito mortale: codice che
caratterizza la situazione amministrativa dell’esito mortale (se “positivo”, “negativo”, o “in
istruttoria”) di un caso di malattia professionale; 20 – indennizzo: codice della tipologia di
indennizzo (se “in temporanea”, “in capitale”, “in rendita diretta”, “in rendita a superstiti”); F –
caratteristiche medico-legali della malattia: 21 – grado di menomazione del lavoratore: grado
complessivo della menomazione dell’integrità psicofisica del lavoratore; 22 – grado di
menomazione del caso: grado di menomazione dell’integrità psicofisica relativo all’evento attuale;
23 – giorni indennizzati: numero dei giorni di inabilità (temporanea assoluta) indennizzati a seguito
della malattia professionale; G – caratteristiche del datore di lavoro: 24 – gestione: se
“agricoltura”, “industria e servizi”, “per conto dello Stato”.
29
Appendice 2
2A – Il modello di lettura degli infortuni
Nella tavola 1 è schematizzata la struttura dell’insieme delle tabelle su cui è costruito il “modello di
lettura” del numero degli infortuni.
Tavola 1 – Temi e linee di approfondimento
linea:
B1
B2
B3
B4
B5
B6
B7
livello 0:
B1
B2
B3
B4
B5
B6
B7
B1.1
B2.1
B3.1
B4.1
B5.1
B6.1
B7.1
B1.1.1
B2.1.1
B3.1.1
B4.1.1
B5.1.1
B6.1.1
B7.1.1
B1.1.2
B2.1.2
B3.1.2
B4.1.2
B5.1.2
B6.1.2
B1.1.3
B2.1.3
B3.1.3
B4.1.3
B5.1.3
B6.1.3
1:
B4.1.4
B1.2
B2.2
B3.2
B4.2
B5.2
B6.2
B1.3
B2.3
B3.3
B4.3
B5.3
B6.3
B1.4
B2.4
B3.4
B4.4
B5.4
B6.4
B1.5
B2.5
B3.5
B4.5
B5.5
B6.5
2:
3:
4:
5:
Linea B1
B1
Denunce d’infortunio per modalità di accadimento e anno di accadimento
B1.1
Denunce d’infortunio per gestione, modalità di accadimento e anno di accadimento
B1.1.1 Denunce d’infortunio per gestione tariffaria, modalità di accadimento e anno di
accadimento
B1.1.2 Denunce d’infortunio in occasione di lavoro per settore di attività economica e anno di
accadimento. Gestione industria e servizi
B1.1.3 Denunce d’infortunio in occasione di lavoro per gestione tariffaria, grande gruppo
tariffario e anno di accadimento
B1.2
Denunce d’infortunio per luogo di accadimento e anno di accadimento
B1.3
Denunce d’infortunio per luogo di nascita dell’infortunato, modalità di accadimento e
anno di accadimento
B1.4
Denunce d’infortunio per genere dell’infortunato, modalità di accadimento e anno di
accadimento
B1.5
Denunce d’infortunio per classe d’età dell’infortunato e anno di accadimento
30
Linea B2
B2
Denunce d’infortunio con esito mortale per modalità di accadimento e anno di
accadimento
B2.1
Denunce d’infortunio con esito mortale per gestione, modalità di accadimento e anno di
accadimento
B2.1.1 Denunce d’infortunio con esito mortale per gestione tariffaria, modalità di accadimento e
anno di accadimento
B2.1.2 Denunce d’infortunio con esito mortale in occasione di lavoro per settore di attività
economica e anno di accadimento. Gestione industria e servizi
B2.1.3 Denunce d’infortunio con esito mortale in occasione di lavoro per gestione tariffaria,
grande gruppo tariffario e anno di accadimento
B2.2
Denunce d’infortunio con esito mortale per luogo di accadimento e anno di accadimento
B2.3
Denunce d’infortunio con esito mortale per luogo di nascita dell’infortunato, modalità di
accadimento e anno di accadimento
B2.4
Denunce d’infortunio con esito mortale per genere dell’infortunato, modalità di
accadimento e anno di accadimento
B2.5
Denunce d’infortunio con esito mortale per classe d’età dell’infortunato e anno di
accadimento
Linea B3
B3
Denunce d’infortunio per anno di accadimento, modalità di accadimento e definizione
amministrativa
B3.1
Denunce d’infortunio per gestione, modalità di accadimento e definizione amministrativa.
Anno di accadimento 2011
B3.1.1 Denunce d’infortunio per gestione tariffaria, modalità di accadimento e definizione
amministrativa. Anno di accadimento 2011
B3.1.2 Denunce d’infortunio in occasione di lavoro per settore di attività economica e definizione
amministrativa. Gestione industria e servizi, anno di accadimento 2011
B3.1.3 Denunce d’infortunio in occasione di lavoro per gestione tariffaria, grande gruppo
tariffario e definizione amministrativa. Anno di accadimento 2011
B3.2
Denunce d’infortunio per luogo di accadimento e definizione amministrativa. Anno di
accadimento 2011
B3.3
Denunce d’infortunio per luogo di nascita dell’infortunato, modalità di accadimento e
definizione amministrativa. Anno di accadimento 2011
B3.4
Denunce d’infortunio per genere dell’infortunato, modalità di accadimento e definizione
amministrativa. Anno di accadimento 2011
B3.5
Denunce d’infortunio per classe d’età dell’infortunato e definizione amministrativa. Anno
di accadimento 2011
Linea B4
B4
Denunce d’infortunio con esito mortale per anno di accadimento, modalità di
accadimento e definizione amministrativa
B4.1
Denunce d’infortunio con esito mortale per gestione, modalità di accadimento e
definizione amministrativa. Anno di accadimento 2011
B4.1.1 Denunce d’infortunio con esito mortale per gestione tariffaria, modalità di accadimento e
definizione amministrativa. Anno di accadimento 2011
31
B4.1.2 Denunce d’infortunio con esito mortale in occasione di lavoro per settore di attività
economica e definizione amministrativa. Gestione industria e servizi, anno di accadimento
2011
B4.1.3 Denunce d’infortunio con esito mortale in occasione di lavoro per gestione tariffaria,
grande gruppo tariffario e definizione amministrativa. Anno di accadimento 2011
B4.1.4 Denunce d’infortunio con esito mortale. Analisi delle cause della definizione
amministrativa “negativo”. Anno di accadimento 2011
B4.2
Denunce d’infortunio con esito mortale per luogo di accadimento e definizione
amministrativa. Anno di accadimento 2011
B4.3
Denunce d’infortunio con esito mortale per luogo di nascita dell’infortunato, modalità di
accadimento e definizione amministrativa. Anno di accadimento 2011
B4.4
Denunce d’infortunio con esito mortale per genere dell’infortunato, modalità di
accadimento e definizione amministrativa. Anno di accadimento 2011
B4.5
Denunce d’infortunio con esito mortale per classe d’età dell’infortunato e definizione
amministrativa. Anno di accadimento 2011
Linea B5
B5
Infortuni accertati positivi per anno di accadimento, modalità di accadimento e classe di
menomazione
B5.1
Infortuni accertati positivi per gestione, modalità di accadimento e classe di
menomazione. Anno di accadimento 2011
B5.1.1 Infortuni accertati positivi per gestione tariffaria, modalità di accadimento e classe di
menomazione. Anno di accadimento 2011
B5.1.2 Infortuni in occasione di lavoro accertati positivi per settore di attività economica e classe
di menomazione. Gestione industria e servizi, anno di accadimento 2011
B5.1.3 Infortuni in occasione di lavoro accertati positivi per gestione tariffaria, grande gruppo
tariffario e anno di accadimento. Anno di accadimento 2011
B5.2
Infortuni accertati positivi per luogo di accadimento e classe di menomazione. Anno di
accadimento 2011
B5.3
Infortuni accertati positivi per luogo di nascita dell’infortunato, modalità di accadimento e
classe di menomazione. Anno di accadimento 2011
B5.4
Infortuni accertati positivi per genere dell’infortunato, modalità di accadimento e classe di
menomazione. Anno di accadimento 2011
B5.5
Infortuni accertati positivi per classe d’età dell’infortunato e classe di menomazione. Anno
di accadimento 2011
Linea B6
B6
Infortuni accertati positivi con esito mortale per modalità di accadimento e anno di
accadimento
B6.1
Infortuni accertati positivi con esito mortale per gestione, modalità di accadimento e
anno di accadimento
B6.1.1 Infortuni accertati positivi con esito mortale per gestione tariffaria, modalità di
accadimento e anno di accadimento
B6.1.2 Infortuni accertati positivi con esito mortale per settore di attività economica e anno di
accadimento. Gestione industria e servizi
B6.1.3 Infortuni accertati positivi con esito mortale in occasione di lavoro per gestione tariffaria,
grande gruppo tariffario e anno di accadimento
32
B6.2
B6.3
B6.4
B6.5
Infortuni accertati positivi con esito mortale per luogo di accadimento e anno di
accadimento
Infortuni accertati positivi con esito mortale per luogo di nascita dell’infortunato, modalità
di accadimento e anno di accadimento
Infortuni accertati positivi con esito mortale per genere dell’infortunato, modalità di
accadimento e anno di accadimento
Infortuni accertati positivi con esito mortale per classe d’età dell’infortunato e anno di
accadimento
Linea B7
B7
Infortuni indennizzati per anno di accadimento, modalità di accadimento e tipo di
indennizzo
B7.1
Giorni d’inabilità temporanea assoluta per anno di accadimento, modalità di accadimento
e classe di menomazione
B7.1.1 Giorni medi d’inabilità temporanea assoluta per anno di accadimento, modalità di
accadimento e classe di menomazione
33
2B – La lettura delle malattie
Nella tavola 2 è schematizzata la struttura dell’insieme delle tabelle del “blocco 1”.
Tavola 2 – Temi e linee di approfondimento. La struttura del “blocco 1”
linea:
M1
M2
M3
M4
M5
M6
M7
livello 0:
M1
M2
M3
M4
M5
M6
M7
M1.1
M2.1
M3.1
M4.1
M5.1
1:
M7.1
M7.1.1
M1.2
M2.2
M3.2
M4.2
M1.3
M2.3
M3.3
M4.3
M5.2
2:
3:
M1.4
4:
La struttura dell’insieme delle tabelle del “blocco 2” è schematizzata nella tavola 3.
Linea M1
M1
Denunce
M1.1 Denunce
M1.2 Denunce
M1.3 Denunce
M1.4 Denunce
di
di
di
di
di
malattie
malattie
malattie
malattie
malattie
professionali per genere e anno di protocollo
professionali per gestione, genere e anno di protocollo
professionali per luogo di nascita, genere e anno di protocollo
professionali per regione e anno di protocollo
professionali per settore ICD-10 denunciato e anno di protocollo
Linea M2
M2
Lavoratori e casi di malattie professionali
amministrativa.
M2.1 Lavoratori e casi di malattie professionali
amministrativa. Anno di protocollo 2013
M2.2 Lavoratori e casi di malattie professionali
amministrativa. Anno di protocollo 2013
M2.3 Lavoratori e casi di malattie professionali
protocollo 2013
per anno di protocollo, genere e definizione
per gestione, genere e definizione
per luogo di nascita, genere e definizione
per regione e definizione amministrativa. Anno di
Linea M3
M3
Lavoratori con malattie professionali riconosciute per anno di protocollo, genere e classe di
menomazione
M3.1 Lavoratori con malattie professionali riconosciute per gestione, genere e classe di
menomazione. Anno di protocollo 2013
M3.2 Lavoratori con malattie professionali riconosciute per luogo di nascita, genere e classe di
34
menomazione. Anno di protocollo 2013
M3.3 Lavoratori con malattie professionali riconosciute per regione e classe di menomazione.
Anno di protocollo 2013
Linea M4
M4
Lavoratori con malattie professionali asbesto correlate riconosciute per anno di protocollo,
genere e classe di menomazione
M4.1 Lavoratori con malattie professionali asbesto correlate riconosciute per gestione, genere e
classe di menomazione. Anno di protocollo 2013
M4.2 Lavoratori con malattie professionali asbesto correlate riconosciute per luogo di nascita,
genere e classe di menomazione. Anno di protocollo 2013
M4.3 Lavoratori con malattie professionali asbesto correlate riconosciute per regione e classe di
menomazione. Anno di protocollo 2013
Linea M5
M5
Lavoratori deceduti con riconoscimento di malattia professionale per gestione, genere e
anno di decesso
M5.1 Lavoratori deceduti con riconoscimento di malattia professionale per luogo di nascita,
genere e anno di decesso
M5.2 Lavoratori deceduti con riconoscimento di malattia professionale per tipo di malattia, classe
di età e anno di decesso
Linea M6
M6
Malattie professionali per settore ICD-10 accertato e anno di protocollo
Linea M7
M7
Lavoratori con malattie professionali riconosciute per anno di protocollo, genere e tipo
indennizzo
M7.1 Giorni d’inabilità temporanea assoluta per anno di protocollo, genere e classe di
menomazione
M7.1.1
Giorni medi d’inabilità temporanea assoluta per anno di protocollo, genere e classe
di menomazione
35
Tavola 3 – Temi e linee di approfondimento. La struttura del “blocco 2”
linea:
MM1
MM2
MM3
MM4
MM5
MM6
MM7
MM8
livello 0:
MM1
MM2
MM3
MM4
MM5
MM6
MM7
MM8
MM1.1
MM2.1
MM3.1
MM4.1
MM5.1
MM6.1
MM7.1
MM8.1
MM1.2
MM2.2
MM3.2
MM4.2
MM5.2
MM6.2
MM7.2
MM8.2
1:
2:
MM1.2.1 MM2.2.1 MM3.2.1 MM4.2.1 MM5.2.1 MM6.2.1 MM7.2.1 MM8.2.1
MM1.3
MM2.3
MM3.3
MM4.3
MM5.3
MM6.3
MM7.3
MM8.3
3:
MM1.3.1 MM2.3.1 MM3.3.1 MM4.3.1 MM5.3.1 MM6.3.1 MM7.3.1 MM8.3.1
MM1.4
MM2.4
MM3.4
MM4.4
MM5.4
MM6.4
MM7.4
MM8.4
4:
MM1.4.1 MM2.4.1 MM3.4.1 MM4.4.1 MM5.4.1 MM6.4.1 MM7.4.1 MM8.4.1
MM1.4.2 MM2.4.2 MM3.4.2 MM4.4.2 MM5.4.2 MM6.4.2 MM7.4.2 MM8.4.2
MM1.5
MM2.5
MM3.5
MM4.5
MM5.5
MM6.5
MM7.5
MM8.5
5:
Linea MM1
MM1
Tumori (C00-D48) per anno di protocollo, genere e classe ICD-10
MM1.1
Tumori (C00-D48) per anno di protocollo, qualificazione di legge e classe ICD-10
MM1.2
Tumori (C00-D48) per territorio e classe ICD-10. Anno di protocollo 2013
MM1.2.1 Tumori (C00-D48) per territorio e ICD-10. Anno di protocollo 2013
MM1.3
Tumori (C00-D48) per settore, subsettore e classe ICD-10. Anno di protocollo 2013
MM1.3.1 Tumori (C00-D48). Anno di protocollo 2013
MM1.4
Tumori (C00-D48) per anno di protocollo, grande gruppo agente causale e classe ICD10
MM1.4.1 Tumori (C00-D48) per grande gruppo agente causale, gruppo agente causale e
classe ICD-10. Anno di protocollo 2013
MM1.4.2 Tumori (C00-D48) a maggior frequenza per ICD-10 e gruppo agente causale. Anno
di protocollo 2013
MM1.5
Tumori (C00-D48) per anno di protocollo, grado di menomazione attuale e classe ICD10
Linea MM2
MM2
Malattie del sistema nervoso (G00-G99) per anno di protocollo, genere e classe ICD10
MM2.1
Malattie del sistema nervoso (G00-G99) per anno di protocollo, qualificazione di legge
e classe ICD-10
MM2.2
Malattie del sistema nervoso (G00-G99) per territorio e classe ICD-10. Anno di
36
MM2.2.1
MM2.3
MM2.3.1
MM2.4
MM2.4.1
MM2.4.2
MM2.5
protocollo 2013
Malattie del sistema nervoso (G00-G99) per territorio e ICD-10. Anno di protocollo
2013
Malattie del sistema nervoso (G00-G99) per settore, subsettore e classe ICD-10.
Anno di protocollo 2013
Malattie del sistema nervoso (G00-G99). Anno di protocollo 2013
Malattie del sistema nervoso (G00-G99) per anno di protocollo, grande gruppo agente
causale e classe ICD-10
Malattie del sistema nervoso (G00-G99) per grande gruppo agente causale, gruppo
agente causale e classe ICD-10. Anno di protocollo 2013
Malattie del sistema nervoso (G00-G99) a maggior frequenza per ICD-10 e gruppo
agente causale. Anno di protocollo 2013
Malattie del sistema nervoso (G00-G99) per anno di protocollo, grado di menomazione
attuale e classe ICD-10
Linea MM3
MM3
Malattie dell'orecchio e dell'apofisi mastoide (H60-H95) per anno di protocollo, genere
e classe ICD-10
MM3.1
Malattie dell'orecchio e dell'apofisi mastoide (H60-H95) per anno di protocollo,
qualificazione di legge e classe ICD-10
MM3.2
Malattie dell'orecchio e dell'apofisi mastoide (H60-H95) per territorio e classe ICD- 10.
Anno di protocollo 2013
MM3.2.1 Malattie dell'orecchio e dell'apofisi mastoide (H60-H95) per territorio e ICD-10. Anno
di protocollo 2013
MM3.3
Malattie dell'orecchio e dell'apofisi mastoide (H60-H95) per settore, subsettore e
classe ICD-10. Anno di protocollo 2013
MM3.3.1 Malattie dell'orecchio e dell'apofisi mastoide (H60-H95). Anno di protocollo 2013
MM3.4
Malattie dell'orecchio e dell'apofisi mastoide (H60-H95) per anno di protocollo, grande
gruppo agente causale e classe ICD-10
MM3.4.1 Malattie dell'orecchio e dell'apofisi mastoide (H60-H95) per grande gruppo agente
causale, gruppo agente causale e classe ICD-10. Anno di protocollo 2013
MM3.4.2 Malattie dell'orecchio e dell'apofisi mastoide (H60-H95) a maggior frequenza per ICD10 e gruppo agente causale. Anno di protocollo 2013
MM3.5
Malattie dell'orecchio e dell'apofisi mastoide (H60-H95) per anno di protocollo, grado di
menomazione attuale e classe ICD-10
Linea MM4
MM4
Malattie del sistema circolatorio
10
MM4.1
Malattie del sistema circolatorio
legge e classe ICD-10
MM4.2
Malattie del sistema circolatorio
protocollo 2013
MM4.2.1 Malattie del sistema circolatorio
2013
MM4.3
Malattie del sistema circolatorio
Anno di protocollo 2013
(I00-I99) per anno di protocollo, genere e classe ICD(I00-I99) per anno di protocollo, qualificazione di
(I00-I99) per territorio e classe ICD-10. Anno di
(I00-I99) per territorio e ICD-10. Anno di protocollo
(I00-I99) per settore, subsettore e classe ICD-10.
37
MM4.3.1 Malattie del sistema circolatorio (I00-I99). Anno di protocollo 2013
MM4.4
Malattie del sistema circolatorio (I00-I99) per anno di protocollo, grande gruppo
agente causale e classe ICD-10
MM4.4.1 Malattie del sistema circolatorio (I00-I99) per grande gruppo agente causale, gruppo
agente causale e classe ICD-10. Anno di protocollo 2013
MM4.4.2 Malattie del sistema circolatorio (I00-I99) a maggior frequenza per ICD-10 e gruppo
agente causale. Anno di protocollo 2013
MM4.5
Malattie del sistema circolatorio (I00-I99) per anno di protocollo, grado di
menomazione attuale e classe ICD-10
Linea MM5
MM5
Malattie del sistema respiratorio (J00-J99) per anno di protocollo, genere e classe
ICD-10
MM5.1
Malattie del sistema respiratorio (J00-J99) per anno di protocollo, qualificazione di
legge e classe ICD-10
MM5.2
Malattie del sistema respiratorio (J00-J99) per territorio e classe ICD-10. Anno di
protocollo 2013
MM5.2.1 Malattie del sistema respiratorio (J00-J99) per territorio e ICD-10. Anno di protocollo
2013
MM5.3
Malattie del sistema respiratorio (J00-J99) per settore, subsettore e classe ICD-10.
Anno di protocollo 2013
MM5.3.1 Malattie del sistema respiratorio (J00-J99). Anno di protocollo 2013
MM5.4
Malattie del sistema respiratorio (J00-J99) per anno di protocollo, grande gruppo
agente causale e classe ICD-10
MM5.4.1 Malattie del sistema respiratorio (J00-J99) per grande gruppo agente causale, gruppo
agente causale e classe ICD-10. Anno di protocollo 2013
MM5.4.2 Malattie del sistema respiratorio (J00-J99) a maggior frequenza per ICD-10 e gruppo
agente causale. Anno di protocollo 2013
MM5.5
Malattie del sistema respiratorio (J00-J99) per anno di protocollo, grado di
menomazione attuale e classe ICD-10
Linea MM6
MM6
Malattie della cute e del tessuto sottocutaneo (L00-L99) per anno di protocollo, genere
e classe ICD-10
MM6.1
Malattie della cute e del tessuto sottocutaneo (L00-L99) per anno di protocollo,
qualificazione di legge e classe ICD-10
MM6.2
Malattie della cute e del tessuto sottocutaneo (L00-L99) per territorio e classe ICD-10.
Anno di protocollo 2013
MM6.2.1 Malattie della cute e del tessuto sottocutaneo (L00-L99) per territorio e ICD-10. Anno
di protocollo 2013
MM6.3
Malattie della cute e del tessuto sottocutaneo (L00-L99) per settore, subsettore e
classe ICD-10. Anno di protocollo 2013
MM6.3.1 Malattie della cute e del tessuto sottocutaneo (L00-L99). Anno di protocollo 2013
MM6.4
Malattie della cute e del tessuto sottocutaneo (L00-L99) per anno di protocollo, grande
gruppo agente causale e classe ICD-10
MM6.4.1 Malattie della cute e del tessuto sottocutaneo (L00-L99) per grande gruppo agente
causale, gruppo agente causale e classe ICD-10. Anno di protocollo 2013
38
MM6.4.2 Malattie della cute e del tessuto sottocutaneo (L00-L99) a maggior frequenza per ICD10 e gruppo agente causale. Anno di protocollo 2013
MM6.5
Malattie della cute e del tessuto sottocutaneo (L00-L99) per anno di protocollo, grado
di menomazione attuale e classe ICD-10
Linea MM7
MM7
Malattie del sistema osteomuscolare e del tessuto connettivo (M00-M99) per anno di
protocollo, genere e classe ICD-10
MM7.1
Malattie del sistema osteomuscolare e del tessuto connettivo (M00-M99) per anno di
protocollo, qualificazione di legge e classe ICD-10
MM7.2
Malattie del sistema osteomuscolare e del tessuto connettivo (M00-M99) per territorio e classe ICD-10. Anno di protocollo 2013
MM7.2.1 Malattie del sistema osteomuscolare e del tessuto connettivo (M00-M99) per territorio
e ICD-10. Anno di protocollo 2013
MM7.3
Malattie del sistema osteomuscolare e del tessuto connettivo (M00-M99) per settore,
subsettore e classe ICD-10. Anno di protocollo 2013
MM7.3.1 Malattie del sistema osteomuscolare e del tessuto connettivo (M00-M99). Anno di
protocollo 2013
MM7.4
Malattie del sistema osteomuscolare e del tessuto connettivo (M00-M99) per anno di
protocollo, grande gruppo agente causale e classe ICD-10
MM7.4.1 Malattie del sistema osteomuscolare e del tessuto connettivo (M00-M99) per grande
gruppo agente causale, gruppo agente causale e classe ICD-10. Anno di protocollo
2013
MM7.4.2 Malattie del sistema osteomuscolare e del tessuto connettivo (M00-M99) a maggior
frequenza per ICD-10 e gruppo agente causale. Anno di protocollo 2013
MM7.5
Malattie del sistema osteomuscolare e del tessuto connettivo (M00-M99) per anno di
protocollo, grado di menomazione attuale e classe ICD-10
Linea MM8
MM8
Malattie asbesto correlate per anno di protocollo, genere e classe ICD-10
MM8.1
Malattie asbesto correlate per anno di protocollo, qualificazione di legge e classe ICD10
MM8.2
Malattie asbesto correlate per territorio e classe ICD-10. Anno di protocollo 2013
MM8.2.1 Malattie asbesto correlate per territorio e ICD-10. Anno di protocollo 2013
MM8.3
Malattie asbesto correlate per settore, subsettore e classe ICD-10. Anno di protocollo
2013
MM8.3.1 Malattie asbesto correlate. Anno di protocollo 2013
MM8.4
Malattie asbesto correlate per anno di protocollo, grande gruppo agente causale e
classe ICD-10
MM8.4.1 Malattie asbesto correlate per grande gruppo agente causale, gruppo agente causale
e classe ICD-10. Anno di protocollo 2013
MM8.4.2. Malattie asbesto correlate a maggior frequenza per ICD-10 e gruppo agente causale
Anno di protocollo 2013
MM8.5
Malattie asbesto correlate per anno di protocollo, grado di menomazione attuale e
classe ICD-10
39
Appendice 2
I dati quantitativi dei rapporti regionali
1. La situazione nel mondo del lavoro nei dati Inail: 1.1 – Posizioni assicurative (Gestione Industria
e Servizi); 1.2 – Premi accertati e incassati (Gestione Industria e Servizi); 1.3 – Rateazioni in
autoliquidazione; 1.4 – Rateazioni ordinarie; 1.5 – Indennizzi in temporanea; 1.6 – Indennizzi in
capitale; 1.7 – Rendite.
2. Infortuni: 2.1 – Denunce di infortunio per modalità e anno di accadimento; 2.2 – Denunce di
infortunio con esito mortale per modalità e anno di accadimento; 2.3 – Infortuni accertati positivi
per modalità e anno di accadimento; 2.4 – Infortuni accertati positivi per esito e anno di
accadimento; 2.5 – Giornate di inabilità temporanea per esito e anno di accadimento.
3. Malattie professionali: 3.1 – Malattie professionali denunciate e riconosciute per anno di
protocollo; 3.2 – Lavoratori che hanno denunciato malattie professionali e casi, per definizione
amministrativa; 3.3 – Malattie professionali riconosciute con esito mortale per anno di decesso.
4. Cura, riabilitazione, reinserimento: 4.1 – Prestazioni sanitarie per prime cure e tipologia di
accadimento; 4.2 – Lavoratori assistiti da équipe multidisciplinari; 4.3 – Progetti di reinserimento;
4.4 – Spese di produzione e acquisto per protesi, ortesi e ausili.
5. Azioni e servizi: 5.1 – Attività di vigilanza; 5.2 – Incentivi per la sicurezza; 5.3 – Riduzione del
tasso per prevenzione: numero di istanze accolte e minor importo pagato; 5.4 – Servizi omologativi
e certificativi richiesti e resi.
40
L’importanza della geografia come elemento di integrazione e
raccordo degli Open Data ed i processi per assicurare la qualità dei
dati
A cura di Massimo Fustini, Direzione Generale Organizzazione, personale, sistemi informativi e
telematica Regione Emilia-Romagna
L’esperienza della Regione Emilia-Romagna
I dataset geografici sono sicuramente tra quelli più richiesti. I contatori di download dei principali
siti Open Data della Pubblica Amministrazione dimostrano che il dato geografico è tra quelli di
maggior interesse. Ma come viene utilizzato il dato geografico scaricato? Sostanzialmente in tre
diversi modi:
1. come lettura dei fenomeni che avvengono sul territorio (la mappa dell’uso del suolo
classifica il territorio dell’intera regione sulla base dell’utilizzazione del territorio ad una
certa data);
2. come base di riferimento da utilizzare per mappare informazioni proprie (dai percorsi
turistici, agli studi per la localizzazione di nuovi insediamenti, per studiare fenomeni legati
all’ambiente, ecc..);
3. come base sulla quale eseguire analisi e fare confronti (ad esempio studiare la copertura
territoriale di un determinato servizio).
Il dato geografico all’interno della Pubblica Amministrazione gioca un ruolo fondamentale per
indirizzare tre aspetti chiave per il successo degli Open Data:
1. possibilità di georiferire Open Data non geografici (es. strutture ricettive, le imprese, i lavori
pubblici, i dati sanitari, i dati ambientali, …);
2. raccordo ed armonizzazione dei dati della Amministrazione che pubblica Open Data rispetto
alla dimensione geografica;
3. elemento di raccordo fra Open Data provenienti da Pubbliche Amministrazioni diverse.
È ormai ampiamente condiviso il principio che il coinvolgimento di cittadini, imprese, ma anche
delle diverse divisioni in cui è organizzata la Pubblica Amministrazione nelle decisioni e gestione
partecipata del territorio passa attraverso la condivisione della conoscenza. Gli Open Data sono il
mezzo principe di questa condivisione, se a fronte di ogni decisione, norma, indirizzo venissero
messi a disposizione i dati utilizzati per arrivare a quella decisione la discussione e la
socializzazione sarebbero molto più rapide e i conflitti basati sulla non conoscenza condivisa della
realtà verrebbero ridotti se non annullati. È qui che l’informazione geografica gioca un ruolo
decisivo. Se tutti i dati riguardanti direttamente o indirettamente il territorio (e per gli enti locali
questi dati rappresentano la parte più significativa delle informazioni trattate) raccolti e gestiti
nell’ambito dei processi della Pubblica Amministrazione fossero correttamente raccordati al
territorio sarebbe possibile pubblicare dati georefernziati e di qualità. Il processo di geocodifica
delle informazioni gestionali può avvenire in due modi o attraverso il processo di
georeferenziazione diretta (assegnando coordinate esplicite alle informazioni trattate) o attraverso
il processo di georeferenziazione indiretta, usando nelle banche dati gestionali chiavi geografiche
come gli indirizzi, i riferimenti catastali, i nomi dei comuni, i nomi delle strade, i numeri delle
sezioni di censimento ISTAT che permettono in modo indiretto di assegnare coordinate
geografiche alle entità trattate.
Il dato georeferenziato ha una capacità espressiva molto maggiore del semplice dato alfanumerico
perché amplia le possibilità di analisi abilitando funzioni geostatistiche come la correlazione
41
territoriale, le analisi di densità, ecc. L’Open Data geografico permette alle imprese di porre
domande del tipo: “voglio aprire un nuovo esercizio commerciale a Bologna, dove sono gli altri
negozi dello stesso tipo, dove si concentra la mia clientela d’elezione, ci sono in zona immobili
commerciali liberi, la zona è servita da mezzi pubblici, in zona ci sono strutture pubbliche che
possono attrarre la mia potenziale clientela, ci sono parcheggi a pagamento con cui potrei fare una
convenzione, ecc.”; se riusciamo a mettere a disposizione dati di qualità, affidabili ed aggiornati
che siano in grado di descrivere il territorio o ciò che vi avviene (sempre nel rispetto della privacy)
allora si attiva il mercato, i cittadini, le imprese, gli studiosi e si abilitano anche quelle nuove
professioni che all’estero si stanno man mano formando di specialisti che conoscendo il patrimonio
informativo sanno dare risposte qualificate a domande complesse come quella dell’esempio
precedente.
Gli Open Data geografici hanno quindi un forte ruolo di spinta per il coinvolgimento degli
utilizzatori esterni ma ha anche un ruolo chiave nella condivisione dei dati all’interno delle singole
Pubbliche Amministrazioni e fra Pubbliche Amministrazioni diverse. Sempre con un esempio, si
pensi ad una unione di comuni che deve ottimizzare il servizio di polizia municipale o un’area vasta
che deve programmare il trasporto locale o la regione che deve programmare iniziative a sostegno
delle aree interne, fino all’istruttore di una pratica edilizia o di una pratica SUAP che deve verificare
l’ammissibilità di un intervento. Tutti questi soggetti per svolgere il proprio lavoro devono
interagire con informazioni riferite al territorio prodotte da enti diversi, tutti hanno l’esigenza di
superare i confine degli enti che hanno prodotto i dati e di avere una visione complessiva del dato
sull’intero territorio di interesse e soprattutto deve disporre del dato nel momento in cui gli serve
(evitando di fare convenzioni, accordi, richieste ad altri enti ma semplicemente prelevando i dati
che gli altri enti hanno aperto e messo a disposizione delle altre amministrazioni).
Perché tutto questo sia possibile è necessario che i dati geografici di riferimento siano di qualità,
affidabili e costantemente aggiornati, per fare questo la Regione Emilia-Romagna ha:

creato una infrastruttura di dati territoriali, per la raccolta, l’aggiornamento, la condivisione
dei dati geografici;

ha definito linee guida per la decertificazione e l’apertura di banche dati per una
progressiva apertura dei dati all’interno della PA e verso l’esterno;

nell’ambito del processo di decertificazione ha definito e condiviso con gli enti locali un
modello di Anagrafe Comunale degli Immobili all’interno della quale vengono gestite le
chiavi territoriali di riferimento;

ha impostato lo sviluppo delle nuove applicazioni per la digitalizzazione dei processi su un
modello di Pubblica Amministrazione digitale che vede la condivisione dei dati e dei
documenti come il mezzo per la semplificazione del rapporto con il cittadino.
La qualità della dimensione geografica dei dati alfanumerici è quindi la chiave di volta, l’ingrediente
di base di una apertura di qualità dei dati.
Il modello di gestione ed apertura dei dati geografici in Regione Emilia-Romagna
La regione Emilia-Romagna per abilitare il processo di miglioramento continuo dell’informazione
geografica come base di raccordo delle altre informazioni prodotte dal sistema degli enti locali ha
prodotto un modello di riferimento e implementato degli strumenti per lo sviluppo della conoscenza
della geografica del territorio:
1. l’infrastruttura di dati territoriali della regione Emilia-Romagna;
42
2. il sistema dell’Anagrafe Comunale degli Immobili e la gestione del ciclo dell’edilizia unitario
per l’intera regione;
3. la pubblicazione come Open Data dei dati geografici di riferimento e la creazione di un
insieme di servizi di accesso alle banche dati di riferimento.
Il modello è stato sviluppato per rendere interoperabili e confrontabili le fonti dati geografiche
gestite ai diversi livelli (regionale e locale) ed alla costituzione di una base di conoscenza condivisa
del territorio.
All'interno degli enti (siano essi enti locali o direzioni regionali) l'informazione territoriale può
essere classificata, ai fini del modello, nelle seguenti categorie:

immagini da satellite o foto aeree che forniscono una restituzione fotografica in scala del
territorio;

oggetti topografici che delimitano e classificano gli elementi fisici e riconoscibili del territorio
(edifici, strade, fiumi); il data base topografico contiene tutti gli oggetti topografici e nel
suo insieme fornisce una descrizione completa del territorio;

oggetti tematici utilizzati per rappresentare sul territorio elementi specifici dei diversi
domini; appartengono a questa categoria gli elaborati di una piano urbanistico, la carta
dell'uso del suolo, la mappa delle aziende agricole, la mappa delle farmacie, le linee di
trasporto pubblico, le reti tecnologiche, la mappa catastale;

oggetti di riferimento: sono quegli oggetti territoriali utilizzati per riferire al territorio le
informazioni alfanumeriche; appartengono a questa categoria ad esempio i numeri civici, le
particelle catastali, le sezioni di censimento, i limiti amministrativi, ecc.
A queste si accompagna una modalità standard di definizione dei metadati descrittivi delle
informazioni (che per quanto riguarda i dati territoriali è particolarmente importante in quanto
definisce per ogni fonte le modalità di costruzione dei dati, l'estensione spaziale e temporale, gli
uffici di riferimento, ecc..) tutti dati necessari per poter stabilire se e come il dato può essere
utilizzato.
L'obiettivo del modello è quello di definire il modo in cui gli enti, a prescindere dalle modalità con
cui vengono gestiti internamente, possa rendere fruibili ed interoperabili i dati territoriali in modo
da creare una base di conoscenza completa e condivisa dell'intero territorio regionale.
I principi che stanno alla base del modello sono quelli della non duplicazione del dato territoriale
ma del suo riuso attraverso servizi standard perseguendo in questo modo l'obiettivo della integrità,
qualità e quindi affidabilità del dato.
I comuni, le direzioni regionali ed altri enti territoriali nell'ambito dei propri compiti di istituto,
producono e gestiscono sia oggetti geografici di riferimento fondamentali per il modello (per i
comuni le anagrafi comunali degli immobili) che oggetti tematici (p.e. piani urbanistici) e
riferiscono le proprie banche dati gestionali agli oggetti di riferimento estendendo in questo modo
l'insieme di strati informativi della propria infrastruttura di dati geografici. I dati prodotti sono nella
maggior parte dei casi di interesse generale.
Il modello ha definito la modalità con la quale la Regione rende disponibili i dati geografici. Le
modalità adottate sono standard, devono essere adottate dagli enti locali per la fruizione dei dati
geografici prodotti dalla regione e possono essere utilizzate per la pubblicazione dei dati degli enti
locali verso la regione e più in generale verso il mondo esterno.
I servizi territoriali previsti dal modello sono rappresentati nella figura seguente e successivamente
descritti in maggior dettaglio:
43
Figura 5 Modello di gestione ed apertura dei dati geografici in Regione Emilia-Romagna
Questa la descrizione del modello:

Servizi di catalogo: si tratta di servizi che consentono di scoprire di quali risorse
cartografiche dispone un ente e delle modalità con le quali l'ente le rende disponibili sia in
forma cartacea che in forma digitale. Se le fonti cartografiche sono pubblicate in forma
digitale il catalogo specifica le modalità di accesso. Questi servizi si basano sulla
consultazione dei metadati;

Servizi di visualizzazione delle mappe: fanno parte di questo insieme i servizi standard OGC
per la pubblicazione di immagini georeferenziate create dinamicamente attraverso
l’interrogazione delle banche dati geografiche e servizi di pubblicazione di mappe statiche
che hanno la caratteristica di essere veloci e fluide come le mappe di Google;

Servizi di geocodifica: comprendono tutti i servizi necessari per collegare informazioni
alfanumeriche tramite l'utilizzo di chiavi territoriali (via e numero civico, foglio e mappale,
UUID) al territorio, fanno parte di questo insieme i servizi per la ricerca in mappa
utilizzando toponimi (nomi di località, fiumi, monti, case), per ottenere i nomi dei luoghi
date le coordinate e per la geocodifica di banche dati alfanumeriche;

Servizi di accesso ai dati geografici, fanno parte di questo insieme i servizi che consentono
di estrarre i dati dai db geografici. I servizi sono standard OGC e permettono, con un
apposito linguaggio, di estrarre dati geografici e un insieme di servizi per l'estrazione dei
dati nei formati standard più diffusi. A questo ambito appartengono anche i servizi per la
pubblicazione come Open Data e Linked Open Data dei dati geografici. Vengono
ricompresi in questo insieme anche i servizi di analisi di prossimità e di routing;

Servizi di aggiornamento dei dati geografici: fanno parte di questo insieme i servizi per
l'aggiornamento del db topografico, di conferimento di nuove informazioni geografiche nei
db dell'ente e di editing via web;
44

Servizi di conversione di coordinate: I servizi che fanno parte del modello sono per la
maggior parte standard ISO supportati sia da prodotti di mercato, sia da prodotti Open
Source ai quali si aggiunge, per i servizi specifici regionali, la disponibilità di software a
riuso che possono essere utilizzati per l'erogazione dei servizi. I servizi che fanno parte del
modello sono indipendenti fra loro e garantiscono la fruizione delle singole funzionalità
secondo le interfacce standard definite dal modello, indipendentemente dalla presenza
degli altri servizi.
Le linee guida per la decertificazione in Emilia-Romagna
In coda a queste premesse va fatto cenno al “Modello di Amministrazione Digitale - MAD” che la
Regione ha delineato con la D.G.R. n. 983/2012 (allegato 2B: “Disegno della PA Digitale:
dematerializzata, interconnessa e cooperativa”). Il MAD rappresenta il modello concettuale cui la
regione guarda al fine di ripensare la propria organizzazione e azione amministrativa in un’ottica di
transizione verso il digitale.
In questa sede va tenuto presente che, per la visione di insieme con cui è stato concepito, il MAD
supporta il concetto di decertificazione, sia promuovendo la pubblicazione di servizi standard sulle
banche dati fondamentali della Pubblica Amministrazione, sia definendo opportune interfacce di
accesso che permettano, nello specifico, “una completa decertificazione nei rapporti fra PA e
privati attraverso l'acquisizione diretta dei dati presso le amministrazioni certificanti da parte delle
amministrazioni procedenti o, in alternativa, la produzione da parte degli interessati solo di
dichiarazioni sostitutive di certificazione o dell'atto di notorietà”. Solo se i diversi sistemi parlano un
linguaggio comune sarà possibile per ogni PA rendere disponibile il proprio patrimonio informativo
alle altre PA e viceversa. L’apertura di anagrafi certificanti all’interno della PA e, nei limiti del
rispetto della privacy, verso cittadini, è visto come fattore abilitante di una PA digitale di qualità ed
efficiente.
Al fine di accelerare il processo di decertificazione e quindi di apertura delle banche dati di
riferimento della PA è stato prodotto un insieme di linee guida di natura normativa, tecnica ed
organizzativa finalizzate a rendere accessibili le anagrafi certificanti presenti all’interno della
Pubblica Amministrazione della Regione Emilia-Romagna. Le linee guida delineano un percorso di
individuazione, verifica documentazione ed apertura delle anagrafi certificanti. Le linee guida sono
state applicate alle quattro banche dati fondamentali per il funzionamento delle amministrazioni
locali e sono stati implementati e messi in produzione i servizi di accesso ai dati stessi i quali, salvo
eventuali limitazioni o impedimenti specifici, sono stati pubblicati come Open Data:

Anagrafe della popolazione residente;

Anagrafe delle imprese;

Anagrafe comunale degli immobili;

Database topografico;
Particolarmente rilevante il sistema di gestione dell'anagrafe comunale degli immobili che
costituisce l'elemento chiave per il raccordo dei dati relativi agli immobili: l’anagrafe permette di
rispondere tempestivamente a domande relative agli immobili, quali: Dove è? Come è fatto? Cosa
è legittimo? Cosa è abusivo? Chi ha diritti? Quali interventi sono ammessi? Quale l’efficienza
energetica? Dove riqualificare? Dove ricostruire? Quali attività economiche vi sono? Quante
persone vi abitano? Quali i consumi? Il sistema è una banca dati certificante che gestisce le chiavi
territoriali fondamentali e che garantisce la correlazione alla fonte delle informazioni catastali con
quelle comunali e descrive compiutamente gli immobili sotto tutti i profili previsti dalle norme
45
vigenti ed abilita la possibilità di decertificare le informazioni relative agli immobili. I dati relativi
agli immobili, ai numeri civici ed alla loro collocazione sono pubblicati, come Open Data, Linked
Open Data e Open Services, e resi disponibili per poter essere utilizzati, riferiti, integrati con
informazioni provenienti da altri soggetti pubblici e privati. I dati correlati agli identificativi
territoriali e pubblicati come Open Data o attraverso Open Services sono in questo modo fra loro
confrontabili rispetto al territorio perché condividono un unico modello aperto di
georeferenziazione delle informazioni.
Il modello di circolarità ed aggiornamento dell’informazioni geografica di riferimento
Diventa quindi di fondamentale importanza mettere a disposizione della PA dei cittadini e delle
imprese informazioni geografiche di base costantemente aggiornate, di alta qualità ed affidabilità.
La regione e diversi comuni da tempo rendono disponibili le proprie basi di dati geografiche ai
privati (professionisti, studiosi, imprese) che le utilizzano per la propria attività professionale.
Alcuni enti hanno visto in questa azione un mezzo per creare una fonte affidabile e continua di
aggiornamento della propria cartografia, ricevendo dai professionisti, nell'ambito del processo di
gestione delle pratiche edilizie, elaborati cartografici già correttamente georiferiti.
La logica open sottesa consente di creare un circolo virtuoso di aggiornamento dei dati geografici:
gli enti mettono a disposizione i propri dati geografici, il mondo esterno li usa per i propri scopi,
così generando nuove informazioni correttamente georiferite e linkate al territorio. Quindi gli enti
locali acquisiscono nell’ambito dei propri processi istituzionali le nuove informazioni, le consolidano
nelle proprie basi geografiche complessive e ne certificano la qualità. Si alimenta così un processo
di co-aggiornamento della conoscenza del territorio.
Da questo punto di vista, gli strati informativi più importanti fra quelli che possono essere sono i
riferimenti territoriali: numeri civici, mappali catastali, toponomastica. Essi rappresentano le chiavi
di raccordo con il territorio dei diversi Open Data pubblicati non solo dagli enti locali ma anche da
altri soggetti che operano sullo stesso territorio (utilities e gestori delle reti, regione, provincia,
associazioni, l’elenco è virtualmente infinito con gli opportuni strumenti).
Questi riferimenti, laddove esista un sistema informativo territoriale comunale, sono contenuti nelle
banche dati gestite dal comune per i propri compiti istituzionali e per questo normalmente
caratterizzati da un livello di qualità e affidabilità elevato e non raggiungibile da altri soggetti
produttori di dati geografici (i big vendor di grafi stradali o i portali globali come Google o
Microsoft).
La regione ha messo a fattor comune la modalità di gestione ed aggiornamento delle chiavi
territoriali che deve essere collocato al livello dei comuni (solo i comuni governano le fonti
informative necessarie per tenere aggiornata la numerazione civica e la toponomastica), in modo
che si arrivi anche alla standardizzazione delle modalità di gestione e di pubblicazione delle chiavi
di riferimento. È stato inoltre definito un “modello dati operazionale” ed un “modello di gestione
dei dati relativi agli immobili” (che ricomprende anche la gestione della toponomastica e della
numerazione civica) e sono state realizzate delle componenti software riusabili, con lo scopo di
diffondere in tutti gli enti un modello uniforme di creazione e gestione dell'anagrafe degli immobili
(in regione Emilia-Romagna la quasi totalità dei comuni ha aderito al progetto).
I dati degli immobili, omogenei fra loro, certificati e di alta qualità, previa opportuna valutazione di
effettiva possibilità, vengono pubblicati come Open Data, Open Services e Linked Open Data e
messi a disposizione delle città.
Il modello estende quanto realizzato nell'ambito del progetto SigmaTER, modello oggi in uso in
diverse regioni italiane, andando ad aggiungere alla porzione di anagrafe degli immobili gestita
dall'Agenzia delle Entrate (ex Agenzia del Territorio) le componenti informative di origine comunale
(come ad esempio la numerazione civica) creando in questo modo l'Anagrafe Comunale degli
46
Immobili. Il modello prevede che l'Anagrafe Comunale degli Immobili venga aggiornata con il
flusso di dati generato dalle pratiche edilizie presentate in forma digitale dai professionisti (in
regione Emilia-Romagna, come in altre regioni d’Italia, la modulistica per l’edilizia è stata
unificata). Dai flussi di aggiornamento dell’anagrafe degli immobili nascono anche i flussi di
aggiornamento di alcuni strati del database topografico regionale che, in questo modo viene
anch’esso mantenuto aggiornato.
La pubblicazione dei dati geografici come Open Data e Open Services attiva un circolo virtuoso che
si conclude con la produzione di nuovi dati geografici utili per aggiornare le banche dati
geografiche degli enti.
Gli Open Data geografici come uno dei fattori abilitanti la Smart Community
La Smart Community è una comunità che si fonda su una forte interconnessione basata su un
continuo scambio di informazioni fra i diversi attori (Pubblica Amministrazione, multi utilities,
società di trasporti, associazioni, cittadini, imprese, università, protezione civile, professionisti) che
interagendo ne determinano il funzionamento.
Un modello integrato è piattaforma abilitante in quanto offre servizi, anagrafi di riferimento sempre
aggiornate e di qualità e un sistema di interconnessione fra le diverse Pubbliche Amministrazioni
sul quale si fondano le future applicazioni per la Smart Community. La condivisione delle anagrafi
fondanti e dei loro sistemi di chiavi ed identificativi crea la base di conoscenza comune ed
omogenea del territorio e di ciò che vi insiste con una estensione che va al di la dei confini della
singola città, tale estensione mette in condizione il pubblico e il privato di poter realizzare sistemi
di gestione della città nella sua forma reale, sistemi che mettendo in correlazione informazioni
provenienti anche dal mondo privato e dai sistemi di sensori con quelle provenienti dalle anagrafi e
dai servizi territoriali, possono permettere di affrontare temi anche molto complessi legati alla
sicurezza, al risparmio energetico ed in generale al benessere della popolazione e così via. Il
processo di semplificazione in atto fa sicuramente parte del processo di creazione della Smart
Community nella quale la Pubblica Amministrazione diventa leggera per il cittadino e l'impresa,
senza rinunciare ai propri compiti di istituto di governo e di controllo; la circolarità e disponibilità
delle informazioni ed una conoscenza sempre aggiornata del territorio permette all'impresa ed al
cittadino di concentrare l'interazione con la Pubblica Amministrazione sul merito delle questioni
annullando il tempo e lo sforzo necessario per recuperare quello che l'Amministrazione già
conosce.
Il modello di PA digitale che si sta consolidando a livello internazionale fa leva sulla
standardizzazione di Open Services e Open Data visti sia come mezzo per l’integrazione interna fra
le diverse componenti della PA che come elemento abilitante per la realizzazione di applicazioni
innovative per la Smart Community che ci si aspetta verranno realizzate principalmente dal mondo
privato. La Pubblica Amministrazione aprendo Dati e Servizi di qualità introduce standardizzazione
e uniformità abilitando in questo modo la realizzazione di servizi (prevalentemente mobile) che
integrando nei servizi esposti dalla PA informazioni provenienti dal settore privato rispondono alle
specifiche esigenze del singolo attore della Smart Community.
Considerazioni conclusive
La disponibilità di Open Data della Pubblica Amministrazione ha come fini primari la valorizzazione
del patrimonio informativo pubblico, e l’abilitazione e “l’essere motore” di iniziative imprenditoriali
(es: creazione servizi mobile, data journalism, data analysis) e civiche (cittadini, associazioni, civic
hacking). Tale disponibilità di dati non deve essere intesa esclusivamente rivolta verso l’esterno ma
anche alle dimensioni interne della specifica Amministrazione e tra Pubbliche Amministrazioni, vista
come mezzo per l’integrazione interna fra le diverse componenti della PA, innescando anche
47
meccanismi di miglioramento in termini di efficienza. A tal fine, è necessario predisporre modelli e
sistemi (in termini di processi) “sostenibili” che abilitino la creazione di Open Data di qualità in
termini di omogeneità, riferimenti comuni, ecc. Tali modelli e sistemi devono prevedere il
coinvolgimento attivo di tutti gli attori (Pubbliche Amministrazioni principalmente, ma anche
privati) coinvolti nella generazione e gestione dei dati. L’Open Data e l’Open Government generano
quindi impatti sia all’interno dell’Amministrazione (sulle strutture organizzative, fino anche ai
“rapporti di potere”), sia all’esterno; per questo motivo è di fondamentale importanza definire
chiaramente gli obiettivi che ci si pone con queste azioni e individuare i relativi strumenti di
valutazione e benchmarking.
La “dimensione” geografica dei dati è elemento di integrazione, confronto e validazione; gli Open
Data e in particolare gli Open Data geografici, sono uno dei fattori abilitanti la Smart Community.
La disponibilità di banche dati certificate e certificanti è fattore di primaria importanza per
l’assicurazione della qualità dei dati nel tempo.
48
L’esperienza Open Data in Roma Servizi per la Mobilità
A cura di Stefano Giovenali, Responsabile della Struttura Organizzativa Servizi della Mobilità, Roma
Servizi per la Mobilità
Gli Open Data per l’infomobilità
L’Agenzia Roma Servizi per la Mobilità dispone dal 2007 di una piattaforma di infomobilità che
eroga servizi di ausilio agli spostamenti per cittadini, turisti e city-users. Attraverso sistemi di
monitoraggio eterogenei, l’Agenzia “fotografa” e storicizza lo stato del traffico cittadino e la
posizione puntuale dei veicoli del trasporto pubblico locale. I dati sono poi forniti agli utenti
attraverso diversi canali e servizi. Tra i servizi maggiormente utilizzati si ricordano:



Cerca linea: il servizio permette di cercare le linee del trasporto pubblico locale e mostrarne
le informazioni statiche (percorsi, fermate, mappe) e dinamiche (tempi di percorrenza
misurati, posizione dei veicoli, tempi di attesa alle fermate);
Cerca percorso: è un route planner multimodale dinamico. Attraverso la conoscenza dello
stato effettivo della rete, il servizio suggerisce istante per istante l’itinerario migliore per
raggiungere la destinazione. I modi di trasporto considerati sono: trasporto pubblico
(Autobus e tram urbani, metropolitana, ferrovie suburbane e regionali), trasporto privato e
mobilità sostenibile (bike and ride, park and ride, car sharing, car pooling);
News: il servizio fornisce notizie sulla mobilità pubblica e privata.
L’intera piattaforma di infomobilità è stata progettata, sviluppata e mantenuta internamente da
“Roma Servizi per la Mobilità”; l’Università di Roma “Tor Vergata” ha validato l’approccio dinamico
del route planner, confrontando gli itinerari suggeriti da esso con quelli proposti da un route
planner statico commerciale (Google Transit) e misurando il miglioramento della qualità delle
soluzioni. I servizi di infomobilità della piattaforma sono erogati sui seguenti canali:



il sito web mobile muovi.roma.it, ottimizzato per i dispositivi mobili anche di vecchia
generazione;
i siti web curati dall’Agenzia, agenziamobilita.roma.it e muoversiaroma.it, tramite una web
app interattiva;
l’app ufficiale “Muoversi a Roma”, per smartphone Android e iOS.
A partire dal 2012 i principali dati e servizi della piattaforma di infomobilità sono esposti
pubblicamente come Open Data. La licenza adottata dall’Agenzia è di tipo Creative Commons
Attribuzione 3.0 Italia. Inoltre, è pubblicato il codice sorgente della maggior parte della piattaforma
di infomobilità, con licenza GNU General Public License v2.
Allo stato attuale, l’Agenzia pubblica in modo aperto i seguenti elementi:


dati statici o dati che cambiano lentamente nel tempo: struttura della rete del trasporto
pubblico locale, collocazione degli impianti semaforici, confini e varchi di accesso a zone a
traffico limitato e aree interessate da particolari discipline di traffico, parcheggi di scambio;
servizi dinamici: i servizi Cerca Linea e Cerca Percorso permettono di conoscere lo stato
della rete del trasporto pubblico locale in tempo reale e di pianificare gli spostamenti. Il
servizio Tempi di percorrenza misura il tempo di percorrenza con mezzo privato delle
principali arterie cittadine. Il servizio News fornisce informazioni sulla mobilità pubblica o
49

privata. Il servizio ZTL informa sulla programmazione e sullo stato attuale delle zone a
traffico limitato;
codice sorgente: la piattaforma di infomobilità dell’Agenzia è sviluppata internamente. Gran
parte del codice realizzato è pubblicato con licenza aperta sulla piattaforma di condivisione
del codice Bitbucket. L’obiettivo della condivisione è duplice: permettere il riutilizzo e la
modifica del codice da parte di enti terzi, istituzioni e organizzazioni; e innescare un
processo di partecipazione attiva dei cittadini, che hanno la possibilità di apportare
modifiche migliorative al software, e proporne l’adozione all’Agenzia stessa. In particolare
l’Agenzia pubblica il codice della parte algoritmica (cerca percorso in tempo reale, stima dei
tempi di percorrenza), del sito web mobile, della web app e dell’app Androiod/iOS.
L’Agenzia, infine, consente e incoraggia l’inclusione dei propri servizi di infomobilità all’interno di
siti web di terze parti non solo attraverso gli Open Data, ma anche tramite strumenti per
webmaster, permettendo anche la personalizzazione dei servizi offerti.
L’accesso ai dati dell’Agenzia
Il punto di partenza per l’accesso agli Open Data dell’Agenzia è il sito web
http://dati.muovi.roma.it. Le modalità di accesso variano a seconda della tipologia di dato esposto,
e sono le seguenti:



dati statici: i dataset statici sono esposti attraverso file (es. il file GTFS con la descrizione
della rete del trasporto pubblico locale), oppure mediante un sistema GIS che offre i dati
geografici attraverso il protocollo GeoServices REST. Non è necessaria alcuna registrazione
per scaricare i dati statici;
servizi dinamici: L’API dei servizi di infomobilità è esposta mediante web service XML-RPC.
Per accedere ai servizi è necessaria la registrazione come sviluppatore. La registrazione è
gratuita e non richiede l’approvazione da parte dell’Agenzia; permette all’Agenzia di
controllare il corretto utilizzo dei servizi, in conformità alla licenza CC-BY-3.0-IT e secondo
un criterio di “fair usage”. Sul sito web è presente la documentazione completa dell’API, e
alcuni esempi di utilizzo dei dati;
codice sorgente: Il codice sorgente della piattaforma è pubblicato su Bitbucket. È possibile
scaricare direttamente il codice, oppure effettuare un fork del repository Mercurial e
apportare modifiche. Un sistema di trouble ticketing consente di segnalare
malfunzionamenti. È anche possibile scaricare un’immagine di una macchina virtuale con
una copia della piattaforma pronta all’uso (previo riallineamento del codice e dei dati).
Gli utenti degli Open Data
Alla data odierna risultano registrati come sviluppatori 447 soggetti. Tra questi, diversi soggetti
sono impegnati nella realizzazione e nel rilascio di servizi che sfruttano i dati dell’agenzia per offrire
un servizio proprio, di solito catalogabile nelle seguenti categorie:



App “locali” per la mobilità romana: rientrano in questa categoria applicazioni come
Autobus Roma, Probus Roma, Roma Bus, Roma Giorno&Notte (il Messaggero), ecc;
App internazionali: Citymapper, Moovit, Transit App, Google Maps (solo dati statici),
Ricerca e sviluppo da parte di università (es. Tor Vergata), partner di progetti europei (es.
IBM Research), ecc.
50
Tramite gli strumenti per webmaster, la web app di RSM è inclusa in diversi siti istituzionali e non,
come ad esempio i siti di Roma Capitale e i siti del quotidiano Leggo, oltre ad essere incorporata
nei siti intranet di aziende romane come servizio per il mobility management.
Le sfide per il prossimo futuro
Come fin ora descritto, l’esperienza di Roma Servizi della Mobilità nello sviluppo di politiche sugli
Open Data è da considerarsi sicuramente un caso di successo, in particolar modo per il livello di
riutilizzo da parte di soggetti terzi dei dati pubblicati.
Rimangono tuttavia grandi margini di miglioramento che stanno peraltro già guidando le attività in
corso. Le risorse necessarie all’adeguato funzionamento delle architetture tecnologiche alla base
dell’erogazione dei servizi open crescono, evidentemente, di pari passo con la diffusione dei servizi
stessi: ciò pone un problema di sostenibilità economica della piattaforma informativa che sta
portando alla rivisitazione del modello stesso di condivisione.
Fino ad oggi, infatti, nella fase iniziale dell’operazione, si è partiti dal presupposto che le risorse di
calcolo a cui gli stakeholders potevano attingere per il riutilizzo dei servizi dovessero essere messe
a disposizione da Roma Servizi per la Mobilità. Un modello diverso è più sostenibile potrebbe
prevedere che siano proprio gli stakeholders ad assumersi l’onere dei costi computazionali. Ciò –
data ormai per acquisita la maturità dei servizi – corrisponderebbe anche ad un criterio di
maggiore equità per il sistema visto nel suo complesso.
Per il raggiungimento di tale obiettivo si possono intravedere diverse soluzioni organizzative e
tecnologiche e, a ben vedere, si potrebbe immaginare una strada analoga a quella percorsa dai
diversi soggetti erogatori di servizi di cloud computing: un provider – in questo caso Roma Servizi
per la Mobilità – metterebbe a disposizione liberamente le tecnologie ma farebbe pagare le risorse
necessarie al loro funzionamento. Una soluzione di questo tipo può presentare diverse criticità: in
primo luogo non si può non notare che la complessità nella gestione di un servizio di cloud
computing è alta e che una simile ipotesi implicherebbe necessariamente un’organizzazione interna
che rischierebbe di assorbire eccessive energie rispetto ai benefici tangibili che potrebbe portare.
In secondo luogo, l’introduzione di un rapporto contrattuale monetizzato con gli stakeholders
potrebbe inquinare il valore culturale dell’operazione e finirebbe con ogni probabilità per far
apparire ridotta la natura open della condivisione.
È auspicabile, tuttavia, che su tali aspetti venga effettuata un’azione di coordinamento a livello
centrale, da un soggetto istituzionale, perché è del tutto evidente che con l’aumentare dei dati
disponibili e delle tecnologie sottostanti, il requisito di sostenibilità economica delle piattaforma di
pubblicazione diventerà sempre più prioritario.
Un modello alternativo prevede invece che i singoli stakeholders possano singolarmente installare
in maniera autonoma su dei propri server i motori di calcolo finalizzati alla erogazione dei servizi. Si
prospetta quindi uno scenario in cui si materializza una rete di provider che erogano i servizi in
maniera indipendente, connessi soltanto dalla fonte originaria del dato che rimarrebbe in Roma
Servizi per la Mobilità. Il punto di forza più immediato per Roma Servizi per la Mobilità
consisterebbe nell’abbattimento degli oneri computazionali, visto che le richieste da servire si
limiterebbero a clienti diretti e ai singoli stakeholders, e non alle richieste dei clienti di questi ultimi.
Non sono poche le criticità da tenere in considerazione: una di queste è la perdita del controllo
diretto sul monitoraggio degli accessi ai servizi: mentre ora, infatti, ogni richiesta passa per i server
di Roma Servizi per la Mobilità, domani le richieste dei clienti finali sarebbero gestite unicamente
dagli stakeholders. Perdere la misura della diffusione di questi servizi implica, per esempio, una
maggiore difficoltà nella valutazione degli impatti delle politiche sugli Open Data nel loro
complesso. Va detto tuttavia che nell’insieme degli stakeholders stanno naturalmente emergendo
dei soggetti più forti, in numero assai limitato, con cui è ragionevole riuscire ad instaurare rapporti
51
strutturati per accedere a queste informazioni. Da notare anche che un provvedimento di questo
tipo scarica (o meglio sarebbe dire “distribuisce”) una parte della complessità sugli altri provider.
Ciò significa che alcuni di questi dovranno dotarsi di infrastrutture proprie con il relativo esborso
economico. In ogni caso, per sua stessa natura, una simile politica è graduabile: piccoli provider
potranno necessitare di un piccolo server, provider più importanti dovranno sostenere spese più
ingenti che tuttavia risulterebbero giustificate dalla numerosità dei propri clienti. Ancora, sarà
possibile introdurre sin dall’inizio una gradualità nella distribuzione, ciò potrebbe essere fatto
proprio sulla base degli accessi richiesti da ogni applicazione: fino ad un certo numero potrebbero
essere accettati, oltre dovrebbero essere presi in carico per intero. Il rischio è che il totale del
carico sia così parcellizzato da impedire quest’ultimo accorgimento, e ciò dovrà essere valutato
nella fase attuativa. Un prerequisito non così intuitivo per poter attuare questa strategia è
l’adozione di tecnologie che siano non semplicemente open source, bensì siano riconosciute come
soluzioni standard.
Roma Servizi per la Mobilità ha già rilasciato tutto il codice sorgente della propria piattaforma con
licenza open source, tuttavia la scelta che è stata fatta negli anni passati – anche per mancanza di
alternative open con il giusto livello di maturità – è stata quella di uno sviluppo ex novo dei
software alla base dei servizi open. Il progetto, per quanto accessibile, non risulta nei fatti davvero
mantenibile, in quanto gli stakeholders dovrebbero farsi carico di installare e mantenere una
soluzione unica per cui non esiste una vera e propria community di sviluppatori in grado di dare
un’assistenza adeguata e di instaurare quel circuito virtuoso di condivisione della conoscenza alla
base della filosofia open source, indispensabile per garantire un carattere di sostenibilità al
software così sviluppato.
Due sono le novità – in tal senso – emerse negli ultimi anni: da un lato la promozione da parte di
Google dello standard (de facto) GTFS (General Transit Feed Specification) e il consolidamento del
progetto Open Trip Planner.
Il primo riguarda il modo in cui rappresentare una rete del Trasporto Pubblico e gli aggiornamenti
in tempo reale del suo stato (posizione dei veicoli, tempi di arrivo alle fermate, variazioni
estemporanee del servizio). Il secondo è un progetto correlato all’assai più famosa piattaforma
Open Street Map e consiste in un motore dinamico e multimodale di calcolo del percorso, proprio
basato sullo standard GTFS.
La presenza di queste due nuove alternative dà forza e concretezza all’approccio ipotizzato: è
ragionevole proporre agli sviluppatori di installare per proprio conto un prodotto standard ed
utilizzare formati standard per mantenere le proprie applicazioni, sia pur con le criticità evidenziate
poco sopra. Da notare, anzi, che il recente arrivo nell’ambito degli stakeholders di soggetti
internazionali che per loro natura si trovano a dover integrare dati dalle realtà più svariate, ha
prodotto stimoli molto forti in tal senso. Infine anche la recente introduzione delle Aree
Metropolitane ha reso ancora più evidente come il sistema urbano di Roma non possa non essere
considerato, a sua volta, come l’integrazione di molti sottosistemi complessi che devono essere
presi in considerazione nelle scelta di viaggio pianificate e che necessitano perciò di standard
realmente interoperabili per poter essere messi in comunicazione gli uni con gli altri (si pensi in
primo luogo al ruolo delle ferrovie in ambito urbano). Da questo punto di vista, il Giubileo della
Misericordia di prossimo inizio si sta rivelando una grande opportunità, avendo impresso una forte
accelerazione su tutti i processi di integrazione di cui sopra.
Per ultimo, ma non in ordine di importanza, non deve essere sottovalutata la sfida implicita nel
cambiamento delle policy di utilizzo di questi dati, che imporrà una gestione della community sin
dal momento della formalizzazione di una simile proposta: ci si attende infatti un contributo ed un
momento di confronto con gli stakeholders che potrebbe portare anche a modificare i ragionamenti
sin qui sviluppati e illustrati nel presente documento.
52
Un Modello dinamico per la gestione, lo sviluppo, l’utilizzo e la
valorizzazione degli Open Data
Luigi Zanella, Direttore Consulting e Business Development Divisione PA Dedagroup ICT Network
L’esperienza di Dedagroup ICT Network
Dedagroup ha sviluppato le proprie competenze grazie alle concrete esperienze con la Pubblica
Amministrazione italiana in particolare con le regioni Lazio (Open Data Lazio) ed Emilia-Romagna
(processo di decertificazione), diverse amministrazioni locali e dal confronto con le migliori pratiche
a livello Europeo ed internazionale sviluppate nell’ambito di progetti Europei sul tema ma
soprattutto dal faticosissimo lavoro fatto nella PA locale (soprattutto nei Comuni) per far si che
questi usino nei propri processi dati prodotti da altre Pubbliche Amministrazioni per prendere
decisioni e per evadere in modo più efficiente le pratiche.
L’esperienza di apertura di banche dati all’interno della PA risale a oltre 10 anni fa con il progetto
SIGMATER di creazione del sistema di interscambio dei dati catastali, realizzato con Regione
Emilia-Romagna, Regione Liguria, l’Agenzia del Territorio e Sogei. All’epoca la realizzazione del
sistema fu lunga e complessa per i problemi legati ai limiti tecnologici dell’epoca e soprattutto alla
la mancanza di un sistema regolamentare.
Oggi la situazione è molto diversa sia dal punto di vista regolamentare, il CAD all’art 58 dice che le
banche dati devono essere rese accessibili all’interno della PA, che dal punto di vista tecnologico.
Oggi possiamo utilizzare la tecnologia sottesa alla pubblicazione degli Open Data come
acceleratore per aprire i dati della PA verso l’interno affiancandola al costoso e complesso metodo
della cooperazione applicativa. In tempi brevi si possono aprire le banche dati metterle in
condivisione creando così una spinta alla trasformazione verso il digitale della Pubblica
Amministrazione.
Come più volte sottolineato in queste pagine, la Pubblica Amministrazione dispone di un
patrimonio informativo straordinario e, ad ogni livello istituzionale, è un importante produttore di
dati, siano essi “ufficiali e certificati” oppure derivati indirettamente dall’attività istituzionale. In
linea con i principi della PSI (Public Sector Information) questo patrimonio non solo può costituire
la “piattaforma abilitante” per l’integrazione e l’elaborazione dei dati, ma anche una risorsa per lo
sviluppo socio economico del Paese.
Dagli scambi avvenuti nel corso dei tavoli di confronto del gruppo di lavoro emergono in modo
chiaro i potenziali di miglioramento dell’efficienza della Pubblica Amministrazione derivanti
dall’apertura delle banche dati non solo per l’esterno ma prima di tutto per l’interno.
Open Data per l’interno della PA come presupposto per l’apertura verso l’esterno
L’idea di condividere dati all’interno della PA non è certo nuova, risale ai tempi del disegno del
Sistema Pubblico di Connettività (SPC). Il CAD all’art. 58 sancisce l’obbligo per le PA di comunicare
tra loro, attraverso la messa a disposizione degli accessi alle proprie basi di dati mediante la
cooperazione applicativa. Alla base del disegno dell’SPC c’è l’idea di creare un modello di Pubblica
Amministrazione che coopera attraverso meccanismi di interoperabilità che, salvaguardando la
validità giuridica delle comunicazioni, permette alle Pubbliche Amministrazioni di collaborare.
Rispetto agli obiettivi iniziali le implementazioni reali e funzionanti sono poche e concentrate nella
Pubblica Amministrazione centrale. I motivi di questa limitata diffusione di servizi di cooperazione
applicativa sono riconducibili a due fattori:
53
1. la complessità tecnologica sottesa, che può essere sostenuta economicamente solo dalle
Pubbliche Amministrazioni più grandi e strutturate;
2. la necessità di creare accordi di servizio bilaterali fra le Pubbliche Amministrazioni che
intendono scambiarsi dati per cooperare.
Se è vero che la condivisione di dati nella PA ha un grande valore, come fare per accelerare il
processo di circolarità del dato?
La soluzione, che si vuole suggerire con questo contributo, può essere quella di utilizzare i principi,
strumenti e metodologie caratteristiche degli Open Data anche per la diffusione dei dati all’interno
della PA.
Da quando negli USA è iniziato il processo di apertura dei dati, sono stati messi a punto strumenti
e metodi per l’apertura al pubblico di Open Data, strumenti che oggi hanno raggiunto un discreto
grado di solidità e diffusione. A livello nazionale è già stato fatto un censimento generale delle
banche dati presenti nelle Pubbliche Amministrazioni, censimento che ha portato alla creazione di
un catalogo nazionale pubblicato in Open Data28. Di nuovo, però, anche questo censimento è stato
vissuto dalle amministrazioni locali come un adempimento e non come un’occasione per “mettersi
in rete” con le altre amministrazioni. Questo atteggiamento ha portato a un qualità molto
disomogenea dei contributi e quindi a una visione complessiva non completa. Bisogna far scattare
la molla dell’interesse di una PA nella catalogazione e apertura delle banche dati, prima di tutto per
se stessa (per abbattere le divisioni interne) poi per rendere disponibili i dati verso altre PA e verso
i cittadini. Se l’azione di apertura è finalizzata alla revisione dei processi interni, allora la qualità del
risultato sarà adeguata. È quindi opportuno che ogni PA avvii un processo di ricognizione delle
proprie banche dati andando poi a creare un catalogo costruito secondo le logiche Open Data (ad
esempio utilizzando la piattaforma Open Source CKAN) che verrà poi aperto verso l’interno, verso
tutte le altre PA e successivamente, per un sottoinsieme, anche verso l’esterno.
Per fare questo è necessario darsi delle priorità: quali banche dati aprire per prime?
Tre sono i fattori da tenere in considerazione:
1. centralità delle banche dati (dati di riferimento);
2. le banche dati che certificano lo stato di soggetti, oggetti e fatti (decertificazione);
3. il grado di interesse dei dati per la formulazione delle policy.
Le banche dati di riferimento
Sicuramente le banche dati che producono un maggiore effetto sul sistema complessivo sono le
banche dati di riferimento (i reference data) ovvero quelle banche dati che rappresentano il
tessuto connettivo attraverso il quale mettere in relazione anche tutte le altre banche dati. Fanno
sicuramente parte di questo insieme:





28
l’anagrafe delle persone fisiche (per la quale è già in corso un processo di unificazione e
condivisione a livello nazionale - ANPR);
l’anagrafe delle Imprese (già disponibile ma ancora non aperta e accessibile in forma
gratuita alle Pubbliche Amministrazioni);
l’anagrafe degli Immobili;
lo stradario e gli indirizzi georiferiti (ANSC);
la cartografia di riferimento (Database topografico e cartografia catastale).
http://basidati.agid.gov.it/catalogo/index.html
54
La centralizzazione e l’apertura (all’interno della PA) abilita la condivisione di queste banche dati e
permette a tutte le amministrazioni che trattano dati relativi a cittadini, imprese, immobili e
territorio di intraprendere un percorso di armonizzazione dei propri dati rispetto alle banche dati di
riferimento con l’obiettivo di collegare correttamente i propri dati al soggetto/oggetto di interesse e
quindi di rendere coerenti e confrontabili i dati.
L’armonizzazione, la coerenza e la confrontabilità dei dati rende possibile per il cittadino il tanto
auspicato attraversamento di più Pubbliche Amministrazioni in modo trasparente: se tutte le PA
riconoscono il cittadino, l’impresa, l’immobile nello stesso modo e condividendo lo stesso insieme di
dati anagrafici allora è possibile anche condividere in modo certo le altre informazioni che ad essi
si riferiscono.
L’apertura e la condivisione all’interno della PA delle banche dati oggi disponibili può essere un
fattore chiave per il completamento e il miglioramento della qualità dei dati. Tutti gli attori della PA
sono interessati ad avere dati di riferimento corretti e certificati. L’apertura stimola una azione di
crowdsourcing di segnalazione di incongruenze da parte di tutte le PA coinvolte volta a migliorare e
consolidare il dato.
La decertificazione
Il secondo elemento da tenere in considerazione è il grado di interesse di una banca dati per le
altre amministrazioni, per i cittadini e per le imprese dal il punto di vista della gestione dei
procedimenti amministrativi.
Alcune banche dati vengono regolarmente utilizzate per certificare lo stato di persone, oggetti, fatti
ad altre amministrazioni o a cittadini ed imprese nell’ambito dei procedimenti amministrativi
codificati per l’esercizio delle funzioni della singola PA. Le banche dati che vengono consultate per
produrre tali certificazioni devono essere aperte per arrivare a sostituire la produzione di un
certificato con una consultazione on line. L’apertura di queste banche dati attua la decertificazione.
Aprire questa categoria di dati verso imprese e cittadini ha inoltre l’importante effetto di contribuire
alla riduzione degli oneri amministrativi a carico di cittadini ed imprese per la presentazione di
pratiche: buona parte dei costi amministrativi che un professionista deve sostenere per presentare
una pratica edilizia, una richiesta di apertura di una impresa o un’autorizzazione ambientale sono
legate agli oneri informativi (le informazioni che il professionista deve comunicare alla Pubblica
Amministrazione per ottenere l’autorizzazione). Una parte importante delle informazioni richieste
sono già nella disponibilità della PA (in senso allargato), spesso non lo sono nella disponibilità
dell’ente specifico cui si chiede l’autorizzazione. Si pensi, ad esempio, ai dati catastali, ai dati
ambientali, allo stato legale degli immobili, ai dati relativi agi impianti preesistenti.
L’apertura di dati che riducano i tempi di recupero delle informazioni da parte dei professionisti può
essere il mezzo con il quale individuare celermente quali dati non chiedere più perché già in
possesso della PA.
Il grado di interesse per la formulazione delle policy
L’aumento della complessità della nostra società in tutte le branche (sicurezza, clima, trasporti,
ambiente, salute, welfare, economia) pone alla politica sfide sempre più grandi. È evidente che per
la definizione di policy adeguate sia sempre più necessario disporre di una conoscenza accurata
dello stato di fatto e di modelli che aiutino a simulare l’effetto delle decisioni.
Anche se stanno aumentando in modo esponenziale i dati prodotti in modo automatico attraverso
reti di sensori (IOT) o dalle persone (social network, dispositivi indossabili, ecc…) i dati prodotti
all’interno delle PA restano la fonte oggi più importante per la creazione di un sistema di
conoscenze su cui creare modelli interpretativi e sistemi di misurazione dell’effetto delle policy.
55
Un potenziale, come già detto, che soffre ancora delle forti problematiche legate alla mancata
circolarità dei dati all’interno della PA stessa, nonché della visione limitata, per chi produce una
banca dati, dell’effettivo interesse che può suscitare una propria fonte dati verso l’esterno. Solo da
tavoli di studio e di confronto multidisciplinari può emergere l’importanza e la validità di una fonte
dati piuttosto che di un’altra.
Tuttavia, ci preme sottolineare come sia sufficiente attivare momenti di confronto e dialogo tra
soggetti diversi perché emergano possibilità e scenari futuri di utilizzo degli Open Data che
possono rispondere con puntualità alle esigenze di enti e cittadini. Gli incontri del tavolo informale
costituito per la realizzazione di questo lavoro, ad esempio, hanno messo a fuoco decine di casi di
possibile condivisione di dati con effetti di grande interesse e utilità.
A titolo di esempio, si riporta come dal tavolo sia emerso come, ai fini della progettazione delle
linee di trasporto pubblico locale, sia importante conoscere le caratteristiche della popolazione che
risiede e lavora nelle zone da servire: a questa esigenza informativa (che se non soddisfatta,
comporta o decisioni approssimate o costi notevoli per indagini campionarie) si può rispondere
attingendo a dati dell’Agenzia delle Entrate, all’Osservatorio dei valori immobiliari, ai dati di INPS,
ai dati anagrafici, ai dati delle imprese, alle mappe: tutte informazioni detenute da PA diverse ma
spesso non accessibili o, comunque, molto complicate da raggiungere. Inutile aggiungere che, se i
dati fossero aperti e disponibili all’interno della PA, i tempi di produzione di modelli di analisi si
ridurrebbero e le decisioni sarebbero più accurate.
Aprire i dati all’interno della PA ha quindi un importante effetto: quello di mettere in condizione le
diverse PA di conoscere il patrimonio informativo disponibile. Infatti è molto più rapido un processo
di innovazione che parte dalla possibilità di accedere direttamente ai dati, di provare e testare la
qualità delle informazioni, verificare le possibili interconnessioni con il proprio sistema informativo
che procedere top down, con uno studio dei modelli dati per poi progettare i servizi ed infine
scoprire che il livello qualitativo dei dati di partenza non è adeguato ad implementare lo scenario
ipotizzato.
Un processo di catalogazione e apertura sistematico della banche dati all’interno della PA crea i
presupposti per aprirsi verso l’esterno: una volta preparati, catalogati e verificata la reale utilità e
gli usi incrociati che se ne possono fare i dati possono essere aperti verso i cittadini e le imprese
attivando i meccanismi di coinvolgimento e condivisione delle informazioni che sono la base
dell’Open Government.
Una proposta di modello per valutare il grado di maturità di una PA rispetto ai temi dell’Open
Government
La logica degli Open Data va ripensata non solo come mero adempimento ai fini della trasparenza
dell’ente ma come un modello di funzionamento e trasformazione del modo di lavorare della
Pubblica Amministrazione.
Oggi, diverse sono le iniziative di Open Government sul territorio nazionale. Si va da iniziative di
apertura dei dati nel sito trasparenza, visto come adempimento normativo fino a iniziative di
collaborazione e partecipazione attiva dei cittadini alle scelte della città. Per avere uno schema di
valutazione si propone questo modello su quattro livelli di maturità che può essere utilizzato per
classificare e valutare le iniziative delle PA in questo campo e può essere preso come base di
partenza per la costruzione di un sistema di misurazione delle iniziative nelle diverse PA.
56
Figura 6 I quattro livelli di maturità che possono essere utilizzati per definire il livello raggiunto da una PA in relazione ai
temi dell’Open Government.
Trasparenza (adempimento normativo)
A questo primo livello la Pubblica Amministrazione “informa” i propri cittadini: la sezione
trasparenza del sito contiene informazioni che descrivono ciò che la Pubblica Amministrazione sta
facendo, come è organizzata, quali contratti ha in corso, ecc. La pubblicazione di informazioni e
dati è, di fatto, un semplice adempimento normativo.
A questo livello i Dati pubblicati, anche quando in formato open, sono statici; raramente sono stati
predisposti automatismi per l’aggiornamento dei dati o sono presenti Open Services. I dipartimenti
titolari dei dati non vengono coinvolti in modo attivo e la qualità del dato costituisce un elemento
secondario. In questo caso, dunque, raramente i dati utilizzati possono costituire un valore o una
fonte attendibile perché non si garantiscono coerenza e di continuità dell’aggiornamento. I dati
pubblicati, in questi casi, sono di fatto una copia scollegata dalle fonti e dai processi di origine, e
dunque di difficile aggiornamento. Nei casi peggiori i dati sono pubblicati una tantum al momento
dell’apertura del sito e poi non più aggiornati, come è facile notare con una rapida ricerca in Rete
nelle sezioni trasparenza o Open Data di moltissime Pubbliche Amministrazioni.
Questi dati, inutile sottolinearlo, non servono, non hanno valore e, come tali, vengono utilizzati
pochissimo.
Coinvolgimento
A questo livello l’Amministrazione cerca di “ascoltare” i cittadini, raccogliendo informazioni su temi
e problematiche della città, pubblicando i dati e cercando di promuoverne l’utilizzo. A questo livello
l’Amministrazione si attiva con iniziative di coinvolgimento di cittadini e imprese in diverse forme:




attiva laboratori su utilizzo ed interpretazione degli Open Data;
organizza iniziative di formazione anche all’interno delle scuole;
organizza convegni pubblici;
promuove premi per le migliori app che sfruttino i propri dati.
57
In questa fase l’azione della PA è rivolta verso il “proprio pubblico” e sui propri dati, si raccolgono
feedback dai cittadini e dalle imprese, si lavora per mettere in condizione i cittadini di poter
controllare l’azione della PA aprendo un canale dai cittadini e imprese verso la PA. In questa fase
gli Open Data possono essere ancora in dataset statici ma si lavora maggiormente sulla qualità e si
cerca di selezionare quei dati che possono essere di interesse e adatti ad avviare confronti sulle
questioni aperte con la cittadinanza.
Normalmente a questo livello si coinvolgono in modo attivo solo i soggetti più sensibili alla
partecipazione, i civic hacker e persone specializzate, mentre difficilmente si riesce a raggiungere il
grande pubblico.
Collaborazione
A questo livello l’Amministrazione, oltre che “ascoltare” i cittadini, si impegna a avviare adeguate
azioni e iniziative sulla base delle opinioni e delle segnalazioni che arrivano dai cittadini.
L’Amministrazione si apre al dialogo con l’obiettivo di raccogliere elementi per arrivare a decisioni
più efficaci. Il principio base è quello che per fare buone scelte è importante mettere a
disposizione le conoscenze e le informazioni disponibili alla discussione collettiva. La decisione,
l’azione, resta comunque sempre nelle mani della Pubblica Amministrazione che ad essa è
preposta. A questo livello si innestano anche le azioni volte a favorire la collaborazione tra PA
diverse, si coinvolgono le direzioni che hanno aperto le proprie banche dati, l’Amministrazione
cerca di rendere disponibili i propri dati ad altre PA finalizzati alla decertificazione ed
all’efficientamento della “macchina amministrativa”. La PA utilizza i propri dati aperti e quelli
provenienti dall’esterno per ridisegnare i propri processi. Anziché chiedere i dati al cittadino si
usano i dati aperti da altre PA. Si utilizzano i dati aperti per la pianificazione partecipata del
territorio, per la progettazione multilivello; Si realizzano nuove applicazioni basate sugli Open Data
per favorirne la comprensione.
In questo caso le Amministrazioni attivano servizi di accesso diretto ai dati, la cui pubblicazione è
dinamica e sempre aggiornata.
Partecipazione
A questo livello l’Amministrazione coinvolge cittadini e le diverse PA operative sul territorio nella
definizione delle proprie policy, cooperando nella costruzione di soluzioni innovative e condivise.
In questo caso è possibile parlare di Politiche Data Driven.
L’apertura dei dati permette alle PA che hanno in carico i diversi aspetti di gestione del territorio
(protezione dell’ambiente, pianificazione urbanistica, sicurezza delle persone e del territorio,
sicurezza del lavoro, protezione e valorizzazione del paesaggio e delle risorse culturali,
programmazione e gestione dei servizi sociali, sviluppo economico, salute, lavoro) di disporre di
dati oggettivi, certificati e condivisi che diventano il metro di misura e il mezzo principale di
rendicontazione delle politiche.
Tale disponibilità è alla base di tutti i processi di governance partecipata: essa favorisce la crescita
del sistema sulle politiche di riordino attraverso monitoraggio e diffusione di indicatori, metodologie
e strumenti comuni, programmazione e pianificazione multilivello; permette la creazione di sistemi
di misurazione condivisi che inquadrano l’operato delle diverse Pubbliche Amministrazioni verso gli
obiettivi comuni definiti dalle politiche di livello nazionale e regionale.
La disponibilità di dati aperti, infine, abilita la cooperazione “con i cittadini” e “fra cittadini” per
innovare il modo in cui le città funzionano. Così come la velocità con cui si fa innovazione nel
campo medico dipende molto dalla velocità con cui circolano i dati e le scoperte fatte da altri, così
l’apertura dei dati della PA può portare ad un coinvolgimento attivo dei dipendenti pubblici e dei
talenti, spesso nascosti, creando le condizioni per una innovazione anche dal basso della PA.
58
Gli Aspetti chiave da curare
A chiusura del lavoro si riassumono alcuni aspetti chiave che derivano dalle esperienze descritte in
questo paper che sarebbe opportuno curare nella definizione di un modello di apertura delle
banche dati all’interno della Pubblica Amministrazione.
La georeferenziazione
L’informazione geografica è elemento di riferimento per l’integrazione e l’armonizzazione dei dati
rispetto alla dimensione territoriale; deve essere considerata come la Piattaforma “unificante” dei
dati e uno strumento trasversale di verifica della qualità dei dati.
Tutti gli Open Data devono riferirsi in modo corretto e uniforme al territorio con l’obiettivo di
creare una visione d’insieme delle fonti informative che via via andranno ad integrarsi. La
dimensione geografica deve, a tendere, essere elemento “costitutivo” del dato e non attributo
opzionale. La granularità geografica del dato deve essere almeno quella del Comune di riferimento.
Se il dato è disponibile anche ad un livello più fine (ad esempio quello delle sezioni di censimento o
dei numeri civici) è auspicabile che l’informazione venga pubblicata. Nei casi in cui un dettaglio
geografico troppo fine rischi di violare la privacy, la sua diffusione andrebbe limitata unicamente
all’interno della PA, mentre per il pubblico sarà rilasciato con una granularità minore.
Ontologie comuni
La coerenza e confrontabilità dei dati passa anche attraverso l’uso di ontologie comuni e relativi
metadati secondo le modalità e standard di fatto (RDF, DCAT-AP, etc.) e le relative
implementazioni realizzate a livello nazionale da iniziative governative e non. Oggi in rete esiste
una grande disponibilità di ontologie e modelli già definiti, per cui è opportuno che si riducano allo
stretto indispensabile la creazione di nuovi modelli limitandosi a riferirsi con coerenza a quelli
esistenti.
Semplificare la comprensione degli Open Data
Seppur sempre più spesso oggetto di studio e analisi, gli Open Data sono, tutt’oggi, spesso difficili
da comprendere, specialmente per specifiche categorie di cittadini, inclusi dipendenti stessi della
PA. La mancata comprensione si lega, ovviamente, alle difficoltà di lettura degli stessi, che si
traduce nell’impossibilità di trarne informazioni di valore nonché di coglierne i possibili riutilizzi. Per
risolvere questo problema è necessario accompagnare la pubblicazione dei dati con modelli di
lettura (v. lavoro Inail) e/o applicazioni di consultazione che ne semplifichino l’interpretazione.
Sono esempi di queste applicazioni iniziative nazionali (quali OpenBilanci, OpenCoesione,
SoldiPubblici) o regionali, ad esempio quelle realizzate da Regione Lazio (OpenProgetti e
OpenSpesa): iniziative e progetti che oltre a permettere l’accesso diretto ai dati mettono a
disposizione applicazioni per la consultazione immediata e semplificata, al fine di avvicinare
all’utilizzo dei dati non solo i tecnici e gli esperti, ma anche i cittadini.
Open Data e Open Services
I cataloghi di Open Data sono, di consueto, copie derivanti da estrazioni dei dati conservati nelle
banche dati gestionali degli enti. Ciò espone al rischio di duplicazione e di mancato aggiornamento
dei dati pubblicati poiché, nel momento stesso in cui si crea una copia dei dati, non si garantisce
che essa sia aggiornata e allineata con l’originale.
Gli Open Services, al contrario, sono servizi aperti di accesso diretto alle banche dati originali (ne è
un esempio il servizio “Cerca Percorso” esposto dall’Agenzia Roma Servizi per la Mobilità).
59
Per tutte le banche dati caratterizzate da un’alta dinamicità e per le quali è necessario disporre del
dato aggiornato all’ultima versione disponibile, sono indicati gli Open Services.
La realizzazione di Open Services richiede, però, lo sviluppo di software specifico, con un costo di
gestione maggiore rispetto alla semplice pubblicazione di Open Data. Costo che però trova
giustificazione nelle possibilità di utilizzo dei dati in ottica di innovazione e creazione di nuovi
servizi.
Gli Open Services dovrebbero quindi essere creati per l’accesso a tutte le banche dati di riferimento
(Anagrafe, Imprese, Immobili, Archivi Geografici) e per quelle fonti caratterizzata da
un’elevatissima dinamicità come i dati provenienti da sensori. Per le banche dati di riferimento gli
Open Services dovrebbero essere allineati secondo standard comuni di funzionalità (servizi di
ricerca, consultazione, movimentazione, estrazione) su tutto il territorio nazionale, così da
agevolarne l’utilizzo da parte degli sviluppatori di applicazioni.
Un’indicazione è dunque quella di usare la logica degli Open Services sugli Open Data non solo per
pubblicare verso l’esterno me, forse soprattutto, per condividere i dati fra Pubbliche
Amministrazioni, favorendo così anche lo sviluppo di applicazioni di consultazione, fruizione e
integrazione dei dati da parte di soggetti terzi: altre amministrazioni, aziende private, associazioni
e società civile; si pensi ad esempio alla possibilità di integrare fonti dati diverse in apposite App.
La qualità dei dati
Per attuare il principio dell’“open by default” è necessario risalire all’origine del dato e gestire e
prevedere già nella fase di generazione il processo di successiva apertura dello stesso, con tutte le
relative caratteristiche (formati, metadati). Se è necessario anonimizzare o aggregare dati affinché
non si violino la privacy o i diritti di soggetti pubblici e privati la cosa va decisa a monte, nel
momento in cui si creano i dati, in collaborazione con il titolare che deve giustificare i motivi di una
eventuale limitazione nell’ apertura della banca dati. Per fare questo è necessario il coinvolgimento
del personale interessato sin dal principio del processo di creazione e archiviazione del dato. Per
far ciò è necessario che il personale della PA sia adeguatamente formato su tutte le fasi del
processo di creazione, rilascio e gestione di banche dati in formato Open. L’apertura dei dati deve
essere integrata nei processi gestionali dei dati stessi e in linea di principio i dati aperti dovrebbero
poter essere estratti dalla banca dati di origine in qualsiasi momento attraverso Open Services o
richieste di estrazione massiva asincrone.
L’utilizzatore, sia esso un’altra PA o un soggetto esterno, deve essere certo dell’attendibilità e della
qualità della banca dati. L’obiettivo cui tendere è che diventi prassi che i dati pubblicati siano gli
stessi sui quali i tecnici interni alla PA operano quotidianamente.
60
Considerazioni conclusive
L’apertura dei dati è la prima e fondamentale azione per realizzare i principi dell’Open Government
e poter così ridisegnare il funzionamento operativo della Pubblica Amministrazione, sfruttando la
disponibilità in forma digitale di dati forniti anche da altri enti.
Ancora oggi, però, nella PA Italiana non esiste un modello di gestione ed organizzazione dei dati
unitario, e vista la complessità e l’articolazione dell’azione amministrativa probabilmente non ci
potrà mai essere. In questa complessità, però, si può pensare di definire un modello comune di
“apertura” che gradualmente e in modo dinamico ci porti ad avere una PA complessivamente
aperta, che condivida i dati fondamentali di riferimento e che metta a disposizione dei suoi utenti,
siano essi cittadini o imprese, un sistema di conoscenza completo (a livello di intera nazione e non
frammentato per singolo territorio), affidabile (con dati di qualità) e coerente (tutti chiamiamo le
stesse cose con gli stessi nomi).
Oggi sono sempre di più le imprese e i professionisti che si dichiarano pronti a interagire con la
Pubblica Amministrazione principalmente attraverso i canali digitali. Perché ciò avvenga, però, è
necessario che si eviti il rischio di limitarsi a replicare in digitale i processi oggi basati sulla carta
(come la maggior parte delle realizzazioni di grandi sistemi IT hanno fatto nel corso degli ultimi
venti anni) ma rimodellando, semplificando riducendo i passaggi e sfruttando il digitale in modo
nativo. In questa transizione l’apertura delle banche fra PA ha un ruolo decisivo per abbattere
tempi, costi e ridurre il rischio di pratiche ostruzionistiche figlie di vecchi modi di operare
tristemente noti.
La realizzazione di iniziative per la condivisione dei dati all’interno ed all’esterno della PA comporta
ovviamente dei costi in termini di tecnologie, competenze e formazione del personale coinvolto:
costi che, però, in un’ottica di medio-lungo termine, saranno velocemente recuperati, anche alla
luce del semplice confronto con i tempi e i costi tipici delle attuali modalità di operare della PA: si
pensi quanto lavoro e tempo comportino le attività di ricerca, condivisione ed raccolta di
informazioni e dati nell’ambito dei procedimenti che coinvolgono amministrazioni diverse, nonché
allo sforzo che occorre affrontare ogni qual volta si crea la necessità di creare e gestire banche dati
realizzate sulla base di esigenze specifiche.
Inoltre, va considerato il risparmio in termini di costi e tempi a carico di cittadini, professionisti ed
imprese nel recupero dei dati necessari e di come esso possa generare un’accelerazione nella
semplificazione nell’espletamento degli step amministrativi, legati alla raccolta, verifica e
predisposizione di documentazione e alla comunicazione di informazioni molto spesso già in
possesso della PA.
Un altro elemento non direttamente quantificabile in termini economici è rappresentato dai benefici
legati al miglioramento della qualità dei dati in possesso della PA una volta che le pratiche di
aggiornamento dei dataset saranno sempre più diffuse e coordinate nell’ottica dell’interoperabilità:
un approccio partecipativo basato su condivisione, integrazione e relativa bonifica incrociata delle
banche dati, che permetterà di migliorare la qualità generale dei servizi pubblici, nella loro totalità.
Il potenziale innovativo degli Open Data è cruciale non solo per procedimenti puntuali, ma anche
per la possibilità di fare da fondamento nella definizione di policy e scelte politiche e gestionali,
ancora oggi spesso basate su stime e valutazioni approssimative (e non su banche dati certificate
ed affidabili) con evidenti ricadute in fase di monitoraggio, che riducono in maniera drammatica la
reale accountability dell’azione politica ed amministrativa.
61
L’apertura dei dati diventa veicolo per trasmettere anche conoscenza e metodi di lavoro fra enti
con funzioni simili ma lontani dal punto di vista territoriale: i comuni, le agenzie, le aree vaste, gli
istituti di ricerca pubblici, hanno bisogni simili ma per territori diversi. L’apertura dei dati stimola la
condivisione dei metodi utilizzati per elaborarli e alimenta un circolo virtuoso di scambio di buone
pratiche basate sugli stessi presupposti di partenza: i dati. La condivisione delle pratiche ha anche
un altro importante effetto, aiuta le PA Centrali a conoscere i bisogni informativi delle PA locali,
indirizza le scelte su quali dati aprire, in questo modo si ottiene un aumento dell’efficacia dei dati
aperti e quindi del ritorno degli investimenti.
I tempi sono certamente maturi per smettere di parlare al futuro e trasformare tutte queste
promesse in un percorso comune da percorrere immediatamente. Come abbiamo cercato di
mostrare in queste pagine, l’apertura dei dati e la disposizione alla collaborazione sta già
mostrando i suoi effetti positivi.
Siamo di fronte alla grande opportunità di rigenerare decisamente il modo di operare di tutta la
Pubblica Amministrazione: gli Open Data sono il carburante di questo cambiamento.
62