Introduzione al progetto ODINet Alessandro Greco Sistemi Territoriali S.r.l. Cascina (Pisa), Italy Il Progetto ODINet è realizzato con il determinante contributo della Regione Toscana a valere sul Programma Operativo Regionale cofinanziato dal FESR per l’obiettivo “Competitività regionale e occupazione” anni 2007-2013. Workshop ODINet, CNR – Pisa, 24 Marzo 2015 Quale è l’obiettivo del progetto? • Progettare ed implementare un prototipo per una innovativa piattaforma tecnologica per l’accesso ed il riuso di dati strutturati disponibili online per mezzo di un motore di ricerca semantico. • Sperimentare il prototipo nei settori: • Sociale • Economico • Sanitario Workshop ODINet, CNR – Pisa, 24 Marzo 2015 I partner di progetto Soggetto capofila Ricerca e sviluppo tecnologie Tematica sanitaria Tematica sociale Tematica economica Consulenza Workshop ODINet, CNR – Pisa, 24 Marzo 2015 Chi siamo Workshop ODINet, CNR – Pisa, 24 Marzo 2015 Sistemi Territoriali s.r.l. Sistemi Territoriali S.r.l. ha sede a Cascina (Pisa), ed è nata nel 1991 come spin off del CNR con l’obiettivo di fornire consulenza e servizi professionali ad enti pubblici ed aziende private nell’ambito dei • Sistemi Informativi Geografici (GIS) • Sistemi di Business Intelligence (BI). Nel corso degli anni le competenze aziendali si sono allargate anche a tematiche di estrema attualità quali • Big Data • Open Data Soci fondatori IIOD Workshop ODINet, CNR – Pisa, 24 Marzo 2015 Big Data e Open Data • 2009 -> oggi – Social Network Analysis • Progetto BINET – Ambito sanitario • Anti frode • 2011 - > Inizio sviluppo StatPortal Open Data • 2012 - > Rilascio portale DatiOpen.it • 2013 - > ODINet Workshop ODINet, CNR – Pisa, 24 Marzo 2015 Perché ODINet Workshop ODINet, CNR – Pisa, 24 Marzo 2015 il Big Bang dei dati • I dati a livello mondiale raddoppiano ogni due anni* – si tratta di una crescita che supera addirittura la legge di Moore. • Si stima che nel 2014 sono stati creati 640 trilioni di gigabyte Fonte: studio IDC Digital Universe “Extracting Value from Chaos” Workshop ODINet, CNR – Pisa, 24 Marzo 2015 Classificazione dei Big Data Datawarehouse Open Data Workshop ODINet, CNR – Pisa, 24 Marzo 2015 ODINet Perché i dati della PA La PA produce moltissimi dati! (in Italia si stima che esistano circa 1.000 data center) Workshop ODINet, CNR – Pisa, 24 Marzo 2015 Crescita Open Data PA In Italia Dati al 20/03/2015 Fonte: DatiGov.it Workshop ODINet, CNR – Pisa, 24 Marzo 2015 SOLO L’INIZIO… Open Data oggi Open Data tra qualche mese Il potenziale Workshop ODINet, CNR – Pisa, 24 Marzo 2015 … non esistono «magie»! • Questa mole di informazioni non è facilmente digerita dai normali software di elaborazione di dati. • Per ricavare delle informazioni strategiche occorrono nuovi strumenti tecnici e teorici. Workshop ODINet, CNR – Pisa, 24 Marzo 2015 Il «problema» attuale • Ricerca di dataset su una tematica, es. «immigrati» Portali web (es. ISTAT, open data, ecc.) Database «locale» Database dei colleghi Workshop ODINet, CNR – Pisa, 24 Marzo 2015 L’obiettivo di ODINet Workshop ODINet, CNR – Pisa, 24 Marzo 2015 Come funziona ODINet? Workshop ODINet, CNR – Pisa, 24 Marzo 2015 Acquisizione dati Abbiamo sviluppato algoritmi capaci di interfacciarci a portali esistenti (es. open data, I.STAT,ecc.) ed importare in modo automatizzato in un database: • • • • • • • • CSV XLS MDB DBF Shapefile RDF SDMX ODATA Workshop ODINet, CNR – Pisa, 24 Marzo 2015 Sviluppo Ontologie Sono state sviluppate ontologie tematiche nei settori del • Sociale • Economico • Sanitario Workshop ODINet, CNR – Pisa, 24 Marzo 2015 Creazione grafo semantico • Sviluppati algoritmi per il – Linkage dei dati con ontologie – Linkage tra ontologie Workshop ODINet, CNR – Pisa, 24 Marzo 2015 … e che vantaggi si ottengono? Grazie a tecniche di analisi di reti sociali, il motore di ricerca è in grado di : • Individuare i dati che sono più pertinenti ad i criteri di ricerca immessi (ranking) • Estrarre dai dati le informazioni utili • Restituire un quadro conoscitivo inerente la ricerca effettuata comprensivo di tabelle, grafici e mappe. Dati Informazioni Presentazione Conoscenza Workshop ODINet, CNR – Pisa, 24 Marzo 2015 L’unione fa la forza! Un aspetto fondamentale del progetto è che consente di fruire in modo integrato ed efficace delle informazioni già in possesso dell’ente unite a quelle provenienti dal mondo degli open data Dati ente Open Data Workshop ODINet, CNR – Pisa, 24 Marzo 2015 Lo scenario di validazione Workshop ODINet, CNR – Pisa, 24 Marzo 2015 Quali dati sono stati acquisiti? Workshop ODINet, CNR – Pisa, 24 Marzo 2015 Altri bacini informativi Workshop ODINet, CNR – Pisa, 24 Marzo 2015 Conclusioni Workshop ODINet, CNR – Pisa, 24 Marzo 2015 Perché è innovativo? • È un motore di ricerca specializzato sui dataset • Acquisisce dati dal web in modo automatizzato • Sfrutta algoritmi basati sulle proprietà dell’SNA (Social Network Analysis) per la ricerca semantica • Non ci sono motori di ricerca semantica con caratteristiche simili (e.g., Quandl, datahub.io, …) Workshop ODINet, CNR – Pisa, 24 Marzo 2015 Prime ricadute del progetto • Paper presentato a eKNOW 2015, 7° Conferenza Internazionale sull’Informazione e la Gestione della Conoscenza (Lisbona) • Integrazione delle tecnologie nella piattaforma StatPortal OpenData • Riuso di alcune componenti in una soluzione per l’open government proposta con SAS Institute Italia • Sperimentazione della metodologia di ODINet nel progetto Open City Platform Bando MIUR smart cities & communities Ambito primario “Cloud computing technologies per smart government” • Progetti con Eupolìs Lombardia e UnionCamere Lombardia in cui la componente di acquisizione dati è stata ulteriormente sviluppata e raffinata (I.STAT, EUROSTAT, web scraping) • Ipotesi di prosecuzione e sperimentazione in vari ambiti tematici (turismo, settore assicurativo, PA centrale, ecc.) Workshop ODINet, CNR – Pisa, 24 Marzo 2015 La gestione della conoscenza è il principale fattore di crescita delle società evolute. «Chi controlla i dati, controlla il presente. Chi controlla il presente controlla il futuro.» George Orwell Workshop ODINet, CNR – Pisa, 24 Marzo 2015