Software aperti e dati pubblici Alcune soluzioni per il trattamento e l’analisi di aree geografiche Marco Pesce 10 giugno 2016 Partiamo da dati pubblici La cartografia della Liguria nel sito Istat gisportal.istat.it Download -> Basi Territoriali Mappa in formato shapefile 11054 sezioni censuarie 2011 Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016 Obiettivo Stimare distanza e tempi di percorrenza tra sezione e struttura sanitaria più vicina • Partenza: il ‘centro’ della sezione (Latitudine e Longitudine del centroide) • Arrivo: 21 strutture di pronto soccorso (Lat e Long), geolocalizzate da Regione Liguria • Distanza = distanza su rete stradale percorsa con mezzi motorizzati Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016 Obiettivo Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016 Ci serve un grafo stradale (e un algoritmo) Grafi stradali ‘commerciali’ • ottimi per approccio online e interattivo - incapsulati in siti e servizi web per l’utente finale - ma... • ...licenze d’uso soggette a limitazioni; l’utilizzo sopra determinate soglie (es. 50.000 accessi online al mese, 25.000 al giorno per 90 giorni consecutivi) comporta dei costi vivi (abbonamenti) • Il numero di interrogazioni al database che dovremmo effettuare per un calcolo completo (11054 x 21 = 232134) supera questo limite Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016 Ci serve un grafo stradale (e un algoritmo) 2 Diminuire e dilazionare nel tempo la quota di accessi? • Sì, ma in caso di errori, prove, ricalcoli o semplice necessità di estendere i confini della zona considerata, i tempi si allungherebbero troppo Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016 Ci serve un grafo stradale (e un algoritmo) 3 Grafo stradale Openstreetmap, elaborato tramite Open Source Routing Machine (OSRM) • codice aperto, algoritmi documentati, licenze d'uso compatibili con i nostri scopi • entrambi utilizzabili sia online che offline Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016 Che cos’è Openstreetmap? www.openstreetmap.org Progetto collaborativo (crowd sourced) finalizzato a creare una banca dati geografica di tutto il pianeta • convoglia dati, contributi e verifiche da più fonti (cittadini, pubbliche amministrazioni, aziende private) • Open Data • archivi scaricabili e riusabili localmente Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016 Che cos’è OSRM? project-osrm.org Routing engine: programma server per la ricerca di percorsi stradali minimi, basato su lavoro dell'università di Karlsruhe • contraction hierarchies (precalcolo) per efficienza: 200mila record richiedono 40 minuti su un normale PC • algoritmo edge-expanded model per tenere conto dei divieti di svolta • velocità stradali specifiche (se presenti nel database openstreetmap) oppure limiti di velocità standard Esiste una versione online e gratuita ma (ci risiamo!) nelle condizioni d'uso è specificato che non sono consentiti ‘troppi’ accessi. Però... Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016 Soluzione ...è possibile creare un’istanza locale del server, cui far elaborare i dati regionali estratti da Openstreetmap Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016 Minima distanza stradale da pronto soccorso (Km) Minima distanza stradale da pronto soccorso(HH:mm) Si tratta di strumenti validi ma naturalmente non devono essere presi in modo acritico • i risultati dipendono dalla qualità del database stradale • calcolo effettuato in condizioni ottimali (no traffico, no semafori) Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016 Controlli qualità • Siamo partiti dai centroidi delle sezioni per immetterci sul nodo più vicino nel grafo stradale: per sezioni molto grandi è un'approssimazione • In alcuni casi l'algoritmo può dare risultati non coerenti: piccole variazioni in lat/long possono far scegliere strade molto diverse combinazione di diversi strumenti per scovare gli outliers: macro scritte ad hoc, autocorrelazione (Lisa, software Geoda); raffronto con grafi commerciali per singoli percorsi Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016 Miglioramenti e sviluppi • ambulatori e altri servizi • invece del solo centroide geometrico considerare molteplici punti di partenza e fare una media • minimizzare direttamente i tempi invece di distanze-tempi (nuova versione OSRM) Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016