Software aperti e dati pubblici
Alcune soluzioni per il trattamento e l’analisi di aree
geografiche
Marco Pesce
10 giugno 2016
Partiamo da dati pubblici
La cartografia della Liguria nel sito Istat
gisportal.istat.it
Download -> Basi Territoriali
Mappa in formato shapefile
11054 sezioni censuarie 2011
Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016
Obiettivo
Stimare distanza e tempi di percorrenza tra sezione e struttura
sanitaria più vicina
• Partenza: il ‘centro’ della sezione (Latitudine e Longitudine del
centroide)
• Arrivo: 21 strutture di pronto soccorso (Lat e Long), geolocalizzate
da Regione Liguria
• Distanza = distanza su rete stradale percorsa con mezzi
motorizzati
Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016
Obiettivo
Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016
Ci serve un grafo stradale (e un algoritmo)
Grafi stradali ‘commerciali’
• ottimi per approccio online e interattivo - incapsulati in siti e servizi
web per l’utente finale - ma...
• ...licenze d’uso soggette a limitazioni; l’utilizzo sopra determinate
soglie (es. 50.000 accessi online al mese, 25.000 al giorno per 90
giorni consecutivi) comporta dei costi vivi (abbonamenti)
• Il numero di interrogazioni al database che dovremmo effettuare per
un calcolo completo (11054 x 21 = 232134) supera questo limite
Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016
Ci serve un grafo stradale (e un algoritmo) 2
Diminuire e dilazionare nel tempo la quota di accessi?
• Sì, ma in caso di errori, prove, ricalcoli o semplice necessità di
estendere i confini della zona considerata, i tempi si
allungherebbero troppo
Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016
Ci serve un grafo stradale (e un algoritmo) 3
Grafo stradale Openstreetmap, elaborato tramite Open Source Routing
Machine (OSRM)
• codice aperto, algoritmi documentati, licenze d'uso compatibili con i
nostri scopi
• entrambi utilizzabili sia online che offline
Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016
Che cos’è Openstreetmap?
www.openstreetmap.org
Progetto collaborativo (crowd sourced) finalizzato a creare una banca
dati geografica di tutto il pianeta
• convoglia dati, contributi e verifiche da più fonti (cittadini, pubbliche
amministrazioni, aziende private)
• Open Data
• archivi scaricabili e riusabili localmente
Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016
Che cos’è OSRM?
project-osrm.org
Routing engine: programma server per la ricerca di percorsi stradali
minimi, basato su lavoro dell'università di Karlsruhe
• contraction hierarchies (precalcolo) per efficienza: 200mila record
richiedono 40 minuti su un normale PC
• algoritmo edge-expanded model per tenere conto dei divieti di svolta
• velocità stradali specifiche (se presenti nel database openstreetmap)
oppure limiti di velocità standard
Esiste una versione online e gratuita ma (ci risiamo!) nelle condizioni
d'uso è specificato che non sono consentiti ‘troppi’ accessi.
Però...
Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016
Soluzione
...è possibile creare un’istanza locale del server, cui far elaborare i dati
regionali estratti da Openstreetmap
Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016
Minima distanza stradale da pronto soccorso (Km)
Minima distanza stradale da pronto soccorso(HH:mm)
Si tratta di strumenti validi ma naturalmente non devono essere
presi in modo acritico
• i risultati dipendono dalla qualità del database stradale
• calcolo effettuato in condizioni ottimali (no traffico, no semafori)
Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016
Controlli qualità
• Siamo partiti dai centroidi delle sezioni per immetterci sul nodo più
vicino nel grafo stradale: per sezioni molto grandi è
un'approssimazione
• In alcuni casi l'algoritmo può dare risultati non coerenti: piccole
variazioni in lat/long possono far scegliere strade molto diverse
combinazione di diversi strumenti per scovare gli outliers: macro scritte
ad hoc, autocorrelazione (Lisa, software Geoda); raffronto con grafi
commerciali per singoli percorsi
Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016
Miglioramenti e sviluppi
• ambulatori e altri servizi
• invece del solo centroide geometrico considerare molteplici punti di
partenza e fare una media
• minimizzare direttamente i tempi invece di distanze-tempi (nuova
versione OSRM)
Software aperti e dati pubblici, Marco Pesce – Genova, 10 giugno 2016