Filippo Licenziati SISTEMI INFORMATIVI TERRITORIALI qualità dei dati QUALITA' DEI DATI NEI SIT INDICE concetti generali controllo di qualità acquisizione, elaborazione, restituzione test di qualità esigenze di accuratezza 2 QUALITA' DEI DATI NEI SIT CONCETTI GENERALI componenti della qualità propagazione dell’errore limiti generali di accuratezza 3 QUALITA' DEI DATI NEI SIT 4 Struttura logica dei principi di qualità QUALITA' DEI DATI NEI SIT 5 Dati geografici Vengono definiti in termini di posizione, tematismo e temporalità, di modo che ciascun dato risulta univocamente definito nelle sue componenti posizionali, tematiche e temporali. QUALITA' DEI DATI NEI SIT Componenti della qualità 6 QUALITA' DEI DATI NEI SIT 7 Componenti del dato geografico (I) POSIZIONE z y x QUALITA' DEI DATI NEI SIT 8 Componenti del dato geografico (II) TEMATISMO LIVELLO linee trasporti rete acqua fermate tubazioni valvole edificato edifici civici QUALITA' DEI DATI NEI SIT 9 Componenti del dato geografico (III) TEMPORALITÀ QUALITA' DEI DATI NEI SIT Precisione del dato La PRECISIONE corrisponde alla lunghezza minima misurabile su un oggetto grafico inserito nel database. E’ funzione del numero di cifre decimali con le quali si effettua la misura. 10 QUALITA' DEI DATI NEI SIT Accuratezza del dato L’ACCURATEZZA dà conto della corrispondenza del dato alla realtà, negli aspetti posizionali, tematici e temporali. 11 QUALITA' DEI DATI NEI SIT Accuratezza posizionale L’opposto della differenza tra le coordinate geografiche di un oggetto sulla superficie terrestre e la sua rappresentazione nel database. 12 QUALITA' DEI DATI NEI SIT Accuratezza tematica L’opposto della differenza tra il valore degli attributi di un oggetto geografico così come registrati nel database e il loro valore reale. 13 QUALITA' DEI DATI NEI SIT Accuratezza temporale L’opposto della differenza tra le variazioni temporali del dato reale e quelle del dato registrato nel database. Dipende dalla frequenza di aggiornamento del database. 14 QUALITA' DEI DATI NEI SIT Cartografia cartacea e cartografia informatica La precisione delle mappe cartacee dipende dal limite fisico della linea tracciata sulla carta (0,5 mm), che condiziona anche l’accuratezza. La precisione dei sistemi informatici dipende dalla lunghezza dei registri (con 32 bit si arriva a 1/2³²) ed è indipendente dall’accuratezza 15 QUALITA' DEI DATI NEI SIT Propagazione dell’errore L’accuratezza globale del database è pari alla minima accuratezza del singolo dato. Operando elaborazioni su dati di accuratezza diversa (ad esempio sovrapponendo cartografie di varia scala), si propagherà l’errore a tutto il database, pur eseguendo i calcoli con un’elevata precisione. 16 QUALITA' DEI DATI NEI SIT 17 Limiti generali di accuratezza Tutti i dati geografici hanno un livello di accuratezza posizionale limitato dalla precisione degli strumenti e dei metodi utilizzati per la loro determinazione. QUALITA' DEI DATI NEI SIT CONTROLLO DI QUALITÀ metodi indicatori 18 QUALITA' DEI DATI NEI SIT Il controllo di qualità Il controllo di qualità deve essere esteso a tutte le fasi di elaborazione dei dati: • input • analisi • output 19 QUALITA' DEI DATI NEI SIT 20 Metodi del controllo di qualità • consistenza del database • confronto con le fonti • confronto con altre fonti di maggiore accuratezza • stime di tipo deduttivo QUALITA' DEI DATI NEI SIT Indicatori della qualità • • • • • • • fonti accuratezza posizionale e tematica coerenza logica completezza edge matching o boundary rectification riservatezza distribuzione DIGEST Digital Geographic Information Exchange Standard 21 QUALITA' DEI DATI NEI SIT 22 ACQUISIZIONE, ELABORAZIONE, RESTITUZIONE rasterizzazione digitalizzazione elaborazione restituzione QUALITA' DEI DATI NEI SIT Rasterizzazione: posizione 1 α x (0 < x < 1) valore medio dell’area della cella w = ∫ (α, x) = 0,2127 errore medio nella dimensione dei poligoni s = w √n Frolov e Maling (1969): vale per rasterizzazioni da data set vettoriali 23 QUALITA' DEI DATI NEI SIT Rasterizzazione: tematismo metodo geometrico metodo quantitativo 24 QUALITA' DEI DATI NEI SIT 25 Rasterizzazione: controllo qualità Consiste in metodi basati sul raffronto con una rasterizzazione effettuata su una griglia con celle di almeno un ordine di grandezza più piccole. QUALITA' DEI DATI NEI SIT Digitalizzazione (I) E’ un processo manuale che può essere influenzato da diversi fattori: • materiale del supporto cartaceo • graficismo • procedura di inquadramento • tolleranza e taratura del digitalizzatore 26 QUALITA' DEI DATI NEI SIT Digitalizzazione (II) 1/2³² 0,5 mm 0,025 mm ???? 27 QUALITA' DEI DATI NEI SIT Digitalizzazione (III) ERRORE MANUALE: dati statistici sperimentali punto originale d y x Max Min Media SD x mappa [mm] x terreno [m] 0,232 5,6 -0,259 -6,2 0 0 0,046 1,1 y mappa [mm] y terreno [m] 0,211 4,3 -0,208 -4,9 0 0 0,043 1 d mappa [mm] d terreno [m] 0,261 6,3 0 0 0,054 1,3 0,032 0,8 punto digitalizzato campione di 32.000 punti digitalizzati su mappa 1:24.000 28 QUALITA' DEI DATI NEI SIT Digitalizzazione (IV) ERRORE MANUALE errore umano minimo possibile: 0,122 mm 0,025 mm con 6 ripetizioni scende a: 0,025 mm errore di deformazione del supporto cartaceo: 0,006 mm/mm 29 QUALITA' DEI DATI NEI SIT 30 Digitalizzazione (V) ERRORI DI BORDO Le discontinuità possono essere causate da errori di inquadramento delle singole tavole, da errori di digitalizzazione, da errori di inquadramento dei singoli file di acquisizione all'interno del database, da difficoltà di interpretazione. QUALITA' DEI DATI NEI SIT Elaborazione (I) Le attività di analisi territoriale possono dare luogo ad errori o possono propagarli. Se il risultato delle elaborazioni sono layers acquisiti al database, questo ne influenza l’accuratezza. 31 QUALITA' DEI DATI NEI SIT Elaborazione (II) OVERLAY • creazione di poligoni spuri di estensione piccolissima • propagazione dell’errore tematico nel caso di calcoli su attributi numerici • possibile introduzione di errori tematici in caso di fusione di layers con attributi alfanumerici 32 QUALITA' DEI DATI NEI SIT Elaborazione (III) BUFFERING L’operazione di buffering dà luogo ad errori se l’oggetto di riferimento o parte di esso è codificato male nel database. 33 QUALITA' DEI DATI NEI SIT Restituzione Si potrebbe pensare di restituire graficamente anche il livello di accuratezza posizionale del dato, associando ad ogni punto una circonferenza di raggio pari all’incertezza della sua posizione. Di conseguenza, anche i segmenti che congiungono tali punti potrebbero avere un andamento incerto. 34 QUALITA' DEI DATI NEI SIT TEST DI QUALITÀ NMAS EMAS/ASPRS standard Capitolato Emilia Romagna 1992 35 QUALITA' DEI DATI NEI SIT Test NMAS National Map Accuracy Standard E’ basato sul confronto di un campione di punti (minimo 20) con fonti di accertata maggiore accuratezza. Per superare il test, la cartografia deve presentare per almeno il 90% del campione un errore minore di 0,8 mm per scale maggiori di 1:20.000 e un errore minore di 0,5 mm per scale minori di 1:20.000 36 QUALITA' DEI DATI NEI SIT 37 Test EMAS/ASPRS standard Engineering Map Accuracy Standard American Society of Photogrammetry and Remote Sensing E’ basato sul confronto di un campione di punti (minimo 20) con fonti di accertata maggiore accuratezza. Si calcola l’errore medio e il suo scarto quadratico medio e si confrontano con i limiti accettabili. QUALITA' DEI DATI NEI SIT 38 Capitolato Emilia Romagna 1992 Scopo: sottosistema della CTR 1:10.000 Scala nominale: 1:500 QUALITA' DEI DATI NEI SIT 39 Capitolato Emilia Romagna 1992 ERRORI MASSIMI AMMISSIBILI (x, y) punto sul terreno D d sul terreno y d sulla cartografia x punto sulla cartografia d 0,2 m d – D 0,3 m QUALITA' DEI DATI NEI SIT 40 Capitolato Emilia Romagna 1992 ERRORI MASSIMI AMMISSIBILI (z) z curve di livello: l – L ≤ 0,25 m punti quotati: q – Q ≤ 0,1 m dislivelli: q - Q ≤ 0,2 m y x QUALITA' DEI DATI NEI SIT 41 Capitolato Emilia Romagna 1992 COLLAUDI A campione su almeno il 5% delle carte verificando, per ciascuna carta: • almeno 10 punti isolati, • almeno 30 punti quotati, • almeno 20 distanze planimetriche, • almeno 50 curve di livello Il collaudo è superato se almeno il 95% degli oggetti verificati rientra nelle tolleranze. QUALITA' DEI DATI NEI SIT 42 ESIGENZE E DOCUMENTAZIONE esigenze di accuratezza schede di documentazione QUALITA' DEI DATI NEI SIT accuratezza Esigenze di accuratezza finalità del DB dimostrativo ricerca geomarketing lavoro a valore legale 43 QUALITA' DEI DATI NEI SIT 44 Scheda di documentazione (I) FONTI • provenienza cartografia • trattamenti in input: • scala data • produttore operatore • data edizione software • accuratezza della fonte algoritmo QUALITA' DEI DATI NEI SIT 45 Scheda di documentazione (II) AGGIORNAMENTI ED ELABORAZIONI • data • operatore • per le elaborazioni: software algoritmo