Corso di Laurea Magistrale in Ingegneria per l’Ambiente e il Territorio A.A. 2014-2015 Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci Modellazione dei dati geografici Acquisizione e trattamento dei dati geografici L’informazione geografica proveniente dal mondo reale può essere gestita in ambiente GIS solo dopo un processo di astrazione che prevede i seguenti livelli: - descrizione secondo MODELLI concettuali interpretazione e analisi concettuale della realtà geografica e di fenomeni territoriali - organizzazione in STRUTTURE elaborazione mediante algoritmi matematici di uso informatico - traduzione in FORMATI digitali lettura, interpretazione ed elaborazione mediante specifico software GIS … sui modelli Una strada può essere modellata come“poligonale” se, ad esempio, si deve inserire in un grafo per lo studio della mobilità. o come “area” compresa tra le linee di margine della carreggiata, se l’obiettivo dell’analisi è, ad esempio, la sua manutenzione …. sulle strutture sono riconducibili a DUE tipologie: vettoriale raster La scelta è legata a: fonte del dato (ad es.: dal rilevamento topografico → vector; da immagini satelliatri → raster); algoritmi e software specifici di elaborazione (analisi spaziali); risultati che si vogliono conseguire (ad es.: carte topografiche di precisione o di immediata comprensione tematica). MODELLAZIONE DEI DATI GEOGRAFICI Una carta è una rappresentazione del territorio ottenuta attraverso primitive geometriche caratterizzate da: ♦ posizione nello spazio ♦ attributi non spaziali La cartografia si basa sulla modellazione di dati geografici: i dati vengono memorizzati in formato elettronico secondo modelli e strutture ben definiti, che consentono di produrre rappresentazioni grafiche più o meno efficaci dal punto di vista concettuale e dell’interpretazione/interrogazione della carta stessa. 1) Quali informazioni desideriamo dedurre dagli archivi di dati geografici? e quindi 2) Quali sono i modelli di dati che descrivono un certo aspetto/fenomeno della realtà in funzione delle finalità della rappresentazione? Categorie di dati tipiche dell'informazione geo-topo-cartografica: Entità: oggetti discontinui, delimitati da confini ben precisi; in ambito GIS le entità vengono usualmente rappresentate mediante modelli vettoriali, generalmente topologici, cui vengono associate tabelle di attributi. Campi: rappresentativi di fenomeni continui nel dominio di definizione, quali ad esempio l'uso del suolo o l’altimetria del terrerreno; i campi vengono discretizzati e rappresentati mediante modelli raster georeferenziati (matrici regolari di attributi) In ambiente GIS l'informazione geografica deve supportare la modellazione di aspetti del territorio più o meno complessi (distribuzione di risorse infrastrutturali, vulnerabilità sismica dell'edificato di una provincia, ..) o, nelle applicazioni “dinamiche”, di fenomeni territoriali ad evoluzione spaziotemporale (rischio esondazioni, propagazione inquinanti aerei, mobilità di merci e persone, …). La modellazione dei dati geografici dovrà essere coerente con le finalità dell'applicazione (SIT) ESEMPIO 1 - Sistema Informativo per l’Agenzia del Territorio OBIETTIVI: associare le proprietà catastali ai rispettivi proprietari Esempi di possibili interrogazioni - Evidenziare tutte le particelle appartenenti a una Ditta - Dare gli indirizzi e le dimensioni superficiali di tutte le particelle appartenenti ad una Ditta - Trovare tutte le particelle adiacenti alle particelle del signor XY - Verificare se due proprietari hanno particelle confinanti - Dare le dimensioni di tutte le particelle che si affacciano su una data strada PROBLEMA: quale modello di dati può rispondere alle esigenze evidenziate? Particelle = entità superficiali georeferenziabili tramite coordinate dei punti che ne definiscono il perimetro (posizionamento diretto) o indirizzo (posizionamento indiretto) Sono importanti non solo le le loro posizioni degli oggetti (particelle) ma anche relazioni con altri oggetti (altre particelle, strade, proprietari,...) Relazioni topologiche tra entità grafiche e relazioni logiche con il DB dei Proprietari ESEMPIO 2 - Sistema Informativo per esigenze di Protezione Civile OBIETTIVI: possibilità di indicare il percorso ottimale da seguire in funzione della destinazione da raggiungere in un dato giorno e a una data ora. Esempi di possibili interrogazioni Individuare la centrale operativa da cui far partire i soccorsi Trovare il percorso ottimale (in termini di tempo, distanza, minore vulnerabilità, ..) Trovare un’alternativa di percorso a partire da un nodo del percorso (ad esempio per l’impossibilità di proseguire per motivi imprevisti/imprevedibili). Visualizzare la mappa delle esondazioni fluviali e le interferenze con la rete stradale …… Strade = entità lineari interconnesse attraverso nodi comuni Origini/Destinazioni dei soccorsi = entità puntuali la modellazione delle strade si baserà su primitive vettoriali e sulla teoria dei grafi. le aree interessate dalle esondazioni potranno essere rappresentate mediante un modello raster La modellazione concettuale E' la fase di analisi del contesto territoriale o del fenomeno di interesse, che conduce alla selezione e descrizione delle entità e delle mutue relazioni che lo caratterizzano. Indipendente sia dal software che dall’hardware ESEMPIO: analisi del rischio sismico di una strada Strada: insieme di tronchi, identificati da nodi di inizio/fine, connessi tra loro, su cui è possibile individuare manufatti sensibili (ponti, rilevati, trincee, …) che possono essere identificati in punti aventi precise coordinate cartografiche. Applicazione del modello ENTITA'-RELAZIONI (E-R) Il formalismo del modello E-R si basa essenzialmente su: entità e classi di entità; relazioni tra entità e classi di entità; attributi di entità e relazioni; cardinalità delle relazioni. ESEMPIO: ENTITA’: ciascun tronco o nodo o ponte, ….. è un’entità; la strada, nel suo complesso, è un’entità.. CLASSE DI ENTITA’: l’insieme dei tronchi compone la classe dei tronchi stradali; l’insieme dei ponti compone la classe dei ponti ; …. RELAZIONI: ciascuna strada è composta da 1 ad N tronchi; ogni manufatto appartiene a un tronco; ogni tronco collega due nodi, …. ATTRIBUTI: nome e lunghezza della strada; lunghezza del tronco; altezza e tipologia del ponte, …. CARDINALITA’: numero minimo (0 o 1) e massimo (N) di entità collegate da una relazione; sono quattro, due per ogni verso della relazione. MODELLAZIONE CONCETTUALE (SCHEMA ENTITA' - RELAZIONE): lunghezza lunghezza nome STRADA codice (1, N) composizione (1, 1) TRONCO (0, N) Presenza (1, 1) codice altezza tipologia PONTE MODELLAZIONE CONCETTUALE (ENTITA' - RELAZIONE): proprietà Ha Bordo bordo Ha Estremo ha bordo MODELLAZIONE DEI DATI GEOGRAFICI componente geometrica: geometria/topologia Componenti del dato geografico: componente semantica: attributi testuali (descrittivi e/o statistici) qualità Componente geometrica La geometria delle entità geografiche è descritto mediante elementi standard di base, detti primitive geometriche. La geometria dipende dalla scala di rappresentazione (dettaglio e approssimazioni rispetto alla "realtà"). La componente geometrica può essere: • vettoriale (coordinate dei punti che descrivono la forma geometrica) • raster (insieme di pixel corrispondenti al particolare oggetto) Componente semantica La componente semantica è data dall’insieme degli attributi di vario dominio (numerico, stringa, …) associati alla parte geometrica del dato. Qualità La qualità del dato geografico è descritta mediante le seguenti categorie: Accuratezza (veridicità del dato); Completezza (esaustività in relazione alla scala di rappresentazione); Aggiornamento (vicinanza temporale dell’acquisizione). PRIMITIVE GEOMETRICHE VETTORIALI Punto: è una primitiva geometrica 0-dimensionale, la cui posizione spaziale è descritta da coordinate (posizionamento diretto) Curva: è una primitiva geometrica limitata, continua, monodimensionale e può essere chiusa o aperta Una curva può intersecare se stessa: - esplicitamente (nella lista delle coordinate ci sono valori ripetuti); - implicitamente (il metodo di interpolazione applicato alla lista di punti dà luogo al passaggio della curva due o più volte nella stessa posizione spaziale). Bordo: è un elemento chiuso monodimensionale non intrecciato (né esplicitamente, né implicitamente); può essere composto da una o più curve. Superficie: è una primitiva geometrica limitata, continua, bidimensionale, delimitata da un bordo esterno e da zero o più bordi (o confini) interni non annidati e non intrecciati. Caratteristiche del modello vettoriale Ciascuna entità territoriale di interesse (feature) viene rappresentata mediante punti, linee, poligoni o combinazioni di questi elementi base. La georeferenziazione delle varie entità territoriali avviene associando a ciascun elemento base la corrispondente posizione geografica. Quindi un punto è memorizzato con una coppia di coordinate (x,y); la linea, in quanto insieme di punti, come serie ordinata di coordinate; le aree infine vengono codificate con una serie di coordinate relative ai segmenti di linea che racchiudono un poligono. Caratteristiche del modello vettoriale Il modello vettoriale è una struttura dati più complessa del raster. E’ necessario memorizzare esplicitamente le coordinate di ciascun vertice. E' estremamente utile per descrivere entità e fenomeni discreti (rete di collegamento stradale o di distribuzione dell’energia elettrica), ma è meno adatto per descrivere entità e fenomeni continui, cioè fenomeni caratterizzati dal variare continuo, nello spazio, di una grandezza (temperatura, precipitazioni, quota, pendenza) Presenta maggiori difficoltà di elaborazione sovrapposizione (es. linea su poligono) nelle operazioni di I dati sono rappresentabili nella loro forma e risoluzione geometrica originale, senza applicare generalizzazioni. L’accuratezza nel posizionamento geografico viene mantenuta. Caratteristiche del modello vettoriale PRIMITIVE GEOMETRICHE RASTER Si basano su strutture (frame) con cui si partiziona lo spazio di interesse con forma e disposizione regolare. Si hanno strutture bi o tridimensionali Ogni elemento è definito dal numero di riga, colonna (2D) e strato (3D). Definita l'origine del sistema di riferimento e dato un ordine di numerazione lungo i tre assi, ogni elemento unitario nella struttura è univocamente definito da tre numeri interi: numero di riga, numero di colonna, numero di piano. PRIMITIVE GEOMETRICHE RASTER Griglia: è una distribuzione regolare di punti, derivabile dagli angoli di tassellatura determinati da una struttura. Una griglia è definita in accordo con la specifica struttura che fornisce la posizione spaziale di ogni punto della griglia stessa. Pixel: primitiva geometrica bidimensionale quadrata o rettangolare, elemento base di una specifica struttura 2D. La sua posizione spaziale è definita dal numero di riga e di colonna. Banda raster: primitiva geometrica bidimensionale costituita da una porzione limitata e rettangolare di una specifica struttura rettangolare 2D. Voxel: è una primitiva geometrica tridimensionale, elemento base per una specifica struttura a tre dimensioni. Blocco raster: è una primitiva geometrica corrispondente ad una porzione di una struttura a tre dimensioni. Caratteristiche del modello raster ( e GRID) La posizione geografica di ogni cella è implicitamente individuata dalla sua posizione nella matrice. La struttura richiede quindi solo la memorizzazione delle coordinate di un punto origine (normalmente l’angolo superiore sinistro). Data la metodologia di memorizzazione dei dati, è facilmente implementabile e le operazioni sui dati sono veloci da eseguire (si lavora con matrici) . La natura delle mappe raster (mappatura di un unico attributo) è adatta alla modellazione matematica e all’analisi quantitativa. Caratteristiche del modello raster ( e GRID) Modello adatto a visualizzare fenomeni che variano con continuità (ad es. l’andamento del terreno o le variazioni graduali di vegetazione) La dimensione della cella determina la risoluzione geometrica con cui vengono rappresentati i dati. Le unità geometriche di base (punto, linea, poligono) vengono “espanse” su gruppi di pixel: difficoltà di gestione della topologia e perdita di risoluzione Possibile migliorare la risoluzione utilizzando un maggior numero di pixel, ma ciò comporta un notevole aumento di memoria richiesta per l’archiviazione del modello. punti celle linee sequenze di celle poligoni insiemi di celle Caratteristiche del modello raster ( e GRID) Struttura semplice, consente di implementare le operazioni di overlay con facilità ed efficienza Ridondanza dei dati in zone in cui il valore dell’attributo mappato è omogeneo Poiché la maggior parte dei dati sono espressi in forma vettoriale, i dati devono essere sottoposti ad una conversione vector-raster. L’introduzione di tale processo elaborativo può creare problemi relativi all’integrità dei dati a causa dell’inevitabile effetto di generalizzazione e di un'eventuale scelta errata della dimensione della cella. NOTA Per la corretta progettazione di una base di dati raster, è importante considerare il rapporto tra la risoluzione geometrica e il minimo elemento rappresentabile. L’area evidenziata copre una superficia minima di ogni cella e non verrà rappresentata. L’area copre gran parte di un numero significativo di celle e risulterà rappresentata. La La superficie superficie coperta coperta dalla dalla singola singola cella cella deve deve essere essere minore minore didi un un quarto quarto dell'area dell'areapiù piùpiccola piccolada darappresentare. rappresentare. Confronto raster-vector In alto a sinistra RELAZIONI SPAZIALI TRA ENTITA’ GEOGRAFICHE Si distingue tra: RELAZIONI TOPOLOGICHE, che non dipendono dall’orientamento e RELAZIONI DIREZIONALI, che ne dipendono. TOPOLOGIA E’ la disciplina matematica che si occupa di connessione e adiacenza di punti e linee e che permette quindi di analizzare le relazioni spaziali tra dati geografici. Un qualsiasi aggiornamento della carta dovrà rispettare i vincoli topologici imposti alle varie entità geografiche coinvolte. PROPRIETA': la topologia è invariante per deformazioni elastiche e continue (ad esempio trasformazioni di datum o di sistema di coordinate) ed è descritta attraverso primitive o relazioni topologiche. RELAZIONI RELAZIONI TOPOLOGICHE TOPOLOGICHEtra traentità entitàgeografiche: geografiche: --equivalenza equivalenza(si (sisovrappone sovrapponecompletamente); completamente); --equivalenza equivalenzaparziale parziale(si (sisovrappone sovrapponeparzialmente, parzialmente,attraversa); attraversa); --contenimento contenimento(è (èinterna); interna); --adiacenza adiacenza(è (èconnessa connessaooincontra); incontra); --separatezza separatezza(è (èdisgiunta) disgiunta) RELAZIONI RELAZIONI DIREZIONALI DIREZIONALItra traentità: entità: --di difronte fronteaa --dall’altra dall’altraparte partedi di --sopra sopra --sotto sotto --aadestra destra --aasinistra sinistra --descrizioni descrizionimetriche metrichedi diangoli angoliazimutali azimutali Si Si hanno hanno anche anche relazioni relazioni di di vicinanza vicinanza che che descrivono descrivono lala distanza distanza tra tra entità entità geografiche sia in termini metrici quantitativi (misura della distanza) che in termini geografiche sia in termini metrici quantitativi (misura della distanza) che in termini qualitativi, qualitativi,mediante mediantetermini terminiquali quali --vicino vicino --lontano lontano --in inprossimità prossimitàdi di Relazioni Relazioni topologiche, topologiche, direzionali direzionali ee di di vicinanza vicinanza sono sono spesso spesso utilizzate utilizzate in incombinazione combinazione tra tra loro loro Esempio Topologiche b è interno a c a è connesso a c d è disgiunto da a f è sovrapposto a e Direzionali g a est di b d a nord di g Vicinanza a vicino a b f lontano da a Topologia di strutture vettoriali Relazioni spaziali tra le entità geografiche Organizzazione dei dati geografici in livelli o strati informativi Tre diverse topologie: - totalmente poligonale - arco-nodo - relazionale Struttura poligonale Ogni strato informativo è costituito da poligoni indipendenti, ciascuno definito dalla successione dei vertici che ne definiscono il perimetro. ID coordinate 1 (E,N), (E,N), (E,N), … 2 (E,N), (E,N), (E,N), … N (E,N), (E,N), (E,N), … . Ad ogni poligono possono essere associati dati descrittivi Ogni linea di contorno viene memorizzate due volte, per ciascuno dei poligoni adiacenti LIMITI: - NO analisi spaziali; -Ridondanza (linee doppie) -difficoltà di modifica e aggiornamento VANTAGGI: - semplicità ed economia di memoria; - efficienza e velocità di accesso e consultazione (grandi DB). Struttura arco-nodo 5 Organizzazione gerarchica degli oggetti per punti, linee e poligoni (entità geometriche elementari) d 3 Poligono (territorio provinciale) .., .., .., .., B a,b,c,e,d c B ID linee A E e 2 ID 4 9 a A 11 D b C . S .., .. , .., .., Punto Linea (confine) ID nodo iniz. nodo fin. d 5 4 e 2 5 -q -- -- ID coordinate 1 (E,N) 2 (E,N) . N (E,N) 6 Struttura relazionale Nella topologia relazionale le informazioni topologiche e quelle descrittive sono memorizzate in strutture separate. Le informazioni descrittive sono contenute in tabelle che vengono a costituire un database relazionale. Ogni Ogniriga rigarappresenta rappresentaun unelemento elementogeografico, geografico,didicui cuivengono vengonomemorizzati memorizzati attributi attributi direttamente direttamente calcolati/assegnati calcolati/assegnati dal dal sistema sistema (identificativo, (identificativo, coordinate, coordinate,dimensioni, dimensioni,..) ..)eegli gliattributi attributidescrittivi descrittivididiinteresse. interesse. VANTAGGI: - possibilità offerte dai database relazionali di connessione diretta, attraverso attributi relazionali, ad altre tabelle di informazioni o di altri database; - standard per i GIS finalizzati ad analisi spaziali. Esempio di struttura relazionale