Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS SCOPI DEL MODULO MODULO 2 – GIS Il modulo 2 ha lo scopo di verificare le nozioni e le conoscenze del candidato relative alle tecnologie di base specifiche per i GIS quali le periferiche specializzate e relativi formati, alle componenti del GIS, al processo di schematizzazione della realtà nei sistemi informativi geografici attraverso un appropriato modello dei dati, al concetto di topologia, all’analisi spaziale applicata ai dati raster ed ai dati vettoriali descriventi campi continui ed entità discrete della realtà. 2.1 Introduzione ai GIS (SIT) 2.1.1 Concetti e conoscenze di base 2.1.1.1 Conoscere il termine ed il concetto di GIS (SIT)) Il termine GIS è un acronimo in lingua inglese che significa GEOGRAPHIC INFORMATION SYSTEM; la traduzione in lingua italiana è Sistema Informativo Geografico. Il termine di SIT è un acronimo che significa SISTEMA INFORMATIVO TERRITORIALE. Una definizione, generalmente accettata, di sistema informativo geografico è la seguente: Una raccolta organizzata di dati geografici, apparecchiature (hardware e software) e personale tecnico finalizzati a catturare, immagazzinare aggiornare, manipolare, analizzare e mostrare tutte le forme di informazioni geograficamente referenziate (o geo-referenziate). Altre definizioni collegate a quella di sistema informativo geografico sono riportate in Fig. 2-1 Fig. 2-1 – Alcune definizioni di GIS e argomenti correlati. 1 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS In altre parole un Sistema Informativo Geografico è un sistema computerizzato in grado di immagazzinare e utilizzare dati riferibili ad aree della superficie terrestre. I sistemi di informazione geografica sono costituiti di tre importanti componenti – l’hardware, i moduli dell’applicazione software, un contesto operativo e organizzativo costituito da persone esperte che richiedono di essere adeguatamente bilanciate perché tutto il sistema funzioni correttamente. L’uso dei sistemi informativi geografici è cresciuto notevolmente a partire dagli anni ‘80 ed in questo momento essi rappresentano strumenti di lavoro comuni ai settori economici e finanziari, della amministrazione pubblica e della ricerca. Da questo punto di vista il GIS (cfr ESRITALIA.COM) è considerato da molti come uno degli strumenti più potenti tra tutte le tecnologie dell’informazione, perché permette di integrare la conoscenza da sorgenti di dati multiple e di creare un ambiente trasversale di collaborazione. Inoltre i GIS sono strumenti intuitivi e cognitivi e uniscono a un potente ambiente di visualizzazione la struttura analitica e di modellazione che ha le proprie radici nelle scienze della geografia. Queste caratteristiche hanno come risultato una tecnologia basata sulla scienza, affidabile e facilmente trasmissibile tra culture, classi sociali, lingue e discipline diverse. Per supportare questa impostazione, i GIS devono potere essere visti secondo tre modalità diverse: 1. L’approccio dei geodati (cioè dati geografici): un GIS è un database spaziale, ossia un database contenente dataset che rappresentano l’informazione geografica in termini di modello di dati generico, e consente la gestione di elementi vettoriali (feature), immagini raster, attributi, topologie, reti e così via 2. L’approccio geovisualizzazione: un GIS consente di costruire rappresentazioni geografiche complete e complesse (mappe) in cui vengono visualizzati gli elementi geografici (feature) e le loro relazioni spaziali con la superficie terrestre. Si possono costruire viste sul sistema informativo sottostante, che sono utilizzate come finestre sul database sottostante, attraverso interrogazioni, analisi ed editing dell’informazione geografica. Ogni GIS ha un insieme di applicazioni cartografiche bidimensionali (2D) e tridimensionali (3D) che forniscono gli strumenti per potere interagire con l’informazione geografica utilizzando questi differenti approcci. 3. L’approccio geoprocessing: un GIS è un insieme di strumenti operativi per l’analisi geografica e l’elaborazione dell’informazione. Le funzioni di geoprocessing, a partire da dataset geografici esistenti, consentono di applicare a essi delle funzioni analitiche e archiviare i risultati in nuovi dataset. Il geoprocessing permette di programmare le attività e di automatizzare i flussi di lavoro attraverso l’assemblaggio di sequenze ordinate di operazioni. Questi tre differenti approcci costituiscono i fondamenti per un GIS funzionale e sono presenti, con modalità d’uso diverse, in tutte le applicazioni a carattere geografico. 2 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS 2.1.1.2 Sapere cosa differenzia i GIS (SIT) dai Sistemi Informativi in generale. SIT è l'acronimo italiano di Sistema Informativo Territoriale, e viene spesso fatto coincidere con la traduzione inglese Geographical Information System. Mogorovich (1988) ha definito il sistema informativo territoriale "Il complesso di uomini, strumenti e procedure (spesso informali) che permettono l'acquisizione e la distribuzione dei dati nell'ambito dell'organizzazione e che li rendono disponibili nel momento in cui sono richiesti a chi ne ha la necessità per svolgere una qualsivoglia attività" (da Wikipedia, 2009). Senza addentrarci ulteriormente in questioni terminologiche una differenza tra il significato del termine GIS e SIT può essere ottenuta sulla base delle definizione fornite dalle normative della Regione Toscana, ovvero della L.R. 5/1995 …omissis… Articolo 4 – SISTEMA INFORMATIVO TERRITORIALE. La Regione, le Provincie e i Comuni singoli o associati partecipano alla formazione del sistema informativo territoriale (S.I.T.). Viene introdotto il Sistema Informativo Territoriale come uno strumento essenziale della politica territoriale della Regione, Province e Comuni. La sua definizione è data successivamente. Il S.I.T. costituisce il riferimento conoscitivo fondamentale per la definizione degli atti di governo del territorio e per la verifica dei loro effetti. La costruzione di un sistema informativo implica la definizione del quadro conoscitivo generale, delle norme di classificazione e archiviazione dei dati, delle metodologie analitiche e degli obiettivi da raggiungere per la salvaguardia ambientale Sono compiti del S.I.T.: a) l’organizzazione della conoscenza necessaria al governo del territorio, articolata nelle fasi della individuazione e raccolta dei dati riferiti alle risorse essenziali del territorio, della loro integrazione con i dati statistici , della georeferenziazione , della certificazione e finalizzazione, della diffusione, conservazione e aggiornamento b) la definizione in modo univoco per tutti i livelli operativi della documentazione informativa a sostegno dell’elaborazione programmatica e progettuale dei diversi soggetti e nei diversi settori; La registrazione degli effetti indotti dall’applicazione delle normative e delle azioni di trasformazione del territorio Il punto a) prevede l’individuazione del contesto disciplinare ( le discipline coinvolte) e conoscitivo (i dati) necessari al governo del territorio. Ad esempio per i rischi naturali gli aspetti geologici, sismici, vulcanologici, geomorfologici, geotecnici, geomeccanici etc, oltre ai vari aspetti urbanistici e sociali. Sono talvolta indispensabili integrazioni con dati statistici ( ad esempio dati INSTAT). Tutti i dati devono essere georeferenziati, ovvero riferiti a un comune sistema di riferimento geografico ( es. Sistema nazionale Gauss Boaga, UTM o Cassini Soldner). I dati devono essere certificabili ovvero ufficiali e “prodotti” con metodologie collaudate che rappresentino lo stato dell’arte del settore. E’ infine compito del S.I.T. la diffusione, la conservazione e l’aggiornamento dei dati. Questo complesso di norme riguardanti i compiti del S.I.T. non obbliga a percorsi metodologici “standard”, ma le sue finalità di fatto obbligano all’impiego di strumenti informatici evoluti come i Geographic Information System. Il punto b) obbliga alla definizione della documentazione informativa (istruzioni, indirizzi e norme tecniche) a sostegno dell’elaborazione dei programmi e delle metodologie d’intervento. Ad esempio la definizione delle strutture dati. 3 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Il punto c) obbliga a far confluire nel S.I.T. la registrazione degli effetti indotti dall’applicazione delle normative e delle azioni di trasformazione del territorio. Il S.I.T. è accessibile a tutti i cittadini e vi possono confluire, previa certificazione nei modi previsti, informazioni prevenienti dagli enti pubblici e dalla comunità scientifica. Il S.I.T. costituisce un pubblico servizio a cui possono accedere tutti i cittadini. Oltre all’aggiornamento dei dati predisposti, possono essere inseriti anche altri dati provenienti da enti pubblici o dalla comunità scientifica. Questa definizione di SIT ci aiuta a comprendere come il sistema informativo territoriale sia in effetti costituito da un insieme di dati e informazioni (georeferenziate) organizzate secondo un modello dati e precise regole concernenti le operazioni di accesso, modifica, interrogazione, consultazione, rappresentazione e diffusione dei dati. Tali operazioni si realizzano oggi concretamente tramite l’impiego di strumenti informatici quali i Geographical Information System o i DBMS spaziali. Ecco che una distinzione tra SIT e GIS appare ora più chiara: il SIT implica la definizione di un modello dati e del contesto delle regole di gestione dei dati da parte del personale specializzato addetto alla manutenzione e aggiornamento degli archivi, nonché della definizione delle regole di accesso da parte degli utilizzatori. Il GIS propriamente detto può in sintesi essere inteso come la parte informatica (nel senso delle procedure software) del sistema. 4 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS 2.1.1.3 Conoscere i principali ambiti applicativi dei GIS (SIT). Ambiti Applicativi Gli Ambiti Applicativi di riferimento del GIS sono molteplici e interessano tutte le tipologie di mercati di riferimento (di seguito descritti), sia nella Pubblica Amministrazione sia nelle aziende industriali e di servizi. Molti tra i più significativi Ambiti Applicativi del GIS sono descritti nelle pagine relative ai diversi Mercati, in modo da contestualizzarli nella realtà operativa del Business specifico che supportano. Alcuni Ambiti Applicativi specifici sono: il Geomarketing; la Logistica; la Business Intelligence; la Gestione delle reti tecnologiche e di Utilities; i Servizi LBSLocation Based Services) anche in prospettiva dei futuri sviluppi del settore spaziale e, in particolare, dei servizi di localizzazione legati al nuovo sistema Galileo. I principali settori produttivi (o mercati) di riferimento (Industries) in cui operano i GIS sono elencati nella seguente Fig. 2-2: Ingeneria Commercio, Comunicazioni, Affari e Finanza Difesa e servizio informazioni (Intelligence) Istruzione Ingegneria Civile Servizi bancari e finanziari Biblioteche e musei Rilevamen to topografic o e cartografic o Gestione delle infrastrutture e servizi (reti) Scuole elementari e medie Assicurazioni Scuole medie superiori e Università Stampa e mezzi di informazione Compravendite immobiliari Distribuzione al dettaglio Governo e pubblica amministra zione Salute servizi persone Amministr azione pubblica statale e periferica Sviluppo economico Gestione ambientale Pubblica sicurezza Protezione Civile Risorse naturali Forestazion e Agricoltura Coste mari Servizi elettorali Archeologia Amministr azione del territorio Cartografia ( a varia scala) Cavità grotte Lavori pubblici Pianificazi one territoriale (urbana e regionale) e alle e Conservazion e Trasporti Servizi pubblici e comunicazioni Sistemi di allerta computerizzati Aviazione Gas ed elettricità e Gestione delle emergenze del territorio Autostrade Servizi localizzazione base Miniere e cave Gestione delle emergenze sanitarie Logistica Idrocarburi ed energia Sicurezza degli interni Ferrovie Risorse idriche Autorità giudiziaria Porti e vie marittime Protezione dagli incendi urbani Gestione degli incendi boschivi e forestazione Trasporti Pubblici e Fig. 2-2 - I principali ambiti applicativi dei GIS (SIT). 5 di di Condotte (oleodotti, metanodotti, acquedotti) Telecomunicazion i Distribuzione idrica e reti tecnologiche (fognature e depurazione) Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS 2.1.1.4 Conoscere e saper distinguere le componenti di un GIS (SIT). La componente Hardware La componente hardware di un GIS è sinteticamente riportata nella Fig.2-3 il computer dispone di un hard disk (disco rigido) su cui sono registrati i dati e i programmi e una memoria di maggiore capacità su cui sono generalmente eseguiti i backup, disponibile via rete o mediante altro collegamento; i sistemi di backup più utilizzati sono i nastri magnetici e i CD-ROM. Un tavolo digitalizzatore (tavoletta grafica) o uno scanner sono utilizzati per l’input dei dati, cioè per la conversione in formato digitale (numerico, analogico ecc.) dei documenti “cartacei” (disegni, tabulati, testi, grafici, immagini). I plotter, le stampanti e ogni tipo di apparecchiatura che serve alla realizzazione di stampe, rappresentano le attrezzature per l’output. La comunicazione tra i computer è realizzata attraverso reti locali (LAN), settoriali o di gruppo (Intranet) e globali (Internet); la comunicazione con il computer cui sono collegati i nodi delle reti (server) è spesso ottenuta mediante reti in fibra ottica o mediante l’uso della rete telefonica con un apparecchio (modem), che modula e demodula il segnale emesso dal computer in linguaggio compatibile con le trasmissioni telefoniche. L’utilizzatore del computer controlla tutto l’hardware comprese le periferiche per la stampa e la trasmissione, attraverso il monitor del computer, la tastiera e il mouse. Fig. 2-3 – La componente hardware di un GIS La componente Software Il software che costituisce i sistemi di informazione geografica può essere diviso in 5 gruppi funzionali (Fig.2-4): a) L’input dati e la verifica b) La registrazione (o immagazzinamento) dei dati e la gestione del database 6 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS c) L’output dati e la presentazione d) La trasformazione dei dati e) L’interazione e l’interfaccia con gli utenti e operatori Fig. 2-4 – Le principali funzioni della componente software di un GIS 7 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS 2.1.1.5 Conoscere le principali funzioni di un GIS Le principali funzioni di un GIS sono strettamente connesse con le 5 funzioni sopra descritte. La funzione di input dei dati e la loro verifica copre tutti gli aspetti della cattura dei dati spaziali dalla carte esistenti, dalle osservazioni di campagna, dai sensori di ogni genere (installati su aerei, satelliti o scanner da tavolo) e della loro conversione in formati digitali elaborabili dai computer. Le operazioni di input dati e di verifica della loro congruità rispetto alla costruzione di un database saranno descritte successivamente. La funzione di immagazzinamento dei dati e la gestione del database (Fig. 2-5) concerne le fasi di organizzazione e strutturazione delle informazioni relative alla ubicazione spaziale degli attributi informativi delle diverse entità geografiche, siano esse punti, linee, poligoni o entità più complesse. I sistemi software per la gestione del database prendono il nome di Data Base Management System (DBMS). Il modello dati da seguire (descrizione formale dei fenomeni reali), la struttura del database e i metodi di organizzazione del database sono caratteristici di ogni database geografico. Figura 2-5 – Fonti e strumenti del data input La funzione di output e la presentazione dei dati (Fig.2-6) concerne il modo di presentazione e illustrazione dei dati e le modalità di trasferimento dei dati all’utilizzatore. I dati possono essere rappresentati come carte, diagrammi, tabelle, report, sia in forma di stampa (hardcopy) che su supporto magnetico o digitale. I metodi di presentazione costituiscono parte della Cartografia Tematica e della Visualizzazione cartografica. La funzione di trasformazione dei dati abbraccia due gruppi di operazioni: la trasformazione dei dati che si rende necessaria per rimuovere gli errori oppure le operazioni di aggiornamento e omogeneizzazione per rendere i dati compatibili con altre basi di dati tutte le operazioni di analisi che possono essere applicate ai dati per giungere alle risposte che possono essere poste da parte degli utilizzatori di un GIS Molte di questi metodi di analisi fanno ormai parte di tutti i sistemi geografici, mentre altre analisi più complesse sono caratteristiche solo di alcuni particolari pacchetti o moduli software. 8 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Figura 2-6 - L'output dei dati 9 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS 2.1.2 Periferiche e tipi di file caratteristici nei GIS (SIT) 2.1.2.1 Conoscere le periferiche di input specifiche utilizzate nei GIS (SIT) e le caratteristiche che le differenziano (ove applicabili a seconda del dispositivo: risoluzione, precisione, gamma colori, modalità di connessione, gestione ed utilizzo). Le finalità del lavoro (in termini di requisiti richiesti quali risoluzione, precisione, gamma colori, modalità di connessione, gestione ed utilizzo), differenziano i campi di applicazione degli strumenti per data imput. I sistemi informativi territoriali possono contenere dati provenienti da diverse fonti. Dal punto di vista della creazione di un data base geografico (o spaziale), è conveniente classificare i dati, siano essi di tipo Raster (immagini) o di tipo Vettoriale (primitive grafiche di tipo punto, linea, poligono), come dati Primari o Secondari (Fig.2-7) Dati di Tipo Raster Primari Dati di Tipo Vettoriale Immagini telerilevate (satelliti tipo LandSat, Rilievi e misure GPS Spot, Ikonos, Eros, etc) Rilievi topo-cartografici Foto aeree digitali Secondari Immagini acquisite tramite scanner o apparecchi Carte topografiche fotografici digitali Data base topografici Modelli digitali del terreno Fig.2-7 – Classificazione del Data-Input I dati geografici possono essere ottenuti sia da un formato digitale che da un formato analogico; questi ultimi devono sempre digitalizzati prima di essere contenuti in un data base geografico. I procedimenti (le metodiche) di raccolta dati sono spesso definite come cattura dei dati, automazione dei dati, conversione dei dati, trasferimento dei dati, traduzione dei dati e digitalizzazione. Sebbene questi termini possano sembrare molto diversi, da un certo punto di vista essi descrivono la stessa operazione, ovvero l’acquisizione dei dati di un data base geografico. Acquisizione primaria di dati raster La più nota metodologia di acquisizione di dati raster è il telerilevamento. Il telerilevamento (Remote Sensing) è la misura delle proprietà fisiche, chimiche e biologiche degli oggetti senza un diretto contatto con essi. Le informazioni acquisite sono relative dalla misura delle quantità di radiazioni elettromagnetiche che sono riflesse, emesse o disseminate. Una grande quantità di sensori che operano su tutto lo spettro elettromagnetico, dal visibile fino alle microonde, sono oggi utilizzati per telerilevare questi dati. La maggior parte di questi è montata su veicoli aerei o satelliti. Una distinzione di base di questi sensori è tra attivi e passivi. I sensori passivi si basano sulla radiazione solare riflessa oppure sulla energia radiata dalla superficie terrestre (es. calore geotermico). I sensori attivi ( come il radar ad apertura sintetica), generano una loro sorgente di onde elettromagnetiche e ne registrano gli effetti con la superficie terrestre. Dal punto di vista dei della costruzione delle 10 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS banche dati, la RISOLUZIONE è il parametro fisico più importante che caratterizza i sistemi di telerilevamento. Ci sono tre aspetti della risoluzione: la risoluzione spaziale, spettrale e temporale. La risoluzione spaziale concerne la dimensione degli oggetti spaziali che possono essere rilevati dal sistema. I sistemi attuali (di tipo commerciale) rilevano immagini con pixel la cui dimensione a terra è compresa da meno di un mero fino a un chilometro. Le camere fotografiche utilizzare per le foto aeree digitali oscillano tra 0,1m – 5 m. La copertura areale di una di una immagine (scena) tele rilevata oscilla da 10 km x 10 km a 200 km x 200 km. La risoluzione spettrale si riferisce alle diverse parti dello spettro elettromagnetico che vengono rilevate (Fig 2-8). Fig.2-8-Tipici valori di riflettenza per acqua, vegetazione e suolo I sistemi di Remot Sensing possono catturare dati in una parte dello spettro elettromagnetico (che si riferiscono ad una sola banda, oppure simultaneamente da diverse parti (multi-banda o multi spettrali). I valori della radiazione sono normalmente normalizzati e ricampionati per fornire un intervallo di numeri interi compreso tra 0-255 per ogni banda, per ogni pixel, in ogni immagine. La risoluzione temporale, o ciclo di ripetizione, descrive la frequenza con la quale le immagini vengono raccolte per la stessa area. Da questo punto di vista ci sono essenzialmente due tipi di satelliti commerciali: orbitanti e geostazionari. I satelliti orbitanti raccolgono informazioni da diverse parti della superficie terrestre ad intervalli regolari. I geostazionari insistono sempre sulla stessa porzione di superficie terrestre. Di eguale importanza specialmente per i progetti GIS di mediagrande scala sono le foto aeree. Queste ultime possono esser acquisite con camere analogiche di tipo tradizionale e successivamente masterizzate tramite uno scanner oppure, come è sempre più frequente tramite camere digitali. Le foto aeree rispetto a gran parte delle immagini satellitari hanno il vantaggio di esser acquisite in stereo coppie, ovvero la sovrapposizione parziale di territorio ripreso da due fotogrammi contigui, permette una ricostruzione tridimensionale del territorio ripreso. Acquisizione primaria di dati vettoriali La raccolta dei dati vettoriali avviene tramite due operazioni di base: il rilevamento topo cartografico ed il Global Positioning System. Questi argomenti verranno trattati nel Modulo 1 Acquisizione secondaria di dati raster utilizzando uno scanner Lo scanner è uno strumento che trasforma le “hardcopy” analogiche (documenti cartacei o in altro materiale) in immagini digitali; ulteriori dettagli sull’uso degli scanner verranno di seguito forniti. Acquisizione secondaria di dati vettoriali 11 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS L’acquisizione secondaria dei dati implica la digitalizzazione delle entità che sono rappresentate da diversi sorgenti dei dati. Il metodo più diffuso è la digitalizzazione manuale, la digitalizzazione a video (a “testa alta”), la fotogrammetria e l’ingresso diretto di dati topografici (COGO). La digitalizzazione manuale tramite digitizer è l’operazione più rapida e più semplice di restituire dati vettoriali. ulteriori dettagli sull’uso dei digitizer verranno di seguito forniti La digitalizzazione a “testa alta” avviene interpretando manualmente attraverso un video di un computer le entità rappresentate su una fonte di dati acquisita allo scanner. La sorgente dei dati è in genre una mappa, una immagine satellitare, una foto aerea o ortofoto etc. Tali fonti di dati sono preliminarmente georeferenziate. Il processo può anche essere erso automatico o parzialmente automatico, tramite l’utilizzo di software speciali. In qusto caso occorre molto tempo per l’editing e la classificazione dei dati interpretati. La fotogrammetria permette di ottenere dati vettoriali direttamente dall’interpretazione di coppie stereoscopiche di foto aree. Il COGO è una abbreviazione di Coodinate Geometri ed è la metodologia di raccolta di dati vettoriali tramite l’ingresso diretto da rilevamento topo cartografico di oggetti (es edifici, strade, condotte, pipeline etc). Periferiche per il data imput. Le principali periferiche di input sono già state elencate in Fig.2-5; queste apparecchiature sono note come quantizer, cioè dispositivi elettronici che sono in grado di convertire dati analogici (come le mappe), in segnali digitali che possono essere utilizzati dai sistemi GIS. I quantizer che sono più frequentemente utilizzati nei sistemi GIS sono: 1 - Il tavolo digitalizzatore (digitizer) (Fig. 2-9 hanno diversa forma e dimensione; il principio di funzionamento si basa sui dati inviati da un cursore (detto Puck, Fig. 2-10) che può essere spostato liberamente su un tavolo sotto la cui superficie è stata inserita una fitta maglia di spire elettriche in grado di rilevare la posizione del segnale inviato. Fig. 2-9 – Tavolo digitalizzatore 12 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-10 – Cursore per tavolo digitalizzatore (puck) Esercitando una pressione su un bottone del cursore, la posizione di quest’ultimo viene rilevata dalle spire del tavolo e trasmessa al computer a cui il digitizer viene collegato. I cursori che passano su questi tavoli sono muniti di una finestra trasparente con un crocicchio che permette di inserire punti, vertici di linea e definire poligoni lungo i bordi delle entità riportate in mappa. I metodi di digitalizzazione tramite digitizer permettono anche di inserire automaticamente dei vertici durante lo spostamento del cursore si può fissare un intervallo di tempo di es 0,25 secondi oppure un intervallo di spazio di 0,5 mm. In Fig. 2-11 sono riassunte e caratteristiche principali dei tavoli digitalizzatori Risoluzione Precisione Gamma colori Modalità connessione Cavo interfaccia RS232 di Gestione ed utilizzo Variabile a Variabile a NN di Adatto per seconda dei seconda dei tipo digitalizzazione manuale modelli: es. modelli; da o disegno CAD (vedi 2450 lpi (line 0,075 mm a testo) por inches) 0,25 mm Fig. 2-11 – Caratteristiche riassuntive dei tavoli digitalizzatori Caratteristiche della digitalizzazione manuale. La digitalizzazione manuale si basa sulle capacità dell’operatore di interpretare il contenuto di una mappa (o altro elaborato grafico) secondo le indicazioni di un modello dati di riferimento. La mappa viene fissata sul tavolo digitalizzatore e l’operatore, tramite lo spostamento del puck, inserisce una serie di punti le cui coordinate relative permetto di ricostruire entità vettoriali quali punti, linee e poligoni. La digitalizzazione manuale tramite un tavolo digitalizzatore fornisce una precisione dello stesso ordine di grandezza della maggior parte delle mappe ed immagini, per cui questo processo di data input non aggiunge significativi errori ai dati prodotti. Tuttavia ci sono caratteristiche della digitalizzazione manuale che possono influire negativamente sulla qualità posizione dei dati spaziali. 13 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Ad esempio nella Fig. 2-12 sono riportati gli errori che influenzano i dati ottenuti, sulla base un errore di posizionamento del cursore di 1 mm. Scala della mappa Errore in metri terreno 1:24000 24 1:50000 50 1:100000 100 1:1000000 1000 Fig. 2-12 – Errori di posizionamento dei dati digitalizzati, prodotti da un errore nella posizione del cursore pari a 1 millimetro Anche le caratteristiche dell’equipment influenzano l’accuratezza finale dei dati; c’e’ un limite superiore sulla precisione di ogni tavolo digitalizzatore che si riflette sulla risoluzione della digitalizzazione. La precisione può essere considerata come la distanza minima al di sotto della quale i punti non possono essere definiti come posizioni distinte. La precisione è spesso riportata come la ripetibilità; per stimare la ripetibilità si cerca di valutare quanto sono vicini tra loro i punti relativi ad una certa posizione, digitati senza che il puck venga spostato. In teoria questi punti dovrebbero essere tutti nella stessa posizione, ma sono evidenti alcune variazioni della posizione dovute alla posizione meccanica del sensore o alle sue caratteristiche elettroniche; tali variazioni influenzano l’accuratezza complessiva della digitalizzazione. L’abilità e l’attitudine dell’operatore è un altro importante fattore che controlla la qualità posizionale dei dati ottenuti; la vista, la capacità di tenere ferma la posizione del cursore etc, sono tutti elementi che si riflettono nel risultato finale. In Fig. 2-13 è riportato il risultato di un test eseguito con un tavolo digitalizzatore di elevata qualità e ripetute digitalizzazioni; come si vede l’errore varia approssimativamente di 0,067 mm. Fig. 2-13 – Errori di digitalizzazione, ottenuti da ripetute digitalizzazioni. I punti che sono stati ripetutamente digitalizzati si raggruppano attorno alla vera localizzazione secondo una normale distribuzione di probabilità 2 - Lo scanner è uno strumento che trasforma le “hardcopy” analogiche (documenti cartacei o in altro materiale) in immagini digitali; lo scanner genera un fascio luminoso e rileva la luce riflessa o trasmessa da tale fascio lungo una serie di linee contigue che attraversano tutto il documento 14 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS (mappa, foto, etc); le diverse caratteristiche della luce riflessa o trasmessa dallo scanner sono da esso trasformate in una matrice di celle digitali di forma regolae (pixel) che nel loro insieme permettono di ricostruire nel computer l’immagine originale con la sua forma ed i suoi colori. Le differenze di quantità di luce riflessa vengono normalmente classificate in due livelli (bianco e nero,1 bit pixel), oppure multipli livelli di grigio (8, 16 o 32 bit pixel). Gli scanner a colori sono in grado di rilevare una gamma di colori classificati in 8 bit pixel nelle bande del verde, rosso e blu. La risoluzione spaziale degli scanner varia tra 100 dpi (dot por inches, punti per pollice, corrispondenti a 4 punti per mm), a 1800 dpi 72 punti per mm). Gli scanner si possono dividere in funzione delle loro modalità di acquisizione dell’immagine, ed in particolare si hanno: Gli scanner piani (flat-bed) Gli scanner “a tamburo” Gli scanner ad alimentazione continua. Negli scanner piani l’originale viene posizionato su una superficie piana trasparente ed il sistema di scansione si sposta lungo le due dimensioni del piano di scansione. Se l’originale di scansione è opaco la luce viene riflessa e rilevata, mentre se l’originale di scansione è trasparente (ad esempio è una pellicola) la luce può essere trasmessa attraverso l’originale. Gli scanner “ a tamburo” utilizzano lo stesso principio degli scanner piani, ma in questi l’originale è posizionato su un tamburo che ruota attorno al sensore del segnale. Negli scanner ad alimentazione continua l’originale viene trascinato da una serie di rulli e scorre rispetto ai sensori di rilievo che sono fissi e distribuiti ungo tutta l’ampiezza dell’originale. L’architettura di questo attrezzo è più semplice e più versatile rispetto alle altre configurazioni sopra descritte, ma la risoluzione e l’accuratezza sono minori Ci sono almeno tre importanti ragioni per eseguire la scansione di originali e manoscritti (hardcopy): Documenti come piani regolatori, disegni CAD, foto ed immagini generali sono acquisite con scanner per migliorare l’accesso ai dati Pellicole e copie cartacee di foto aeree sono acquisite per fornire il cotesto geografico di riferimento dei dati (layer di sfondo) Mappe e foto aeree sono acquisiti per essere restituiti in forma vettoriale tramite digitalizzazione (vettorializzati) Per quanto riguarda le risoluzione si va da (8 bit pixel, 256 livelli di grigio) e 400 dpi (16 punti per mm) come ottima risoluzione per acquisire dati da utilizzare come “sfondo” degli strati informativi vettoriali. Per foto aeree da utilizzare come foto interpretazione ed analisi si utilizzano risoluzioni fino a 1000 dpi ( 8 bit pixel nelle tre bande RGB). In Fig. 2-14 Risoluzione Variabile: fino a 300 dpi per macchine da ufficio fino a 800-1200 dpi per grafica oltre 1200 (fino a 2400-3600) per usi fotogrammetrici Con pixel da 25 a 50 micron la risoluzione varia da 2,5 a 5,0 cm terreno per una mappa a scala 1:1000 Precisio ne Precision e delle linee +0,1% Gamma colori Generalmente Red, Green Blue con immagini da 8 a 24 bit pixel Modalità di connessione USB Gestione ed utilizzo Utilizzo per acquisizione di documenti quali mappe, immagini, foto da utilizzare direttamente negli archivi oppure come fornte di dati da vettorializzare manualmente o automaticamente. Fig. 2-14 – Caratteristiche riassuntive degli scanner 15 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS 2.1.2.2 Riconoscere i tipi di file più comuni utilizzati nei GIS (SIT) e a quale categoria appartengono (vettoriale o raster). I formati di dati geografici. Uno dei principali problemi nell’impiego di dati geografici provenienti da diverse fonti, è che essi possono essere codificati in formati di file molto diversi tra loro. La ragione di utilizzare diversi formati di file dipende dal fatto che non esiste (o almeno non esisteva) un formato di tipo generale che possa soddisfare tutte le esigenze; ad esempio un file che permetta una restituzione di elaborazioni 3D e al tempo stesso consenta di definire complesse relazioni topologiche. Per questo motivo i produttori di software hanno sviluppato i formati di file in funzione delle diverse esigenze degli utenti. Al fine di individuare standardizzazioni dei vari dati geografici sono oltre 25 le organizzazioni che sono coinvolte in tutto il mondo. A livello globale ISO (Intenational Standard Organization), è responsabile del coordinamento delle varie commissioni tecniche sui dati geografici (TC 211 e TC 287). In Europa la CEN (Commision Européan Normalisation) è l’organismo che si occupa di standardizzazione e a livello nazionale nelle singole nazioni operano altri organismi (es. in Italia la UNI). Un’altra importante organizzazione che definisce standard geografici è la OGC (Open GIS Consortiun), un gruppo costituito da produttori (vendor), accademici ed utilizzatori che sono interessati alla interoperabilità dei dati geografici. In Fig 2-15 sono elencati alcuni dei più famosi formati di dati geografici. Fig. 2-15 – I principali tipi di formati geografici rastre e vector 2.1.3 I dati e le fonti dei dati nei GIS (SIT) 2.1.3.1 Saper distinguere le tipologie di dati utilizzati nei GIS (SIT). 16 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS La principale caratteristica delle tipologie di dati utilizzate nei GIS è la georeferenziazione; tutte le tipologie di dati devono avere un riferimento spaziale preciso ed univoco. Ad un dato corrisponde una posizione e quella posizione è unica per quel dato. Esiste una vasta gamma di dati che vengono utilizzati nei sistemi GIS e ciò dipende delle innumerevoli finalità per cui tali sistemi possono essere utilizzati. Dal momento che i GIS possono essere utilizzati per analisi archeologiche, geomarketing, pianificazione territoriale e urbana etc, le sorgenti di dati non possono essere facilmente classificate o inventariate esaurientemente. Anche all’interno di un solo progetto GIS la varietà del materiale può essere notevole. Sebbene il tipo di materiale possa variare notevolmente da progetto a progetto, è indispensabile che i professionisti che si occupano di GIS conoscano alcune delle più comuni fonti di dati. Le agenzie e gli enti governativi sono i maggiori produttori di dati: Regioni, Provincie, Comuni, Comunità Montane, Autorità di Bacino (nazionali e regionali), Enti di Bonifica, Servizi Tecnici e Agenzie Centrali (es ISPRA), Organi Cartografici dello Stato (L'istituto Geografico Militare; L'istituto Idrografico della Marina; La Sezione Fotocartografica dello Stato Maggiore dell'Aeronautica; L'amministrazione del Catasto e dei Servizi Tecnici Erariali; Il Servizio Geologico); l’INGV, La Protezione Civile, etc . Occorre tenere presente che le Amministrazioni Statali o periferiche sopra citate, spesso organizzano i dati per le loro finalità ed in modo diverso da settore a settore e da luogo a luogo. Questo implica che sia necessario spendere una discreta quantità di tempo per ottenere i dati e per portarli nella forma che ci serve. Esistono anche produttori di dati privati che dispongono di dati e informazioni di grande importanza per gli aspetti commerciali, ma spesso tali dati sono molto costosi o non accessibili I comuni formati digitali Le modalità con cui i dati digitali sono resi disponibili sono soggetti a frequenti mutamenti. Di seguito sono elencati e brevemente descritti alcuni formati di file che sono ampiamente utilizzati come fonti di dati digitali per i GIS. Census Bureau Topographically Integrated Geographic Encoding and Referencing System (TIGER). I Tiger file sono stati sviluppati per supportare le attività di classificazione dell’Ufficio del Censo statunitense. I file includono dati digitali inerenti alle entità cartografiche, confini amministrativi, toponimi, coordinate, indirizzi codificati etc. Si tratta di dati che coprono esclusivamente il territorio americano (USA) USGS Digital Line Graphs (DLGs). Questi dati sono rappresentazioni digitali (suddivise in punti, linee e poligoni) di informazioni cartografiche tratte dalle tradizionali carte del Servizio geologico Americano (USGS). I dati sono suddivisi in layer tematici (idrografia, elevazione, trasporti, toponomastica, etc) USGS Digital Orthophoto Quadrangles (DOQs). Sono ortofoto digitali relative ai quadrangles cartografici del USGS. Analoghe a queste tipologie di dati sono le ortofoto digitali prodotte da AIMA, CGR, etc, che coprono varie porzioni (es il taglio delle sezioni 1:10.000) del territorio italiano. Spatial Data Transfer Standard. Questo standard fornisce specifiche per il trasferimento di dati spaziali digitali da una applicazione all’altra. I formati commerciali Occasionalmente i produttori di software producono dei formati che diventano degli standard di fatto per il trasferimento dei dati. Nel mondo della cartografia, del disegno digitale e dei GIS, i più importanti di questi sono il DXF (Drawing Exchange Format) e lo SHAPEFILE. Il DXF è un file in 17 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS formato ASCII che descrive il contenuto dei file CAD in modo che essi siano interpretabili e leggibili dai tutti i sistemi software. Lo shapefile è descritto nel paragrafo 2.1.3.5 Quali sono gli aspetti principali da valutare nei dati geografici Si afferma spesso che i dataset privi di documentazione sono dataset privi di valore. C’e’ molto di vero in questa affermazione in quanto l’assenza di informazioni concernenti la qualità dei dati comporta l’impiego di molto tempo da parte dell’utente per cercare le stesse informazioni. I dati dovrebbero essere sempre accompagnati da una documentazione sulla qualità che riporti esattamente cosa contiene il file, come sono stati ottenuti i dati, come sono stati controllati etc. La commissione ISO TC211 ha definito le informazioni caratteristiche che devono accompagnare i report sulla qualità dei dati. Se la documentazione è limitata, nel valutare le tipologie di dati geografici si deve comunque cercare di sapere: La data di creazione Da dove proviene il file Con quale metodo o procedura i dati sono stati raccolti Qual è l’area coperta dai dati A quale scala i dati sono stati digitalizzati Quale sistema di riferimento è stato utilizzato Quale è la densità di osservazione (scala di campionamento) utilizzata per la compilazione di dati Quanto sono accurate i posizionamenti e le informazioni delle diverse entità La logicità e la consistenza dei dati La chiarezza delle visualizzazioni cartografiche L’evidenza e l’accessibilità dei dati funzionali al progetto Il formato di gestione dei dati Le modalità di esecuzione dei collaudi e controlli Per quali finalità i dati sono stati compilati Le referenze del fornitore (Traduzione da Kenneth E. Foote and Margaret Lynch, Department of Geography, University of Texas at Austin, 1995) 2.1.3.2 Riconoscere le principali fonti di dati usabili nei GIS (SIT), quali: dati telerilevati, Catasto, mappe cartacee e digitali, dati socio-economici. DATI TELERILEVATI I dati telerilevati sono ottenuti tramite misure e rilievi indiretti eseguiti da sensori e strumenti posti a considerevoli distanze dalle entità misurate. Nel contesto dei GIS, utilizziamo il termine di dati tele rilevati per indicare foto aeree acquisite da vettori aerei ed immagini satellitari per indicare le immagini acquisite dai sensori posti su satelliti. Negli ultimi anni tutti questi tipi di dati sono passati dalle registrazioni analogiche su pellicole a formati digitali. I dati telerilevati costituiscono una forte di dati molto importanti di dati spaziali, per le seguenti ragioni: Coprono una ampia area con un costo relativamente basso ed in modo uniforme Le foto e le immagini acquisite da scanner possono rilevare la luce fino alle lunghezza d’onda che sono fuori dello spettro visibile all’occhio umano. Alcuni tipi di foto aeree sono sensibili alle 18 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS lunghezze d’onda infrarosse. Gli scanner aerei e satellitari hanno range spettrali molto vasti, fino alle lunghezza d’onda termiche ed oltre. Hanno un’accuratezza geometrica elevata. I dati telerilevati possono essere convertiti in dati spaziali con elevata accuratezza. Le foto aeree sono le fonti principali dei dati per la produzione di cartografie di dettaglio. Le registrazioni dei dati sono permanenti; una immagine è fissa nel tempo e nello spazio e conseguentemente è possibile comparare l’evoluzione dei fenomeni confrontando tra loro immagini acquisite in tempi successivi FOTO AEREE L’uso principale delle foto aeree nei GIS può essere diviso in tre principali impieghi: Realizzazione di carte topografiche di dettaglio Fotointerpretazione delle tipologie di dati e informazioni contenute nelle foto. Es, informazioni geologiche, forestali, pedologiche, uso del suolo, etc. Sfondo per mappe di entità geografiche (strade, toponimi, centri urbani, etc), quando le le mappe topografiche a grande e a media scala sono assenti. Le foto aeree possono essere in bianco e nero acquisite tramite pellicole o sensori digitali sensibili a lunghezze d’onda da 0,4 m a 0,7 m, pellicole a colori con strati sensibili a lunghezze d’onda variabili tra 0,4-0,5 m (blue), 0,5-0,6 m (verde), 0,6-0,7 m (rosso), oppure a raggi infra-rossi con pellicole sensibili a lunghezze d’onda oscillanti tra 0,7 m e 1,1 m. Le tipologie di foto in bianco e nero sono le più diffuse. Le foto ad infrarossi possono essere di aiuto per le interpretazioni particolari, come nella forestazione, dato che la vegetazione emette diversi tipi di radiazione nella parte di spettro elettromagnetico degli infrarossi. Le foto aeree sono sempre affette da qualche distorsione in quanto il loro punto di presa non è sempre esattamente verticale ed il terreno ripreso è raramente orizzontale e piatto. Conseguentemente le informazioni provenienti dalle foto aeree devono essere trasferite ad un sistema di riferimento convenzionale prima che possano essere utilizzate nei GIS. Le foto aeree sono acquisite in coppie stereoscopiche: la stessa porzione di suolo è ripresa da due foto contigue aventi diversi punti di acquisizione. Questa tecnica di acquisizione consente di visualizzare i soggetti ripresi in tre dimensioni e di ottenere dati geometrici nelle tre dimensioni X,Y,Z. IMMAGINI SATELLITARI L’uso delle immagini satellitari presenta notevoli vantaggi rispetto alle foto aeree; in genere hanno range spettrali più ampi che vanno molto oltre le lunghezze d’onda rilevabili dalle foto aeree. Gli scanner satellitari hanno anche il vantaggio di avere un angolo di prospettiva molto alto, il che riduce gli errori che influenzano le foto aeree. I sensori satellitari possono essere suddivisi in due grandi gruppi: passivi e attivi. I sensori ottici passivi rilevano la radiazione solare riflessa e la radiazione termica ri-emessa. I sensori ottici attivi, come il RADAR sono dotati di strumenti per l’emissione e la misura dell’energia nella parte di spettro elettromagnetico delle microonde. In questo gruppo rientrano un certo numero di sistemi basati su Laser (LiDAR). In questi sensori il la sorgente laser è trasportata da un vettore aereo (elicottero o aereo) ed il raggio laser emesso è puntato verso la superficie terrestre. La pulsazione del raggio laser in emissione e l’energia riflessa sono misurate in modo da restituire una accurata distanza tra il sensore e l’oggetto misurato. Queste pulsazioni possono essere modulate ed inviate migliaia di volte al secondo, in modo da tracciare la superficie studiata con grande dettaglio. Nella tipologia di sensori passivi, ne esiste un grosso numero ad alta risoluzione; questi sistemi forniscono risoluzione spaziale a terra sotto 1 metro e sono in fase di allestimento sensori 19 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS commerciali con risoluzione di 50 cm. Queste alte risoluzioni rendono fortemente concorrenziale l’uso delle immagini satellitari con le foto aeree. CATASTO La cartografia catastale italiana ha inizio con la legge n. 3682 del 1° marzo 1886 per il riordinamento dell’imposta fondiaria (Legge Messedaglia). Viene usualmente realizzata per giurisdizioni amministrative comunali, suddividendo i territori interessati in sezioni censuarie. Le carte catastali non sono in generali regolari perché sono solo planimetriche e non contengono l’altimetria. Solo recentemente le nuove mappe catastali fotogrammetriche sono state integrate con linee di livello di equidistanza e = 2 m. Inoltre l’oggetto della rappresentazione è la particella catastale, cioèuna ben delimitata porzione continua di terreno, situata in un unico comune, appartenente ad un unico possessore, assoggettata ad un’unica specie di coltura, con uniforme grado di opportunità, oppure, se non soggetta a coltura, riservata ad un’unica destinazione d’uso. La particella catastale deve essere inquadrata nella sua corretta ubicazione, sia rispetto alle particelle circostanti che rispetto ai particolari topografici di natura stabile (Fig. 2-16). Fig.2-16 – Stralcio di cartografia catastale con indicazione del numero di particella Le carte catastali vengono in generale redatte alla scala 1:2000 e prendono il nome di mappe. Sono invece redatti alla scala 1:1000 (allegati) i centri abitati e le relative zone di espansione e le porzioni inferiore a 20 are (1 ara = 100 m2) e alla scala 1:500 le porzioni di territorio nelle quali l’area media delle particelle è inferiore e 3 are. Viceversa per le zone montuose a proprietà poco divisa e per le quali si presuma non possano avvenire cambiamenti rilevanti per quanto riguarda il particellamento si adottano rappresentazioni alla scala 1:4000 (area media delle particelle non inferiore a 5 ettari; 1 ettaro = 10 000 m2). Le mappe catastali sono formate per sezioni e suddivise in fogli di formato standard (70x100 cm2). La porzione di mappa disegnata in ciascun foglio è a perimetro chiuso, in genere coincidente con i limiti di proprietà. Quando è necessario sviluppare a scala maggiore qualche particolare porzione del territorio si fa uno sviluppo disegnandolo se possibile negli spazi liberi del corrispondente foglio; se ciò non è possibile si disegna su fogli separati, che vengono detti allegati. Le varie sezioni della mappa catastale di uno stesso comune sono indicate con le lettere maiuscole, mentre i fogli di mappa sono contraddistinti con numeri. Le mappe usualmente contengono: delimitazioni delle particelle catastali; 20 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS delimitazioni relative alla viabilità, alle acque e ad ogni altro particolare topografico di pubblica proprietà e di specifico interesse; confini amministrativi comunali, provinciali, regionali e statali; i punti trigonometrici; le curve di livello e i punti quotati. Il territorio nazionale è completamente cartografato con circa 310.000 mappe catastali. La rappresentazione adottata per tali mappe fu in origine la Cassini-Soldner. Per coprire tutto il territorio nazionale furono adottate complessivamente 849 origini, 31 con grandi estensione e 818 con piccole estensioni (Fig.2-17). Fig.2-17- Esempio di Foglio di Mappa La rappresentazione è quindi policentrica; ogni centro è di solito un vertice trigonometrico di ordine superiore (I o II ordine); l’estensione massima della zona che si riferisce ad un centro di proiezione è di circa 70 km dall’origine in direzione Est-Ovest e 100 km in direzione Nord-Sud. La rappresentazione di Cassini-Soldner è afilattica; si può osservare però che per xmax = 70 km il modulo di deformazione superficiale non supera il valore 1,00005; inoltre lungo il meridiano centrale è sia equivalente che conforme. Queste considerazioni hanno quindi suggerito di adottare tale rappresentazione per le mappe catastali. La rappresentazione Cassini-Soldner è stata adottata dal Catasto (Legge 3682) per la maggior parte del territorio, in sede di formazione della propria cartografia. La cartografia catastale è stata realizzata in molti casi prima della pubblicazione definitiva (1908-19) dei risultati della triangolazione dell’IGMI. In questi casi sono stati assunti, per i vertici di I, II e III ordine, valori provvisori delle coordinate forniti volta a volta dall'IGMI. Tali valori si sono rivelati spesso diversi (in certi casi sensibilmente) da quelli definitivi. La rete catastale non è quindi del tutto congruente con quella nazionale, cioè angoli e lati della rete non sono esattamente gli stessi, anche prescindendo dal sistema geodetico di riferimento. Molti vertici di IV ordine IGMI fanno parte della rete catastale come vertici di rete, sottorete o dettaglio. Le relative coordinate derivano però da misure eseguite autonomamente dal Catasto, e sono quindi generalmente diverse da quelle calcolate dall’IGMI; in certi casi è diversa anche la materializzazione dei punti. 21 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS A partire dal 1942 iniziò la conversione della cartografia catastale con l’adozione della rappresentazione conforme di Gauss-Boaga sull’ellissoide internazionale. Purtroppo questa operazione non è ancora ultimata e quindi in alcuni casi vi possono essere problemi nell’uso congiunto di carte catastali e regionali (queste ultime, più recenti, sono tutte nel sistema Gauss Boaga). Il catasto ha in atto una vasta digitalizzazione delle mappe e degli allegati (vedi in seguito Banca Dati Cartografia Catastale). (Da Prof.ssa Maria Antonia Brovelli, Facoltà di Ingegneria - Campus Como, http://geomatica.como.polimi.it/corsi/cartografialaurea/introduzione.htm) MAPPE CARTACEE E DIGITALI La produzione sistematica delle cartografie topografiche dei territori nazionali è iniziata alcuni secoli fa. Negli Stati Uniti il United States Geological Survey svolge tale compito dal 1879 ed anche in Italia dopo l’unificazione del regno, si iniziarono i progetti sistematici di cartografia dell’intero territorio. Come è noto le mappe topografiche riferendosi ad una realtà fisica e urbanistica di un determinato periodo costituiscono delle vere e proprie testimonianze sull’evoluzione storica di un territorio, sia dal punto di vista geomorfologico che socio-economico. La disponibilità di cartografie topografiche di grande e media scala (1:25.000-1:50.000), ha portato alla realizzazione anche di carte tematiche delle risorse naturali e tra queste la cartografia geologica è senz’altro una delle più importanti. Nel corso del tempo, con l’evoluzione delle conoscenze e delle diverse esigenze le cartografie di tipo tematico, basate sempre sulla cartografia topografica di grande scala, sono aumentate e quindi oggi disponiamo di molti dati tematici agricoluturali, forestali, pedologici, geomorfologici, etc, che sono georeferenziati su queste mappe cartacee. Su queste mappe “antiche” è possibile ancora oggi trarre dati ed informazioni territoriali che spesso non sono reperibili in altri documenti più recenti. In Italia la produzione cartografica“su supporto cartaceo” è andata avanti fino alla fine degli anni “70 e quindi essendo molti i dati disponibili su questi documenti, è frequente il loro utilizzo. Ad esempio le carte topografiche, corografiche e geografiche dell'IGMI che coprono l’intero territorio nazionale sono oggi disponibili solo in formato cartaceo (o relative scansioni). Infatti la Carta Topografica d'Italia serie 25/V si compone di 3545 elementi alla scala 1:25 000, denominati "tavolette", che hanno le dimensioni di 7'30" in longitudine e 5' in latitudine. Abbraccia una zona di terreno pari a circa 100 kmq. È inquadrata nella rappresentazione conforme di Gauss-Boaga, nel sistema geodetico nazionale con reticolato chilometrico UTM riferito al sistema geodetico europeo (ED50). La carta è tutta pubblicata. Al contrario la più recente versione di questa cartografia la “Carta topografica d'Italia serie 25” si compone di 2298 elementi alla scala 1:25 000, denominati "sezioni", che hanno le dimensioni di 10' in longitudine e 6' in latitudine. Le sezioni, elaborate con rilievo aerofotogrammetrico numerico o analogico e successivamente disegnate con metodologie automatiche o manuali, sono inquadrate nella rappresentazione conforme UTM; il sistema di riferimento geodetico è basato sull'ellissoide internazionale con orientamento medio europeo (ED50). Questa serie cartografica, disponibile sia informato cartaceo che numerico è tutt’ora in corso di allestimento. Dalla fine degli anni “80 si è assistito alla progressiva sostituzione delle mappe cartacee con quelle digitali; questa transizione è avvenuta prima come pura conversione da “carta a raster” mediante acquisizione tramite scanner e successivamente come vettoralizzazione e digitalizzazione con le modalità di base descritte in precedenza a proposito del data input. Oggi si dispone di una discreta quantità di dati tematici organizzati in banche dati vettoriali, con modelli dati non sempre 22 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS propriamente definiti, ma che hanno l’indubbio vantaggio della facile reperibilità presso i vari enti che si occupano di risorse territoriali. Nel caso della cartografia topografica le modalità di realizzazione si sono molto evolute per cui nell’ultimo decennio i dati topografici a grande scala (1:10000, 1:5000, 1:2000), vengono restituiti direttamente con metodi numerici e distribuiti agli utenti in struttura e formati di file di tipo CAD. La tendenza attuale è il passaggio ulteriore dalla cartografia prettamente numerica alla realizzazione di data base topografici. DATI SOCIO-ECONOMICI I dati socio economici sono fondamentali nelle fasi di analisi eseguite tramite GIS o “in ambiente GIS”. Fanno parte di una categoria di dati che nel contesto delle banche dati spaziali prende il nome di “dati ancillari”. Questa definizione potrebbe far pensare ad un contributo marginale che queste informazioni portano al data set, ma invece è da attribuire essenzialmente al fatto che tali dati non dispongono di feature geografiche proprie ma sono essenzialmente delle semplici tabelle. La possibilità di collegare (più specificatamente, georiferire), tali dati alle feature spaziali che rappresentano il territorio rende molto efficiente la loro utilizzazione e molto interessanti i risultati delle analisi. Ad esempio tutti i dati di censo e di densità di popolazione sono molto utili per le analisi di geo-markenting, per l’organizzazione dei trasporti pubblici e di innumerevoli tipologie di servizi (reti tecnologiche, energia, gestione rifiuti, telecomunicazioni, etc). In Italia il maggior produttore di dati socio economici è l’ISTAT (http://www.istat.it/dati/db_siti/), ma anche la PA periferica dispone di servizi statistici efficienti che producono e distribuiscono dati socio-economici. 2.1.3.3 Conoscere il concetto di dati territoriali I dati territoriali hanno la principale caratteristica di trattare entità georeferenziate. I dati territoriali, così come definiti dalla direttiva INSPIRE (vedi sotto, sono tutti quei dati che “attengono, direttamente o indirettamente, a una località o un’area geografica specifica”. Il Joint Research Center (Centro di Ricerca Europeo) ha calcolato che il 90% dei dati ambientali è un dato territoriale,nmentre secondo uno studio della Commissione Europea, l’informazione geografica costituisce il 52% del valore dell’intero parco dell’informazione del settore pubblico. I dati territoriali, di cui è ormai accertato il significativo valore economico, sono uno strumento di conoscenza fondamentale per: descrivere accuratamente lo stato di fatto e valutare le necessità (posizione e sfruttamento delle risorse naturali;posizione e distribuzione di persone, affari, beni, nuovi sviluppi, servizi ed altre infrastrutture; visualizzazione e analisi delle reti); formulare le politiche di intervento (analisi dei cambiamenti ambientali, coordinazione delle risposte alle emergenze, disastri naturali e causati dall’uomo, supporto nella progettazione); monitorare l’implementazione e lo sviluppo delle politiche e degli interventi (registrazione e disseminazione delle informazioni). Secondo INSPIRE, al fine di poterne comprendere e modellare le relazioni, i dati geografici possono essere riuniti in gruppi tematici (Fig.2-18) INSPIRE è una Direttiva (2007/2/EC del 14 marzo 2007) del Parlamento europeo e del Consiglio con l'obiettivo di essere un supporto alla stesura di politiche che possono avere un impatto diretto o indiretto sull'ambiente. INSPIRE si basa sulla interoperabilità delle infrastrutture di dati spaziali creati dagli stati membri. Questa direttiva europea è entrata in vigore il 15 maggio 2007. L'intenzione è di creare un quadro giuridico per la realizzazione e l’attivazione di un'infrastruttura per l’informazione territoriale in Europa, al fine di formulare, attuare, monitorare e valutare le politiche comunitarie a vari livelli e di fornire informazioni ai cittadini. Tra gli obiettivi principali della direttiva 23 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS INSPIRE figura la possibilità di rendere disponibile una quantità di dati maggiore e di qualità più elevata ai fini dell'elaborazione delle politiche comunitarie e della loro attuazione negli Stati membri a qualsiasi livello. La direttiva è incentrata in particolare sulla politica ambientale, ma in futuro ci si aspetta che possa essere estesa ad altri settori come l’agricoltura, i trasporti e l’energia. Con il termine Infrastruttura di Dati Territoriali (IDT) (Spatial Data Infrastructure nel linguaggio utilizzato internazionalmente) indica l'insieme di tecnologie, metodi, politiche ed accordi istituzionali tesi a facilitare la disponibilità, l'omogeneità e l'accesso a dati geospaziali; la parola infrastruttura viene utilizzata per veicolare il concetto di un ambiente di supporto affidabile, in analogia alle reti stradali o di telecomunicazioni, per la circolazione dei dati stessi. L’organizzazione delle Infrastrutture di dati territoriali fa riferimento alla direttiva INSPIRE (acronimo per Infrastructure for Spatial Information in Europe - Infrastruttura per l'Informazione Territoriale in Europa), un progetto della Commissione Europea con l'obiettivo di realizzare infrastrutture di dati territoriali nella Comunità europea. (da Wikipedia, 2009) Fig. 2-18- Elenco dei raggruppamenti tematici dei dati spaziali secondo INSPIRE. L’ampia gamma di argomenti coperta dei temi esprime la generale richiesta di soddisfare tutte le azioni volte allo sviluppo sostenibile ed i requisiti funzionali allo sviluppo dell’amministrazione digitale (egovernment). Ulteriori informazioni su INSPIRE sono ottenibili su: http://inspire.jrc.ec.europa.eu/reports/ImplementingRules/DataSpecifications/D2.3_Definition _of_Annex_Themes_and_scope_v3.0.pdf 24 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS 2.1.3.4 Sapere identificare le varie tipologie di attributi (quali nominali, ordinali, intervallo, rapporto o ratio). Gli attributi degli oggetti spaziali da immagazzinare in un database sono classificabili in tre gruppi: spaziali temporali tematici La maggior parte degli attributi può essere caratterizzata da attributi di tutti i tipi sebbene, in pratica, gli attributi spaziali e temporali siano qualche volta poco importanti o addirittura trascurabili perché hanno un valore costante per tutte i record del database. Per la maggior parte degli scopi GIS, gli attributi temporali e tematici sono considerati come non-spaziali. I valori degli attributi possono essere basati su osservazioni primarie o misure o derivare da elaborazioni, selezioni o calcolo. Attributi spaziali Gli attributi spaziali registrano la localizzazione la geometria e la topologia degli oggetti spaziali. La localizzazione spaziale degli oggetti è registrata in coordinate geografiche (lat.-long.), in uno dei sistemi cartografici standard o in coordinate rettilinee con una origine locale. Una delle prerogative dei GIS è la capacità di trasformare i dati spaziali da un sistema di coordinate a un altro, in modo che carte con diversi sistemi di proiezione possano essere confrontate. In generale la posizione dati geotematici non è descritta mediante metrodi convenzionali (es. codice postale, gli indirizzi di uno stradario), ma sono ubicati rispetto ai sistemi cartografici di riferimento (Carta Catastale, Carta Comunale, Carta Tecnica Regionale, Carte Topografiche e Geografiche IGMI). Molti dati geoscientifici specialmente di tipo geologico, non sono pensati e descritti dagli operatori nella loro posizione spaziale nel sistema di riferimento cartografico, bensì sono ubicati rispetto alle relazioni spaziali (spesso topologiche) con entità geografiche limitrofe. Per esempio una occorrenza mineraria può essere descritta come affiorante “lungo il torrente…” oppure “lungo il contatto tra…”. Attributi non-spaziali Gli attributi temporali e tematici degli oggetti spaziali sono generalmente trattati nello stesso modo nei sistemi informativi geografici. Gli attributi temporali si riferiscono spesso all’età degli oggetti (es. età delle formazioni) o ai tempi di misurazione. Gli attributi tematici si riferiscono a tutti gli altri tipi di proprietà degli oggetti che non sono né geografiche, né temporali Le tavole (o tabelle) degli attributi Gli attributi degli oggetti spaziali sono in genere organizzati in tabelle. Qualunque sia l’organizzazione interna delle tabelle interna a un computer, esse possono essere pensate come dei file “piatti” costituiti da un arrangiamento bidimensionale di un certo numero di record o file, che rappresentano i valori delle entità o oggetti spaziali e un certo numero di colonne che rappresentano gli attributi delle entità. Ogni sistema che contiene una grossa varietà e quantità di dati, inclusi i GIS, richiede l’organizzazione e la gestione dei dati mediante le funzionalità proprie dei database management system; per questo, prima di vedere le capacità di analisi dei GIS, è indispensabile definire alcune proprietà e definizioni dei DBMS che costituiscono una parte importante del “motore” dei GIS. Le tabelle delle feature geografiche (FEATURE ATTRIBUTE TABLE) Il sw ARC/INFO, analogamente a altri sistemi, immagazzina le informazioni descrittive nelle tabelle di un data base (INFO). Ogni tabella è costituita da campi (item) e ogni record immagazzina i dati di ogni occorrenza della feature (in questo caso punti, linee, poligoni).Queste tabelle o file di basi di dati sono genericamente noti come feature attribute table. 25 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Come già descritto le capacità di un GIS consistono nel legare i dati spaziali (grafici) con i dati descrittivi (tabulari). In questo tipo di legame ci sono almeno tre importanti caratteristiche da ricordare. Esiste una relazione uno a uno (one to one) tra le feature geografiche sulla carta e i record nelle FAT. La connessione tra le feature geografiche e i loro contenuti descrittivi è mantenuta mediante un unico identificatore numerico che è assegnato a ogni feature (ad es. Per i poligoni l’ identificatore è assegnato dalla label point). L’identificatore unico è fisicamente immagazzinato in due posti: nel file che contiene le coordinate x,y e nel corrispondente record nella FAT. Il sw Arc/Info e Arc View costruiscono e mantengono automaticamente queste connessioni. Gli attributi sono principalmente utilizzati per registrare le caratteristiche non-spaziali di una entità (come vedremo essi sono spesso denominati ITEM, CAMPI, FIELD, VARIABILI, etc). Gli attributi di diverso tipo possono essere raggruppati per descrivere le proprietà non spaziali di ogni oggetto nei database. Questi attributi possono assumere forme e data type diverse (anche in funzione dell’evoluzione delle conoscenze e tecnologica), ma tutti questi attributi possono essere classificati come: NOMINALI ORDINALI INTERVALLO O RAPPORTO ATTRIBUTI NOMINALI Essi ospitano variabili (dati) che forniscono informazioni descrittive sugli oggetti, ad esempio il colore di una entità o di una occorrenza. Altri esempi di attributi nominali sono il tipo di vegetazione, i nomi delle città, i possessori di particelle, etc. NON SONO IMPLICITE IN QUESTO TIPO DI ATTRIBUTI RIFERIMENTI QUANTITATIVI (es. dimensione, taglia, ordine etc). Attributi nominali possono essere immagini, clip, audio, etc. ATTRIBUTI ORDINALI Questi attributi ospitano variabili (dati) che implicano una classificazione (ranking) o un ordine dei loro valori. Un attributo di questo genere può essere descrittivo, come alto, medio basso. Possono essere anche attributi numerici; valori di resistenza al taglio, meccanica, permeabilità. L’ordine descrive solo la posizione o il rango, ma non specifica la forma né la scala. ATTRIBUTI INTERVALLO O RAPPORTO Sono attributi utilizzati per valori numerici dove sia il grado che le differenze assolute di dimensioni tra gli oggetti, sono espresse tramite numeri. I valori di questi attributi sono spesso registrati come numeri reali . Area della superficie, lunghezza, peso, altezza, valore e profondità sono alcuni esempi di attributi di questo genere 2.1.3.5 Conoscere i principali tipi di formato di dati geografici (quali coverage, geodatabase, shapefile, grid, dxf, dwg, geotiff, GML). I principali tipi di dati geografici sono già stati elencati in Fig. 2-14, nel contesto dei tipi di file che i diversi vendor di software hanno prodotto. Più in dettaglio di seguito si descrivono di seguito alcuni specifici formati di dati che sono utilizzati dai principali pacchetti di softaware GIS, tra cui ArcGis; Fig. 2-19 sono riportati tali formati nella visualizzazione per icone adottata da quest’ultimo software. 26 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-19-Principali formati di dati geografici utilizzabili nel sistema ArcGis™. COVERAGE Una coverage (in italiano “copertura”) è formato di file geografici vettoriali basato sul modello georelazionale (una applicazione in campo spaziale o geografico del più generale Modello Relazionale generalmente utilizzato nelle basi di dati): tale formato permette di memorizzare sia la componente spaziale (localizzazione), sia gli attributi descrittivi, delle entità geografiche. Le coperture, come molti altri tipi di dati geografici vettoriali, utilizzano un insieme di classi di feature per rappresentare al meglio le entità spaziali. Ognuna di queste classi di feature registra un insieme di punti, linee e poligoni e annotazioni. Le coperture possono registrare relazioni topologiche tra le entità geografiche memorizzate. Una copertura viene registrata come una directory, all’interno del quale ogni classe di feature viene registrata come un insieme di file. Per esempio una copertura apparirà nell’interfaccia di visualizzazione del modulo ArcCatalog, con l’icona in giallo di Fig. 2-20. In questo esempio, si nota che una copertura relativa a linee di drenaggio contiene un insieme di entità lineari (line), delle annotazioni per tali linee ed un file di tic (punti) che definiscono i quattro vertici delimitanti l’estensione spaziale della copertura. In pratica è spesso necessaria che una coverage registri più di una feature class per definire le feature di intersse. Per esempio in una copertura poligonale vengono registrate sia le linee che delimitano 27 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS l’area poligonale sia le geometrie poligonali. Inoltre i poligoni hanno anche la necessità di disporre delle entità puntuali label, che registrano gli attributi informativi del poligono. Ogni Fig. 2-20- Struttura delle coperture copertura ha una classe di feature, denominata Tic, che definisce le estensioni spaziali dell’area interessata dalla copertura, in un sistema di riferimento convenzionale. Questi Tic NON rappresentano delle feature puntuali effettive della copertura In Fig. 2-21 vengono illustrate le classi di feature comuni in una copertura. Fig. 2-21 – Insieme di feature che partecipano alla definizione GEODATABASE Il Geodatabase è un archivio informatico di diversi tipi di dati geografici. In ArcGis™ il geodatabase è un insieme di dati di vario tipo registrati in un unico repository (un Microsoft Access database, oppure un database relazionale multiutente (come Oracle™, Microsoft SQL Server, PostgreSQL, Informix, or IBM DB2). I dataset fondamentali nel geodatabase Un concetto chiave del geodatabase è il dataset. Il dataset è il meccanismo primario utilizzato per organizzare e utilizzare le informazioni geografiche; il geodatabase contiene tre principali tipi di dataset: Le classi di feature 28 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS I dataset raster Le tabelle La creazione di una raccolta di questi tipi di dataset è il primo passo per la progettazione e la costruzione di un geodatabase. Gli utilizzatori in genere iniziano costruendo un certo numero di questi dataset e successivamente aumentano le capacità del geodatabase inserendo funzionalità avanzate (come l’aggiunta di relazioni topologiche, reti e sottotipi). Queste funzionalità avanzate permettono di modellare le caratteristiche di base del Sistema Informativo Geografico, di mantenere l’integrità dei dati e lavorare rispettando un consistente insieme di relazioni spaziali. La registrazione nel Geodatabase di tabelle e file L’immagazzinamento nel geodatabase include la registrazione sia dello schema che delle regole geometriche di base per ogni dato geografico registrato; inoltre vengono registrati i dati tabellari ed i dati raster. Si noti che per tutte e tre le tipologie di dati (classi di feature (geometrie), tabelle degli attributi e dati raster), così come per tutte le altre tipologie di dati, tutte le registrazioni avvengono tramite tabelle. La rappresentazione spaziale delle feature geografiche avviene sia per elementi vettoriali che raster; queste geometrie sono immagazzinate e gestite in tradizionali tabelle degli attributi. Ogni classe di feature viene registrata come una tabella ed ogni fila rappresenta una occorrenza di feature (un punto, una linea, un poligono). Nella Fig. 2-22, è rappresentata una tabella degli attributi di una feature poligonale. Ogni fila della tabella rappresenta una occorrenza (un poligono); il valore del campo ‘SHAPE’ uguale a Polygon, è utilizzato dal sistema per identificare nel campo i valori di coordinate e la forma elementare (primitiva) della geometria. Fig. 2-22- Tabella di una feature class poligonale Uno degli elementi fondamentali dell’organizzazione dei dati geografici tramite geodatabase, è le scalabilità del sistema: si passa da una versione del database utilizzabile solo da un utente (definita Personal Geodatabase), ad una versione condivisa da più utenti che possono contemporaneamente lavorare sulle geometrie e sugli attributi. Questi Relational Database Management System che permettono di ampliare notevolmente le capacità di memoria e gli accessi condivisi sono: Oracle (using the ArcSDE SQL type or the Oracle Spatial SQL type, if you use Oracle Spatial) IBM DB2 IBM Informix 29 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Microsoft SQL Server Informix PostGreSQL (using the ArcSDE SQL Type or the PostGIS SQL type, if you wish to use PostGIS) SHAPEFILE Lo shapefile è un formato di dati geografici vettoriali, creato e diffuso dalla ESRI per la diffusione e scambio speditivo di informazioni geografiche georeferenziate e non topologiche. Lo shapefile, di cui sono state rese pubbliche le specifiche, utilizza più file per la definizione dei dati. Il numero minimo di file utile alla definizione di uno shapefile è 3; tra questi i file di tipo *.shp definiscono il formato dello shape geometrico (primitiva geometrica, i.e. punto, linea, poligono); i file di tipo *.shx recano i dati relativi a un indice spaziale degli shape cioè (come è nello scopo delle indicazioni dei dbms) definiscono un indice che permette rapidamente la ricerca delle occorrenze; i file di tipo *.dbf sono i filesystem che consentono l’immagazzinamento delle informazioni relative alle tabelle degli attributi. Lo shapefile può includere poi, come opzione, altri 8 tipi di file che hanno le seguenti caratteristiche: il file *.prj – definisce la proiezione/sistema di riferimento dei dati; i file *.sbn e *.shx, che definiscono ulteriori indici spaziali delle feature; i file *.fbn e *.fbx, che definiscono degli indici spaziali delle feature in forma di sola-lettura; i file *.ain e *.aih, che definiscono gli indici relativi ai campi attivi nelle tabelle o nelle tabelle degli attributi; * il file *.mxs che definisce un indice di geocodifica (geocoding) in modalità lettura-scrittura ( formato ODB); il file *.atx che definisce un indice per il filesystem *.dbf nella forma shapefile.columname; il file *.cpg definisce il codepage funzionale alla codifica dei caratteri da utilizzare. GRID, Il GRID (Georeferenced Raster Image Data), è un formato di registrazione di dati raster creato da ESRI. Ci sono due tipi di formato Grid: interi e floating, in cui i valori dei pixel sono rispettivamente valori interi o valori decimali. I Grid caratterizzati da valori interi sono adatti er la rappresentazione di entità discrete (esempio: una categoria di dati come l’uso del suolo, la geologia etc.), mentre i Grid costituiti da valori decimali sono adati per rappresentare entità continue (esempio, forze di campo quali Gravità, Campo magnetico etc). Gli attributi per i valori interi sono registrati in una Tabella dei Valori (VAT: Value Attribute Table). Una VAT ha un record per ogni valore unico nel Grid; il record della tabella si riferisce ad una particolare classe o gruppo di celle che hanno tutte lo stesso valore. L’attributo VALUE riporta il valore per le celle in questione e l’attributo COUNT il numero delle celle (es. se in un Grid 50 celle hanno valore 1, che si riferisce alla categoria “Foresta”, allora la VAT riporterebbe VALUE=1 e COUNT = 50, per ognuna delle 50 celle.) I Grid con valori decimali (Floating Point), non hanno una VAT perché le celle nel GRID possono assumere ogni valore all’interno di un determinato range. Le celle in questo tipo di Grid non ricadono esattamente in categorie discrete. Il valore della cella è relativo alla sua posizione: ad esempio, in un Grid che rappresenta l’elevazione il valore 10,1662 indica che la località è ca 10 metri sopra il livello del mare. Gli intervalli che possono essere registrati come valori di Grid sono: Floating-point grids possono registrare valori tra -3.438 e 3.438. Integer grids possono registrare valori tra -2147483648 e 2147483647 (-231 to 231-1). Per i Grid interi, tali intervalli si applicano soltanto all’attributo ITEM. Un Grid intero può avere altri attributi informativi (INFO), che sono aggiunti alle VAT; in questi attributi il valore dipende dalla definizione dell’attributo. 30 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Il sistema di coordinate di un Grid, è lo stesso degli altri dati geografici di tipo raster. Le file e le colonne sono parallele all’asse X e Y del Sistema di Riferimento rispettivamente. Poiché ogni cella del Grid ha la stessa dimensione, la localizzazione e l’area coperta da ogni cella è facilmente determinabile dal numero delle file e delle colonne e dalle coordinate X,Y dell’angolo in alto a sinistra del Grid (Fig.2-23). Il Grid può anche portare delle informazioni addizionali come il sistema di coordinate associato. Fig.2-23 DXF Il DXF è un file in formato ASCII che descrive il contenuto dei file CAD in modo che essi siano interpretabili e leggibili dai tutti i sistemi software. AutoCAD DXF (Drawing Interchange Format, o Drawing Exchange Format) è un formato per i file di tipo CAD, sviluppato da Autodesk come soluzione per scambiare dati tra il programma AutoCAD e altri programmi. Il DXF fu introdotto originariamente nel dicembre 1982 insieme ad AutoCAD 1.0, e consentiva una rappresentazione esatta dei dati del formato originale di AutoCAD, DWG, per il quale Autodesk non ha mai rilasciato le specifiche. Oggi Autodesk pubblica le specifiche del formato DXF sul suo sito per le versioni dalla versione di AutoCAD 13 (novembre 1994) ad AutoCAD 2008 (marzo 2007). Le versioni di AutoCAD dalla Release 10 (ottobre 1988) e successive supportano sia la versione ASCII che quella binaria del formato DXF. Le versioni iniziali supportavano solo il formato ASCII. Mentre AutoCAD diventava più potente, supportando oggetti sempre più complessi, il DXF diventava meno utile. Certi tipi di oggetti, come i solidi ACIS e le regioni, non sono documentate. Altri tipi di oggetti, come i blocchi dinamici di AutoCAD 2006, e tutti gli oggetti per le versioni di fascia alta di AutoCAD, sono parzialmente documentate, ma non ad un livello sufficiente per consentire ad altri sviluppatori di utilizzarle. La maggior parte degli sviluppatori di software commerciale, come i concorrenti della Autodesk, scelsero di supportare il DWG come il loro formato principale come scambio di dati con AutoCAD, usando le librerie della Open Design Alliance - un consorzio no-profit che si è occupata del reverse engineering del formato DWG. Struttura del file La versione ASCII del formato DXF può essere visualizzata con un editor di testi. La struttura di base è la seguente: HEADER - Informazioni generali riguardati il disegno. Ogni parametro è una variabile con un nome e un valore associato. CLASSES- Contiene le informazioni per le classi definite TABLES ENTITIES 31 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS OBJECTS THUMBNAILIMAGE - contiene un'anteprima dell'immagine del file END OF FILE DWG Il DWG è formato di file originale di AutoCAD™, per il quale Autodesk™ non ha mai rilasciato le specifiche. TIFF e GEOTIFF I file “Tagged Image File Format” (TIFF), sono il formato di dati raster più versatile. Questi formati possono memorizzare a differenti quantità di bit pixel (profondità di bit) e possono essere compressi con diverse tecniche di compressione che variano in funzione delle dimensione del file e della accuratezza richiesta. Molti software GIS (tra cui ArcMap) sono in grado di creare file di questo tipo, denominati GEOTIFF che supportano al loro interno le informazioni di Georeferenziazione (dimensione in metri del pixel e sistema di riferimento). GML L’ “Open Geospatial Consortium” (OGC) ha definito le specifiche del “Geography Markup Language Encoding Specification (GML)”, che rappresenta un protocollo standard per la codifica delle geometrie e degli attribute utilizzando il linguaggio XML. Un importante concetto da comprendere è che il GML non è un formato singolo, ma piuttosto un meccanismo adatto alla definizione di quasi ogni formato geospaziale. Questa capacità del GML, supporta in pratica tutte le necessità di chi deve pubblicare i propri modelli di informazioni spaziali senza dipendere troppo dalla natura e dalle caratteristiche di tali modelli. Il GML fu progettato per coprire molte esigenze; per esempio le specifiche del GML3, descrivono quasi 1000 tipologie di oggetti spaziali ed un vasto numero di tipi geometrici funzionali alla descrizione delle feature. Ogni codifica GML seguirà fedelmente un suo profilo che si può ritenere quasi uno specifico formato; come ogni altro formato di dati, ogni profilo GML richiederà un proprio traduttore per la decodifica e l’utilizzo in altri sistemi. 2.1.4 La scala nei GIS (SIT) 2.1.4.1 Conoscere il concetto di scala nei GIS (SIT). Le mappe cartacee sono state per lungo tempo un potente mezzo per la comunicazione dell’informazione geografica. Tali mappe si possono considerare come una rappresentazione analogica, o un modello fisico nel quale il mondo reale è rappresentato in scala. Infatti, nel caso di un una mappa cartacea, una parte del mondo reale viene scalata (ridotta) fino ad adattarsi alla forma del 32 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS formato di stampa. Una proprietà fondamentale delle mappe cartacee è la loro scala nominale o frazione rappresentativa, che rappresenta il rapporti tra la una distanza misurata tra due oggetti presenti sulla mappa e la stessa distanza misurata tra i due oggetti nel mondo reale (es. 1:25.000). Questo concetto risulta un po’ ingannevole in quanto la misura sulla mappa è una misura sul piano, mentre la misura nella realtà è una misura su una superficie non piana, per cui il rapporto di scala non può essere costante. Le mappe cartacee sono state importanti, particolarmente prima dell’avvento delle tecnologie digitali, tanto che molti concetti ed idee che sono associate ai GIS sono ereditate direttamente dalle mappe cartacee.. Ad esempio la scala è spesso citata come una caratteristica del database digitale, sebbene la stessa definizione di scala è un non sense se applicata ai dati digitali. Infatti non ha propriamente senso misurare una distanza in un computer e rapportarla ad una distanza reale. In genere quando si considera una scala per un db digitale, ci si riferisce alla scala della mappa originale che costituisce la sorgente dei dati. Sfortunatamente il termine scala ha acquisito troppi significati nel corso del tempo e la conseguenza è stata una certa confusione. Scala come dettaglio: molti cartografi ed utilizzatori utilizzano il termine scala per indicare la risoluzione spaziale o il livello di dettaglio spaziale dei dati riportati in carta. Le scale sono dettagliate se loro includono informazioni sugli oggetti molto piccoli, mente sono scale grossolane se si limitano a fornire informazioni per oggetti di grandi dimensioni. Scala come estensione: spesso il termine si riferisce all’estensione geografica coperta dalla mappa o dal progetto. In questo senso talvolta il termine indica diversi aspetti del progetto come il budget investito o la quantità di personale coinvolto Scala come rapporto matematico. Come sopra definito la scala (nominale) è normalmente riferita ad un rapporto numerico tra distanze: al numeratore la distanza cartografica e al numeratore la corrispondente distanza reale. Questo ha frequentemente indotto alla confusione tra piccola scala e grande scala. In effetti con piccola scala, dato il senso del rapporto che è tanto più piccolo quanto più inferiore ad 1, si devono intendere le cartografie con elevata superficie di territorio rappresentata per una data superficie di mappa cartacea, mentre con cartografie di grande scala si devono intendere le cartografie di dettaglio, dove l’effettivo rapporto di scala è prossimo a 1. Inoltre come scala si intende talvolta una sorta di resa tra il livello di risoluzione spaziale ed il livello di dettaglio degli attributi, che può essere immagazzinato in una applicazione. 2.1.5 La georeferenziazione 2.1.5.1 Conoscere il concetto di georeferenziazione La localizzazione di dati è uno dei principali benefici relativi all’impiego di dati geografici; le mappe hanno la capacità di tenere legate tra loro i diversi tipi di informazione in quanto si riferiscono alle stesse zone e permettono di misurare distanze e aree. Senza una localizzazione i dati sono definiti non-spaziali e hanno scarso valore all’interno dei sistemi informativi geografici. Correntemente 33 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS vengono utilizzati diversi termini per descrivere l’attività di assegnazione di una localizzazione agli elementi di una mappa. Si utilizzano verbi quali GEOREFERENZIARE, GEOLOCALIZZARE, GEOCODIFICARE. Il più diffuso ed utilizzato di questi termini è Georeferenziare, che si riferisce all’insieme delle tecniche e procedure che permettono di determinare la posizione di una entità cartografica all’interno di un sistema di riferimento. A questo fine possiamo ipotizzare un’attività di georeferenziazione diretta che consiste nella misura effettiva della posizione delle entità cartografiche all’interno di un sistema di riferimento, quale ad esempio il rilevamento della posizione di entità della superficie terrestre attraverso il Global Positioning System o le Stazioni Totali integrante con GPS, oppure una georeferenziazione indiretta. Quest’ultima è una procedura che consente di definire la posizione (coordinate) dei dati presenti all’interno di una mappa sulla base della definizione di una relazione tra alcuni punti della mappa e le loro posizioni in un sistema di riferimento 2.1.5.2 Conoscere le modalità di georeferenziazione dei dati raster. La georeferenziazione è il processo che stabilisce una relazione fra un sistema di coordinate di una immagine (file e colonne), definibile come spazio dell’immagine, e il sistema di coordinate di una carta (X,Y; Fig. 2-24), definibile come spazio della carta. Un simile processo di trasformazione avviene anche quando si stabiliscono le relazioni tra uno strato informativo vettoriale definito in un qualsiasi sistema di coordinate (es. coordinate macchina), e un altro sistema di coordinate. Fig.2-24 - Schematizzazione di una struttura di immagine raster CONVERSIONE DI COORDINATE Un tipico input di dati cartografici per un progetto da gestire mediante GIS potrebbe consistere in: Una carta geologica (in una proiezione cilindrica conforme) in forma digitale, che si presenta come una tabella o un file ASCII delle coordinate X e Y dei vertici delle entità poligonali e dei punti di controllo Una tabella di dati geochimici con coordinate spaziali X e Y in UTM. Un’ immagine da satellite in forma raster 34 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Il primo problema che si pone nell’utilizzare questi dati è la conversione del loro sistema di coordinate in quello in uso alla banca dati da costruire: questa operazione consiste nella conversione di coordinate. Un tipico progetto GIS inizia con la scelta dell’estensione geografica dell’area da studiare, del sistema di coordinate e della proiezione cartografica; ad esempio l’UTM fuso 32. Le fasi richieste per la conversione delle coordinate per un insieme di dati raster sono le seguenti: 1. Inserire nel campo cartografico un certo numero di punti di controllo (ground control point o tic) da utilizzare come punti di riferimento a coordinate note. I punti sono desunti dalla carta originale o da controlli a terra. 2. Assegnare ai punti di controllo, in coordinate “macchina” o “utente”, le coordinate reali, talvolta definite “coordinate mondo”. 3. controllare lo scarto quadratico medio tra i punti di controllo e trasformare il modello raster (immagine) dalle coordinate “macchina” alle coordinate locali. 4. Proiettare il modello raster nel sistema di proiezione prescelto, mediante la scelta del Datum e della proiezione. Nel caso si debba trasformare le coordinate e proiettare una immagine raster si deve “ricampionare” l’immagine in un nuove set di dati raster , dove le coodinate dei pixel sono spaziate secondo il sistema di coordinate e la proiezione prescelta. In questo caso l’immagine raster viene adattata (“warping”) o deformata come un foglio di gomma (“rubber-sheeting”) in base a punti controllo introdotti arbitrariamente o in base a controlli di campagna. La conversione dei dati vector La Fig. 2-25 illustra in forma di digramma di flusso (“flow chart”) tutte le fasi di conversione delle coordinate. La fonte dei dati in A esprime i dati in coordinate “macchina” (es. Millimetri o pollici), da portare in coordinate cartesiane (es. UTM). Le fonti dei dati B e C esprimono i dati in coordinate cartesiane e geografiche rispettivamente da trasformare in altri sistemi. In generale lo scopo è di portare tutte le fonti nel sistema di coordinate in uso al progetto. Quando i dati provengono da una fonte di tipo A, ovvero da coordinate macchina da trasformare in coordinate piane in un sistema di proiezione noto, si utilizzano una serie di punti di controlli inseriti nei dati vettoriali come simboli (es. croci ) detti “tic”. Di questi punti di controllo devono essere note le coordinate reali nel sistema cartografico originale. La prima fase di operazioni consiste nel convertire le coordinate “macchina” nel sistema di coordinate reali originali (es. UTM o GaussBoaga), mediante una funziona polinomiale empirica di trasformazione. Nei punti di controllo sono noti sia le coordinate “macchina” (u,v) sia le coordinate reali (x, y). La trasformazione tiene conto dei cambiamenti di scala, della traslazione dell’origine e della rotazione tra i due insiemi di coordinate (macchina VS mondo). Questo tipo di trasformazione cui sono soggetti i dati, ha la forma di una funzione polinomiale del primo ordine ed è nota come trasformazione affine. Le equazioni della trasformazione affine per convertire le coordinate da “macchina” a “reali” sono le seguenti: X=a+bu+cv Y= d+eu+fv Dove i coefficienti a,b,c,d,e sono determinati da almeno 3 punti di controllo e le coordinate X,Y sono i riferimenti cartesiani da trovare (“easting” e “northing” del nuovo sistema di riferimento). Con 3 punti di controllo, con una coppia di valori per ogni punto, si possono determinare i 6 coefficienti necessari alla risoluzione dell’equazione. In questo caso le coordinate X e Y sono 35 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS determinate univocamente, senza poter effettuare un controllo sulla loro precisione. Se si utilizzano più di 3 punti di controllo, l’errore posizionale può essere tenuto sotto controllo: le coordinate dei punti sono calcolate con il criterio dei minimi quadrati, e le coordinate risultanti hanno un errore residuale. L’errore residuale di ogni punto viene generalmente definito come la distanza pitagorica tra la posizione osservata e la posizione calcolata, ed è definito dalla relazione: residual = ((X – X obs)2 + (y – Y obs)2 )1/2 La lista di valori residui calcolati con la precedente relazione, mostra la qualità della localizzazione dei punti. Una volta che i punti inseriti soddisfano le condizioni di precisione richieste, eventualmente localizzando di nuovo qualche punto, la trasformazione affine é utilizzata per convertire tutte le coordinate esistenti nelle nuove coordinate X, Y. In una situazione dove il sistema cartografico di partenza non è noto (es. dati vettoriali provenienti dalla digitazione di una foto aerea, o dati cartografici provenienti da disegni CAD) è indispensabile inserire molti punti di controllo “a terra” (“ground control point”) dove è possibile determinare con certezza la posizione geografica, e trasporre ai dati con una equazione polinomiale di ordine maggiore del primo. Una funzione di “correzione” di grado superiore, non tiene conto soltanto delle funzioni di scala, rotazione e traslazione fra il sistema dei piani cartesiani, ma prende in considerazione anche un adattamento (warping) ai dati di controllo. Una funzione polinomiale sia quadratica (6 coefficienti per ogni equazione), o cubica (10 coefficienti per equazione), calcola le coordinate da assegnare ai dati sulla base del criterio dei minimi quadrati, come visto in precedenza. Se dopo il calcolo eseguito dalla polinomiale, le coordinate ricalcolate per ogni GCP non hanno una precisione accettabile per tutti i punti, i punti che sulla base dell’errore residuo hanno un valore troppo distante da quello reale possono essere scartati. Una volta che il calcolo della nuova posizione dei punti GCP sulla carta soddisfa le condizioni richieste (basso rms), la posizione geografica di tutti i dati viene ricalcolata e si passa definitivamente al sistema di coordinate definitivo. Per questo, in generale nelle attività di lavoro cartografico, non ha molta importanza stabilire il sistema di coordinate della carta di partenza, e la conversione viene fatta direttamente dalle coordinate piane del documento di partenza alle coordinate piane del lavoro finale, saltando le coordinate geografiche. 36 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-25- Fasi conversione di dati vettoriali da coordinate "macchina" alle coordinate in uso al progetto GIS. Dalla sorgente di dati A arrivano i dati in coordinate “macchina” (es. x, y espressi in millimetri o pollici). Dalla fonte di dati B arrivano dati già in coordinate reali di tipo cartesiano (x,y) da portare in coordinate geografiche. Dalla fonte dei dati C arrivano i parametri di conversione tra un sistema di proiezione esistente e un altro prescelto. Proiezione delle coordinate piane al sistema di coordinate geografiche Questa fase include una equazione di trasformazione inversa, per convertire le coordinate piane o cartesiane (X,Y) alle coordinate geografiche (Queste trasformazioni sono equazioni derivate matematicamente che variano da un sistema di proiezione un altro in base al diverso tipo di sferoide utilizzato etc. Per eseguire queste trasformazioni, anche in ambito GIS, è indispensabile disporre dei parametri dell’ellissoide di riferimento. Proiezione delle coordinate geografiche al sistema di coordinate di lavoro (piane). Questa fase include una equazione di trasformazione diretta per convertire i valori di coordinate geografiche ( in coordinate piane (X,Y). Conversione dei dati raster Quando devono essere convertiti o georeferenziati i dati raster la procedura adottata é quella descritta in Fig. 2-26, e il processo di conversione consiste nel definire un nuovo raster, le cui coordinate dei nuovi assi di riferimento e dei nuovi pixel siano conformi alle coordinate desiderate. 37 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-26 – La conversione di coordinate in un’immagine raster Per questa operazione è indispensabile eseguire un ricampionamento del raster originale. Per determinare queste nuove coordinate del centro dei pixel nel nuovo grid, si utilizzano una coppia di equazioni di trasformazione. Se il raster di partenza è già in coordinate geografiche note come nel caso delle immagini satellitari geocodificate, si può impiegare una trasformazione diretta. Se il raster di partenza è in un sistema di coordinate ignoto è indispensabile utilizzare una funzione polinomiale di ordine più elevato. La differenza tra la conversione delle coordinate dei dati raster e quella dei dati vector, è che tutti gli attributi dei pixel devono essere convertiti da un raster a un altro, e non solo le informazioni relative alle coordinate. E’ indispensabile una relazione funzionale per trasformare le coordinate dei grid; inoltre il valore dei pixel nel nuovo grid sono calcolati in base a uno o più valori dei grid circostanti (neighbouring pixel) nel vecchio grid. Il processo è illustrato nella Fig. 2-27. 38 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-27 – Ricampionamento per la conversione di un’immagine raster in un’altra. A: L’immagine iniziale è ricampionata in un nuovo grid le cui coordinate sono scelte in relazione alla proiezione geografica desiderata. La raccolta e l’uso dei GCP da imporre alla funzione polinomiale (sia essa cubica che quadratica) è esattamente per quella descritta nel caso dei dati vettoriali. Il processo di ricampionamento dal vecchio grid è eseguito con uno dei tre seguenti metodi: “nearest neighbour”, “bilinear interpolation” e “cubic convolution”. Nel primo caso, “nearest neighbour”, ogni nuovo pixel prende il valore dei pixel più vicini dal vecchio grid. Quando gli attributi dei pixel sono delle categorie o numeri ordinali, deve essere utilizzata la funzione di calcolo “nearest neighbour” in quanto non ha senso utilizzare la media di valori con dati quali il tipo di roccia o l’abbondanza di un elemento. Per ottenere immagini raster più aderenti ai punti di controllo si possono utilizzare gli altri metodi di interpolazione, oltre al “nearest neighbour”, che richiedono molto più tempo e memoria per il loro calcolo, con il massimo di impegno del computer che viene raggiunto con la convoluzione cubica. 2.1.5.3 Conoscere il funzionamento di un file di georeferenziazione dei dati raster (World File). Le immagini sono registrate come dati raster nelle quali ogni cella dell’immagine ha un numero di fila ed uno di colonna. Per visualizzare le immagini è necessario stabilire una trasformazione da coordinate immagine a coordinate reali. I parametri per tali trasformazioni sono registrati con le immagini. Alcuni formati di immagini quali ERDAS IMAGINE, BSQ, BIL, BIP, GeoTIFF, e grids, registrano le informazioni per la georeferenziazione nell’intestazione (header) del file. Altri tipi di immagine utilizzano queste informazioni registrate in un file ASCII separato, denominato world file, in quanto esso contiene i parametri per le trasformazioni reali utilizzate dall’immagine. E’ facile riconoscere il word file in quanto possiede lo stesso nome del file immagine e una diversa estensione che in genere è “*.tfw”. Il file world ha una forma come nell’esempio di seguito riportato: 20.17541308822119 - A 39 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS 0.00000000000000 - D 0.00000000000000 - B -20.17541308822119 - E 424178.11472601280548 - C 4313415.90726399607956 - F La trasformazione da coordinate immagine a coordinate mondo, è una trasformazione affine a sei parametri della forma seguente: x1 = Ax + By + C y1 = Dx + Ey + F dove x1= coordinata calcolata x del pixel in coordinate mondo y1= coordinata calcolata y del pixel in coordinate mondo x = numero di colonna di un pixel nell’immagine y = numero di fila di un pixel nell’immagine A = x-scale: dimensione del pixel in unità di mappa nella direzione x B, D= valori di rotazione C,F = termini di traslazione. Coordinate mappa x,y del centro del pixel in alto a sinistra E = valore negativo della scala y. Dimensione del pixel in unità di mappa in direzione y Notare che la y-scale (E) ha un valore negativo in quanto l’origine dell’immagine e le coordinate geografiche sono in diversi sistemi cartesiani. L’origine dell’immagine è posta nell’angolo in alto a sinistra, mentre l’origine del sistema di coordinate è posta nell’angolo in basso a sinistra. I valori delle file nell’immagine aumentano dall’origine verso il basso, mentre il valore delle coordinate y nella mappa aumentano dall’origine verso l’alto. 2.2 Il Modello dei Dati 2.2.1 Modellazione della Realtà 2.2.1.1 Sapere cosa è il modello dei dati. I computer e i GIS non possono essere applicati direttamente alla realtà: è sempre indispensabile una forma di adattamento o interpretazione dei dati. Il computer elabora i dati e opera su numeri e dati che sono contenuti internamente sotto forma di digitazioni binarie. Il processo di astrazione dalla realtà per la rappresentazione della geologia, tettonica, geofisica o qualsiasi altra proprietà della superficie terrestre prende il nome di modello simbolico. Il processo di definizione e organizzazione dei dati riferiti alla realtà in un coerente insieme di dati digitali prende il nome di Data Modelling o modellizzazione dei dati (in qualche caso Modellizzazione Concettuale). L’organizzazione logica dei dati secondo una schema (prestabilito) prende il nome di Modello Dati (Data Model). La realtà deve pertanto essere descritta mediante un modello dati e una Struttura Dati che si adatta alla rappresentazione di tale modello. Infine deve essere scelto un Formato di File (File Format), funzionale alla struttura dati. Ad esempio i dati spaziali relativi alle altezze possono essere rappresentati secondo un modello raster, il raster a sua volta è organizzato in una struttura dati “run-lenght encoded” e i dati registrati su un dispositivo di memoria in un formato di file del tipo “*.CUT” file o “*.Tiff” (Tagged Image File Format). Alternativamente la superficie a terra potrebbe essere descritta mediante un modello vettoriale, espresso da poligoni delimitati da archi. In questo caso i dati potrebbero essere organizzati in Coverage (metodo Arc/Info) o Temi (metodo/ArcView) scritti sul dispositivo di memorizzazione secondo il formato “*.e00” o 40 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS “shapefile”. Il modello TIN (Triangular Irregular Network) è un altro modello dati utilizzato per la descrizione del modello digitale del terreno. E’ chiaro che non esiste un unico modo di organizzare, descrivere, e registrare i dati e le informazioni: la scelta del modello dati, della struttura dati e dei formati di registrazione è soggettiva e dipende dagli obiettivi del progetto. I Dati sono definibili come fatti verificabili della realtà che rappresentiamo, mentre le Informazioni si riferiscono a dati organizzati in modo da rendere comprensibile il contenuto, permettere l’elaborazione ecc. Le informazioni spaziali sono difficilmente estraibili dai dati se questi ultimi non sono organizzati originariamente mediante specifiche che richiedano informazioni e attributi spaziali. Lo spazio geografico deve essere rappresentato mediante quantità discrete in quanto le grandezze continue, come il campo magnetico o gravitazionale, non possono essere registrate come tali: ciò dipende dalla struttura dei computer che richiedono per la trattazione dei dati una loro organizzazione in quantità discrete ovvero non-continue. Tutti i dati spaziali sono rappresentabili mediante entità geografiche discrete come Punti, Linee e Poligoni. I modelli vettoriali (vettoriali) e raster (immagini) sono schemi comunemente riconosciuti per l’organizzazione di dati spaziali all’interno dei GIS. Un DataBase è una raccolta di dati inter-relazionati. Un DataBase Management System (DBMS) è un software (sw) per immagazzinare, editare e recuperare i dati contenuti nel database. Molti GIS gestiscono separatamente i dati spaziali e non spaziali; altri utilizzano un DBMS interno o connessioni a DBMS esterni (Oracle™, Informix™, Access™). 2.2.1.2 Conoscere il processo di creazione di un modello dei dati. La creazione di un modello di dati si articola nelle fasi di progettazione : • CONCETTUALE • LOGICA • FISICA 2.2.1.3 Conoscere i concetti di modello concettuale, modello logico, modello fisico. Due tipi (principali) di modelli modello concettuale modelli logici modelli concettuali MODELLO CONCETTUALE Un modello concettuale rappresenta concetti (entità e relationi tra le entità, a differenza di un modello mentale che descrive idee di un certo dominio del problema. La modellazione o progettazione concettuale è una tecnica molto nota di progettazione dati, assieme alla progettazione logica e alla progettazione fisica . Il modello concettuale deve essere per definizione indipendente dai dettagli dell'implementazione, come la concorrenza o la memorizzazione dei dati. Lo scopo del modello concettuale è esprimere il significato di termini e concetti usati dagli esperti del dominio per discutere il problema, e a trovare le giuste relazioni tra concetti differenti. Questo modello è anche chiamato modello semantico. Il modello concettuale cerca di chiarire il significato di vari termini spesso ambigui, e assicura che non ci siano problemi con una differente interpretazione di termini e concetti. Questo perché, tali interpretazioni possono portare errori nel progetto software basato su tale interpretazione dei 41 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS concetti. Una volta che i concetti del dominio sono stati modellati, il modello diventa una base stabile per lo sviluppo successivo dell'applicazione nel dominio. I concetti del modello concettuale possono essere usati come base di una progettazione orientata agli oggetti e implementati in un programma, come le classi di un linguaggio orientato agli oggetti. La realizzazione di modelli concettuali di domini diversi possono essere combinati tra di loro a formare una piattaforma coerente. Un modello concettuale può essere descritto usando varie notazioni, come UML o OMT per la progettazione a oggetti, o IE o IDEF1X per il Modello entità-relazione. Nella notazione UML, il modello concettuale è spesso descritto con un class diagram nel quale le classi rappresentano concetti, le associazioni rappresentano relazioni tra i concetti e i role type di un'associazione rappresentano i "role types" assunti dalle istanze dei concetti nelle varie situazioni. Nella notazione ER, il modello concettuale è descritto con un diagramma ER nel quale le entità rappresentano i concetti, cardinalità and opzionalità rappresentano le relazioni tra i concetti. (da Wikipedia, 2009) MODELLI LOGICI Adottati nei DBMS esistenti per l’organizzazione dei dati. Tali modelli sono utilizzati dai programmi e sono indipendenti dalle strutture fisiche. Alcuni esempi di tali modelli sono: relazionale, reticolare, gerarchico, a oggetti. Il Modello relazionale “…Una relazione è una struttura bidimensionale che contiene dati…” questo concetto sintetico corrisponde in pratica a una tabella. Una fila di una relazione è una tupla e una colonna è un campo, o un attributo o un item. La tupla è un analogo del record dati di un file, che contiene una raccolta di dati relativi a diversi attributi che descrivono le proprietà di un oggetto spaziale. Una chiave o un campo chiave, è un attributo che identifica univocamente le tuple e fornisce una connessione tra una relazione e un’altra. La tabella di Fig. 2-28 è un esempio di una relazione che concerne dati geochimici che costituiscono una parte di un vasto database geochimico. Ogni fila o tupla della tabella è un campione. I campi sono attributi che rappresentano la proprietà dei campioni; il numero del campione non può essere utilizzato come campo chiave perché non si hanno valori unici (anche se nell’esempio sono riportati valori unici). Così l’anno di rilevamento e il numero del campione sono trattati insieme come una chiave composita. I campi chiave, sia singoli sia compositi, sono anche noti come attributi identificativi. Le proprietà di un database relazionale, come definite da Codd (1970) sono: Tutti i dati devono essere rappresentati in forma tabulare, diversamente che nei modelli gerarchici o ramificati Tutti i dati devono essere atomici. Questo significa che ogni cella di un tabella deve contenere solo un valore. Nella tabella di fig. 22 ogni campione può avere solo un valore per ogni elemento (ad es. per lo Zn). Analisi e dati ripetuti richiedono più tuple. Non sono ammessi duplicati delle tuple 42 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Le tuple possono essere riorganizzate senza che il significato delle loro relazioni cambi. Ad esempio i campioni possono essere disposti nella tabella in ogni ordine senza alterare il contenuto della tabella. Fig. 2-28 – Tavola con attributi geochimici organizzati in un “file piano”. Ogni campione è registrato su una linea separata (tupla, fila o record). Ogni attributo occupa una colonna o campo. Questa tabella rappresenta una relazione in un database relazionale. Ogni fila è chiamata “tupla” (traslitterazione dall’inglese tuple). Una o pìù colonne possono essere dei “campi chiave” o semplicemente chiave, in quanto essi collegano una relazione con un’altra. Qui due campi “anno” e “numero di campione” sono combinati e utilizzati come “campochiave “ composito. Un concetto essenziale nella progettazione di un database relazionale è la normalizzazione, che è il processo di conversione di relazioni complesse in un grande numero di relazioni più semplici che soddisfino le regole relazionali. Il processo di normalizzazione è più facilmente spiegabile attraverso un esempio. Supponiamo che una carta geologica sia stata digitalizzata e che una tabella iniziale sia stata creata per collegare i poligoni (gli oggetti spaziali o le entità) ad una serie di attributi che descrivono la litologia e l’età (tabella A nella Fig. 2-29). Nella convenzione dei database relazionali questa relazione può essere riferita nel modo seguente: POLIGONI (poly#,Fm_name,lithology,age) Dove POLIGON è il nome della relazione, poly# è il campo chiave (sottolineato), Fm_name, lithology e age sono attributi rappresentati in questo caso da stringhe di testo. “Fm_name” è il nome della formazione geologica, “lithology” il nome del litotipo dominante e “age” l’età geologica relativa. Considerando che gli attributi testuali possono essere causa di difficoltà (le definizioni cambiano con il tempo e sono spesso soggettive), il primo passo nella riorganizzazione della relazione di fig. 23A, è aggiungere un nuovo attributo numerico in sostituzione dell’attributo testuale. Accanto al nome della formazione, si aggiunge il campo numerico Fm#; lo stesso per i campi lith#, e age#. In questo modo la nuova tabella di Fig. 2-29B può essere espressa dalla espressione: POLIGONI (poly#,FM#,Fm_name,lith#,lithology,age#,age). 43 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-29 - A (in alto): la relazione Poligoni prima della normalizzazione: si noti che molte formazioni sono ripetute più di una volta. Una grande tabella organizzata in questo modo sarebbe di difficile editazione modifica, in quanto ogni cambio necessiterebbe di essere ripetuto molte volte. B: la stessa tabella in A dopo l’aggiunta di alcuni campi numerici come prima fase della normalizzazione. Si noti come il numero delle formazioni sia ripetuto molte volte, perché più di un poligono cartografato può appartenere alla stessa formazione. Anche in questo semplice esempio c’è una considerevole ridondanza nella tabella, perché i poligoni 4,5,7 contengono tutti la stessa formazione, che è ripetuta in tre tuple. Il primo passo nella normalizzazione consiste nella eliminazione delle ripetizioni e delle ridondanze. A questo fine è indispensabile creare una nuova tabella chiamata FORMAZIONE e una semplificazione della tabella POLIGONI nel modo seguente: POLIGONI(poly#,Fm#), and FORMAZIONE(Fm#,Fm_name,lith#,lithology,age#,age). In una grande mappa con migliaia di poligoni, questa semplificazione porta già ad un considerevole risparmio di memoria e, cosa più importante, ad una organizzazione dei dati più efficiente. Il numero di formazione (Fm#) diviene in questo caso l’attributo di connessione fra le due relazioni, essendo il campo chiave nella tabella FORMAZIONE. Questo consente alla tabella FORMAZIONE di essere editata indipendentemente dalla tabella POLGONI e viceversa. In ogni caso la tabella FORMAZIONE contiene ancora dei gruppi ripetuti perché le formazioni 2, 3 e 4 hanno la stessa età. 44 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Questo può essere rettificato semplificando la tabella FORMAZIONE creando una tabella ETA’ separata. FORMAZIONE(Fm#,Fm_name,lith#,lithology,age#), e ETA’(age#,age) Ora ogni tupla nelle tabelle (o relazioni) POLIGONI, FORMAZIONE e ETA’ non contiene gruppi ripetuti e la tabella (o relazione) ETA’ può essere editata singolarmente e aggiornata. In un database reale la tabella ETA’ potrebbe avere oltre 100 tuple che riportano intervalli di età anche non legati a una particolare formazione nella tabella FORMAZIONE. Nel lessico dei DBMS le relazioni senza gruppi ripetuti sono definite in “prima forma normale” o “forma normale” (1NF). La seconda fase di normalizzazione consiste nell’assicurare che ogni attributo non identificativo (gli attributi che non sono chiave) sia in corrispondenza biunivoca stretta con il campo chiave. Il campo chiave, (attributo identificativo) può essere definito su più attributi (attributi multipli). Ad esempio supponiamo il caso di una tabella che contenga i record relativi a campioni di rocce; ogni campione ha un suo numero, ma lo schema di campionatura prevede che si ricominci da 1 ogni volta che si esegue un nuovo rilevamento. In questo caso potremmo utilizzare una tavola per il numero di rilevamento e il numero di campione come attributo identificativo, per costituire una chiave “composita” o “accoppiata”; è indispensabile ricordare che né il numero di campione né il numero di rilevamento possono da soli definire la chiave. Le relazioni stabilite con questo criterio si dicono in Seconda Forma Normale (2NF). La terza fase di normalizzazione consiste nell’assicurare che gli attributi non identificativi siano mutuamente indipendenti. Questo non è il caso della tabella FORMAZIONE perché lith# e lithology sono “dipendenti” uno dall’altro in rapporto 1:1 nel senso che per ogni lith# si può sempre individuare una litologia e viceversa. Anche il nome della formazione e il relativo numero sono dipendenti l’uno dall’altro, ma il Fm# è un attributo identificativo, essendo un campo chiave, e conseguentemente richiede una normalizzazione. Per rettificare il problema con la litologia, la tabella FORMAZIONE, è ulteriormente semplificata ed è definita una nuova tabella chiamata LITOLOGIA: FORMAZIONE(Fm#,Fm_nome,lith#,age#) e LITOLOGIA(lith#, litology). Questa operazione completa il processo di normalizzazione e ha il risultato di decomporre la tabella originale in quattro tabelle più semplici che sono ora definite in terza forma normale (3FN). Queste tabelle semplificate sono, come mostrato nella tabella di Fig. 2-30, riassumibili in: POLIGONI (poly#,Fm#), FORMAZIONE(Fm#,Fm_nome,lith#,age#), LITOLOGIA(lith#, litology), e ETA’(age#,age). 45 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-30 – Relazioni dalla tabella di Fig. 2-28 dopo la normalizzazione in “terza forma normale”. Si noti che sono eliminate le ripetizioni, rendendo l’editing più facile come mostrato nella Fig. 2-31. Il processo di normalizzazione può essere portato ancora avanti, fino almeno alla “quinta forma normale”. Lo scopo primario di questa decomposizione quelle che sono note come anomalie, in altre parole degli effetti indesiderati che ricorrono quando le relazioni non sono in forma normale. Queste anomalie si verificano quando le tabelle vengono modificate aggiungendo o cancellando delle tuple. E’ ovvio che quando si devono eseguire delle modifiche in relazioni non normalizzate, i cambiamenti devono essere eseguiti in tutte le tuple in cui appare il valore da modificare (tabelle in Figg. 2-31 e 232). Paradossalmente la formalizzazione sacrifica la velocità del recupero dell’informazione. Per aumentare la velocità del recupero dell’informazione “distribuita” nelle varie relazioni, queste possono essere di nuovo unite e ordinate secondo vari criteri, sia per l’edizione sia per la comprensione del modello. L’operatore che esegue questa unione si chiama JOIN. Possono esistere tre tipi differenti di relazioni fra le tabelle Relazione Uno-a-molti Iniziamo con la relazione Uno-a-molti. Questo è il tipo di relazione che si ha fra le tabelle Clienti e Ordini. Un unico numero cliente identifica ogni cliente. Questo cliente, identificato univocamente, può fare diversi ordini dei prodotti indicati. Quindi il DBMS può trovare una corrispondenza tra ogni singolo record della tabella Clienti (uno) e un infinito numero di record (molti) della tabella Ordini. Le relazioni Uno-a-molti sono probabilmente quelle più comuni dei tre casi possibili; comunque non bisogna dimenticare le altre due. 46 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-31 - Editing della relazione mostrata in Fig. 2-29 prima della normalizzazione. Supponiamo che sia stato scoperto che la formazione di Mount. non sia un gabbro, bensì un granito. Sebbene questo sia un esempio triviale è evidente che un caso del genere obbliga a una correzione di 3 tuple nella tabella non-normalizzata Fig. 2-32 –Dopo la normalizzazione le relazioni POLIGONI e ETA’ rimangono inalterate mentre due piccoli cambiamenti sono necessari per le relazioni FORMAZIONI e LITOLOGIA. Supponiamo che questo cambio sia fatto in una situazione reale di una carta geologica contenente alcune migliaia di poligoni; anche in questo caso i cambiamenti sarebbero della stessa entità di quelli dell’esempio in quanto la relazione POLIGONI rimane inalterata. Relazione Molti-a-uno Questa relazione, opposta alla prima, è quella che si ha nel caso di una carta geologica o tematica e la sua legenda; in un database possiamo avere numerose record relativi ai diversi poligoni in cui affiora la stessa formazione. Per non ripetere a ogni record di questo tipo la descrizione della formazione ecc. il DBMS può trovare una corrispondenza tra i Molti record relativi ai poligoni della stessa formazione e una tabella in cui sono riportate unicamente le descrizioni delle formazioni. Una relazione di questo tipo serve a definire la cosiddetta Look Up table di una carta. Relazione Uno-a-uno Un'altra possibilità è la relazione Uno-a-uno. In questo caso, un record di una tabella ha un solo record corrispondente nella seconda tabella. Un esempio potrebbe essere una casa editrice che permette ai suoi autori di scrivere uno e un solo libro. Se si ha una tabella autori e una tabella libri 47 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS per la situazione descritta, le quali condividono un campo comune, numero autore, si ottiene una relazione Uno-a-uno. Ogni record di autore avrebbe un solo record di libro corrispondente. Relazione Molti-a-molti Il terzo tipo è la relazione Molti-a-molti. In questo tipo di relazione, ogni record nella prima tabella della relazione, può avere diverse corrispondenze nella seconda tabella, e ogni record nella seconda tabella può avere diverse corrispondenze nella prima tabella. Supponiamo che la casa editrice pubblichi una serie di libri che sono stati scritti da gruppi di collaboratori. La compagnia ha due tabelle nel proprio database: una per gli autori e una per i libri. Ogni libro è scritto da un gruppo di autori quindi i record della tabella hanno più di una corrispondenza nella tabella degli autori. Allo stesso tempo, ogni autore può essere impiegato nella scrittura di più di un libro. Quindi anche i record nella tabella autori hanno più di una corrispondenza nella tabella libri e concludendo la relazione è Molti-a-molti. Le modo operative dei diversi tipi di unioni descritte saranno viste nella sezione dedicata al sistema GIS ArcView. Il modello relazionale non è molto utilizzato per le coordinate spaziali dei vertici nel modello vettoriale perché la sequenza dei vertici è di vitale importanza per definire una linea. L’applicazione del modello relazionale potrebbe portare a violare l’ultimo dei principi di Codd sulle proprietà del modello relazionale è cioè che le tuple in una relazione possono essere riorganizzzate solo se non si modificano i dati. Prima di abbandonare l’argomento delle Tabelle degli Attributi è importante notare che esse rappresentano un link unificante tra il modello raster e il modello vector. Supponiamo una mappa che mostri diversi tipi di roccia, (Fig. 2-33); i poligoni riferiti a diversi tipi di roccia sono le entità spaziali cui sono collegate le tabelle degli attributi sia nel modello vector (Fig.2-33A), che nel modello raster ottenuto per conversione automatica dai dati vettoriali. Nel modello raster gli oggetti spaziali sono ora divenuti pixel che nel loro complesso individuano le entità poligonali (Fig.2-33B). In questo modo i due modelli condividono la stessa tabella degli attributi (Fig.2-33C). Questo esempio illustra il dualismo tra il modello Raster e il modello Vector e che i pixel considerabili come oggetti spaziali nel modello raster, possono essere considerati come membri di uno oggetto spaziale composito (poligono) nel modello vettoriale. 48 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-33- A: Un carta geologica nel modello vettoriale. B: la stessa carta nel modello raster. C: Entrambi i modelli utilizzano la stessa tabella degli attributi. La tabella degli attributi nel modello raster è un puntatore (ha lo stesso codice) al numero del poligono. MODELLI CONCETTUALI Modelli concettuali Permettono di rappresentare i dati in modo indipendente da ogni sistema e cercano di descrivere i concetti del mondo reale.Sono utilizzati nelle fasi preliminari di progettazione. Il più diffuso è il modello Entity-Relationship (M Entità: Rappresentano concetti (un raggruppamento di nomi, una classe o una categoria di “cose”), significativi per l’applicazione e sui quali esiste la necessità di raccogliere informazioni. Tutte le entità sono rappresentate da sostantivi, ma non tutti i sostantivi sono riconducibili a delle entità. CITTA’, DIPARTIMENTO, IMPIEGATO, ACQUISTO e VENDITA sono esempi di entità di una applicazione aziendale. Un’occorrenza di una entità è un’istanza della classe che l’entità rappresenta. Creazione di Entità Esaminare i sostantivi e per ciascuno domandarsi: è significativo per l’applicazione? l’applicazione ha necessità di raccogliere dati su di esso? è un gruppo o un’istanza di un gruppo? Nominare l’entità (al singolare) associando gli eventuali sinonimi; Descrivere formalmente l’entità, verificarne la conformità con le specifiche e verificare l’uniformità di comprensione del significato attribuito; 49 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Relazioni Rappresentano legami logici, significativi per l’applicazione, tra due o più entità. RESIDENZA è un esempio di relazione che può intercorrere tra le entità CITTÀ e IMPIEGATO; ESAME è un esempio di relazione che può sussistere tra le entità STUDENTE e CORSO. Un’istanza di relazione è una ennupla (coppia nel caso più frequente di relazioni binarie) costituita da istanze di entità, una per ciascuna delle entità coinvolte. MODELLI FISICI Il modello fisico di una base di dati descrive in dettaglio la struttura e le caratteristiche dell’insieme delle tabelle che la costituiscono. 2.2.2 Rappresentazione continua e discreta della Realtà Oggetti spaziali artificiali con limiti regolari Ogni suddivisione regolare dello spazio produce oggetti spaziali poligonali di forma regolare, come i pixel (quadrati) di un’immagine raster o i voxel, cubi aventi un pixel come base. La traccia di una sezione o il piano di un profilo geologico sono un esempio di oggetti spaziali lineari e poligonali di questo tipo. Una differenza chiave tra i modelli dati raster e vector consiste nell’utilizzo di modelli spaziali regolari per la trattazione raster, e di oggetti spaziali irregolari (artificiali o naturali) nella trattazione vector (Figg.2-34 e 2-35). Figura 2-34 – A: rappresentazione di un poligono nel modello vector. B: rappresentazione di un poligono nel modello raster. 50 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-35. A Rappresentazione digitale di oggetti spaziali su una carta secondo il modello vector. Il modello vector è un’astrazione della realtà nella quale gli oggetti spaziali sono rappresentati come punti, linee e poligoni; questi ultimi sono geograficamente riferiti a un sistema di coordinate. B: Rappresentazione di un’entità poligonale secondo il modello raster: i dati spaziali vengono rappresentati come una matrice di celle, ognuna delle quali ha un valore per un attributo. La posizione spaziale di un elemento è implicita nell’ordine delle celle del grid. 2.2.2.1 Conoscere la rappresentazione della realtà attraverso il Modello Vettoriale. Il modello vettoriale è molto utile alla rappresentazione di carte: punti, linee, poligoni e simboli difficilmente possono essere rappresentati fedelmente mediante dati raster senza ricorrere a pixel molto piccoli. Nella modo vettoriale le linee che racchiudono le aree sono delle poligonali che passano da vertici, ognuno dei quali è ubicato in base a una coppia di coordinate nel sistema di riferimento prescelto. Se i vertici di queste poligonali sono molto fitti, i perimetri e gli archi rappresentano molto precisamente le forme delle entità geografiche cui si riferiscono. La struttura dati necessaria alla registrazione dei dati vector è considerevolmente più complessa rispetto all’omologa struttura raster e la rappresentazione al monitor o la stampa dei dati richiede comunque la conversione Vector >Raster. Rappresentazioni raster e vector possono essere differenziate sulla base di come rappresentano lo spazio, oppure mediante il tipo di oggetti spaziali che utilizzano. Il modello raster utilizza una enumerazione areale o volumetrica ; il modello vector utilizza linee o superfici per rappresentare aree o volumi. Il modello raster descrive elementi poligonali o volumi direttamente. Il modello vector registra i limiti degli oggetti e utilizza uno schema di collegamento (etichettamento o labeling) che lega gli oggetti ai loro specifici attributi. Il labeling implica la definizione degli attributi topologici: attributi spaziali (coordinate, lunghezze, perimetri e aree) che definiscono le relazioni di adiacenza e contenimento fra gli oggetti spaziali. 51 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Il tipo fondamentale di modello vector è rappresentato dal modello a “spaghetti” dove i punti sono rappresentati da coppie di coordinate spaziali, le linee da poligonali che passano da vertici di coordinate note e i poligoni sono delimitati da linee chiuse. Se ogni punto, linea, poligono di una carta geologica è digitalizzato mediante un digitalizzatore (manuale o automatico) la struttura che otteniamo è quella riportata in Fig. 2-36. Fig. 2-36– A: Nel modello a spaghetti le linee sono definite dai vertici le cui localizzazioni spaziali sono registrate nelle tabelle delle coordinate geometriche. B: Il modello topologico fornisce delle informazioni addizionali circa la adiacenza, contenimento, e connettività degli archi e dei nodi. Se gli oggetti spaziali sono registrati con i loro attributi informativi, generalmente con dati spaziali e non-spaziali nello stesso file, i punti le linee e i poligoni possono essere stampati utilizzando diversi simboli, spessori di linee o riempimenti di poligoni, a seconda attributi informativi registrati assieme agli oggetti. Con una gestione di database minima degli oggetti spaziali e dei loro attributi, questi possono essere selezionati ed elaborati per mostrare le caratteristiche selezionate. I cambi di scala e di proiezione geografica applicate ai dati vettoriali sono dirette, permettendo l’ingrandimento di zone specifiche e la loro modifica per una enorme varietà di scopi. Molti pacchetti software commerciali di basso costo offrono questo tipo di funzionalità e per molte applicazioni, in scienze della terra, rappresentano una soluzione ad elevato rapporto qualità/prezzo. Molti software (sw), come i programmi di disegno tecnico tipo AUTOCAD™, sono in grado gestire automaticamente dati cartografici o spaziali e offrono grandi possibilità di visualizzazione cartografica. La differenza sostanziale tra questi sistemi basati su modelli vector e i GIS consiste nell’uso di relazioni 52 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS topologiche o dati topologici per la descrizione di relazioni spaziali tra gli oggetti. Nell’uso del modello vector gli attributi topologici sono essenziali per una efficiente sovrapposizione e elaborazione dei dati cartografici. La strutturazione dei dati vettoriali secondo un criterio topologico è una differenza chiave tra il modello a “spaghetti” e il modello topologico. 2.2.2.2 Conoscere la rappresentazione della realtà attraverso il Modello Raster. Il termine raster (dall’inglese trama, reticolo, griglia o schermo televisivo) trae origine dalla tecnologia televisiva analogica, ovvero dal termine che indica le righe orizzontali (dette anche scan line) dei televisori o dei monitor). In computer grafica, indica la griglia ortogonale di punti che costituisce un'immagine raster. Nella grafica raster l'immagine viene vista come una scacchiera e ad ogni elemento della scacchiera, chiamato pixel, viene associato uno specifico colore. Il colore può essere definito con due tecniche: se l'immagine contiene pochi colori (massimo 256) si crea un elenco dei colori da utilizzare e nella scacchiera viene inserito l'indice che punta allo specifico colore del pixel; nel caso si vogliano utilizzare molti più colori il singolo pixel non definisce più l'indice a una tavolozza di colori ma definisce il colore direttamente. Il colore viene definito come un'unione delle componenti blu, rossa e verde. Questo non è l'unico modo di definire un colore, esistono molti modi che vengono chiamati spazi di colore ma nel caso delle immagini generate al computer il sistema RGB (RED Rosso, GREEN verde BLUE Blu) è il più diffuso dato che le schede grafiche lo utilizzano in modo nativo per generare il segnale da visualizzare con il monitor (Fig. 2-37). Fig. 2-37 – Modalità di gestione del colore in una immagine raster RGB Proprietà della grafica raster La bitmap è caratterizzata da due proprietà: risoluzione; profondità di colore. La prima è determinata dal numero di pixel contenuti nell'unità di misura considerata (in genere il pollice inglese, che misura 2,54 cm) ed è ottenuta moltiplicando il numero di pixel orizzontali per quello dei pixel verticali; si misura in PPI (Points Per Inch o Dot Per Inch). La seconda è definita 53 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS dalla memoria che si dedica ad ogni pixel, ovvero dal numero di bit dedicati ad ogni pixel per descrivere il colore, e si misura in BPP (Bit Per Pixel); maggiore è il numero di bit, maggiore è il numero di colori che è possibile descrivere. La grafica bitmap non è vantaggiosa se l'utente necessita di apportare modifiche all'immagine, perché nel caso ad esempio di uno zoom, la risoluzione diventa bassissima e quindi la qualità dell'immagine peggiora notevolmente. I software grafici, per ridurre il problema, sono in grado di ripristinare la risoluzione inserendo nuovi pixel che vengono calcolati facendo una interpolazione di punti, il processo inserisce, perciò, deliberatamente una quantità di informazioni presunte. La grafica bitmap è invece ideale per rappresentare immagini della realtà, per modificare contrasti e luminosità di queste, per applicare filtri di colore. Formati di immagini raster I dati raster possono essere memorizzati attraverso tipologie di file che sfruttando algoritmi di compressione diversi, gravando in modo differente sul supporto di memorizzazione. I formati raster più comuni sono i seguenti: Non compressi Questi formati di file hanno richieste di elaborazione minima, non essendo necessari algoritmi di compressione (in fase di scrittura) e decompressione (in fase di lettura), tuttavia, mancando di compressione, risultano particolarmente voluminosi, in termini di spazio occupato su disco (o altro dispositivo di memorizzazione), rispetto agli altri formati: raw bmp (in alcuni casi i file bmp sono compressi con un algoritmo RLE) Con compressione lossless Le immagini salvate con un algoritmo di compressione dati lossless occupano meno spazio nei dispositivi di memorizzazione, mantenendo inalterata tutta l'informazione originale: png (certe applicazioni permettono anche la scrittura di file png non compressi) tga tiff (sebbene questo sia l'uso più comune, questo formato permette diversi tipi di compressione) gif (per immagini fino a 256 colori) Con compressione lossy Le immagini memorizzate con un algoritmo di compressione lossy, subiscono una perdita di informazione; pertanto questa tecnica non è adatta per salvare le immagini che vengono rielaborate coi programmi di fotoritocco (le continue modifiche comporterebbero un progressivo degrado dell'immagine ad ogni salvataggio e riapertura); invece, in virtù delle ridotte dimensioni del file, sono particolarmente indicate per la trasmissione di immagini o per ridurre le dimensioni di un'applicazione o di un prodotto da distribuire. jpeg gif (per immagini con più di 256 colori si ottiene una compressione lossy poiché vengono eliminate la maggior parte delle sfumature di colore) Altre applicazioni Nel campo dei Sistemi informativi territoriali o GIS, il termine raster è usato per indicare la tipologia di dato impiegata nella rappresentazione cartografica digitale. Con i dati raster il territorio viene 54 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS riprodotto attraverso una matrice di pixel di forma quadrata o rettangolare. A ciascun pixel è associato un attributo che definisce le caratteristiche dell'elemento rappresentato. Ad esempio in un modello digitale di elevazione a ciascun pixel è associato il valore della quota sul livello del mare in quel punto. La dimensione dei pixel è inversamente proporzionale alla precisione della carta. I dati raster possono essere implementati in un sistema GIS mediante acquisizione diretta con apparecchiature a lettura ottica quali ad esempio scanner d'immagini o attraverso l'elaborazione di dati, raster o vettoriali, già acquisiti. (da Wikipedia, 2009) Uno dei vantaggi del modello raster e che i dati diversi tipi di dati spaziali possono essere sovrapposti senza la necessità di complessi calcoli numerici o geometrici che sono invece indispensabili nella trattazione vettoriale. Nel modello raster ogni strato di reticolo di celle registra un attributo separato. Le celle sono costanti in forma e sono generalmente quadrate sebbene siano utilizzate rettangoli, triangoli, equilateri o esagoni per questo le coordinate spaziali non sono generalmente esplicitate per ogni cella e la a localizzazione delle celle è ottenuta mediante la numerazione di file e colonne. La risoluzione spaziale di un raster è la dimensione sul terreno di un pixel. Con una risoluzione di 100 m, un’area quadrata di 100 km di lato richiede un raster di 1000 file per 1000 colonne per un totale di 1.000.000 di pixel. 2.2.3 Topologia 2.2.3.1 Conoscere il concetto di topologia. La realtà fisica o geografica può essere rappresentata mediante entità geometriche semplici: punti, linee e poligoni. Quando studiamo una carta, la nostra mente ottiene delle informazioni addizionali interpretando le relazioni spaziali tra le feature geografiche che stiamo studiando e quelle vicine. Ad esempio, si può tracciare un percorso lungo una carta stradale per individuare la strada tra un aeroporto e un albergo oppure individuare due particelle di terreno contigue e la strada lungo la quale esse sono ubicate. Nella cartografia numerica (o digitale), tali relazioni spaziali sono definite utilizzando la topologia. La topologia o studio dei luoghi (dal greco τοπος, luogo, e λογος, studio) è una delle più importanti branche della matematica moderna. Si caratterizza come lo studio delle proprietà delle figure e delle forme che non cambiano quando viene effettuata una deformazione senza "strappi", "sovrapposizioni" o "incollature". Concetti fondamentali come convergenza, limite, continuità, connessione o compattezza trovano nella topologia la loro migliore formalizzazione. La topologia si basa essenzialmente sui concetti di spazio topologico, funzione continua e omeomorfismo. Col termine topologia si indica anche la collezione di aperti che definisce uno spazio topologico. Per esempio un cubo e una sfera sono oggetti topologicamente equivalenti (cioè omeomorfi), perché possono essere deformati l'uno nell'altro senza ricorrere a nessuna incollatura, strappo o sovrapposizione; una sfera e un toro invece non lo sono, perché il toro contiene un "buco" che non può essere eliminato da una deformazione (da Wikipedia, 2009) 2.2.3.2 Conoscere i concetti di adiacenza, connettività e “definizione di area” (Contenimento). La topologia è il termine utilizzato per riferirsi alla continuità di spazio e proprietà spaziali, quali la connettività, che restano inalterate dalle distorsioni. Nella rappresentazione delle entità spaziali dei modelli vettoriali una proprietà topologica, come la connettività, è definita esplicitamente da un puntatore diretto fra i record di oggetti che sono tra loro legati nello spazio (ad esempio il punto la connessione tra due strade). La topologia è una relazione matematica per definire esplicitamente le 55 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS relazioni spaziali tra le entità. Il principio è in pratica semplice: la topologia esprime le diverse relazioni spaziali come una lista di feature geografiche (es. un’area è definita da archi che ne delimitano i bordi). L’abilità di creare è immagazzinare le relazioni topologiche ha un gran numero di vantaggi. La topologia consente di immagazzinare i dati in modo più efficiente permettendo l’elaborazione di una grossa mole di dati in tempi minori. Nel modello vettoriale le entità lineari (archi) sono geometricamente descritte da un set di coordinate che individuano i vertici di una poligonale. Da un punto di vista delle proprietà topologiche le coordinate dei vertici assumono il significato espresso nei tre principi che seguono: 1. Gli archi si connettono l’uno all’altro in corrispondenza dei nodi (Principio di CONNETTIVITA’) 2. Gli archi che connettendosi racchiudono un’area definiscono un poligono (Principio di DEFINIZIONE DELL’AREA) 3. Gli archi hanno una direzione ed un poligono di destra e un poligono di sinistra (Principio di CONTIGUITA’) Principio di CONNETTIVITA’ I punti (di coordinate x, y) lungo l’arco sono definiti vertici e definiscono la forma dell’arco. Le terminazioni dell’arco sono dette nodi. Ogni arco ha due nodi: un nodo di partenza (a from-node ) e un arco di arrivo (a to-node).Gli archi si connettono ai nodi. Tracciando tutti gli archi che si connettono a un nodo, Arc/Info riconosce quali archi connettere. Nella Fig. 2-38 gli archi 3,4,5, e 6, tutti si connettono al nodo 3. Con questa informazione il computer sa che è possibile viaggiare lungo l’arco 5 e girare lungo l’arco3 perché loro condividono il nodo 3, ma non è possibile andare direttamente dall’arco5 all’arco 9 perché l’arco5 e l’arco 9 non condividono nessun nodo comune. 56 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-38 – Il principio di connettività degli archi. Principio di DEFINIZIONE DELL’AREA I poligoni sono rappresentati da una serie di coordinate x, y che una volta connesse delimitano un’area. Il sw Arc/Info immagazzina gli archi che delimitano i poligoni, piuttosto che un set di coordinate chiuse. Una lista di archi che costituiscono ogni poligono è immagazzinata ed utilizzata, se necessario, (per esempio per disegnare i poligoni). Nella Fig. 2-39 gli archi 4,6,7,10 e 8 comprendono il poligono 2. Lo 0 prima dell’8 indica che gli archi formano un’isola all’interno del poligono 2. Sebbene un arco possa apparire nella lista dei poligoni per alcune volte, esso è immagazzinato una sola volta. Immagazzinando le entità geografiche una sola volta si economizza molto sulla memoria impegnata dal data base e inoltre i bordi dei poligoni adiacenti non si sovrappongono. 2.2.3.3 Saper distinguere i termini di struttura di dati vettoriali a spaghetti (o CAD) e struttura di dati vettoriali topologica. Nel modello topologico, i limiti tra i poligoni sono interrotti in una serie di archi e nodi e le relazioni spaziali tra queste entità sono registrate nella Tabella degli Attributi (Fig. 2-40). Nel modello a spaghetti il limite tra due poligoni adiacenti è registrato due volte, uno per ogni poligono; questo approccio porta a una duplicazione della memoria impegnata e a una non esatta corrispondenza tra i due limiti del poligono. Nel modello topologico il poligono a destra e a sinistra di ogni arco è definito esplicitamente e di conseguenza i limiti dei poligoni non sono mai ripetuti. Una importante differenza tra il modello a spaghetti e il modello topologico riguarda le aree completamente coperte da poligoni. Nel modello a spaghetti non è necessario che i poligoni occupino tutto lo spazio formando un mosaico interconnesso, spazialmente esaustivo e non-ripetitivo. Ad esempio se la regione è sottoposta a inondazioni regolari e la carta mostra le estensioni dell’area inondabile in diverse date, nel modello a spaghetti i poligoni possono sovrapporsi e non è necessario che ricoprano tutta l’area. Per un database di piccole dimensioni, questo modello organizzativo è molto conveniente sia per interrogazioni spaziali semplici come determinare quale area , se è tra queste, tra quelle inondate contiene la localizzazione geografica richiesta. Per i database di grandi dimensioni con migliaia di aree poligonali e per le interrogazioni che richiedono una copertura completa delle aree senza aree nulle, il modello a spaghetti non è sufficiente. 57 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-39- Il principio di definizione dell'area Fig. 2- 40 - Il principio di contiguità Questa situazione è superata nel modello topologico dal cosidetto Planar Enforcement, che porta alla creazione di un set di poligoni che riempiono completamente la superficie da rappresentare. In questo modo ogni punto della superficie è contenuto all’interno di un poligono. Sia il modello topologico sia il modello raster soddisfano questa condizione. La Fig. 2-41 illustra il concetto di Planar Enforcement per una carta che mostra la sovrapposizione tra due aree rilevate. Gli attributi topologici degli oggetti spaziali sono delle caratteristiche che non variano anche nel caso di trasformazioni come traslazione, cambio di scala, rotazione e taglio. Le coordinate spaziali e 58 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS alcuni attributi geometrici degli oggetti spaziali, come l’area il perimetro e l’orientazione sono soggetti da tali trasformazioni, tuttavia la contiguità, la definizione dell’area e la connettività sono caratteristiche topologiche che rimangono invariate (Fig. 2-42). Nel modello topologico, gli attributi degli oggetti spaziali sono definiti in aggiunta alle coordinate spaziali del modello a spaghetti. La costruzione della topologia significa aggiungere una struttura topologica a una struttura a spaghetti e realizzare un Planar Enforcement dello spazio rappresentato. Si consideri l’esempio in una carta di entità poligonali che sia digitalizzata mediante un CAD con un modello a spaghetti: la topologia può essere aggiunta o costruita in un GIS prima di eseguire delle operazioni di analisi spaziale che richiedono la presenza di attributi topologici. Una volta che i dati spaziali sono rappresentati mediante un modello topologico la cancellazione di vertici, linee, poligoni, influenza non solo la struttura geometrica (le coordinate spaziali), ma anche la struttura topologica. Per questo motivo, dopo ogni operazione di questo genere (cancellazione, aggiunta o aggiornamento della geometria), è indispensabile ricostruire di nuovo la topologia. Fig. 2-41 – A: In A sono mostrati i limiti di tre rilevamenti portati avanti in diversi anni; si noti che le aree rilevate si sovrappongono in alcune aree, mentre altre sono completamente assenti. Nella struttura dai a spaghetti questa suddivisione delle aree è ammessa. B: Le stesse aree di rilevamento dopo il Planar Enforcment creato dal modello topologico, sono divise in 7 poligoni. Applicando, come in questo caso, il modello topologico è indispensabile la creazione di una tabella degli attributi per mettere in relazione i poligoni con i rilevamenti. 59 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-42 - A: Entità poligonale su una carta geologica. B: La stessa entità dopo aver applicato una trasformazione di taglio: area, perimetro e orientazione sono variate, restano invariate solo le caratteristiche che dipendono dai principi di contiguità, definizione d’area o contenimento e connettività. Il modello vector è più adatto alla rappresentazione delle entità geografiche su una carta, perché le curve che rappresentano i limiti dei poligoni o di altre entità sono approssimabili in modo migliore con un sistema di coordinate piuttosto che con una matrice di punti regolarmente spaziati come nel modello raster. Tuttavia è da tenere presente che la fedeltà cartografica è spesso più apparente che reale a causa del livello di campionatura che hanno i limiti delle feature poligonali riportate nelle carte. Il modello topologico risulta indispensabile quando sono richieste nelle forme di interrogazione attributi topologici, come “trovare tutti i poligoni che hanno i graniti su un lato”. L’aspetto negativo del modello topologico è il notevole impegno di elaborazione richiesto alla CPU del computer Di notevole interesse sono anche i modelli dati che utilizzano poligoni irregolari per modellare le superfici. Il Triangular Irregular Network (TIN) è utilizzato principalmente per rappresentare l’elevazione digitale delle superfici. Il modello di Voronoi suddivide una regione in poligoni di Voronoi e Thiessen; in entrambi i modelli i dati derivano dagli attributi dei punti. La superficie da rappresentare è l’altitudine di un’area (Fig.2-43), e l’obiettivo della modellizzazione è di convertire degli oggetti puntuali in un mosaico di oggetti areali che approssimino al meglio una superficie. Il metodo preferito è la triangolazione di Delunay, che produce un unico set di triangoli. Le faccette triangolari risultanti formano un mosaico di una superficie piana le cui geometrie nello spazio sono definite dall’altezza (coordinata z) dei vertici del triangolo; il rilevo topografico del terreno risulta ben approssimato da questo set di triangoli. La rete di triangoli risulta vantaggiosa perché la dimensione dei triangoli varia al variare della densità dei punti, con una dimensione maggiore dove i punti sono distanziati e una dimensione minore dove i punti sono fitti. 60 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-43 - Relazioni tra i triangoli di Delunay (linee tratteggiate) con i punti di partenza ai vertici dei triangoli e i poligoni di Thiessen e Voronoi (linee intere) , ognuno dei quali contiene un solo punto. I triangoli formano un modello vettoriale costituito da una rete irregolare di triangoli (TIN). Dove i punti traggono origine da una superficie a curve di livello la densità dei punti incrementa con la densità delle linee, fornendo una maggiore densità di piccoli triangoli sui versanti a maggiore pendenza rispetto alle zone meno inclinate. Il modello TIN risulta vantaggioso per le discontinuità morfologiche che riesce a rappresentare implementandolo con le Breakline, superfici di discontinuità netta che inserite nel modello TIN permettono di evidenziare pareti verticali, falesie, faglie. 2.2.3.4 Conoscere le relazioni topologiche dei dati raster (essenzialmente basata sul concetto di adiacenza/vicinanza). Nello spazio definito tramite un modello dati raster, il concetto topologico di base che caratterizza i dati vettoriali (la Connettività) è implicitamente ereditato dalla struttura geometrica dei dati. Infatti come sopra descritto, la regione di interesse e completamente suddivisa da pixel , in cui la dimensione x=y. Inoltre tale spazio è definito dalle coordinate X max, X min; Ymax; Ymin (Fig. 2-44). 61 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-44 (mod. da geoserver.disat.unimib.it) Ogni cella possiede otto celle confinanti con essa: 4 nelle direzioni cardinali e 4 nelle direzioni diagonali. Le celle sono identificate attraverso la loro posizione nella griglia e la localizzazione di una cella può essere calcolata in base alla sua posizione e alla sua dimensione position in the grid 2.3 DBMS 2.3.1 DBMS e GIS (SIT) 2.3.1.1 Sapere cosa è un DBMS. Definiamo prima una Base di dati secondo una accezione generica e metodologica. Una base di dati è un “Insieme organizzato di dati utilizzati per il supporto allo svolgimento delle attività di un ente (azienda, ufficio, persona) (accezione specifica, metodologica e tecnologica)” Una base di dati la si può definire anche come un “Insieme di dati gestito da un DBMS” I DATABASE MANAGEMENT SYSTEM (DBMSs) Un database è una grande raccolta di dati tra loro inter-relazionati immagazzinati all’interno di un ambiente computerizzato. I dati immagazzinati in questi ambienti sono persistenti, (indipendenti dalla evoluzione e durata dei sistemi hardware e software). Molte applicazioni “non standard” dei DB sono emerse negli ultimi 15 anni e riguardano i database spaziali, le immagini, il computer-aided design (CAD) e il manifacturing-aided design (CAM), il DB testuale, l’ingegneria del software e la bionformatica. Un database può essere visto come un unico o più file immagazzinati su un device di memoria (disco). Un Data Base Management System (DBMS) è una raccolta di software che gestisce la struttura del DB e controlla l’accesso dei dati che sono immagazzinati nel database. Generalmente parlando un DBMS facilita il processo di: Definire un database; cioè specificare il tipo di dato, la struttura ed i constraint che devono essere considerati Costruire il database; cioè immagazzinare i dati all’interno di memorie persistenti 62 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Manipolare il database Interrogare il database per recuperare dati specifici Aggiornare il database (changing value) Un DBMS dipende dal fondamentale concetto della indipendenza dei dati. L’utente interagisce con la rappresentazione dal reale immagazzinamento fisico, ed il DBMS è incaricato di tradurre le manipolazioni dell’utente in efficienti operazioni sulla struttura fisica dei dati. Questo meccanismo si ottiene attraverso l’uso di differenti livelli di astrazione. E’ comune nei DB distinguere tre livelli di ambiente dei sistemi: Il livello fisico che si occupa dell’immagazzinamento delle strutture il livello logico che definisce la rappresentazione dei dati proposta all’utente il livello esterno che corrisponde ad una parziale vista del database fornita in una particolare applicazione La distinzione tra il livello fisico ed il livello logico è centrale nel campo dei database. Questa separa chiaramente i compiti funzionali al sistema dalle rappresentazioni e sistemi di manipolazioni semplificate che sono offerte all’utente (Fig.2-45). Fig. 2-45- Schematizzazione dell’ambiente di sistema di un DBMS 2.3.1.2 Conoscere le strutture logiche dei DBMS nei GIS (SIT). Ciascun DB consiste di strutture logiche di memorizzazione, per immagazzinare e gestire i dati, (tabelle, indici, etc.) e di strutture fisiche di memorizzazione che contengono le strutture logiche. Un DBMS fornisce la capacità a diversi utenti di condividere i dati ed i processi che li riguardano. Dal momento che possono esistere diversi utenti, ci sono diverse esigenze che riguardano il db. La domanda che ne consegue è come può un singolo database rispondere alla esigenze di molti utenti. Un DBMS minimizza questo problemi fornendo due “viste” (modalità di visualizzazione) dei dati registrati nel db: una vista esterna detta LOGICA ed una vista interna detta FISICA. La vista logica è 63 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS la vista a cui accede l’utente e le strutture logiche sono appunto le strutture utilizzabili dallutente per interagire con i dati; queste strutture rappresentano i dati per l’utente in modo che essi siano significativi sia per quest’ultimo che per i programmi dedicati al processing dei dati. Con la visualizzazione logica gli utenti possono vedere i dati differentemente da come essi sono in effetti memorizzati nel db, ed è loro consentita la manipolazione dei dati senza conoscere i dettagli tecnici della registrazione fisica. In questo senso una delle principali capacità dei DBMS è che mentre può esiste all’interno di un db una sola modalità di registrazione fisica dei dati, possono esistere una serie(teoricamente) infinita di viste logiche. In pratica la vista logica è la modalità con cui gli utenti si riferiscono ai dati, mentre la vista fisica è la modalità con cui i dati sono elaborati e registrati. In un dbms spaziale o in un applicativo GIS come ArcGis™ l’accesso ai dati tramite il modulo ArcCatalog™ permette di utilizzare le strutture logiche del software per interagire con i dati a diversi livelli, prescindendo dalle modalità di registrazione fisica che talora possono anche essere molto diverse tra loro; basti pensare alle modalità di registrazione delle Coverage, degli Shapefile o delle Feature Class nel Geodabase. 2.3.1.3 Conoscere le principali operazioni sui dati contenuti in un DBMS (selezione, inserimento, aggiornamento, eliminazione). SELEZIONE Le operazioni sui dati contenuti in un DBMS sono realizzate tramite l’uso del linguaggio "Structured Query Language". E’ un linguaggio con varie funzionalità: contiene sia il DDL (data definition linguage) sia il DML (data manipolation linguage).Esistono varie versioni di SQL. Il comando fondamentale di SQL è SELECT. La struttura essenziale di una SELECT è la seguente SELECT ListaAttributi FROM ListaTabelle [ WHERE Condizione ] Le tre parti di cui si compone un‘istruzione SELECT vengono spesso chiamate clausola „SELECT“ (detta anche target list), clausula „FROM“ e clausula „Where“. Le forme del comando SELECT sono moltissime; qui vedremo la sintassi principale; per una più approfondita esemplificazione dell’uso del comando SELECT si rimanda al Modulo 3. La forma più semplice di SELECT è la seguente: SELECT colonna1, colonna2 FROM tabelle WHERE (condizioni) ORDER BY colonna1, colonna2 Quindi è essenziale specificare le colonne (campi o attributi) da visualizzare, la tabella sorgente, eventuali condizioni ed eventuale ordine. Invece di scrivere un elenco di colonne è possibile scrive * che indica tutte le colonne della tabella. Per visualizzare una intera tabella si scrive il comando: SELECT * FROM studenti; Per visualizzare un sottoinsieme di colonne, orinate secondo un certo criterio (l’età in questo caso) si scrive il comando: SELECT nome, eta FROM studenti ORDER BY eta 64 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Possiamo scegliere di visualizzare solo alcune righe per tabella: SELECT nome FROM studenti WHERE eta < 30 AND codice_corso = 1; In questo esempio le condizioni imposte sono due: gli student che siano più giorvani di 30 anni e che abbiamo sostenuto l’esame avente codice_corso = 1 (es. Analisi Matematica) INSERIMENTO I comandi che permettono la modifica dei dati in una tabella sono INSERT : inserisce righe in una tabella DELETE: cancella le righe di una tabella UPDATE: Modifica i dati di una riga di tabella La struttura del comando INSERT è la seguente: INSERT INTO nome_tabella (nome_colonna1, nome_colonna2, …) VALUE (valore1, valore2,..) Bisogna specificare la tabella, l’elenco delle colonne, che vogliamo inserire, quindi l’elenco corrispondente dei valori. CANCELLAZIONE (ELIMINAZIONE) Il comando DELETE permette di cancellare le righe di una tabella; la sua forma più semplice è: DELETE FROM nome_tabella; Questo comando elimina tutte le righe dalla tabella. La forma che invece viene solitamente utilizzata è: DELETE FROM nome_tabella WHERE condizione; La specifica condizione permette di eliminare solo quelle occorrenze che rispettano la condizione: DELETE FROM studenti WHERE eta<30; AGGIORNAMENTO I dati si modificano con il commando UPDATE. La struttura del comando UPDATE è: UPDATE nome_tabella SET nome_colonna=valore WHERE (condizione) EsempioU UPDATE studenti SET codice_corso=2 WHERE nome=’rossi giorgio’ 2.4 Analisi dei dati 2.4.1 Analisi spaziale 2.4.1.1 Conoscere le analisi spaziali tipiche sui dati raster. La sovrapposizione di dati raster 65 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS I dati raster sono costituiti di celle equidimensionali regolarmente spaziate; conseguentemente non c’è formazione di “sliver polygon” come nel caso della sovrapposizione vettoriale e non esiste la necessità di distinguere fra poligoni, linee e punti perché i dati raster sono esclusivamente composti di celle. L’analisi dei dati raster varia da semplice a molto complessa, principalmente a causa della semplicità e flessibilità del modello dati raster. Come è stato definito i dati raster sono basati su insiemi di dati omogenei e bidimensionali e da strutture di dati che sono utilizzate da molti linguaggi informatici inclusi quelli di prima generazione. MAP ALGEBRA La Map Algebra è la combinazione “cella-cella” degli strati informativi raster. La combinazione richiede l’applicazione ai dati raster di un insieme di funzioni locali e di prossimità e di una minore quantità di funzioni globali. Il concetto della Map Aplgebra si basa sulla semplicità e flessibilità della struttura di immagazzinamento dei valori delle griglie raster. Ogni numero rappresenta un valore nella esatta posizione della cella raster. Le semplici operazioni aritmetiche (addizione, sottrazione, moltiplicazione) possono essere realizzate tramite i numeri immagazzinati da un insieme di dati raster che abbiano la stessa risoluzione spaziale: per ogni posizione, i valori delle corrispondenti celle raster forniscono i fattori delle operazioni aritmetiche in questione. La Map Algebra prevede l’esecuzione di operazioni tra uno o più strati informativi: unaria (unary), sono le operazioni applicate ad un solo layer, binarie (binary) sono le operazioni applicate a due layer ed infine operazioni di ordine superiore implicano più strati informativi. Una semplice operazione su un solo strato informativo (unaria) applica la funzione ad ogni cella del raster e registra il valore calcolato su un raster di ouput. La Fig.2-46 illustra il risultato di una moltiplicazione x 2 di ogni cella. Ogni cella che rappresenta il risultato della operazione Outlayer=Inlayer x 2, viene posizionato dove si trova la cella su cui è stata eseguita l’operazione. Fig. 2-46 (da Bolstad, 2008) – Esempio di operazioni raster. A sinistra ogni cella del raster è moltiplicata per il valore 2 ed il valore risultante è inserito nella cella corrispondente. A destra è illustrata una operazione di addizione tra due raster Sono possibili altri tipi di operazioni quali elevazione a potenza, divisione, conversione, etc. Le operazioni binarie sono simili a quelle descritte, con la differenza che implicano più dati strati informativi ed il calcolo avviene tra le celle che occupano la stessa posizione. La somma tra due layer può essere descritta come segue: sumlayer = layer A + layer b 66 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Il raster risultante avrà le celle nelle stesse posizioni di quelli di partenza, con la caratteristica che ogni cella del raster risultante sarà la somma dei valori delle celle in ingresso. Negli esempi riportati in Fig. 10.1 i due layer utilizzati hanno la stessa risoluzione e la stessa estensione spaziale. Questo può non essere sempre vero ed in questi casi è necessario ricorrere al ricampionamento degli strati informativi per ottenere la stessa risoluzione e la stessa estensione spaziale (Fig. 2-47). Fig. 2-47(da Bolstad, 2008) – esempio di dati raster con diversa risoluzione spaziale Nel caso in cui la sovrapposizione dei due raster non sia completa (cioè i due raster non si ricoprano identicamente), nelle celle prive di dati il nuovo strato informativo sarà caratterizzato da celle recanti i valori “no data” oppure un valore convenzionale tipo “-9999”. Come le operazioni tramite dati vettoriali, le operazioni raster sono classificabili come locali, di prossimità o vicinanza (dette anche funzioni focali) e globali (dette anche funzioni zonali). Le operazioni locali sono utilizzate soltanto per i dati in cella singola, le operazioni di prossimità sono basate sui dati di un insieme di celle, le operazioni globali utilizzano tutti i dati da ogni singolo layer di dati (Fig. 2-48) 67 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-48 (da Bolstad, 2008) – Esempio di applicazioni di funzioni locali e globali in dati raster 2.4.1.2 Conoscere le analisi spaziali tipiche sui dati vettoriali su singolo strato informativo. La principale funzione di analisi spaziale su un singolo layer è il BUFFER (Fig. 2-49). Il Buffer è una delle più utilizzate funzioni di prossimità. Il buffer è un’area di rispetto, ampia a piacere, creata attorno ad ogni occorrenza di uno strato vettoriale, sia esso costiuito da punti, linee o poligoni. E’ una delle funzioni di analisi spaziale più utilizzata 68 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-49 – Funzione di Buffer 2.4.1.3 Conoscere le analisi spaziali tipiche sui dati vettoriali su più strati informativi Una delle forme più semplici di processing integrato delle geometrie e degli attributi è quello di selezionare un’entità grafica sul monitor e chiedere al sistema di mostrare le informazioni registrate nel DB. Una volta ricevuta l’ordine d’interrogazione, il GIS cerca all’interno del DB gli attributi dell’entità selezionata; le informazioni possono successivamente essere trasferite in altri programmi o stampate. Una forma di processing avanzato è basata sulle condizioni che ogni tipo di entità venga rappresentata sia geometricamente sia nella tabella degli attributi e che la geometria sia esprimibile attraverso una carta tematica. Tutte le carte tematiche che esprimono le caratteristiche dei diversi attributi possono essere “sovrapposte” e integrate l’una con l’altra, per elaborare una carta tematica finale contenente tutte le informazioni geometriche di ognuna delle carte sovrapposte. Inoltre la carta finale integrata è costituita da una nuova tabella comprensiva di tutti gli attributi (Fig.2-50). La sovrapposizione topologica (“overlay” topologico) di poligoni La sovrapposizione di poligoni è un’operazione spaziale nella quale un layer tematico contenente poligoni viene sovrapposto a un altro per formare un nuovo layer con altri poligoni. Gli angoli di ogni nuovo poligono sono le intersezioni tra i lati dei poligoni originari giacenti su i diversi layer, per questo il calcolo di tutte le possibili intersezioni può richiedere al computer molto tempo. Se le aree sono già registrate nel computer come secondo un modello topologico le aree da calcolare ex novo sono ridotte, e ridotto e anche il tempo impiegato dal computer. Le nuove intersezioni sono identificate come nodi e le linee come connessioni (“links”) tra questi ultimi; i nuovi nodi e le connessioni costituiscono la nuova struttura topologica. 69 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig.2-50– Una sovrapposizione computerizzata può essere assimilata a una serie di carte sovrapposte. Questa sovrapposizione porta a una espansione della tabella degli attributi oltre che a una variazione della geometria. Per esempio, consideriamo il poligono C4 della Fig. 2-51 che risulta dalla combinazione del poligono C e del poligono quattro. Il sistema non potrà associare attributi con C4 se non esista una topologia associata con i dati originari e i nuovi dati. Con la topologia associata ai nuovi dati, il sistema riconosce che il poligono C4 comprende 22 linee e parte della linea 23 e della linea uno. Inoltre il sistema “è avvertito” che il poligono quattro è sulla parte destra della linea 22 e sulla parte sinistra della linea 23 e che il poligono C è sulla parte sinistra del poligono uno. In conformità a queste informazioni il sistema “è informato” che il poligono C4 è una composizione del poligono quattro e del poligono C sia geometricamente che in termini d’attributi. 70 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-51– Esempio di sovrapposizione topologica di strati informativi: il poligono C4 è composto dall’intersezione del poligono C e del poligono quattro. Ogni nuovo poligono è un nuovo oggetto che è rappresentato da una nuova fila (un “record”) nella tabella degli attributi (FAT).Ogni nuova occorrenza ha un nuovo attributo, che è rappresentato da una nuova colonna nella tabella degli attributi. La sovrapposizione e la comparazione di due “data set” di diversa accuratezza geometrica portano spesso alla formazione di un grosso numero di piccoli poligoni. Questi piccoli poligoni detti “sliver polygon” possono essere rimossi successivamente utilizzando le loro caratteristiche d’area, forma e altri criteri informativi. Una delle procedure più utilizzate per rimuovere questi poligoni è quella di accorparli a quelli di maggiore area che gli sono vicini (Fig. 2-52). Figura 2-52 – La topologia dei dati deve essere completata prima della loro sovrapposizione. Oltre ad eseguire una sovrapposizione geometrica e informativa di poligoni, il sistema può presentare un nuova immagine della nuova struttura dei dati, eliminando i bordi tra i poligoni che hanno lo stesso significato (ad esempio i poligoni riferiti alla stessa unità geologica). Questo processo d’accorpamento può essere automatico oppure controllato dall’utente. La procedura generale per una sovrapposizione di poligoni è la seguente: 1. Calcolo dei punti d’intersezione 2. Formazione dei nodi e delle connessioni (link) 3. Definizione della topologia e dei conseguentemente dei nuovi oggetti 4. Rimozione degli “sliver polygon” in eccesso e, se necessario, dissoluzione dei limiti tra i poligoni d’uguale significato 5. Compilazione dei nuovi attributi La sovrapposizione di poligoni può essere utilizzata per ritagliare una “finestra geografica” in un database; per esempio “ritagliare” le informazioni del database esattamente lungo i limiti amministrativi della città. Infine elenchiamo i tre tipi fondamentali di sovrapposizione tra poligoni UNIONE INTERSEZIONE IDENTITA’ Queste operazioni differiscono soltanto nelle caratteristiche spaziali del risultato finale (Fig. 2-53) 71 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-53 - I tre diversi tipi di sovrapposizione poligonale (da ESRI, Understanding GIS) Altri tipi di sovrapposizione spaziale comprendono: Punti su poligoni Linee su poligoni Punti su poligoni Nello stesso modo delle entità poligonali anche le entità puntuali possono essere sovrapposte ai poligoni: il risultato sarà un nuovo set di punti che ricevono gli attributi dei poligoni entro cui sono compresi (Fig.2-54). Fig. 2-54- Sovrapposizione di punti su poligoni 72 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Linee su poligoni Gli archi possono essere sovrapposti ai poligoni: il risultato sarà un nuovo set d’archi contenenti gli attributi degli archi originari e dei poligoni cui sono stati sovrapposti (Fig. ). Tutte queste sovrapposizioni sono simili a quelle utilizzate nel caso della sovrapposizione poligonale: calcolo delle intersezioni, formazione dei nodi e delle intersezioni, formazione della topologia e infine aggiornamento delle tabelle delle attributi (FAT: “Feature Attribute Table”). Fig. 2-56 - sovrapposizione di linee su poligoni 2.4.1.4 Saper distinguere le procedure di calcolo di distanze ed aree nel modello vettoriale e raster. Le procedure di calcolo dei parametri geometrici fondamentali di linee e poligoni differiscono profondamente nelle due tipologie di dati raster e vettoriale. Nel modello vettoriale tali valori sono calcolati in base alle caratteristiche geometriche della stessa feature e sono riportati nella tabella degli attributi. Nel Geodatabase in particolare,(come anche nelle Coverage), tali valori sono automaticamente aggiornati quando si adottano delle variazioni di forma e lunghezza che incidono su aree e distanze. Nei dati raster una tale procedura non è possibile in quanto non esistono primitive geometriche ma solo pixel geometricamente indipendenti l’uno dall’altro. Per calcolare lunghezze, distanze e aree in questi casi si deve ricorrere ai metodi di analisi spaziale (intersecando strati vettoriali con strati raster, oppure alle operazioni di map algebra sopra descritte), oppure attraverso le funzioni di analisi e misura di cui sono dotati gli applicativi GIS. 2.4.2 Analisi basate sugli attributi 2.4.2.1 Conoscere il processo di selezione di oggetti in funzione degli attributi. Delle operazioni di SELECT si è parlato nei paragrafi precedenti; vediamo ora altre operazioni di ricerca basate sugli attributi. Operazioni logiche Le selezioni o ricerche logiche in un database impiegano normalmente l’algebra d’insieme o l’algebra Booleana. 73 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS L’algebra degli insiemi (set algebra) usa tre tipi d’operatori: uguale a (“eq” o “=”), maggiore di (“ge” o “>”), minore di (“lt” o “<”) e una combinazione tra questi operatori, perciò il risultato finale è: =, >, <, >, <, Questi operatori sono inclusi nel inguaggio Structured Query Linguage (SQL). Le entità possono essere selezionate o riclassificate in base ai loro attributi gli operatori algebrici sopradescritti e le regole dell’algebra Boolena che sono incorporati nei linguaggi di database come ad esempio il SQL. L’algebra Booleana usa gli operatori logici AND, OR, XOR, NOT per determinare se una particolare condizione è vera o falsa. Ogni attributo è pensato come se definisse un insieme di valori. L’operatore AND è l’intersezione di due insiemi di valori (quelle entità che appartengono ad A e B); l’operatore OR è l’unione dei due insiemi (quelle entità che appartengono sia ad A sia a B); l’operatore NOT rappresenta la differenza, in altre parole identifica quelle entità che appartengono ad A ma a B; l’operatore XOR identifica le entità che appartengono esclusivamente ad A o a B, ma non a entrambi gli insiemi di dati. Questo semplice insieme di relazioni sono spesso rappresentate visivamente nella forma del diagramma di Venn (fig. 42). Notare che tutte le operazioni logiche viste possono essere applicate a tutti i tipi di dati, siano essi booleani, nominali, ordinali, scalari o direzionali. Due semplici esempi illustrano i principi esposti. Consideriamo di avere a disposizione un database spaziale di tipo immobiliare. Una tipica interrogazione che può essere posta da un acquirente è la seguente: “trovare la localizzazione di tutte le case il cui costo è compreso tra Euro 200.000 e Euro 400.0000 con quattro stanze da letto e una superficie complessiva di 300 m2”. Se il database contiene i dati presenti nella richiesta, allora la risposta può essere facilmente ottenuta impostando una query principalmente basata sull’operatore AND, e sugli operatori algebrici =, >, <, >, <,. La sintassi esatta è la seguente (si noti l’impiego di IF e THEN) IF COST GE 200000 AND COST LT 400000 AND BEDROOM_N° = 4 AND PLOT_AREA GE 300 THEN ITEM=1 ELSE ITEM=0. Dove: IF e THEN : sono un operatori che descrivono l’istanza di ricerca (esempio: SE il costo è maggiore di….. e il n° di stanze è uguale a ……..e la superficie è maggiore di ….. ALLORA ……) ITEM=1 ELSE ITEM =0: nel caso che l’istanza di ricerca sia VERA alle entità che rispondono ai requisiti sarà assegnato nel campo denominato ITEM un valore = 1, oppure nel caso che l’istanza di ricerca sia FALSA alle entità che non rispondono ai requisiti assegnato nel campo denominato ITEM un valore = 0. GE, LT, = : operatori di “Set Algebra” COST, BEDROOM_N°, PLOT_AREA, ITEM: Campi presenti nel data base. Consideriamo ora un’interrogazione rivolta alla classificazione di uso del suolo. In un database di uso del suolo, ogni unità cartografata può avere un attributo che descrive la tessitura e il Ph del terreno. Se consideriamo un insieme A delle unità cartografate che chiamiamo “Cerrado” (una denominazione di uso del suolo), e B costituisce un insieme di unità cartografiche in cui il Ph del suolo è superiore a sette, allora le seguenti sintassi esprimono: X= A AND B trova tutte le occorrenze in cui il “Cerrado” ha un Ph >7 X= A OR B trova tutte le occorrenze di “Cerrado”, e tutte le occorrenze in cui il suolo ha un Ph >7 74 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS X= A XOR B trova tutte le occorrenze che sono o “Carrado” o hanno un suolo con Ph>7 X= A NOT B trova tutte le occorrenze che sono o “Carrado” o hanno un suolo con Ph<7 Alle occorrenze selezionate si può assegnare un nuovo valore (es. “suolo utilizzabile”) attraverso una sintassi del tipo “IF …..THEN” con una sintassi del tipo: “Assegna il valore “Utilizzabile” a tutte le unità cartografate in cui tessitura_suolo = Cerrado and Ph>=5.5”. Notare l’utilizzo degli operatori IF e THEN: IF (SE) la condizione C è vera THEN (Allora) esegui il compito specificato (assegna il valore “Utilizzabile”). Fig.2-57 – Diagramma di Venn mostrante il risultato dell’applicazione della logica Boleana alla unione e intersezione di due o più insiemi. In tutti i casi l’area in nero rappresenta la condizione “TRUE” (vera) Si noti che a differenza degli operatori aritmetici gli operatori Booleani non sono commutativi. Il risultato della sintassi “A AND B OR C “ dipende dalla priorità di AND rispetto ad OR. Le parentesi sono utilizzate per indicare un chiaro ordine di valutazione, quando ci sono più di due insiemi (Fig.257). Per esempio se l’insieme C contiene unità cartografiche di suolo scarsamente drenato, allora la sintassi : X=(A AND B) OR C seleziona tutte le unità cartografiche di “Cerrado” insieme a quelle un suolo con Ph >=7 e un drenaggio scarso. Aspetti spaziali degli della selezione mediante operatori booleani 75 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS L’esecuzione di una selezione logica e di una riclassificazione degli attributi non-spaziali di entità geografiche produce uno scarso effetto sull’immagine cartografica, eccetto che in termini di simbolismi e elaborazione dei limiti. La computazione di un nuovo attributo, secondo una selezione logica richiede la preparazione di una legenda e la “ricolorazione” delle entità selezionate (Fig.2-58). Quando la selezione individua poligoni adiacenti con lo stesso significato, può essere utile la dissoluzione del limite tra queste entità, in modo da ottenere una carta generalizzata (Fig. 2-59). Gli operatori Booleani non sono solo applicabili agli attributi non-spaziali delle entità geografiche, perché loro sono applicabili anche alla localizzazione geografica e agli attributi spaziali delle entità. Ad esempio si potrebbe richiedere l’individuazione delle unità cartografiche che hanno una superficie superiore a cinque ha, con un particolare tipo di suolo con un Ph>7.0. Una ricerca più complessa potrebbe coinvolgere la forma dell’area, le caratteristiche dei limiti dell’area in rapporto alle aree vicine (come ad esempio le aree verdi che bordano quelle urbane). In questi casi i risultati della ricerca produrrebbero un effetto anche sul pattern spaziale delle entità e non solo sugli attributi non-spaziali. Fig.2-58 –La ricerca delle entità sulla base di attributi presenti nel DB oppure la creazione di nuovi attributi sulla base di operazioni su quelli già presenti, non cambia la forma ma solo la colorazione dei poligoni. Lo stesso succede nel caso di operazioni di ricerca “punti entro poligoni, utili per ricercare i poligoni che racchiudono punti. 76 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-59 – Se durante una ricerca o una riclassificazione, due poligoni adiacenti ricevono lo stesso codice, il limite tra i due poligoni può essere dissolto, fino ad ottenere una carta “generalizzata”. PROCESSING DEGLI ATTRIBUTI : OPERAZIONI ARITMETICHE SEMPLICI E COMPLESSE SUGLI ATTRIBUTI DELLE SINGOLE ENTITÀ I nuovi attributi possono essere computati utilizzando tutte le normali regole aritmetiche (+, -, /, *, lg, exp, le funzioni trigonometriche, e tutte le combinazioni che includono modelli matematici complessi). Le funzioni aritmetiche e trigonometriche possono essere utilizzati su dati scalari e certi tipi di dati cardinali. Le operazioni aritmetiche su tipi di dati Booleani e nominali non hanno senso (un’espressione come X=sqrt (Londra) non ha significato). Alcuni esempi ipotetici di calcolo di nuovi attributi per una data area amministrativa (entità poligonale) sono: L’incremento di popolazione = Popolazione 1990 – Popolazione 1980 Il totale della spesa per l’energia elettrica = Incasso medio x n° di persone La produttività media di prodotti agricoli (es. grano) = Quantità totale / n° delle fattorie La produttività media prevista = f(crop) (Dove f è un modello matematico complesso che calcola la produttività in funzione dell’umidità, della fertilità del suolo ecc.) L’allocazione di classi = Risultato di una classificazione multivariata (dove la classificazione multivariata potrebbe essere un criterio statistico per elaborare gli attributi delle entità) 2.4.2.2 Conoscere l’utilità delle relazioni e collegamenti tra tabelle. Il modello relazionale è basato su valori e dettagli su questo modello e sul Join sono stati forniti nel paragrafo 2.2.1.3 (Conoscere i concetti di modello concettuale, modello logico, modello fisico). Di seguito vengono schematizzate le principali caratteristiche dell’operatore Join. I riferimenti fra dati in relazioni diverse sono rappresentati per mezzo di valori dei domini che compaiono nelle ennuple (Fig. 2-60) 77 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-60 – Esempio di collegamento tra tabelle basato sui valori di un campo chiave (Da Atzeni et al, 2006) Campo/i Chiave Insieme di attributi che identificano le ennuple di una relazione Definizione di Join Il join è l'operatore più interessante dell'algebra relazionale permette di correlare dati in relazioni diverse; attraverso questo operatore le tabelle possono essere collegate in modo da fornire una informazione completa. Esempio: Prove scritte in un concorso pubblico (Fig. 2-61) I compiti sono anonimi e ad ognuno è associata una busta chiusa con il nome del candidato Ciascun compito e la relativa busta vengono contrassegnati con uno stesso numero Fig. 2-61 – applicazione del Jooin per ricostruire il collegamento tra tabella 2.4.2.3 Conoscere i principali elementi di statistica, quali concetti di media, deviazione standard, minimi quadrati, scarto quadratico medio. MEDIA In statistica la media è un insieme di indicatori di posizione, anche se spesso con questo termine si intende la media aritmetica 78 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Le principali medie sono la media aritmetica la media geometrica la media armonica la media di potenza le quali a loro volta possono essere semplici ponderate Nella lingua italiana, in statistica, spesso viene chiamata media (intendendo implicitamente "aritmetica") ciò che realmente si chiama Valore atteso, in quanto vengono calcolati nello stesso modo, ma hanno significati teorici differenti: per taluni la media aritmetica viene applicata soltanto nella statistica descrittiva e il valore atteso nell'ambito della probabilità e delle variabili casuali in particolare. La formula della media è: ovvero La media, come tutti gli indici di posizione, ci dice all'incirca l'ordine di grandezza (la posizione sulla scala dei numeri, appunto) dei valori esistenti. In particolare dice che: se abbiamo N valori, con media Ma, allora per conoscere la somma di tutti questi valori è sufficiente moltiplicare N con Ma. Ci permette così di avere un'idea della quantità complessiva conoscendo soltanto il valore medio e quanti valori ci sono. Che si tratti di un indicatore di posizione lo si verifica facilmente, in quanto se aggiungiamo a tutti i valori una stessa quantità allora la media è anch'essa aumentata di quella stessa quantità. Inoltre, se moltiplichiamo tutti i valori con un determinato numero, allora anche la media aritmetica viene moltiplicata con tale numero. DEVIAZIONE STANDARD La deviazione standard (in inglese: standard deviation) o scarto tipo o scarto quadratico medio è un indice di dispersione (vale a dire una misura di variabilità di una popolazione o di una variabile casuale) derivato direttamente dalla varianza, ha la stessa unità di misura dei valori osservati (mentre la varianza ha come unità di misura il quadrato dell'unità di misura dei valori di riferimento). La deviazione standard misura la dispersione dei dati intorno al valore atteso (Fig. 2-62). 79 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-62- Rappresentazione grafica della deviazione standard in un data set con una media di 50 (in blu) e una deviazione standard (σ) di 20. MINIMI QUADRATI Il metodo dei minimi quadrati (in inglese OLS: Ordinary Least Squares) è una tecnica di ottimizzazione che permette di trovare una funzione che si avvicini il più possibile ad un'interpolazione di un insieme di dati (tipicamente punti del piano). In particolare la funzione trovata deve essere quella che minimizza la somma dei quadrati delle distanze dai punti dati. Questo metodo va distinto da quelli per l'interpolazione dove si richiede che la funzione calcolata passi esattamente per i punti dati. L'utilizzo più frequente è nell'approssimare l'andamento di dati sperimentali con linee di tendenza. SCARTO QUADRATICO MEDIO Lo scarto quadratico medio σ (sigma) di una distribuzione è la media quadratica degli scarti dei singoli dati dalla loro media aritmetica M. Indicati con x1 x2,...,xn i dati, con M la media aritmetica e con σ lo scarto quadratico medio si ha: Lo scarto quadratico medio è un numero sempre positivo ed è nullo solo se tutti i valori sono uguali tra loro. (da Wikipedia, 2009) 80 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS 2.4.2.4 Saper distinguere i principali metodi di classificazione (quali quantili, deviazione standard, interruzioni naturali). QUANTILE Nella classificazione per Quantili, ogni classe di legenda un egual numero di occorrenze. Una classificazione per quantili è adatta ad una distribuzione lineare dei dati. Poiché le occorrenze sono raggruppate per numero in ogni classe, la mappa risultante può essere fuorviante. Utilizzando questa modalità di classificazione occorrenze molto simili possono essere poste in classi adiacente (ma comunque diverse), così come occorrenze con valori molto diversi tra loro possono essere inserite nella stessa classe. Si possono minimizzare tali distorsioni incrementando il numero di classi (Fig. 263) Fig. 2-63 – Esempio di classificazione per quantili Deviazione standard Questa classificazione mostra quanto i valori delle occorrenze variano rispetto al valore medio; le divisioni tra le classi sono create sulla base di questi valori. In genere una legenda di colori (color 81 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS ramp) a due colori enfatizza i valori che i trovano al di sopra e al di sotto della media (Fig. 2-64). Fig. 2-64 – Esempio di classificazione per deviazione standard INTERRUZIONI NATURALI Le classi sono basate su raggruppamenti naturali inerenti ai dati. I punti di separazione di una classe corrispondono alle interruzioni di classificazione che raggruppano al meglio i dati tra loro simili; tali differenze naturali dei dati sono massimizzate per evidenziare al meglio le classi. Le occorrenze sono divise in classi i cui limiti sono posti in corrispondenza dei “salti” di valore più grandi (Fig. 2-65). Fig. 2-65 – Esempio di classificazione per interruzioni naturali (natural breaks) 2.5 Cartografia tematica 2.5.1 La rappresentazione tematica 2.5.1.1 Saper definire il termine carta tematica. 82 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS La cartografia tematica è una mappa che esprime uno specifico significato diverso dal normale contenuto di una carta topografica o geografica; tale significato prende il nome di tema. Nelle carte tematiche gli elementi topo-cartografici quali, orografia, idrografia, viabilità, toponomastica, centri urbani, etc., sono utilizzati come riferimenti per la georeferenziazione del tema specifico. Mentre la cartografia topografica si definisce come carta di base, la cartografia tematica spesso si definisce anche come cartografia derivata, in quanto il tema espresso dalla carta è spesso frutto di elaborazione o specifico rilevamento: ad esempio la cartografia geologica, la cartografia dell’uso del suolo, la cartografia della vegetazione o della forestazione, sono tipici esempi di cartografie tematiche che sono ottenute attraversi specifici rilevamenti di campagna, basati tutti sulla cartografia topografica di riferimento. In questo senso, la scala della cartografia topografica utilizzata per il rilevamento di questi temi, definisce la scala del rilevamento tematico. Il tematismo è quindi la rappresentazione del fenomeno su una cartografia raster o vettoriale nella quale tramite punti, linee o superfici associate a simboli, retini o colori si visualizza il risultato di un'analisi di qualità (uso del suolo, zone di piano regolatore, intensità del traffico su una strada, ecc.). La caratteristica principale attribuibile ad una cartografia tematica è quella di rendere immediatamente leggibili i differenti aspetti di un fenomeno diffuso sul territorio, con un approccio che associ la simbologia utilizzata per la rappresentazione all’andamento dello stesso. Questa tipologia di associazione viene definita Convenzione Geografica. Essa è da intendersi come assegnazione di codici cromatici per le unità indicate, in base a corrispondenza tra colori base e fattori principali. Si ottengono così delle carte che permettono di avere una visione d’insieme del territorio, con variazioni colorimetriche o di simbologia, facilmente e intuitivamente correlabili alla variazione nello spazio, di quello che si è scelto come tematismo. Si utilizzano metodi diversi per rendere visibili le variazioni del tematismo nello spazio (da Maiellaro, ITC-CNR-IT) 2.5.1.2 Saper elencare gli elementi fondamentali di una carta tematica. In linea di principio i cartografi utilizzano sei parametri grafici per la simbolizzazione dei fenomeni geografici (Fig.2-66): La dimensione La densità La tessitura Il colore L’orientazione La forma Questi sei parametri differiscono a seconda dell’applicazione - per esempio nell’illustrare le caratteristiche qualitative dei vari tipi di oggetti, come le specie vegetali, oppure le caratteristiche quantitative dei vari attributi, come l’intensità’ delle emissioni gassose, il numero degli abitanti, etc. La dimensione La variazione della dimensione dei simboli e’ il modo più semplice per illustrare le variazioni quantitative. Le dimensioni dei simboli possono essere definite in funzione delle intensità’ misurate. Anche alcuni tipi di diagrammi, come i diagrammi “a torta”, qualche volta possono essere utili a rappresentazioni cartografiche. In ogni caso, le differenze di dimensioni non sono sempre direttamente percepibili dall’occhio umano. Come nella maggior parte delle percezioni sensoriali, la differenza di intensità è ben percepita solo su base comparativa e esagerando le differenze: per questo il diametro di simboli circolari che rappresentano una data quantità deve essere quasi triplicato per esprimere i valori che sono solo raddoppiati. 83 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS La densità’ La scala dei grigi, o la variazione di densità, è il modo principalmente utilizzato per illustrare dati secondo una schema classificativo quantitativo. Come in tutti i parametri cartografici, c’è un limite inferiore alla dimensione che può essere percepita dall’utente. La scala dei grigi, ed esempio, non deve essere divisa in più di 10 classi, in modo da evitare che le classi vicine si confondano. Per essere percepita regolarmente, gli incrementi di grigio devono essere scalati come segue: (0%), 9%, 19%, 31%, 45%, 74%, 84%, 91%, 100%. Le proprietà della densità sono espresse in Fig. 2-67. La prima impressione e’ che siano rappresentate le varie intensità, mentre in realtà sono espressi solo dati qualitativi. Le aree più scure sono più facilmente percepibili delle aree chiare; questo mostra che la variazione di densità porta a una differente visualizzazione delle aree rappresentate. Le carte in cui sono utilizzati i simboli per coprire le aree sono spesso definite “choroplethe” dal greco “choros” (luogo) e “plethos” (intensità). I Colori I colori sono lo strumento migliore e il più elegante per distinguere le varie qualità dei dati cartografici. Sfortunatamente i colori sono spesso utilizzati senza criterio per tutti i parametri cartografici. Sebbene i colori siano spesso codificati in scale e utilizzati per indicare proprietà quantitative come area, dentista di popolazione, temperature mensili, grado di industrializzazione, etc., non esiste un loro utilizzo condiviso, nella rappresentazione di dati classificati. 84 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-66 – In linea di principio esistono 6 tipologie di parametri grafici che possono essere utilizzati per simbolizzare i fenomeni geografici; forma, orientazione, colore, tessitura, densità e dimensione. Il rosso, il blu, il verde e l’arancione potrebbero rappresentare i valori del 10, 20, 30 e 40 di una grandezza misurabile e riportata in carta, ma l’utente può interpretare correttamente i valori classificati solo se esiste una scala colorimetrica di 85 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS riferimento. Il tono dei colori è spesso relativo all’incremento quantitativo: colori di tonalità più forte indicano valori (della stessa categoria) più elevati. La variazione nei toni di un singolo colore è in effetti più comprensibile di una variazione di colori. In linea di principio i colori potrebbero essere variati con continuità in quanto lo spettro dei colori visibili è continuo. Comunque è praticamente impossibile ottenere una variazione continua dei colori su carta stampata. L’uso del colore consente spesso lo sfruttamento delle associazioni più comuni: ad esempio il rosso è comunemente associato con il pericolo e potrebbe essere utilizzato per indicare in carta le aree proibite. Figura 2-67 - Esempio di uso scorretto della densità dei parametri grafici. L’impressione che si ha guardando la carta ( a causa del figurato a righe) e che quest’ultima esprima valori quantitativi, mentre in realtà si riferisce a caratteristiche qualitative (tipologie vegetali). La Forma Le variazioni geometriche delle forme sono molto valide per indicare le differenze qualitative. L’uso delle forme non trasmette nessuna impressione generale, ma può essere utilizzato per trasmettere dettagli. Le forme sono normalmente utilizzabili per tutti i parametri cartografici. La tessitura Molto raramente la variazione della tessitura è utilizzata per una differenza qualitativa: solo nel caso di una maggiore concentrazione di punti si può trasmettere l’idea di una maggiore o minore intensità. L’orientazione I simboli lineari, nelle loro diverse orientazioni, sono utilizzati per illustrare le differenze qualitative. LA SELEZIONE DEI SIMBOLI CARTOGRAFICI Nella Fig. 2-68., i parametri cartografici, sono definiti in termini della loro percezione visiva, della loro capacità di distinguere tra diversi fenomeni e di rappresentare diverse classi. 86 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-68 – Illustrazione delle relazioni fra parametri grafici visivi e loro capacità a rappresentare le fenomenologie Nelle carte che contengono diversi parametri cartografici, il disegno basato sulle dimensioni dei simboli e in scala di grigio, sono più visibili dei disegni basati sulla forma del simbolo e a colori. I parametri cartografici possono essere combinati possono essere combinati per mostrare diversi fenomeni simultaneamente. Per esempio, l’impiego dei colori può essere variato nelle linee o nei punti utilizzati nel disegno. La scelta dei simboli cartografici è raramente semplice e le seguenti indicazioni possono servire da guida: 1. Individuare e separare quello che può essere espresso mediante simboli puntuali, lineari o areali 2. Considerare lo scopo finale della carta (turistica, geologica, applicativa, etc) 3. Considerare le caratteristiche dei parametri cartografici 4. Utilizzare i simboli di uguale impatto per rappresentare variabili di uguale importanza 5. Utilizzare simboli relativi per fenomeni relativi 6. Considerare i fenomeni visuali e le loro caratteristiche. Per esempio: La simmetrica dei simboli (strade, ferrovie) I simboli appaiono più piccoli quando sono circondati da simboli (anche di altra forma) più grandi Nel caso di due aree non separate da una linea di confine, la differenza del tono di colore tra le due aree viene incrementata (le aree più chiare sembreranno più chiare e viceversa) 7. La tradizione della simbolizzazione cartografica (es. il rosso significa pericolo, il blu significa acqua, etc), e gli standard esistenti. I più comuni errori nella rappresentazione cartografica includono: L’uso scorretto dei parametri cartografici Il colore di sfondo troppo intenso per i simboli da rappresentare in “primo piano” Eccessivo numero di temi diversi (qualitativi e quantitativi), da rappresentare Legenda inadeguata e materiale illustrativo insufficiente. Nelle carte che rappresentano diversi fenomeni, spesso presentano delle aree dove fenomeni adiacenti si sovrappongono. In questo caso i parametri grafici devono essere utilizzati attentamente, in modo che l’utilizzatore possa rapidamente comprendere la sovrapposizione e non interpretare i temi come fenomeni separati (Fig. 2-69). 87 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS Fig. 2-69 – In questa rappresentazione della diversificazione delle aree linguistiche, e delle aree di coesistenza nella stessa area di gruppi linguistici si hanno due inconvenienti: nello schema di sinistra, nella zona di sovrapposizione, si ha l’impressione dell’esistenza di un nuovo gruppo, mentre nello schema di destra la rappresentazione è chiara. 2.5.1.3 Saper distinguere i tipi di carte tematiche (quali coroplete, isoplete, a simboli proporzionali, a densità di punti). COROPLETE Nelle mappe di questo tipo sono rappresentati quantitativamente dei significati che si esprimono sul territorio, attraverso l’uso di classi a cui sono associati dei colori. La variazione dei colori esprima la variazione del significato: ad esempio in una carta della precipitazione su possono utilizzare colori più intensi per valori di precipitazione maggiori. La gamma di colori utilizzata prende nome di rampa dei colori. ISOPLETE Le mappe isoplete mostrano la distribuzione di un valore in termini di entità geometriche (spesso linee o poligoni), che collegano parti del territorio caratterizzate da valori uguali. Una importante differenza tra le mappe cloropete e isoplete consiste nel fatto che queste ultime tipologie di mappe non aggregano i valori all’interno di classi o entità predefinite. Le mappe isoplete possono essere di due tipi linee di uguale valore dell'attributo aree di uguale intervallo di attributo. SIMBOLI PROPORZIONALI E’ possibile rappresentare le quantità di un fenomeno su una mappa utilizzando una dimensione variabile dei simboli; ad esempio si possono utilizzare cerchi di dimensione variabile per rappresentare città con diversa quantità di popolazione. Anche in questo caso, quando si utilizzano simboli graduati, i valori quantitativi sono raggruppati entro classi e all’interno di una classe tutte le feature sono disegnate con lo stesso simbolo. DENSITÀ DI PUNTI Un altro metodo di rappresentazione dei fenomeni quantitativi è quello di utilizzare una mappa a densità di punti. Maggiore e’ la densità di punti all’interno di un’area, maggiore è l’entità del fenomeno in quel definito areale. Ogni punto ha rappresenta una definita quantità di valori, per esempio 1000 abitanti oppure 1000 automobili. I punti sono distribuiti casualmente all’interno di 88 Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della Pubblica Amministrazione della Regione Marche Dispense per il corso Modulo 2 – GIS ogni area e non rappresentano una localizzazione di feature. Più vicino sono i punti tra loro, maggiore è la densità di elementi in quell’area. 2.5.1.4 Comprendere i termini di mappe quantitative e qualitative. Le mappe quantitative esprimono in ogni punto della mappa una variazione quantitativa di un significato che si esprime con un parametro misurabile in valori numerici interi o decimali (es. una carta orografica o delle acclività). La mappa qualitativa individua invece delle categorie di dati che appartengono a classificazioni sistematiche che non si esprimo necessariamente attraverso valori numerici (es una carta geologica, geomorfologica, della forestazione) 89