GIS e Sistemi Informativi Territoriali: Corso ECDLGIS

Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
SCOPI DEL MODULO MODULO 2 – GIS
Il modulo 2 ha lo scopo di verificare le nozioni e le conoscenze del candidato relative alle
tecnologie di base specifiche per i GIS quali le periferiche specializzate e relativi formati, alle
componenti del GIS, al processo di schematizzazione della realtà nei sistemi informativi
geografici attraverso un appropriato modello dei dati, al concetto di topologia, all’analisi
spaziale applicata ai dati raster ed ai dati vettoriali descriventi campi continui ed entità
discrete della realtà.
2.1 Introduzione ai GIS (SIT)
2.1.1 Concetti e conoscenze di base
2.1.1.1 Conoscere il termine ed il concetto di GIS (SIT))
Il termine GIS è un acronimo in lingua inglese che significa GEOGRAPHIC INFORMATION
SYSTEM; la traduzione in lingua italiana è Sistema Informativo Geografico. Il termine di SIT è un
acronimo che significa SISTEMA INFORMATIVO TERRITORIALE.
Una definizione, generalmente accettata, di sistema informativo geografico è la seguente:
Una raccolta organizzata di dati geografici, apparecchiature (hardware e software) e personale
tecnico finalizzati a catturare, immagazzinare aggiornare, manipolare, analizzare e mostrare tutte le
forme di informazioni geograficamente referenziate (o geo-referenziate).
Altre definizioni collegate a quella di sistema informativo geografico sono riportate in Fig. 2-1
Fig. 2-1 – Alcune definizioni di GIS e argomenti correlati.
1
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
In altre parole un Sistema Informativo Geografico è un sistema computerizzato in grado di
immagazzinare e utilizzare dati riferibili ad aree della superficie terrestre.
I sistemi di informazione geografica sono costituiti di tre importanti componenti – l’hardware, i
moduli dell’applicazione software, un contesto operativo e organizzativo costituito da persone
esperte che richiedono di essere adeguatamente bilanciate perché tutto il sistema funzioni
correttamente.
L’uso dei sistemi informativi geografici è cresciuto notevolmente a partire dagli anni ‘80 ed in questo
momento essi rappresentano strumenti di lavoro comuni ai settori economici e finanziari, della
amministrazione pubblica e della ricerca.
Da questo punto di vista il GIS (cfr ESRITALIA.COM) è considerato da molti come uno degli
strumenti più potenti tra tutte le tecnologie dell’informazione, perché permette di integrare la
conoscenza da sorgenti di dati multiple e di creare un ambiente trasversale di collaborazione. Inoltre i
GIS sono strumenti intuitivi e cognitivi e uniscono a un potente ambiente di visualizzazione la
struttura analitica e di modellazione che ha le proprie radici nelle scienze della geografia. Queste
caratteristiche hanno come risultato una tecnologia basata sulla scienza, affidabile e facilmente
trasmissibile tra culture, classi sociali, lingue e discipline diverse.
Per supportare questa impostazione, i GIS devono potere essere visti secondo tre modalità diverse:
1. L’approccio dei geodati (cioè dati geografici): un GIS è un database spaziale, ossia un database
contenente dataset che rappresentano l’informazione geografica in termini di modello di dati
generico, e consente la gestione di elementi vettoriali (feature), immagini raster, attributi, topologie,
reti e così via
2. L’approccio geovisualizzazione: un GIS consente di costruire rappresentazioni geografiche
complete e complesse (mappe) in cui vengono visualizzati gli elementi geografici (feature) e le loro
relazioni spaziali con la superficie terrestre. Si possono costruire viste sul sistema informativo
sottostante, che sono utilizzate come finestre sul database sottostante, attraverso interrogazioni,
analisi ed editing dell’informazione geografica. Ogni GIS ha un insieme di applicazioni cartografiche
bidimensionali (2D) e tridimensionali (3D) che forniscono gli strumenti per potere interagire con
l’informazione geografica utilizzando questi differenti approcci.
3. L’approccio geoprocessing: un GIS è un insieme di strumenti operativi per l’analisi geografica e
l’elaborazione dell’informazione. Le funzioni di geoprocessing, a partire da dataset geografici
esistenti, consentono di applicare a essi delle funzioni analitiche e archiviare i risultati in nuovi
dataset. Il geoprocessing permette di programmare le attività e di automatizzare i flussi di lavoro
attraverso l’assemblaggio di sequenze ordinate di operazioni. Questi tre differenti approcci
costituiscono i fondamenti per un GIS funzionale e sono presenti, con modalità d’uso diverse, in
tutte le applicazioni a carattere geografico.
2
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
2.1.1.2 Sapere cosa differenzia i GIS (SIT) dai Sistemi Informativi in generale.
SIT è l'acronimo italiano di Sistema Informativo Territoriale, e viene spesso fatto coincidere con la
traduzione inglese Geographical Information System. Mogorovich (1988) ha definito il sistema
informativo territoriale "Il complesso di uomini, strumenti e procedure (spesso informali) che
permettono l'acquisizione e la distribuzione dei dati nell'ambito dell'organizzazione e che li
rendono disponibili nel momento in cui sono richiesti a chi ne ha la necessità per svolgere una
qualsivoglia attività" (da Wikipedia, 2009).
Senza addentrarci ulteriormente in questioni terminologiche una differenza tra il significato del
termine GIS e SIT può essere ottenuta sulla base delle definizione fornite dalle normative della
Regione Toscana, ovvero della L.R. 5/1995
…omissis…
Articolo 4 – SISTEMA INFORMATIVO TERRITORIALE.
La Regione, le Provincie e i Comuni singoli o associati partecipano alla formazione del sistema
informativo territoriale (S.I.T.).
Viene introdotto il Sistema Informativo Territoriale come uno strumento essenziale della politica
territoriale della Regione, Province e Comuni. La sua definizione è data successivamente.
Il S.I.T. costituisce il riferimento conoscitivo fondamentale per la definizione degli atti di governo
del territorio e per la verifica dei loro effetti.
La costruzione di un sistema informativo implica la definizione del quadro conoscitivo generale,
delle norme di classificazione e archiviazione dei dati, delle metodologie analitiche e degli obiettivi
da raggiungere per la salvaguardia ambientale
Sono compiti del S.I.T.:
a) l’organizzazione della conoscenza necessaria al governo del territorio, articolata nelle fasi della
individuazione e raccolta dei dati riferiti alle risorse essenziali del territorio, della loro
integrazione con i dati statistici , della georeferenziazione , della certificazione e finalizzazione,
della diffusione, conservazione e aggiornamento
b) la definizione in modo univoco per tutti i livelli operativi della documentazione informativa a
sostegno dell’elaborazione programmatica e progettuale dei diversi soggetti e nei diversi settori;
La registrazione degli effetti indotti dall’applicazione delle normative e delle azioni di
trasformazione del territorio
Il punto a) prevede l’individuazione del contesto disciplinare ( le discipline coinvolte) e conoscitivo (i
dati) necessari al governo del territorio. Ad esempio per i rischi naturali gli aspetti geologici, sismici,
vulcanologici, geomorfologici, geotecnici, geomeccanici etc, oltre ai vari aspetti urbanistici e sociali.
Sono talvolta indispensabili integrazioni con dati statistici ( ad esempio dati INSTAT). Tutti i dati
devono essere georeferenziati, ovvero riferiti a un comune sistema di riferimento geografico ( es.
Sistema nazionale Gauss Boaga, UTM o Cassini Soldner). I dati devono essere certificabili ovvero
ufficiali e “prodotti” con metodologie collaudate che rappresentino lo stato dell’arte del settore. E’
infine compito del S.I.T. la diffusione, la conservazione e l’aggiornamento dei dati. Questo
complesso di norme riguardanti i compiti del S.I.T. non obbliga a percorsi metodologici “standard”,
ma le sue finalità di fatto obbligano all’impiego di strumenti informatici evoluti come i Geographic
Information System.
Il punto b) obbliga alla definizione della documentazione informativa (istruzioni, indirizzi e norme
tecniche) a sostegno dell’elaborazione dei programmi e delle metodologie d’intervento. Ad esempio
la definizione delle strutture dati.
3
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Il punto c) obbliga a far confluire nel S.I.T. la registrazione degli effetti indotti dall’applicazione delle
normative e delle azioni di trasformazione del territorio.
Il S.I.T. è accessibile a tutti i cittadini e vi possono confluire, previa certificazione nei modi previsti,
informazioni prevenienti dagli enti pubblici e dalla comunità scientifica.
Il S.I.T. costituisce un pubblico servizio a cui possono accedere tutti i cittadini. Oltre
all’aggiornamento dei dati predisposti, possono essere inseriti anche altri dati provenienti da enti
pubblici o dalla comunità scientifica.
Questa definizione di SIT ci aiuta a comprendere come il sistema informativo territoriale sia in effetti
costituito da un insieme di dati e informazioni (georeferenziate) organizzate secondo un modello dati
e precise regole concernenti le operazioni di accesso, modifica, interrogazione, consultazione,
rappresentazione e diffusione dei dati. Tali operazioni si realizzano oggi concretamente tramite
l’impiego di strumenti informatici quali i Geographical Information System o i DBMS spaziali. Ecco
che una distinzione tra SIT e GIS appare ora più chiara: il SIT implica la definizione di un modello
dati e del contesto delle regole di gestione dei dati da parte del personale specializzato addetto alla
manutenzione e aggiornamento degli archivi, nonché della definizione delle regole di accesso da
parte degli utilizzatori. Il GIS propriamente detto può in sintesi essere inteso come la parte
informatica (nel senso delle procedure software) del sistema.
4
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
2.1.1.3 Conoscere i principali ambiti applicativi dei GIS (SIT).
Ambiti Applicativi
Gli Ambiti Applicativi di riferimento del GIS sono molteplici e interessano tutte le tipologie di
mercati di riferimento (di seguito descritti), sia nella Pubblica Amministrazione sia nelle aziende
industriali e di servizi. Molti tra i più significativi Ambiti Applicativi del GIS sono descritti nelle
pagine relative ai diversi Mercati, in modo da contestualizzarli nella realtà operativa del Business
specifico che supportano.
Alcuni Ambiti Applicativi specifici sono:
 il Geomarketing;
 la Logistica;
 la Business Intelligence;
 la Gestione delle reti tecnologiche e di Utilities;
 i Servizi LBSLocation Based Services) anche in prospettiva dei futuri sviluppi del settore
spaziale e, in particolare, dei servizi di localizzazione legati al nuovo sistema Galileo.
I principali settori produttivi (o mercati) di riferimento (Industries) in cui operano i GIS sono
elencati nella seguente Fig. 2-2:
Ingeneria
Commercio,
Comunicazioni,
Affari e Finanza
Difesa
e
servizio
informazioni
(Intelligence)
Istruzione
Ingegneria
Civile
Servizi bancari e
finanziari
Biblioteche
e musei
Rilevamen
to
topografic
o
e
cartografic
o
Gestione delle
infrastrutture e
servizi (reti)
Scuole
elementari e
medie
Assicurazioni
Scuole
medie
superiori e
Università
Stampa e mezzi
di informazione
Compravendite
immobiliari
Distribuzione al
dettaglio
Governo e
pubblica
amministra
zione
Salute
servizi
persone
Amministr
azione
pubblica
statale
e
periferica
Sviluppo
economico
Gestione
ambientale
Pubblica
sicurezza
Protezione
Civile
Risorse
naturali
Forestazion
e
Agricoltura
Coste
mari
Servizi
elettorali
Archeologia
Amministr
azione del
territorio
Cartografia
( a varia
scala)
Cavità
grotte
Lavori
pubblici
Pianificazi
one
territoriale
(urbana e
regionale)
e
alle
e
Conservazion
e
Trasporti
Servizi pubblici e
comunicazioni
Sistemi
di
allerta
computerizzati
Aviazione
Gas ed elettricità
e
Gestione delle
emergenze del
territorio
Autostrade
Servizi
localizzazione
base
Miniere e
cave
Gestione delle
emergenze
sanitarie
Logistica
Idrocarburi
ed energia
Sicurezza degli
interni
Ferrovie
Risorse
idriche
Autorità
giudiziaria
Porti e vie
marittime
Protezione dagli
incendi urbani
Gestione degli
incendi boschivi
e forestazione
Trasporti
Pubblici
e
Fig. 2-2 - I principali ambiti applicativi dei GIS (SIT).
5
di
di
Condotte
(oleodotti,
metanodotti,
acquedotti)
Telecomunicazion
i
Distribuzione
idrica
e
reti
tecnologiche
(fognature
e
depurazione)
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
2.1.1.4 Conoscere e saper distinguere le componenti di un GIS (SIT).
La componente Hardware
La componente hardware di un GIS è sinteticamente riportata nella Fig.2-3 il computer dispone di
un hard disk (disco rigido) su cui sono registrati i dati e i programmi e una memoria di maggiore
capacità su cui sono generalmente eseguiti i backup, disponibile via rete o mediante altro
collegamento; i sistemi di backup più utilizzati sono i nastri magnetici e i CD-ROM. Un tavolo
digitalizzatore (tavoletta grafica) o uno scanner sono utilizzati per l’input dei dati, cioè per la
conversione in formato digitale (numerico, analogico ecc.) dei documenti “cartacei” (disegni,
tabulati, testi, grafici, immagini).
I plotter, le stampanti e ogni tipo di apparecchiatura che serve alla realizzazione di stampe,
rappresentano le attrezzature per l’output. La comunicazione tra i computer è realizzata attraverso
reti locali (LAN), settoriali o di gruppo (Intranet) e globali (Internet); la comunicazione con il
computer cui sono collegati i nodi delle reti (server) è spesso ottenuta mediante reti in fibra ottica o
mediante l’uso della rete telefonica con un apparecchio (modem), che modula e demodula il segnale
emesso dal computer in linguaggio compatibile con le trasmissioni telefoniche. L’utilizzatore del
computer controlla tutto l’hardware comprese le periferiche per la stampa e la trasmissione,
attraverso il monitor del computer, la tastiera e il mouse.
Fig. 2-3 – La componente hardware di un GIS
La componente Software
Il software che costituisce i sistemi di informazione geografica può essere diviso in 5 gruppi
funzionali (Fig.2-4):
a) L’input dati e la verifica
b) La registrazione (o immagazzinamento) dei dati e la gestione del database
6
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
c) L’output dati e la presentazione
d) La trasformazione dei dati
e) L’interazione e l’interfaccia con gli utenti e operatori
Fig. 2-4 – Le principali funzioni della componente software di un GIS
7
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
2.1.1.5 Conoscere le principali funzioni di un GIS
Le principali funzioni di un GIS sono strettamente connesse con le 5 funzioni sopra descritte. La
funzione di input dei dati e la loro verifica copre tutti gli aspetti della cattura dei dati spaziali dalla
carte esistenti, dalle osservazioni di campagna, dai sensori di ogni genere (installati su aerei, satelliti o
scanner da tavolo) e della loro conversione in formati digitali elaborabili dai computer. Le operazioni
di input dati e di verifica della loro congruità rispetto alla costruzione di un database saranno
descritte successivamente.
La funzione di immagazzinamento dei dati e la gestione del database (Fig. 2-5) concerne le fasi di
organizzazione e strutturazione delle informazioni relative alla ubicazione spaziale degli attributi
informativi delle diverse entità geografiche, siano esse punti, linee, poligoni o entità più complesse. I
sistemi software per la gestione del database prendono il nome di Data Base Management System
(DBMS). Il modello dati da seguire (descrizione formale dei fenomeni reali), la struttura del database
e i metodi di organizzazione del database sono caratteristici di ogni database geografico.
Figura 2-5 – Fonti e strumenti del data input
La funzione di output e la presentazione dei dati (Fig.2-6) concerne il modo di presentazione e
illustrazione dei dati e le modalità di trasferimento dei dati all’utilizzatore. I dati possono essere
rappresentati come carte, diagrammi, tabelle, report, sia in forma di stampa (hardcopy) che su
supporto magnetico o digitale. I metodi di presentazione costituiscono parte della Cartografia
Tematica e della Visualizzazione cartografica.
La funzione di trasformazione dei dati abbraccia due gruppi di operazioni:
la trasformazione dei dati che si rende necessaria per rimuovere gli errori oppure le operazioni di
aggiornamento e omogeneizzazione per rendere i dati compatibili con altre basi di dati
tutte le operazioni di analisi che possono essere applicate ai dati per giungere alle risposte che
possono essere poste da parte degli utilizzatori di un GIS
Molte di questi metodi di analisi fanno ormai parte di tutti i sistemi geografici, mentre altre analisi più
complesse sono caratteristiche solo di alcuni particolari pacchetti o moduli software.
8
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Figura 2-6 - L'output dei dati
9
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
2.1.2 Periferiche e tipi di file caratteristici nei GIS (SIT)
2.1.2.1 Conoscere le periferiche di input specifiche utilizzate nei GIS (SIT) e le caratteristiche
che le differenziano (ove applicabili a seconda del dispositivo: risoluzione, precisione, gamma
colori, modalità di connessione, gestione ed utilizzo).
Le finalità del lavoro (in termini di requisiti richiesti quali risoluzione, precisione, gamma colori,
modalità di connessione, gestione ed utilizzo), differenziano i campi di applicazione degli strumenti
per data imput. I sistemi informativi territoriali possono contenere dati provenienti da diverse fonti.
Dal punto di vista della creazione di un data base geografico (o spaziale), è conveniente classificare i
dati, siano essi di tipo Raster (immagini) o di tipo Vettoriale (primitive grafiche di tipo punto, linea,
poligono), come dati Primari o Secondari (Fig.2-7)
Dati di Tipo Raster
Primari
Dati di Tipo Vettoriale
Immagini telerilevate (satelliti tipo LandSat, Rilievi e misure GPS
Spot, Ikonos, Eros, etc)
Rilievi topo-cartografici
Foto aeree digitali
Secondari Immagini acquisite tramite scanner o apparecchi Carte topografiche
fotografici digitali
Data base topografici
Modelli digitali del terreno
Fig.2-7 – Classificazione del Data-Input
I dati geografici possono essere ottenuti sia da un formato digitale che da un formato analogico;
questi ultimi devono sempre digitalizzati prima di essere contenuti in un data base geografico. I
procedimenti (le metodiche) di raccolta dati sono spesso definite come cattura dei dati, automazione
dei dati, conversione dei dati, trasferimento dei dati, traduzione dei dati e digitalizzazione. Sebbene
questi termini possano sembrare molto diversi, da un certo punto di vista essi descrivono la stessa
operazione, ovvero l’acquisizione dei dati di un data base geografico.
Acquisizione primaria di dati raster
La più nota metodologia di acquisizione di dati raster è il telerilevamento. Il telerilevamento (Remote
Sensing) è la misura delle proprietà fisiche, chimiche e biologiche degli oggetti senza un diretto
contatto con essi. Le informazioni acquisite sono relative dalla misura delle quantità di radiazioni
elettromagnetiche che sono riflesse, emesse o disseminate. Una grande quantità di sensori che
operano su tutto lo spettro elettromagnetico, dal visibile fino alle microonde, sono oggi utilizzati per
telerilevare questi dati. La maggior parte di questi è montata su veicoli aerei o satelliti. Una
distinzione di base di questi sensori è tra attivi e passivi. I sensori passivi si basano sulla radiazione
solare riflessa oppure sulla energia radiata dalla superficie terrestre (es. calore geotermico). I sensori
attivi ( come il radar ad apertura sintetica), generano una loro sorgente di onde elettromagnetiche e
ne registrano gli effetti con la superficie terrestre. Dal punto di vista dei della costruzione delle
10
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
banche dati, la RISOLUZIONE è il parametro fisico più importante che caratterizza i sistemi di
telerilevamento. Ci sono tre aspetti della risoluzione: la risoluzione spaziale, spettrale e temporale. La
risoluzione spaziale concerne la dimensione degli oggetti spaziali che possono essere rilevati dal
sistema. I sistemi attuali (di tipo commerciale) rilevano immagini con pixel la cui dimensione a terra è
compresa da meno di un mero fino a un chilometro. Le camere fotografiche utilizzare per le foto
aeree digitali oscillano tra 0,1m – 5 m. La copertura areale di una di una immagine (scena) tele
rilevata oscilla da 10 km x 10 km a 200 km x 200 km.
La risoluzione spettrale si riferisce alle diverse parti dello spettro elettromagnetico che vengono
rilevate (Fig 2-8).
Fig.2-8-Tipici valori di riflettenza per acqua, vegetazione e suolo
I sistemi di Remot Sensing possono catturare dati in una parte dello spettro elettromagnetico (che si
riferiscono ad una sola banda, oppure simultaneamente da diverse parti (multi-banda o multi
spettrali). I valori della radiazione sono normalmente normalizzati e ricampionati per fornire un
intervallo di numeri interi compreso tra 0-255 per ogni banda, per ogni pixel, in ogni immagine.
La risoluzione temporale, o ciclo di ripetizione, descrive la frequenza con la quale le immagini
vengono raccolte per la stessa area. Da questo punto di vista ci sono essenzialmente due tipi di
satelliti commerciali: orbitanti e geostazionari. I satelliti orbitanti raccolgono informazioni da diverse
parti della superficie terrestre ad intervalli regolari. I geostazionari insistono sempre sulla stessa
porzione di superficie terrestre. Di eguale importanza specialmente per i progetti GIS di mediagrande scala sono le foto aeree. Queste ultime possono esser acquisite con camere analogiche di tipo
tradizionale e successivamente masterizzate tramite uno scanner oppure, come è sempre più
frequente tramite camere digitali. Le foto aeree rispetto a gran parte delle immagini satellitari hanno
il vantaggio di esser acquisite in stereo coppie, ovvero la sovrapposizione parziale di territorio
ripreso da due fotogrammi contigui, permette una ricostruzione tridimensionale del territorio ripreso.
Acquisizione primaria di dati vettoriali
La raccolta dei dati vettoriali avviene tramite due operazioni di base: il rilevamento topo cartografico
ed il Global Positioning System. Questi argomenti verranno trattati nel Modulo 1
Acquisizione secondaria di dati raster utilizzando uno scanner
Lo scanner è uno strumento che trasforma le “hardcopy” analogiche (documenti cartacei o in altro
materiale) in immagini digitali; ulteriori dettagli sull’uso degli scanner verranno di seguito forniti.
Acquisizione secondaria di dati vettoriali
11
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
L’acquisizione secondaria dei dati implica la digitalizzazione delle entità che sono rappresentate da
diversi sorgenti dei dati. Il metodo più diffuso è la digitalizzazione manuale, la digitalizzazione a
video (a “testa alta”), la fotogrammetria e l’ingresso diretto di dati topografici (COGO).
La digitalizzazione manuale tramite digitizer è l’operazione più rapida e più semplice di restituire dati
vettoriali. ulteriori dettagli sull’uso dei digitizer verranno di seguito forniti
La digitalizzazione a “testa alta” avviene interpretando manualmente attraverso un video di un
computer le entità rappresentate su una fonte di dati acquisita allo scanner. La sorgente dei dati è in
genre una mappa, una immagine satellitare, una foto aerea o ortofoto etc. Tali fonti di dati sono
preliminarmente georeferenziate. Il processo può anche essere erso automatico o parzialmente
automatico, tramite l’utilizzo di software speciali. In qusto caso occorre molto tempo per l’editing e
la classificazione dei dati interpretati.
La fotogrammetria permette di ottenere dati vettoriali direttamente dall’interpretazione di coppie
stereoscopiche di foto aree.
Il COGO è una abbreviazione di Coodinate Geometri ed è la metodologia di raccolta di dati vettoriali
tramite l’ingresso diretto da rilevamento topo cartografico di oggetti (es edifici, strade, condotte,
pipeline etc).
Periferiche per il data imput. Le principali periferiche di input sono già state elencate in Fig.2-5;
queste apparecchiature sono note come quantizer, cioè dispositivi elettronici che sono in grado di
convertire dati analogici (come le mappe), in segnali digitali che possono essere utilizzati dai sistemi
GIS. I quantizer che sono più frequentemente utilizzati nei sistemi GIS sono:
1 - Il tavolo digitalizzatore (digitizer) (Fig. 2-9 hanno diversa forma e dimensione; il principio di
funzionamento si basa sui dati inviati da un cursore (detto Puck, Fig. 2-10) che può essere spostato
liberamente su un tavolo sotto la cui superficie è stata inserita una fitta maglia di spire elettriche in
grado di rilevare la posizione del segnale inviato.
Fig. 2-9 – Tavolo digitalizzatore
12
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-10 – Cursore per tavolo digitalizzatore (puck)
Esercitando una pressione su un bottone del cursore, la posizione di quest’ultimo viene rilevata dalle
spire del tavolo e trasmessa al computer a cui il digitizer viene collegato. I cursori che passano su
questi tavoli sono muniti di una finestra trasparente con un crocicchio che permette di inserire punti,
vertici di linea e definire poligoni lungo i bordi delle entità riportate in mappa. I metodi di
digitalizzazione tramite digitizer permettono anche di inserire automaticamente dei vertici durante lo
spostamento del cursore si può fissare un intervallo di tempo di es 0,25 secondi oppure un intervallo
di spazio di 0,5 mm. In Fig. 2-11 sono riassunte e caratteristiche principali dei tavoli digitalizzatori
Risoluzione
Precisione
Gamma colori
Modalità
connessione
Cavo
interfaccia
RS232
di Gestione ed utilizzo
Variabile
a Variabile
a NN
di Adatto
per
seconda
dei seconda
dei
tipo digitalizzazione manuale
modelli:
es. modelli;
da
o disegno CAD (vedi
2450 lpi (line 0,075 mm a
testo)
por inches)
0,25 mm
Fig. 2-11 – Caratteristiche riassuntive dei tavoli digitalizzatori
Caratteristiche della digitalizzazione manuale.
La digitalizzazione manuale si basa sulle capacità dell’operatore di interpretare il contenuto di una
mappa (o altro elaborato grafico) secondo le indicazioni di un modello dati di riferimento. La mappa
viene fissata sul tavolo digitalizzatore e l’operatore, tramite lo spostamento del puck, inserisce una
serie di punti le cui coordinate relative permetto di ricostruire entità vettoriali quali punti, linee e
poligoni. La digitalizzazione manuale tramite un tavolo digitalizzatore fornisce una precisione dello
stesso ordine di grandezza della maggior parte delle mappe ed immagini, per cui questo processo di
data input non aggiunge significativi errori ai dati prodotti. Tuttavia ci sono caratteristiche della
digitalizzazione manuale che possono influire negativamente sulla qualità posizione dei dati spaziali.
13
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Ad esempio nella Fig. 2-12 sono riportati gli errori che influenzano i dati ottenuti, sulla base un
errore di posizionamento del cursore di 1 mm.
Scala della mappa
Errore in metri terreno
1:24000
24
1:50000
50
1:100000
100
1:1000000
1000
Fig. 2-12 – Errori di posizionamento dei dati digitalizzati, prodotti da un errore nella
posizione del cursore pari a 1 millimetro
Anche le caratteristiche dell’equipment influenzano l’accuratezza finale dei dati; c’e’ un limite
superiore sulla precisione di ogni tavolo digitalizzatore che si riflette sulla risoluzione della
digitalizzazione. La precisione può essere considerata come la distanza minima al di sotto della quale
i punti non possono essere definiti come posizioni distinte. La precisione è spesso riportata come la
ripetibilità; per stimare la ripetibilità si cerca di valutare quanto sono vicini tra loro i punti relativi ad
una certa posizione, digitati senza che il puck venga spostato. In teoria questi punti dovrebbero
essere tutti nella stessa posizione, ma sono evidenti alcune variazioni della posizione dovute alla
posizione meccanica del sensore o alle sue caratteristiche elettroniche; tali variazioni influenzano
l’accuratezza complessiva della digitalizzazione.
L’abilità e l’attitudine dell’operatore è un altro importante fattore che controlla la qualità posizionale
dei dati ottenuti; la vista, la capacità di tenere ferma la posizione del cursore etc, sono tutti elementi
che si riflettono nel risultato finale. In Fig. 2-13 è riportato il risultato di un test eseguito con un
tavolo digitalizzatore di elevata qualità e ripetute digitalizzazioni; come si vede l’errore varia
approssimativamente di 0,067 mm.
Fig. 2-13 – Errori di digitalizzazione, ottenuti da ripetute digitalizzazioni. I punti che sono
stati ripetutamente digitalizzati si raggruppano attorno alla vera localizzazione secondo una
normale distribuzione di probabilità
2 - Lo scanner è uno strumento che trasforma le “hardcopy” analogiche (documenti cartacei o in
altro materiale) in immagini digitali; lo scanner genera un fascio luminoso e rileva la luce riflessa o
trasmessa da tale fascio lungo una serie di linee contigue che attraversano tutto il documento
14
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
(mappa, foto, etc); le diverse caratteristiche della luce riflessa o trasmessa dallo scanner sono da esso
trasformate in una matrice di celle digitali di forma regolae (pixel) che nel loro insieme permettono di
ricostruire nel computer l’immagine originale con la sua forma ed i suoi colori.
Le differenze di quantità di luce riflessa vengono normalmente classificate in due livelli (bianco e
nero,1 bit pixel), oppure multipli livelli di grigio (8, 16 o 32 bit pixel). Gli scanner a colori sono in
grado di rilevare una gamma di colori classificati in 8 bit pixel nelle bande del verde, rosso e blu. La
risoluzione spaziale degli scanner varia tra 100 dpi (dot por inches, punti per pollice, corrispondenti
a 4 punti per mm), a 1800 dpi 72 punti per mm). Gli scanner si possono dividere in funzione delle
loro modalità di acquisizione dell’immagine, ed in particolare si hanno:
Gli scanner piani (flat-bed)
Gli scanner “a tamburo”
Gli scanner ad alimentazione continua.
Negli scanner piani l’originale viene posizionato su una superficie piana trasparente ed il sistema di
scansione si sposta lungo le due dimensioni del piano di scansione. Se l’originale di scansione è
opaco la luce viene riflessa e rilevata, mentre se l’originale di scansione è trasparente (ad esempio è
una pellicola) la luce può essere trasmessa attraverso l’originale.
Gli scanner “ a tamburo” utilizzano lo stesso principio degli scanner piani, ma in questi l’originale è
posizionato su un tamburo che ruota attorno al sensore del segnale.
Negli scanner ad alimentazione continua l’originale viene trascinato da una serie di rulli e scorre
rispetto ai sensori di rilievo che sono fissi e distribuiti ungo tutta l’ampiezza dell’originale.
L’architettura di questo attrezzo è più semplice e più versatile rispetto alle altre configurazioni sopra
descritte, ma la risoluzione e l’accuratezza sono minori
Ci sono almeno tre importanti ragioni per eseguire la scansione di originali e manoscritti (hardcopy):
Documenti come piani regolatori, disegni CAD, foto ed immagini generali sono acquisite con
scanner per migliorare l’accesso ai dati
Pellicole e copie cartacee di foto aeree sono acquisite per fornire il cotesto geografico di riferimento
dei dati (layer di sfondo)
Mappe e foto aeree sono acquisiti per essere restituiti in forma vettoriale tramite digitalizzazione
(vettorializzati)
Per quanto riguarda le risoluzione si va da (8 bit pixel, 256 livelli di grigio) e 400 dpi (16 punti per
mm) come ottima risoluzione per acquisire dati da utilizzare come “sfondo” degli strati informativi
vettoriali. Per foto aeree da utilizzare come foto interpretazione ed analisi si utilizzano risoluzioni
fino a 1000 dpi ( 8 bit pixel nelle tre bande RGB). In Fig. 2-14
Risoluzione
Variabile:
fino a 300 dpi per macchine da
ufficio
fino a 800-1200 dpi per grafica
oltre 1200 (fino a 2400-3600) per
usi fotogrammetrici
Con pixel da 25 a 50 micron la
risoluzione varia da 2,5 a 5,0 cm
terreno per una mappa a scala
1:1000
Precisio
ne
Precision
e delle
linee +0,1%
Gamma colori
Generalmente
Red, Green Blue
con immagini da
8 a 24 bit pixel
Modalità
di
connessione
USB
Gestione ed utilizzo
Utilizzo per acquisizione di
documenti quali mappe,
immagini, foto da utilizzare
direttamente negli archivi
oppure come fornte di dati da
vettorializzare manualmente
o automaticamente.
Fig. 2-14 – Caratteristiche riassuntive degli scanner
15
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
2.1.2.2 Riconoscere i tipi di file più comuni utilizzati nei GIS (SIT) e a quale categoria
appartengono (vettoriale o raster).
I formati di dati geografici.
Uno dei principali problemi nell’impiego di dati geografici provenienti da diverse fonti, è che essi
possono essere codificati in formati di file molto diversi tra loro. La ragione di utilizzare diversi
formati di file dipende dal fatto che non esiste (o almeno non esisteva) un formato di tipo generale
che possa soddisfare tutte le esigenze; ad esempio un file che permetta una restituzione di
elaborazioni 3D e al tempo stesso consenta di definire complesse relazioni topologiche. Per questo
motivo i produttori di software hanno sviluppato i formati di file in funzione delle diverse esigenze
degli utenti.
Al fine di individuare standardizzazioni dei vari dati geografici sono oltre 25 le organizzazioni che
sono coinvolte in tutto il mondo. A livello globale ISO (Intenational Standard Organization), è
responsabile del coordinamento delle varie commissioni tecniche sui dati geografici (TC 211 e TC
287). In Europa la CEN (Commision Européan Normalisation) è l’organismo che si occupa di
standardizzazione e a livello nazionale nelle singole nazioni operano altri organismi (es. in Italia la
UNI). Un’altra importante organizzazione che definisce standard geografici è la OGC (Open GIS
Consortiun), un gruppo costituito da produttori (vendor), accademici ed utilizzatori che sono
interessati alla interoperabilità dei dati geografici. In Fig 2-15 sono elencati alcuni dei più famosi
formati di dati geografici.
Fig. 2-15 – I principali tipi di formati geografici rastre e vector
2.1.3 I dati e le fonti dei dati nei GIS (SIT)
2.1.3.1 Saper distinguere le tipologie di dati utilizzati nei GIS (SIT).
16
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
La principale caratteristica delle tipologie di dati utilizzate nei GIS è la georeferenziazione; tutte le
tipologie di dati devono avere un riferimento spaziale preciso ed univoco. Ad un dato corrisponde
una posizione e quella posizione è unica per quel dato.
Esiste una vasta gamma di dati che vengono utilizzati nei sistemi GIS e ciò dipende delle
innumerevoli finalità per cui tali sistemi possono essere utilizzati. Dal momento che i GIS possono
essere utilizzati per analisi archeologiche, geomarketing, pianificazione territoriale e urbana etc, le
sorgenti di dati non possono essere facilmente classificate o inventariate esaurientemente. Anche
all’interno di un solo progetto GIS la varietà del materiale può essere notevole. Sebbene il tipo di
materiale possa variare notevolmente da progetto a progetto, è indispensabile che i professionisti che
si occupano di GIS conoscano alcune delle più comuni fonti di dati.
Le agenzie e gli enti governativi sono i maggiori produttori di dati: Regioni, Provincie, Comuni,
Comunità Montane, Autorità di Bacino (nazionali e regionali), Enti di Bonifica, Servizi Tecnici e
Agenzie Centrali (es ISPRA), Organi Cartografici dello Stato (L'istituto Geografico Militare;
L'istituto Idrografico della Marina; La Sezione Fotocartografica dello Stato Maggiore
dell'Aeronautica; L'amministrazione del Catasto e dei Servizi Tecnici Erariali; Il Servizio Geologico);
l’INGV, La Protezione Civile, etc .
Occorre tenere presente che le Amministrazioni Statali o periferiche sopra citate, spesso organizzano
i dati per le loro finalità ed in modo diverso da settore a settore e da luogo a luogo. Questo implica
che sia necessario spendere una discreta quantità di tempo per ottenere i dati e per portarli nella
forma che ci serve. Esistono anche produttori di dati privati che dispongono di dati e informazioni di
grande importanza per gli aspetti commerciali, ma spesso tali dati sono molto costosi o non
accessibili
I comuni formati digitali
Le modalità con cui i dati digitali sono resi disponibili sono soggetti a frequenti mutamenti. Di
seguito sono elencati e brevemente descritti alcuni formati di file che sono ampiamente utilizzati
come fonti di dati digitali per i GIS.
Census Bureau Topographically Integrated Geographic Encoding and Referencing System (TIGER).
I Tiger file sono stati sviluppati per supportare le attività di classificazione dell’Ufficio del Censo
statunitense. I file includono dati digitali inerenti alle entità cartografiche, confini amministrativi,
toponimi, coordinate, indirizzi codificati etc. Si tratta di dati che coprono esclusivamente il territorio
americano (USA)
USGS Digital Line Graphs (DLGs). Questi dati sono rappresentazioni digitali (suddivise in punti,
linee e poligoni) di informazioni cartografiche tratte dalle tradizionali carte del Servizio geologico
Americano (USGS). I dati sono suddivisi in layer tematici (idrografia, elevazione, trasporti,
toponomastica, etc)
USGS Digital Orthophoto Quadrangles (DOQs). Sono ortofoto digitali relative ai quadrangles
cartografici del USGS. Analoghe a queste tipologie di dati sono le ortofoto digitali prodotte da
AIMA, CGR, etc, che coprono varie porzioni (es il taglio delle sezioni 1:10.000) del territorio
italiano.
Spatial Data Transfer Standard. Questo standard fornisce specifiche per il trasferimento di dati
spaziali digitali da una applicazione all’altra.
I formati commerciali
Occasionalmente i produttori di software producono dei formati che diventano degli standard di fatto
per il trasferimento dei dati. Nel mondo della cartografia, del disegno digitale e dei GIS, i più
importanti di questi sono il DXF (Drawing Exchange Format) e lo SHAPEFILE. Il DXF è un file in
17
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
formato ASCII che descrive il contenuto dei file CAD in modo che essi siano interpretabili e leggibili
dai tutti i sistemi software. Lo shapefile è descritto nel paragrafo 2.1.3.5
Quali sono gli aspetti principali da valutare nei dati geografici
Si afferma spesso che i dataset privi di documentazione sono dataset privi di valore. C’e’ molto di
vero in questa affermazione in quanto l’assenza di informazioni concernenti la qualità dei dati
comporta l’impiego di molto tempo da parte dell’utente per cercare le stesse informazioni. I dati
dovrebbero essere sempre accompagnati da una documentazione sulla qualità che riporti esattamente
cosa contiene il file, come sono stati ottenuti i dati, come sono stati controllati etc. La commissione
ISO TC211 ha definito le informazioni caratteristiche che devono accompagnare i report sulla qualità
dei dati.
Se la documentazione è limitata, nel valutare le tipologie di dati geografici si deve comunque cercare
di sapere:
 La data di creazione
 Da dove proviene il file
 Con quale metodo o procedura i dati sono stati raccolti
 Qual è l’area coperta dai dati
 A quale scala i dati sono stati digitalizzati
 Quale sistema di riferimento è stato utilizzato
 Quale è la densità di osservazione (scala di campionamento) utilizzata per la compilazione di
dati
 Quanto sono accurate i posizionamenti e le informazioni delle diverse entità
 La logicità e la consistenza dei dati
 La chiarezza delle visualizzazioni cartografiche
 L’evidenza e l’accessibilità dei dati funzionali al progetto
 Il formato di gestione dei dati
 Le modalità di esecuzione dei collaudi e controlli
 Per quali finalità i dati sono stati compilati
 Le referenze del fornitore
(Traduzione da Kenneth E. Foote and Margaret Lynch, Department of Geography, University of
Texas at Austin, 1995)
2.1.3.2 Riconoscere le principali fonti di dati usabili nei GIS (SIT), quali: dati telerilevati,
Catasto, mappe cartacee e digitali, dati socio-economici.
DATI TELERILEVATI
I dati telerilevati sono ottenuti tramite misure e rilievi indiretti eseguiti da sensori e strumenti posti a
considerevoli distanze dalle entità misurate. Nel contesto dei GIS, utilizziamo il termine di dati tele
rilevati per indicare foto aeree acquisite da vettori aerei ed immagini satellitari per indicare le
immagini acquisite dai sensori posti su satelliti. Negli ultimi anni tutti questi tipi di dati sono passati
dalle registrazioni analogiche su pellicole a formati digitali.
I dati telerilevati costituiscono una forte di dati molto importanti di dati spaziali, per le seguenti
ragioni:
Coprono una ampia area con un costo relativamente basso ed in modo uniforme
Le foto e le immagini acquisite da scanner possono rilevare la luce fino alle lunghezza d’onda che
sono fuori dello spettro visibile all’occhio umano. Alcuni tipi di foto aeree sono sensibili alle
18
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
lunghezze d’onda infrarosse. Gli scanner aerei e satellitari hanno range spettrali molto vasti, fino alle
lunghezza d’onda termiche ed oltre.
Hanno un’accuratezza geometrica elevata. I dati telerilevati possono essere convertiti in dati spaziali
con elevata accuratezza. Le foto aeree sono le fonti principali dei dati per la produzione di
cartografie di dettaglio.
Le registrazioni dei dati sono permanenti; una immagine è fissa nel tempo e nello spazio e
conseguentemente è possibile comparare l’evoluzione dei fenomeni confrontando tra loro immagini
acquisite in tempi successivi
FOTO AEREE
L’uso principale delle foto aeree nei GIS può essere diviso in tre principali impieghi:
Realizzazione di carte topografiche di dettaglio
Fotointerpretazione delle tipologie di dati e informazioni contenute nelle foto. Es, informazioni
geologiche, forestali, pedologiche, uso del suolo, etc.
Sfondo per mappe di entità geografiche (strade, toponimi, centri urbani, etc), quando le le mappe
topografiche a grande e a media scala sono assenti.
Le foto aeree possono essere in bianco e nero acquisite tramite pellicole o sensori digitali sensibili a
lunghezze d’onda da 0,4 m a 0,7 m, pellicole a colori con strati sensibili a lunghezze d’onda
variabili tra 0,4-0,5 m (blue), 0,5-0,6 m (verde), 0,6-0,7 m (rosso), oppure a raggi infra-rossi
con pellicole sensibili a lunghezze d’onda oscillanti tra 0,7 m e 1,1 m. Le tipologie di foto in
bianco e nero sono le più diffuse. Le foto ad infrarossi possono essere di aiuto per le interpretazioni
particolari, come nella forestazione, dato che la vegetazione emette diversi tipi di radiazione nella
parte di spettro elettromagnetico degli infrarossi. Le foto aeree sono sempre affette da qualche
distorsione in quanto il loro punto di presa non è sempre esattamente verticale ed il terreno ripreso è
raramente orizzontale e piatto. Conseguentemente le informazioni provenienti dalle foto aeree
devono essere trasferite ad un sistema di riferimento convenzionale prima che possano essere
utilizzate nei GIS. Le foto aeree sono acquisite in coppie stereoscopiche: la stessa porzione di suolo
è ripresa da due foto contigue aventi diversi punti di acquisizione. Questa tecnica di acquisizione
consente di visualizzare i soggetti ripresi in tre dimensioni e di ottenere dati geometrici nelle tre
dimensioni X,Y,Z.
IMMAGINI SATELLITARI
L’uso delle immagini satellitari presenta notevoli vantaggi rispetto alle foto aeree; in genere hanno
range spettrali più ampi che vanno molto oltre le lunghezze d’onda rilevabili dalle foto aeree. Gli
scanner satellitari hanno anche il vantaggio di avere un angolo di prospettiva molto alto, il che riduce
gli errori che influenzano le foto aeree. I sensori satellitari possono essere suddivisi in due grandi
gruppi: passivi e attivi. I sensori ottici passivi rilevano la radiazione solare riflessa e la radiazione
termica ri-emessa. I sensori ottici attivi, come il RADAR sono dotati di strumenti per l’emissione e la
misura dell’energia nella parte di spettro elettromagnetico delle microonde. In questo gruppo
rientrano un certo numero di sistemi basati su Laser (LiDAR). In questi sensori il la sorgente laser è
trasportata da un vettore aereo (elicottero o aereo) ed il raggio laser emesso è puntato verso la
superficie terrestre. La pulsazione del raggio laser in emissione e l’energia riflessa sono misurate in
modo da restituire una accurata distanza tra il sensore e l’oggetto misurato. Queste pulsazioni
possono essere modulate ed inviate migliaia di volte al secondo, in modo da tracciare la superficie
studiata con grande dettaglio.
Nella tipologia di sensori passivi, ne esiste un grosso numero ad alta risoluzione; questi sistemi
forniscono risoluzione spaziale a terra sotto 1 metro e sono in fase di allestimento sensori
19
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
commerciali con risoluzione di 50 cm. Queste alte risoluzioni rendono fortemente concorrenziale
l’uso delle immagini satellitari con le foto aeree.
CATASTO
La cartografia catastale italiana ha inizio con la legge n. 3682 del 1° marzo 1886 per il riordinamento
dell’imposta fondiaria (Legge Messedaglia). Viene usualmente realizzata per giurisdizioni
amministrative comunali, suddividendo i territori interessati in sezioni censuarie. Le carte catastali
non sono in generali regolari perché sono solo planimetriche e non contengono l’altimetria. Solo
recentemente le nuove mappe catastali fotogrammetriche sono state integrate con linee di livello di
equidistanza e = 2 m. Inoltre l’oggetto della rappresentazione è la particella catastale, cioèuna ben
delimitata porzione continua di terreno, situata in un unico comune, appartenente ad un unico
possessore, assoggettata ad un’unica specie di coltura, con uniforme grado di opportunità, oppure,
se non soggetta a coltura, riservata ad un’unica destinazione d’uso.
La particella catastale deve essere inquadrata nella sua corretta ubicazione, sia rispetto alle particelle
circostanti che rispetto ai particolari topografici di natura stabile (Fig. 2-16).
Fig.2-16 – Stralcio di cartografia catastale con indicazione del numero di particella
Le carte catastali vengono in generale redatte alla scala 1:2000 e prendono il nome di mappe. Sono
invece redatti alla scala 1:1000 (allegati) i centri abitati e le relative zone di espansione e le porzioni
inferiore a 20 are (1 ara = 100 m2) e alla scala 1:500 le porzioni di territorio nelle quali l’area media
delle particelle è inferiore e 3 are. Viceversa per le zone montuose a proprietà poco divisa e per le
quali si presuma non possano avvenire cambiamenti rilevanti per quanto riguarda il particellamento si
adottano rappresentazioni alla scala 1:4000 (area media delle particelle non inferiore a 5 ettari; 1
ettaro = 10 000 m2). Le mappe catastali sono formate per sezioni e suddivise in fogli di formato
standard (70x100 cm2). La porzione di mappa disegnata in ciascun foglio è a perimetro chiuso, in
genere coincidente con i limiti di proprietà. Quando è necessario sviluppare a scala maggiore qualche
particolare porzione del territorio si fa uno sviluppo disegnandolo se possibile negli spazi liberi del
corrispondente foglio; se ciò non è possibile si disegna su fogli separati, che vengono detti allegati.
Le varie sezioni della mappa catastale di uno stesso comune sono indicate con le lettere maiuscole,
mentre i fogli di mappa sono contraddistinti con numeri.
Le mappe usualmente contengono:
 delimitazioni delle particelle catastali;
20
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS

delimitazioni relative alla viabilità, alle acque e ad ogni altro particolare topografico di
pubblica proprietà e di specifico interesse;
 confini amministrativi comunali, provinciali, regionali e statali;
 i punti trigonometrici;
 le curve di livello e i punti quotati.
Il territorio nazionale è completamente cartografato con circa 310.000 mappe catastali.
La rappresentazione adottata per tali mappe fu in origine la Cassini-Soldner. Per coprire tutto il
territorio nazionale furono adottate complessivamente 849 origini, 31 con grandi estensione e 818
con piccole estensioni (Fig.2-17).
Fig.2-17- Esempio di Foglio di Mappa
La rappresentazione è quindi policentrica; ogni centro è di solito un vertice trigonometrico di ordine
superiore (I o II ordine); l’estensione massima della zona che si riferisce ad un centro di proiezione è
di circa 70 km dall’origine in direzione Est-Ovest e 100 km in direzione Nord-Sud. La
rappresentazione di Cassini-Soldner è afilattica; si può osservare però che per xmax = 70 km il
modulo di deformazione superficiale non supera il valore 1,00005; inoltre lungo il meridiano centrale
è sia equivalente che conforme. Queste considerazioni hanno quindi suggerito di adottare tale
rappresentazione per le mappe catastali.
La rappresentazione Cassini-Soldner è stata adottata dal Catasto (Legge 3682) per la maggior parte
del territorio, in sede di formazione della propria cartografia. La cartografia catastale è stata
realizzata in molti casi prima della pubblicazione definitiva (1908-19) dei risultati della triangolazione
dell’IGMI. In questi casi sono stati assunti, per i vertici di I, II e III ordine, valori provvisori delle
coordinate forniti volta a volta dall'IGMI. Tali valori si sono rivelati spesso diversi (in certi casi
sensibilmente) da quelli definitivi. La rete catastale non è quindi del tutto congruente con quella
nazionale, cioè angoli e lati della rete non sono esattamente gli stessi, anche prescindendo dal sistema
geodetico di riferimento. Molti vertici di IV ordine IGMI fanno parte della rete catastale come vertici
di rete, sottorete o dettaglio. Le relative coordinate derivano però da misure eseguite
autonomamente dal Catasto, e sono quindi generalmente diverse da quelle calcolate dall’IGMI; in
certi casi è diversa anche la materializzazione dei punti.
21
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
A partire dal 1942 iniziò la conversione della cartografia catastale con l’adozione della
rappresentazione conforme di Gauss-Boaga sull’ellissoide internazionale.
Purtroppo questa operazione non è ancora ultimata e quindi in alcuni casi vi possono essere problemi
nell’uso congiunto di carte catastali e regionali (queste ultime, più recenti, sono tutte nel sistema
Gauss Boaga).
Il catasto ha in atto una vasta digitalizzazione delle mappe e degli allegati (vedi in seguito Banca Dati
Cartografia Catastale).
(Da Prof.ssa Maria Antonia Brovelli, Facoltà di Ingegneria - Campus Como,
http://geomatica.como.polimi.it/corsi/cartografialaurea/introduzione.htm)
MAPPE CARTACEE E DIGITALI
La produzione sistematica delle cartografie topografiche dei territori nazionali è iniziata alcuni secoli
fa. Negli Stati Uniti il United States Geological Survey svolge tale compito dal 1879 ed anche in
Italia dopo l’unificazione del regno, si iniziarono i progetti sistematici di cartografia dell’intero
territorio. Come è noto le mappe topografiche riferendosi ad una realtà fisica e urbanistica di un
determinato periodo costituiscono delle vere e proprie testimonianze sull’evoluzione storica di un
territorio, sia dal punto di vista geomorfologico che socio-economico. La disponibilità di cartografie
topografiche di grande e media scala (1:25.000-1:50.000), ha portato alla realizzazione anche di
carte tematiche delle risorse naturali e tra queste la cartografia geologica è senz’altro una delle più
importanti. Nel corso del tempo, con l’evoluzione delle conoscenze e delle diverse esigenze le
cartografie di tipo tematico, basate sempre sulla cartografia topografica di grande scala, sono
aumentate e quindi oggi disponiamo di molti dati tematici agricoluturali, forestali, pedologici,
geomorfologici, etc, che sono georeferenziati su queste mappe cartacee. Su queste mappe “antiche”
è possibile ancora oggi trarre dati ed informazioni territoriali che spesso non sono reperibili in altri
documenti più recenti. In Italia la produzione cartografica“su supporto cartaceo” è andata avanti fino
alla fine degli anni “70 e quindi essendo molti i dati disponibili su questi documenti, è frequente il
loro utilizzo.
Ad esempio le carte topografiche, corografiche e geografiche dell'IGMI che coprono l’intero
territorio nazionale sono oggi disponibili solo in formato cartaceo (o relative scansioni). Infatti la
Carta Topografica d'Italia serie 25/V si compone di 3545 elementi alla scala 1:25 000, denominati
"tavolette", che hanno le dimensioni di 7'30" in longitudine e 5' in latitudine. Abbraccia una zona di
terreno pari a circa 100 kmq. È inquadrata nella rappresentazione conforme di Gauss-Boaga, nel
sistema geodetico nazionale con reticolato chilometrico UTM riferito al sistema geodetico europeo
(ED50). La carta è tutta pubblicata.
Al contrario la più recente versione di questa cartografia la “Carta topografica d'Italia serie 25” si
compone di 2298 elementi alla scala 1:25 000, denominati "sezioni", che hanno le dimensioni di 10'
in longitudine e 6' in latitudine. Le sezioni, elaborate con rilievo aerofotogrammetrico numerico o
analogico e successivamente disegnate con metodologie automatiche o manuali, sono inquadrate
nella rappresentazione conforme UTM; il sistema di riferimento geodetico è basato sull'ellissoide
internazionale con orientamento medio europeo (ED50). Questa serie cartografica, disponibile sia
informato cartaceo che numerico è tutt’ora in corso di allestimento.
Dalla fine degli anni “80 si è assistito alla progressiva sostituzione delle mappe cartacee con quelle
digitali; questa transizione è avvenuta prima come pura conversione da “carta a raster” mediante
acquisizione tramite scanner e successivamente come vettoralizzazione e digitalizzazione con le
modalità di base descritte in precedenza a proposito del data input. Oggi si dispone di una discreta
quantità di dati tematici organizzati in banche dati vettoriali, con modelli dati non sempre
22
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
propriamente definiti, ma che hanno l’indubbio vantaggio della facile reperibilità presso i vari enti che
si occupano di risorse territoriali.
Nel caso della cartografia topografica le modalità di realizzazione si sono molto evolute per cui
nell’ultimo decennio i dati topografici a grande scala (1:10000, 1:5000, 1:2000), vengono restituiti
direttamente con metodi numerici e distribuiti agli utenti in struttura e formati di file di tipo CAD. La
tendenza attuale è il passaggio ulteriore dalla cartografia prettamente numerica alla realizzazione di
data base topografici.
DATI SOCIO-ECONOMICI
I dati socio economici sono fondamentali nelle fasi di analisi eseguite tramite GIS o “in ambiente
GIS”. Fanno parte di una categoria di dati che nel contesto delle banche dati spaziali prende il nome
di “dati ancillari”. Questa definizione potrebbe far pensare ad un contributo marginale che queste
informazioni portano al data set, ma invece è da attribuire essenzialmente al fatto che tali dati non
dispongono di feature geografiche proprie ma sono essenzialmente delle semplici tabelle. La
possibilità di collegare (più specificatamente, georiferire), tali dati alle feature spaziali che
rappresentano il territorio rende molto efficiente la loro utilizzazione e molto interessanti i risultati
delle analisi. Ad esempio tutti i dati di censo e di densità di popolazione sono molto utili per le analisi
di geo-markenting, per l’organizzazione dei trasporti pubblici e di innumerevoli tipologie di servizi
(reti tecnologiche, energia, gestione rifiuti, telecomunicazioni, etc). In Italia il maggior produttore di
dati socio economici è l’ISTAT (http://www.istat.it/dati/db_siti/), ma anche la PA periferica dispone
di servizi statistici efficienti che producono e distribuiscono dati socio-economici.
2.1.3.3 Conoscere il concetto di dati territoriali
I dati territoriali hanno la principale caratteristica di trattare entità georeferenziate.
I dati territoriali, così come definiti dalla direttiva INSPIRE (vedi sotto, sono tutti quei dati che
“attengono, direttamente o indirettamente, a una località o un’area geografica specifica”.
Il Joint Research Center (Centro di Ricerca Europeo) ha calcolato che il 90% dei dati ambientali è un
dato territoriale,nmentre secondo uno studio della Commissione Europea, l’informazione geografica
costituisce il 52% del valore dell’intero parco dell’informazione del settore pubblico.
I dati territoriali, di cui è ormai accertato il significativo valore economico, sono uno strumento di
conoscenza fondamentale per:
descrivere accuratamente lo stato di fatto e valutare le necessità (posizione e sfruttamento delle
risorse naturali;posizione e distribuzione di persone, affari, beni, nuovi sviluppi, servizi ed altre
infrastrutture; visualizzazione e analisi delle reti);
formulare le politiche di intervento (analisi dei cambiamenti ambientali, coordinazione delle risposte
alle emergenze, disastri naturali e causati dall’uomo, supporto nella progettazione);
monitorare l’implementazione e lo sviluppo delle politiche e degli interventi (registrazione e
disseminazione delle informazioni).
Secondo INSPIRE, al fine di poterne comprendere e modellare le relazioni, i dati geografici possono
essere riuniti in gruppi tematici (Fig.2-18)
INSPIRE è una Direttiva (2007/2/EC del 14 marzo 2007) del Parlamento europeo e del Consiglio
con l'obiettivo di essere un supporto alla stesura di politiche che possono avere un impatto diretto o
indiretto sull'ambiente. INSPIRE si basa sulla interoperabilità delle infrastrutture di dati spaziali creati
dagli stati membri. Questa direttiva europea è entrata in vigore il 15 maggio 2007.
L'intenzione è di creare un quadro giuridico per la realizzazione e l’attivazione di un'infrastruttura per
l’informazione territoriale in Europa, al fine di formulare, attuare, monitorare e valutare le politiche
comunitarie a vari livelli e di fornire informazioni ai cittadini. Tra gli obiettivi principali della direttiva
23
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
INSPIRE figura la possibilità di rendere disponibile una quantità di dati maggiore e di qualità più
elevata ai fini dell'elaborazione delle politiche comunitarie e della loro attuazione negli Stati membri a
qualsiasi livello. La direttiva è incentrata in particolare sulla politica ambientale, ma in futuro ci si
aspetta che possa essere estesa ad altri settori come l’agricoltura, i trasporti e l’energia.
Con il termine Infrastruttura di Dati Territoriali (IDT) (Spatial Data Infrastructure nel linguaggio
utilizzato internazionalmente) indica l'insieme di tecnologie, metodi, politiche ed accordi istituzionali
tesi a facilitare la disponibilità, l'omogeneità e l'accesso a dati geospaziali; la parola infrastruttura
viene utilizzata per veicolare il concetto di un ambiente di supporto affidabile, in analogia alle reti
stradali o di telecomunicazioni, per la circolazione dei dati stessi.
L’organizzazione delle Infrastrutture di dati territoriali fa riferimento alla direttiva INSPIRE
(acronimo per Infrastructure for Spatial Information in Europe - Infrastruttura per l'Informazione
Territoriale in Europa), un progetto della Commissione Europea con l'obiettivo di realizzare
infrastrutture di dati territoriali nella Comunità europea. (da Wikipedia, 2009)
Fig. 2-18- Elenco dei raggruppamenti tematici dei dati spaziali secondo INSPIRE. L’ampia
gamma di argomenti coperta dei temi esprime la generale richiesta di soddisfare tutte le azioni
volte allo sviluppo sostenibile ed i requisiti funzionali allo sviluppo dell’amministrazione
digitale (egovernment). Ulteriori informazioni su INSPIRE sono ottenibili su:
http://inspire.jrc.ec.europa.eu/reports/ImplementingRules/DataSpecifications/D2.3_Definition
_of_Annex_Themes_and_scope_v3.0.pdf
24
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
2.1.3.4 Sapere identificare le varie tipologie di attributi (quali nominali, ordinali, intervallo,
rapporto o ratio).
Gli attributi degli oggetti spaziali da immagazzinare in un database sono classificabili in tre gruppi:
 spaziali
 temporali
 tematici
La maggior parte degli attributi può essere caratterizzata da attributi di tutti i tipi sebbene, in pratica,
gli attributi spaziali e temporali siano qualche volta poco importanti o addirittura trascurabili perché
hanno un valore costante per tutte i record del database. Per la maggior parte degli scopi GIS, gli
attributi temporali e tematici sono considerati come non-spaziali. I valori degli attributi possono
essere basati su osservazioni primarie o misure o derivare da elaborazioni, selezioni o calcolo.
Attributi spaziali
Gli attributi spaziali registrano la localizzazione la geometria e la topologia degli oggetti spaziali. La
localizzazione spaziale degli oggetti è registrata in coordinate geografiche (lat.-long.), in uno dei
sistemi cartografici standard o in coordinate rettilinee con una origine locale. Una delle prerogative
dei GIS è la capacità di trasformare i dati spaziali da un sistema di coordinate a un altro, in modo che
carte con diversi sistemi di proiezione possano essere confrontate. In generale la posizione dati
geotematici non è descritta mediante metrodi convenzionali (es. codice postale, gli indirizzi di uno
stradario), ma sono ubicati rispetto ai sistemi cartografici di riferimento (Carta Catastale, Carta
Comunale, Carta Tecnica Regionale, Carte Topografiche e Geografiche IGMI). Molti dati geoscientifici specialmente di tipo geologico, non sono pensati e descritti dagli operatori nella loro
posizione spaziale nel sistema di riferimento cartografico, bensì sono ubicati rispetto alle relazioni
spaziali (spesso topologiche) con entità geografiche limitrofe. Per esempio una occorrenza mineraria
può essere descritta come affiorante “lungo il torrente…” oppure “lungo il contatto tra…”.
Attributi non-spaziali
Gli attributi temporali e tematici degli oggetti spaziali sono generalmente trattati nello stesso modo
nei sistemi informativi geografici. Gli attributi temporali si riferiscono spesso all’età degli oggetti (es.
età delle formazioni) o ai tempi di misurazione. Gli attributi tematici si riferiscono a tutti gli altri tipi
di proprietà degli oggetti che non sono né geografiche, né temporali
Le tavole (o tabelle) degli attributi
Gli attributi degli oggetti spaziali sono in genere organizzati in tabelle. Qualunque sia
l’organizzazione interna delle tabelle interna a un computer, esse possono essere pensate come dei
file “piatti” costituiti da un arrangiamento bidimensionale di un certo numero di record o file, che
rappresentano i valori delle entità o oggetti spaziali e un certo numero di colonne che rappresentano
gli attributi delle entità. Ogni sistema che contiene una grossa varietà e quantità di dati, inclusi i GIS,
richiede l’organizzazione e la gestione dei dati mediante le funzionalità proprie dei database
management system; per questo, prima di vedere le capacità di analisi dei GIS, è indispensabile
definire alcune proprietà e definizioni dei DBMS che costituiscono una parte importante del
“motore” dei GIS.
Le tabelle delle feature geografiche (FEATURE ATTRIBUTE TABLE)
Il sw ARC/INFO, analogamente a altri sistemi, immagazzina le informazioni descrittive nelle tabelle
di un data base (INFO). Ogni tabella è costituita da campi (item) e ogni record immagazzina i dati di
ogni occorrenza della feature (in questo caso punti, linee, poligoni).Queste tabelle o file di basi di
dati sono genericamente noti come feature attribute table.
25
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Come già descritto le capacità di un GIS consistono nel legare i dati spaziali (grafici) con i dati
descrittivi (tabulari). In questo tipo di legame ci sono almeno tre importanti caratteristiche da
ricordare.
Esiste una relazione uno a uno (one to one) tra le feature geografiche sulla carta e i record nelle
FAT.
La connessione tra le feature geografiche e i loro contenuti descrittivi è mantenuta mediante un unico
identificatore numerico che è assegnato a ogni feature (ad es. Per i poligoni l’ identificatore è
assegnato dalla label point).
L’identificatore unico è fisicamente immagazzinato in due posti: nel file che contiene le coordinate
x,y e nel corrispondente record nella FAT.
Il sw Arc/Info e Arc View costruiscono e mantengono automaticamente queste connessioni.
Gli attributi sono principalmente utilizzati per registrare le caratteristiche non-spaziali di una entità
(come vedremo essi sono spesso denominati ITEM, CAMPI, FIELD, VARIABILI, etc).
Gli attributi di diverso tipo possono essere raggruppati per descrivere le proprietà non spaziali di
ogni oggetto nei database. Questi attributi possono assumere forme e data type diverse (anche in
funzione dell’evoluzione delle conoscenze e tecnologica), ma tutti questi attributi possono essere
classificati come:
 NOMINALI
 ORDINALI
 INTERVALLO O RAPPORTO
ATTRIBUTI NOMINALI
Essi ospitano variabili (dati) che forniscono informazioni descrittive sugli oggetti, ad esempio il
colore di una entità o di una occorrenza. Altri esempi di attributi nominali sono il tipo di vegetazione,
i nomi delle città, i possessori di particelle, etc. NON SONO IMPLICITE IN QUESTO TIPO DI
ATTRIBUTI RIFERIMENTI QUANTITATIVI (es. dimensione, taglia, ordine etc). Attributi
nominali possono essere immagini, clip, audio, etc.
ATTRIBUTI ORDINALI
Questi attributi ospitano variabili (dati) che implicano una classificazione (ranking) o un ordine dei
loro valori. Un attributo di questo genere può essere descrittivo, come alto, medio basso. Possono
essere anche attributi numerici; valori di resistenza al taglio, meccanica, permeabilità. L’ordine
descrive solo la posizione o il rango, ma non specifica la forma né la scala.
ATTRIBUTI INTERVALLO O RAPPORTO
Sono attributi utilizzati per valori numerici dove sia il grado che le differenze assolute di dimensioni
tra gli oggetti, sono espresse tramite numeri. I valori di questi attributi sono spesso registrati come
numeri reali . Area della superficie, lunghezza, peso, altezza, valore e profondità sono alcuni esempi
di attributi di questo genere
2.1.3.5 Conoscere i principali tipi di formato di dati geografici (quali coverage, geodatabase,
shapefile, grid, dxf, dwg, geotiff, GML).
I principali tipi di dati geografici sono già stati elencati in Fig. 2-14, nel contesto dei tipi di file che i
diversi vendor di software hanno prodotto.
Più in dettaglio di seguito si descrivono di seguito alcuni specifici formati di dati che sono utilizzati
dai principali pacchetti di softaware GIS, tra cui ArcGis; Fig. 2-19 sono riportati tali formati nella
visualizzazione per icone adottata da quest’ultimo software.
26
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-19-Principali formati di dati geografici utilizzabili nel sistema ArcGis™.
COVERAGE
Una coverage (in italiano “copertura”) è formato di file geografici vettoriali basato sul modello
georelazionale (una applicazione in campo spaziale o geografico del più generale Modello
Relazionale generalmente utilizzato nelle basi di dati): tale formato permette di memorizzare sia la
componente spaziale (localizzazione), sia gli attributi descrittivi, delle entità geografiche. Le
coperture, come molti altri tipi di dati geografici vettoriali, utilizzano un insieme di classi di feature
per rappresentare al meglio le entità spaziali. Ognuna di queste classi di feature registra un insieme di
punti, linee e poligoni e annotazioni. Le coperture possono registrare relazioni topologiche tra le
entità geografiche memorizzate. Una copertura viene registrata come una directory, all’interno del
quale ogni classe di feature viene registrata come un insieme di file. Per esempio una copertura
apparirà nell’interfaccia di visualizzazione del modulo ArcCatalog, con l’icona in giallo di Fig. 2-20.
In questo esempio, si nota che una copertura relativa a linee di drenaggio contiene un insieme di
entità lineari (line), delle annotazioni per tali linee ed un file di tic (punti) che definiscono i quattro
vertici delimitanti l’estensione spaziale della copertura.
In pratica è spesso necessaria che una coverage registri più di una feature class per definire le feature
di intersse. Per esempio in una copertura poligonale vengono registrate sia le linee che delimitano
27
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
l’area poligonale sia le geometrie poligonali. Inoltre i poligoni hanno anche la necessità di disporre
delle entità puntuali label, che registrano gli attributi informativi del poligono. Ogni
Fig. 2-20- Struttura delle coperture
copertura ha una classe di feature, denominata Tic, che definisce le estensioni spaziali dell’area
interessata dalla copertura, in un sistema di riferimento convenzionale. Questi Tic NON
rappresentano delle feature puntuali effettive della copertura In Fig. 2-21 vengono illustrate le classi
di feature comuni in una copertura.
Fig. 2-21 – Insieme di feature che partecipano alla definizione
GEODATABASE
Il Geodatabase è un archivio informatico di diversi tipi di dati geografici. In ArcGis™ il geodatabase
è un insieme di dati di vario tipo registrati in un unico repository (un Microsoft Access database,
oppure un database relazionale multiutente (come Oracle™, Microsoft SQL Server, PostgreSQL,
Informix, or IBM DB2).
I dataset fondamentali nel geodatabase
Un concetto chiave del geodatabase è il dataset. Il dataset è il meccanismo primario utilizzato per
organizzare e utilizzare le informazioni geografiche; il geodatabase contiene tre principali tipi di
dataset:
Le classi di feature
28
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
I dataset raster
Le tabelle
La creazione di una raccolta di questi tipi di dataset è il primo passo per la progettazione e la
costruzione di un geodatabase. Gli utilizzatori in genere iniziano costruendo un certo numero di
questi dataset e successivamente aumentano le capacità del geodatabase inserendo funzionalità
avanzate (come l’aggiunta di relazioni topologiche, reti e sottotipi). Queste funzionalità avanzate
permettono di modellare le caratteristiche di base del Sistema Informativo Geografico, di mantenere
l’integrità dei dati e lavorare rispettando un consistente insieme di relazioni spaziali.
La registrazione nel Geodatabase di tabelle e file
L’immagazzinamento nel geodatabase include la registrazione sia dello schema che delle regole
geometriche di base per ogni dato geografico registrato; inoltre vengono registrati i dati tabellari ed i
dati raster. Si noti che per tutte e tre le tipologie di dati (classi di feature (geometrie), tabelle degli
attributi e dati raster), così come per tutte le altre tipologie di dati, tutte le registrazioni avvengono
tramite tabelle. La rappresentazione spaziale delle feature geografiche avviene sia per elementi
vettoriali che raster; queste geometrie sono immagazzinate e gestite in tradizionali tabelle degli
attributi.
Ogni classe di feature viene registrata come una tabella ed ogni fila rappresenta una occorrenza di
feature (un punto, una linea, un poligono). Nella Fig. 2-22, è rappresentata una tabella degli attributi
di una feature poligonale. Ogni fila della tabella rappresenta una occorrenza (un poligono); il valore
del campo ‘SHAPE’ uguale a Polygon, è utilizzato dal sistema per identificare nel campo i valori di
coordinate e la forma elementare (primitiva) della geometria.
Fig. 2-22- Tabella di una feature class poligonale
Uno degli elementi fondamentali dell’organizzazione dei dati geografici tramite geodatabase, è le
scalabilità del sistema: si passa da una versione del database utilizzabile solo da un utente (definita
Personal Geodatabase), ad una versione condivisa da più utenti che possono contemporaneamente
lavorare sulle geometrie e sugli attributi. Questi Relational Database Management System che
permettono di ampliare notevolmente le capacità di memoria e gli accessi condivisi sono:
Oracle (using the ArcSDE SQL type or the Oracle Spatial SQL type, if you use Oracle Spatial)
IBM DB2
IBM Informix
29
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Microsoft SQL Server
Informix
PostGreSQL (using the ArcSDE SQL Type or the PostGIS SQL type, if you wish to use PostGIS)
SHAPEFILE
Lo shapefile è un formato di dati geografici vettoriali, creato e diffuso dalla ESRI per la diffusione e
scambio speditivo di informazioni geografiche georeferenziate e non topologiche. Lo shapefile, di cui
sono state rese pubbliche le specifiche, utilizza più file per la definizione dei dati. Il numero minimo
di file utile alla definizione di uno shapefile è 3; tra questi i file di tipo *.shp definiscono il formato
dello shape geometrico (primitiva geometrica, i.e. punto, linea, poligono); i file di tipo *.shx recano i
dati relativi a un indice spaziale degli shape cioè (come è nello scopo delle indicazioni dei dbms)
definiscono un indice che permette rapidamente la ricerca delle occorrenze; i file di tipo *.dbf sono i
filesystem che consentono l’immagazzinamento delle informazioni relative alle tabelle degli attributi.
Lo shapefile può includere poi, come opzione, altri 8 tipi di file che hanno le seguenti caratteristiche:
il file *.prj – definisce la proiezione/sistema di riferimento dei dati; i file *.sbn e *.shx, che
definiscono ulteriori indici spaziali delle feature; i file *.fbn e *.fbx, che definiscono degli indici
spaziali delle feature in forma di sola-lettura; i file *.ain e *.aih, che definiscono gli indici relativi ai
campi attivi nelle tabelle o nelle tabelle degli attributi; * il file *.mxs che definisce un indice di geocodifica (geocoding) in modalità lettura-scrittura ( formato ODB); il file *.atx che definisce un indice
per il filesystem *.dbf nella forma shapefile.columname; il file *.cpg definisce il codepage funzionale
alla codifica dei caratteri da utilizzare.
GRID,
Il GRID (Georeferenced Raster Image Data), è un formato di registrazione di dati raster creato da
ESRI. Ci sono due tipi di formato Grid: interi e floating, in cui i valori dei pixel sono rispettivamente
valori interi o valori decimali. I Grid caratterizzati da valori interi sono adatti er la rappresentazione
di entità discrete (esempio: una categoria di dati come l’uso del suolo, la geologia etc.), mentre i
Grid costituiti da valori decimali sono adati per rappresentare entità continue (esempio, forze di
campo quali Gravità, Campo magnetico etc). Gli attributi per i valori interi sono registrati in una
Tabella dei Valori (VAT: Value Attribute Table). Una VAT ha un record per ogni valore unico nel
Grid; il record della tabella si riferisce ad una particolare classe o gruppo di celle che hanno tutte lo
stesso valore. L’attributo VALUE riporta il valore per le celle in questione e l’attributo COUNT il
numero delle celle (es. se in un Grid 50 celle hanno valore 1, che si riferisce alla categoria “Foresta”,
allora la VAT riporterebbe VALUE=1 e COUNT = 50, per ognuna delle 50 celle.)
I Grid con valori decimali (Floating Point), non hanno una VAT perché le celle nel GRID possono
assumere ogni valore all’interno di un determinato range. Le celle in questo tipo di Grid non
ricadono esattamente in categorie discrete. Il valore della cella è relativo alla sua posizione: ad
esempio, in un Grid che rappresenta l’elevazione il valore 10,1662 indica che la località è ca 10 metri
sopra il livello del mare.
Gli intervalli che possono essere registrati come valori di Grid sono:
Floating-point grids possono registrare valori tra -3.438 e 3.438.
Integer grids possono registrare valori tra -2147483648 e 2147483647 (-231 to 231-1).
Per i Grid interi, tali intervalli si applicano soltanto all’attributo ITEM. Un Grid intero può avere altri
attributi informativi (INFO), che sono aggiunti alle VAT; in questi attributi il valore dipende dalla
definizione dell’attributo.
30
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Il sistema di coordinate di un Grid, è lo stesso degli altri dati geografici di tipo raster. Le file e le
colonne sono parallele all’asse X e Y del Sistema di Riferimento rispettivamente. Poiché ogni cella
del Grid ha la stessa dimensione, la localizzazione e l’area coperta da ogni cella è facilmente
determinabile dal numero delle file e delle colonne e dalle coordinate X,Y dell’angolo in alto a
sinistra del Grid (Fig.2-23). Il Grid può anche portare delle informazioni addizionali come il sistema
di coordinate associato.
Fig.2-23
DXF
Il DXF è un file in formato ASCII che descrive il contenuto dei file CAD in modo che essi siano
interpretabili e leggibili dai tutti i sistemi software. AutoCAD DXF (Drawing Interchange Format, o
Drawing Exchange Format) è un formato per i file di tipo CAD, sviluppato da Autodesk come
soluzione per scambiare dati tra il programma AutoCAD e altri programmi. Il DXF fu introdotto
originariamente nel dicembre 1982 insieme ad AutoCAD 1.0, e consentiva una rappresentazione
esatta dei dati del formato originale di AutoCAD, DWG, per il quale Autodesk non ha mai rilasciato
le specifiche. Oggi Autodesk pubblica le specifiche del formato DXF sul suo sito per le versioni dalla
versione di AutoCAD 13 (novembre 1994) ad AutoCAD 2008 (marzo 2007). Le versioni di
AutoCAD dalla Release 10 (ottobre 1988) e successive supportano sia la versione ASCII che quella
binaria del formato DXF. Le versioni iniziali supportavano solo il formato ASCII. Mentre AutoCAD
diventava più potente, supportando oggetti sempre più complessi, il DXF diventava meno utile. Certi
tipi di oggetti, come i solidi ACIS e le regioni, non sono documentate. Altri tipi di oggetti, come i
blocchi dinamici di AutoCAD 2006, e tutti gli oggetti per le versioni di fascia alta di AutoCAD, sono
parzialmente documentate, ma non ad un livello sufficiente per consentire ad altri sviluppatori di
utilizzarle. La maggior parte degli sviluppatori di software commerciale, come i concorrenti della
Autodesk, scelsero di supportare il DWG come il loro formato principale come scambio di dati con
AutoCAD, usando le librerie della Open Design Alliance - un consorzio no-profit che si è occupata
del reverse engineering del formato DWG.
Struttura del file
La versione ASCII del formato DXF può essere visualizzata con un editor di testi. La struttura di
base è la seguente:
HEADER - Informazioni generali riguardati il disegno. Ogni parametro è una variabile con un nome
e un valore associato.
CLASSES- Contiene le informazioni per le classi definite
TABLES
ENTITIES
31
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
OBJECTS
THUMBNAILIMAGE - contiene un'anteprima dell'immagine del file
END OF FILE
DWG
Il DWG è formato di file originale di AutoCAD™, per il quale Autodesk™ non ha mai rilasciato le
specifiche.
TIFF e GEOTIFF
I file “Tagged Image File Format” (TIFF), sono il formato di dati raster più versatile. Questi formati
possono memorizzare a differenti quantità di bit pixel (profondità di bit) e possono essere compressi
con diverse tecniche di compressione che variano in funzione delle dimensione del file e della
accuratezza richiesta. Molti software GIS (tra cui ArcMap) sono in grado di creare file di questo
tipo, denominati GEOTIFF che supportano al loro interno le informazioni di Georeferenziazione
(dimensione in metri del pixel e sistema di riferimento).
GML
L’ “Open Geospatial Consortium” (OGC) ha definito le specifiche del “Geography Markup
Language Encoding Specification (GML)”, che rappresenta un protocollo standard per la codifica
delle geometrie e degli attribute utilizzando il linguaggio XML. Un importante concetto da
comprendere è che il GML non è un formato singolo, ma piuttosto un meccanismo adatto alla
definizione di quasi ogni formato geospaziale. Questa capacità del GML, supporta in pratica tutte le
necessità di chi deve pubblicare i propri modelli di informazioni spaziali senza dipendere troppo dalla
natura e dalle caratteristiche di tali modelli. Il GML fu progettato per coprire molte esigenze; per
esempio le specifiche del GML3, descrivono quasi 1000 tipologie di oggetti spaziali ed un vasto
numero di tipi geometrici funzionali alla descrizione delle feature. Ogni codifica GML seguirà
fedelmente un suo profilo che si può ritenere quasi uno specifico formato; come ogni altro formato di
dati, ogni profilo GML richiederà un proprio traduttore per la decodifica e l’utilizzo in altri sistemi.
2.1.4 La scala nei GIS (SIT)
2.1.4.1 Conoscere il concetto di scala nei GIS (SIT).
Le mappe cartacee sono state per lungo tempo un potente mezzo per la comunicazione
dell’informazione geografica. Tali mappe si possono considerare come una rappresentazione
analogica, o un modello fisico nel quale il mondo reale è rappresentato in scala. Infatti, nel caso di un
una mappa cartacea, una parte del mondo reale viene scalata (ridotta) fino ad adattarsi alla forma del
32
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
formato di stampa. Una proprietà fondamentale delle mappe cartacee è la loro scala nominale o
frazione rappresentativa, che rappresenta il rapporti tra la una distanza misurata tra due oggetti
presenti sulla mappa e la stessa distanza misurata tra i due oggetti nel mondo reale (es. 1:25.000).
Questo concetto risulta un po’ ingannevole in quanto la misura sulla mappa è una misura sul piano,
mentre la misura nella realtà è una misura su una superficie non piana, per cui il rapporto di scala non
può essere costante. Le mappe cartacee sono state importanti, particolarmente prima dell’avvento
delle tecnologie digitali, tanto che molti concetti ed idee che sono associate ai GIS sono ereditate
direttamente dalle mappe cartacee.. Ad esempio la scala è spesso citata come una caratteristica del
database digitale, sebbene la stessa definizione di scala è un non sense se applicata ai dati digitali.
Infatti non ha propriamente senso misurare una distanza in un computer e rapportarla ad una distanza
reale. In genere quando si considera una scala per un db digitale, ci si riferisce alla scala della mappa
originale che costituisce la sorgente dei dati.
Sfortunatamente il termine scala ha acquisito troppi significati nel corso del tempo e la conseguenza
è stata una certa confusione.
Scala come dettaglio: molti cartografi ed utilizzatori utilizzano il termine scala per indicare la
risoluzione spaziale o il livello di dettaglio spaziale dei dati riportati in carta. Le scale sono
dettagliate se loro includono informazioni sugli oggetti molto piccoli, mente sono scale grossolane se
si limitano a fornire informazioni per oggetti di grandi dimensioni.
Scala come estensione: spesso il termine si riferisce all’estensione geografica coperta dalla mappa o
dal progetto. In questo senso talvolta il termine indica diversi aspetti del progetto come il budget
investito o la quantità di personale coinvolto
Scala come rapporto matematico. Come sopra definito la scala (nominale) è normalmente riferita
ad un rapporto numerico tra distanze: al numeratore la distanza cartografica e al numeratore la
corrispondente distanza reale. Questo ha frequentemente indotto alla confusione tra piccola scala e
grande scala. In effetti con piccola scala, dato il senso del rapporto che è tanto più piccolo quanto
più inferiore ad 1, si devono intendere le cartografie con elevata superficie di territorio rappresentata
per una data superficie di mappa cartacea, mentre con cartografie di grande scala si devono intendere
le cartografie di dettaglio, dove l’effettivo rapporto di scala è prossimo a 1.
Inoltre come scala si intende talvolta una sorta di resa tra il livello di risoluzione spaziale ed il livello
di dettaglio degli attributi, che può essere immagazzinato in una applicazione.
2.1.5 La georeferenziazione
2.1.5.1 Conoscere il concetto di georeferenziazione
La localizzazione di dati è uno dei principali benefici relativi all’impiego di dati geografici; le mappe
hanno la capacità di tenere legate tra loro i diversi tipi di informazione in quanto si riferiscono alle
stesse zone e permettono di misurare distanze e aree. Senza una localizzazione i dati sono definiti
non-spaziali e hanno scarso valore all’interno dei sistemi informativi geografici. Correntemente
33
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
vengono utilizzati diversi termini per descrivere l’attività di assegnazione di una localizzazione agli
elementi di una mappa. Si utilizzano verbi quali GEOREFERENZIARE, GEOLOCALIZZARE,
GEOCODIFICARE. Il più diffuso ed utilizzato di questi termini è Georeferenziare, che si riferisce
all’insieme delle tecniche e procedure che permettono di determinare la posizione di una entità
cartografica all’interno di un sistema di riferimento. A questo fine possiamo ipotizzare un’attività di
georeferenziazione diretta che consiste nella misura effettiva della posizione delle entità cartografiche
all’interno di un sistema di riferimento, quale ad esempio il rilevamento della posizione di entità della
superficie terrestre attraverso il Global Positioning System o le Stazioni Totali integrante con GPS,
oppure una georeferenziazione indiretta. Quest’ultima è una procedura che consente di definire la
posizione (coordinate) dei dati presenti all’interno di una mappa sulla base della definizione di una
relazione tra alcuni punti della mappa e le loro posizioni in un sistema di riferimento
2.1.5.2 Conoscere le modalità di georeferenziazione dei dati raster.
La georeferenziazione è il processo che stabilisce una relazione fra un sistema di coordinate di una
immagine (file e colonne), definibile come spazio dell’immagine, e il sistema di coordinate di una
carta (X,Y; Fig. 2-24), definibile come spazio della carta. Un simile processo di trasformazione
avviene anche quando si stabiliscono le relazioni tra uno strato informativo vettoriale definito in un
qualsiasi sistema di coordinate (es. coordinate macchina), e un altro sistema di coordinate.
Fig.2-24 - Schematizzazione di una struttura di immagine raster
CONVERSIONE DI COORDINATE
Un tipico input di dati cartografici per un progetto da gestire mediante GIS potrebbe consistere in:
 Una carta geologica (in una proiezione cilindrica conforme) in forma digitale, che si presenta
come una tabella o un file ASCII delle coordinate X e Y dei vertici delle entità poligonali e
dei punti di controllo
 Una tabella di dati geochimici con coordinate spaziali X e Y in UTM.
 Un’ immagine da satellite in forma raster
34
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Il primo problema che si pone nell’utilizzare questi dati è la conversione del loro sistema di
coordinate in quello in uso alla banca dati da costruire: questa operazione consiste nella conversione
di coordinate. Un tipico progetto GIS inizia con la scelta dell’estensione geografica dell’area da
studiare, del sistema di coordinate e della proiezione cartografica; ad esempio l’UTM fuso 32.
Le fasi richieste per la conversione delle coordinate per un insieme di dati raster sono le seguenti:
1. Inserire nel campo cartografico un certo numero di punti di controllo (ground control point o
tic) da utilizzare come punti di riferimento a coordinate note. I punti sono desunti dalla carta
originale o da controlli a terra.
2. Assegnare ai punti di controllo, in coordinate “macchina” o “utente”, le coordinate reali,
talvolta definite “coordinate mondo”.
3. controllare lo scarto quadratico medio tra i punti di controllo e trasformare il modello raster
(immagine) dalle coordinate “macchina” alle coordinate locali.
4. Proiettare il modello raster nel sistema di proiezione prescelto, mediante la scelta del Datum e
della proiezione.
Nel caso si debba trasformare le coordinate e proiettare una immagine raster si deve “ricampionare”
l’immagine in un nuove set di dati raster , dove le coodinate dei pixel sono spaziate secondo il
sistema di coordinate e la proiezione prescelta.
In questo caso l’immagine raster viene adattata (“warping”) o deformata come un foglio di gomma
(“rubber-sheeting”) in base a punti controllo introdotti arbitrariamente o in base a controlli di
campagna.
La conversione dei dati vector
La Fig. 2-25 illustra in forma di digramma di flusso (“flow chart”) tutte le fasi di conversione delle
coordinate. La fonte dei dati in A esprime i dati in coordinate “macchina” (es. Millimetri o pollici), da
portare in coordinate cartesiane (es. UTM). Le fonti dei dati B e C esprimono i dati in coordinate
cartesiane e geografiche rispettivamente da trasformare in altri sistemi. In generale lo scopo è di
portare tutte le fonti nel sistema di coordinate in uso al progetto.
Quando i dati provengono da una fonte di tipo A, ovvero da coordinate macchina da trasformare in
coordinate piane in un sistema di proiezione noto, si utilizzano una serie di punti di controlli inseriti
nei dati vettoriali come simboli (es. croci ) detti “tic”. Di questi punti di controllo devono essere note
le coordinate reali nel sistema cartografico originale. La prima fase di operazioni consiste nel
convertire le coordinate “macchina” nel sistema di coordinate reali originali (es. UTM o GaussBoaga), mediante una funziona polinomiale empirica di trasformazione.
Nei punti di controllo sono noti sia le coordinate “macchina” (u,v) sia le coordinate reali (x, y). La
trasformazione tiene conto dei cambiamenti di scala, della traslazione dell’origine e della rotazione
tra i due insiemi di coordinate (macchina VS mondo). Questo tipo di trasformazione cui sono
soggetti i dati, ha la forma di una funzione polinomiale del primo ordine ed è nota come
trasformazione affine. Le equazioni della trasformazione affine per convertire le coordinate da
“macchina” a “reali” sono le seguenti:
X=a+bu+cv
Y= d+eu+fv
Dove i coefficienti a,b,c,d,e sono determinati da almeno 3 punti di controllo e le coordinate X,Y
sono i riferimenti cartesiani da trovare (“easting” e “northing” del nuovo sistema di riferimento).
Con 3 punti di controllo, con una coppia di valori per ogni punto, si possono determinare i 6
coefficienti necessari alla risoluzione dell’equazione. In questo caso le coordinate X e Y sono
35
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
determinate univocamente, senza poter effettuare un controllo sulla loro precisione. Se si utilizzano
più di 3 punti di controllo, l’errore posizionale può essere tenuto sotto controllo: le coordinate dei
punti sono calcolate con il criterio dei minimi quadrati, e le coordinate risultanti hanno un errore
residuale. L’errore residuale di ogni punto viene generalmente definito come la distanza pitagorica
tra la posizione osservata e la posizione calcolata, ed è definito dalla relazione:
residual = ((X – X obs)2 + (y – Y obs)2 )1/2
La lista di valori residui calcolati con la precedente relazione, mostra la qualità della localizzazione
dei punti. Una volta che i punti inseriti soddisfano le condizioni di precisione richieste, eventualmente
localizzando di nuovo qualche punto, la trasformazione affine é utilizzata per convertire tutte le
coordinate esistenti nelle nuove coordinate X, Y.
In una situazione dove il sistema cartografico di partenza non è noto (es. dati vettoriali provenienti
dalla digitazione di una foto aerea, o dati cartografici provenienti da disegni CAD) è indispensabile
inserire molti punti di controllo “a terra” (“ground control point”) dove è possibile determinare con
certezza la posizione geografica, e trasporre ai dati con una equazione polinomiale di ordine
maggiore del primo. Una funzione di “correzione” di grado superiore, non tiene conto soltanto delle
funzioni di scala, rotazione e traslazione fra il sistema dei piani cartesiani, ma prende in
considerazione anche un adattamento (warping) ai dati di controllo. Una funzione polinomiale sia
quadratica (6 coefficienti per ogni equazione), o cubica (10 coefficienti per equazione), calcola le
coordinate da assegnare ai dati sulla base del criterio dei minimi quadrati, come visto in precedenza.
Se dopo il calcolo eseguito dalla polinomiale, le coordinate ricalcolate per ogni GCP non hanno una
precisione accettabile per tutti i punti, i punti che sulla base dell’errore residuo hanno un valore
troppo distante da quello reale possono essere scartati. Una volta che il calcolo della nuova posizione
dei punti GCP sulla carta soddisfa le condizioni richieste (basso rms), la posizione geografica di tutti
i dati viene ricalcolata e si passa definitivamente al sistema di coordinate definitivo. Per questo, in
generale nelle attività di lavoro cartografico, non ha molta importanza stabilire il sistema di
coordinate della carta di partenza, e la conversione viene fatta direttamente dalle coordinate piane del
documento di partenza alle coordinate piane del lavoro finale, saltando le coordinate geografiche.
36
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-25- Fasi conversione di dati vettoriali da coordinate "macchina" alle coordinate in uso
al progetto GIS. Dalla sorgente di dati A arrivano i dati in coordinate “macchina” (es. x, y
espressi in millimetri o pollici). Dalla fonte di dati B arrivano dati già in coordinate reali di
tipo cartesiano (x,y) da portare in coordinate geografiche. Dalla fonte dei dati C arrivano i
parametri di conversione tra un sistema di proiezione esistente e un altro prescelto.
Proiezione delle coordinate piane al sistema di coordinate geografiche
Questa fase include una equazione di trasformazione inversa, per convertire le coordinate piane o
cartesiane (X,Y) alle coordinate geografiche (Queste trasformazioni sono equazioni derivate
matematicamente che variano da un sistema di proiezione un altro in base al diverso tipo di sferoide
utilizzato etc. Per eseguire queste trasformazioni, anche in ambito GIS, è indispensabile disporre dei
parametri dell’ellissoide di riferimento.
Proiezione delle coordinate geografiche al sistema di coordinate di lavoro (piane).
Questa fase include una equazione di trasformazione diretta per convertire i valori di coordinate
geografiche ( in coordinate piane (X,Y).
Conversione dei dati raster
Quando devono essere convertiti o georeferenziati i dati raster la procedura adottata é quella
descritta in Fig. 2-26, e il processo di conversione consiste nel definire un nuovo raster, le cui
coordinate dei nuovi assi di riferimento e dei nuovi pixel siano conformi alle coordinate desiderate.
37
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-26 – La conversione di coordinate in un’immagine raster
Per questa operazione è indispensabile eseguire un ricampionamento del raster originale. Per
determinare queste nuove coordinate del centro dei pixel nel nuovo grid, si utilizzano una coppia di
equazioni di trasformazione. Se il raster di partenza è già in coordinate geografiche note come nel
caso delle immagini satellitari geocodificate, si può impiegare una trasformazione diretta. Se il raster
di partenza è in un sistema di coordinate ignoto è indispensabile utilizzare una funzione polinomiale
di ordine più elevato.
La differenza tra la conversione delle coordinate dei dati raster e quella dei dati vector, è che tutti gli
attributi dei pixel devono essere convertiti da un raster a un altro, e non solo le informazioni relative
alle coordinate. E’ indispensabile una relazione funzionale per trasformare le coordinate dei grid;
inoltre il valore dei pixel nel nuovo grid sono calcolati in base a uno o più valori dei grid circostanti
(neighbouring pixel) nel vecchio grid. Il processo è illustrato nella Fig. 2-27.
38
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-27 – Ricampionamento per la conversione di un’immagine raster in un’altra. A:
L’immagine iniziale è ricampionata in un nuovo grid le cui coordinate sono scelte in relazione
alla proiezione geografica desiderata.
La raccolta e l’uso dei GCP da imporre alla funzione polinomiale (sia essa cubica che quadratica) è
esattamente per quella descritta nel caso dei dati vettoriali.
Il processo di ricampionamento dal vecchio grid è eseguito con uno dei tre seguenti metodi: “nearest
neighbour”, “bilinear interpolation” e “cubic convolution”. Nel primo caso, “nearest neighbour”, ogni
nuovo pixel prende il valore dei pixel più vicini dal vecchio grid. Quando gli attributi dei pixel sono
delle categorie o numeri ordinali, deve essere utilizzata la funzione di calcolo “nearest neighbour” in
quanto non ha senso utilizzare la media di valori con dati quali il tipo di roccia o l’abbondanza di un
elemento. Per ottenere immagini raster più aderenti ai punti di controllo si possono utilizzare gli altri
metodi di interpolazione, oltre al “nearest neighbour”, che richiedono molto più tempo e memoria
per il loro calcolo, con il massimo di impegno del computer che viene raggiunto con la convoluzione
cubica.
2.1.5.3 Conoscere il funzionamento di un file di georeferenziazione dei dati raster (World File).
Le immagini sono registrate come dati raster nelle quali ogni cella dell’immagine ha un numero di fila
ed uno di colonna. Per visualizzare le immagini è necessario stabilire una trasformazione da
coordinate immagine a coordinate reali. I parametri per tali trasformazioni sono registrati con le
immagini. Alcuni formati di immagini quali ERDAS IMAGINE, BSQ, BIL, BIP, GeoTIFF, e grids,
registrano le informazioni per la georeferenziazione nell’intestazione (header) del file. Altri tipi di
immagine utilizzano queste informazioni registrate in un file ASCII separato, denominato world file,
in quanto esso contiene i parametri per le trasformazioni reali utilizzate dall’immagine. E’ facile
riconoscere il word file in quanto possiede lo stesso nome del file immagine e una diversa estensione
che in genere è “*.tfw”.
Il file world ha una forma come nell’esempio di seguito riportato:
20.17541308822119 - A
39
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
0.00000000000000 - D
0.00000000000000 - B
-20.17541308822119 - E
424178.11472601280548 - C
4313415.90726399607956 - F
La trasformazione da coordinate immagine a coordinate mondo, è una trasformazione affine a sei
parametri della forma seguente:
x1 = Ax + By + C
y1 = Dx + Ey + F
dove
x1= coordinata calcolata x del pixel in coordinate mondo
y1= coordinata calcolata y del pixel in coordinate mondo
x = numero di colonna di un pixel nell’immagine
y = numero di fila di un pixel nell’immagine
A = x-scale: dimensione del pixel in unità di mappa nella direzione x
B, D= valori di rotazione
C,F = termini di traslazione. Coordinate mappa x,y del centro del pixel in alto a sinistra
E = valore negativo della scala y. Dimensione del pixel in unità di mappa in direzione y
Notare che la y-scale (E) ha un valore negativo in quanto l’origine dell’immagine e le coordinate
geografiche sono in diversi sistemi cartesiani. L’origine dell’immagine è posta nell’angolo in alto a
sinistra, mentre l’origine del sistema di coordinate è posta nell’angolo in basso a sinistra. I valori
delle file nell’immagine aumentano dall’origine verso il basso, mentre il valore delle coordinate y
nella mappa aumentano dall’origine verso l’alto.
2.2 Il Modello dei Dati
2.2.1 Modellazione della Realtà
2.2.1.1 Sapere cosa è il modello dei dati.
I computer e i GIS non possono essere applicati direttamente alla realtà: è sempre indispensabile una
forma di adattamento o interpretazione dei dati. Il computer elabora i dati e opera su numeri e dati
che sono contenuti internamente sotto forma di digitazioni binarie. Il processo di astrazione dalla
realtà per la rappresentazione della geologia, tettonica, geofisica o qualsiasi altra proprietà della
superficie terrestre prende il nome di modello simbolico.
Il processo di definizione e organizzazione dei dati riferiti alla realtà in un coerente insieme di dati
digitali prende il nome di Data Modelling o modellizzazione dei dati (in qualche caso
Modellizzazione Concettuale).
L’organizzazione logica dei dati secondo una schema (prestabilito) prende il nome di Modello Dati
(Data Model). La realtà deve pertanto essere descritta mediante un modello dati e una Struttura
Dati che si adatta alla rappresentazione di tale modello. Infine deve essere scelto un Formato di File
(File Format), funzionale alla struttura dati. Ad esempio i dati spaziali relativi alle altezze possono
essere rappresentati secondo un modello raster, il raster a sua volta è organizzato in una struttura
dati “run-lenght encoded” e i dati registrati su un dispositivo di memoria in un formato di file del tipo
“*.CUT” file o “*.Tiff” (Tagged Image File Format). Alternativamente la superficie a terra potrebbe
essere descritta mediante un modello vettoriale, espresso da poligoni delimitati da archi.
In questo caso i dati potrebbero essere organizzati in Coverage (metodo Arc/Info) o Temi
(metodo/ArcView) scritti sul dispositivo di memorizzazione secondo il formato “*.e00” o
40
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
“shapefile”. Il modello TIN (Triangular Irregular Network) è un altro modello dati utilizzato per la
descrizione del modello digitale del terreno.
E’ chiaro che non esiste un unico modo di organizzare, descrivere, e registrare i dati e le
informazioni: la scelta del modello dati, della struttura dati e dei formati di registrazione è soggettiva
e dipende dagli obiettivi del progetto. I Dati sono definibili come fatti verificabili della realtà che
rappresentiamo, mentre le Informazioni si riferiscono a dati organizzati in modo da rendere
comprensibile il contenuto, permettere l’elaborazione ecc.
Le informazioni spaziali sono difficilmente estraibili dai dati se questi ultimi non sono organizzati
originariamente mediante specifiche che richiedano informazioni e attributi spaziali. Lo spazio
geografico deve essere rappresentato mediante quantità discrete in quanto le grandezze continue,
come il campo magnetico o gravitazionale, non possono essere registrate come tali: ciò dipende dalla
struttura dei computer che richiedono per la trattazione dei dati una loro organizzazione in quantità
discrete ovvero non-continue.
Tutti i dati spaziali sono rappresentabili mediante entità geografiche discrete come Punti, Linee e
Poligoni.
I modelli vettoriali (vettoriali) e raster (immagini) sono schemi comunemente riconosciuti per
l’organizzazione di dati spaziali all’interno dei GIS.
Un DataBase è una raccolta di dati inter-relazionati. Un DataBase Management System (DBMS) è
un software (sw) per immagazzinare, editare e recuperare i dati contenuti nel database.
Molti GIS gestiscono separatamente i dati spaziali e non spaziali; altri utilizzano un DBMS interno o
connessioni a DBMS esterni (Oracle™, Informix™, Access™).
2.2.1.2 Conoscere il processo di creazione di un modello dei dati.
La creazione di un modello di dati si articola nelle fasi di progettazione :
• CONCETTUALE
• LOGICA
• FISICA
2.2.1.3 Conoscere i concetti di modello concettuale, modello logico, modello fisico.
Due tipi (principali) di modelli
 modello concettuale
 modelli logici
 modelli concettuali
MODELLO CONCETTUALE
Un modello concettuale rappresenta concetti (entità e relationi tra le entità, a differenza di un
modello mentale che descrive idee di un certo dominio del problema.
La modellazione o progettazione concettuale è una tecnica molto nota di progettazione dati, assieme
alla progettazione logica e alla progettazione fisica .
Il modello concettuale deve essere per definizione indipendente dai dettagli dell'implementazione,
come la concorrenza o la memorizzazione dei dati.
Lo scopo del modello concettuale è esprimere il significato di termini e concetti usati dagli esperti del
dominio per discutere il problema, e a trovare le giuste relazioni tra concetti differenti. Questo
modello è anche chiamato modello semantico.
Il modello concettuale cerca di chiarire il significato di vari termini spesso ambigui, e assicura che
non ci siano problemi con una differente interpretazione di termini e concetti. Questo perché, tali
interpretazioni possono portare errori nel progetto software basato su tale interpretazione dei
41
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
concetti. Una volta che i concetti del dominio sono stati modellati, il modello diventa una base stabile
per lo sviluppo successivo dell'applicazione nel dominio. I concetti del modello concettuale possono
essere usati come base di una progettazione orientata agli oggetti e implementati in un programma,
come le classi di un linguaggio orientato agli oggetti. La realizzazione di modelli concettuali di
domini diversi possono essere combinati tra di loro a formare una piattaforma coerente.
Un modello concettuale può essere descritto usando varie notazioni, come UML o OMT per la
progettazione a oggetti, o IE o IDEF1X per il Modello entità-relazione.
Nella notazione UML, il modello concettuale è spesso descritto con un class diagram nel quale le
classi rappresentano concetti, le associazioni rappresentano relazioni tra i concetti e i role type di
un'associazione rappresentano i "role types" assunti dalle istanze dei concetti nelle varie situazioni.
Nella notazione ER, il modello concettuale è descritto con un diagramma ER nel quale le entità
rappresentano i concetti, cardinalità and opzionalità rappresentano le relazioni tra i concetti. (da
Wikipedia, 2009)
MODELLI LOGICI
Adottati nei DBMS esistenti per l’organizzazione dei dati. Tali modelli sono utilizzati dai programmi
e sono indipendenti dalle strutture fisiche. Alcuni esempi di tali modelli sono: relazionale, reticolare,
gerarchico, a oggetti.
Il Modello relazionale
“…Una relazione è una struttura bidimensionale che contiene dati…” questo concetto sintetico
corrisponde in pratica a una tabella. Una fila di una relazione è una tupla e una colonna è un campo,
o un attributo o un item. La tupla è un analogo del record dati di un file, che contiene una raccolta
di dati relativi a diversi attributi che descrivono le proprietà di un oggetto spaziale. Una chiave o un
campo chiave, è un attributo che identifica univocamente le tuple e fornisce una connessione tra una
relazione e un’altra. La tabella di Fig. 2-28 è un esempio di una relazione che concerne dati
geochimici che costituiscono una parte di un vasto database geochimico. Ogni fila o tupla della
tabella è un campione. I campi sono attributi che rappresentano la proprietà dei campioni; il numero
del campione non può essere utilizzato come campo chiave perché non si hanno valori unici (anche
se nell’esempio sono riportati valori unici). Così l’anno di rilevamento e il numero del campione sono
trattati insieme come una chiave composita. I campi chiave, sia singoli sia compositi, sono anche noti
come attributi identificativi. Le proprietà di un database relazionale, come definite da Codd (1970)
sono:
 Tutti i dati devono essere rappresentati in forma tabulare, diversamente che nei modelli
gerarchici o ramificati
 Tutti i dati devono essere atomici. Questo significa che ogni cella di un tabella deve
contenere solo un valore. Nella tabella di fig. 22 ogni campione può avere solo un valore
per ogni elemento (ad es. per lo Zn). Analisi e dati ripetuti richiedono più tuple.
 Non sono ammessi duplicati delle tuple
42
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS

Le tuple possono essere riorganizzate senza che il significato delle loro relazioni cambi.
Ad esempio i campioni possono essere disposti nella tabella in ogni ordine senza alterare
il contenuto della tabella.
Fig. 2-28 – Tavola con attributi geochimici organizzati in un “file piano”. Ogni campione è
registrato su una linea separata (tupla, fila o record). Ogni attributo occupa una colonna o
campo. Questa tabella rappresenta una relazione in un database relazionale. Ogni fila è
chiamata “tupla” (traslitterazione dall’inglese tuple). Una o pìù colonne possono essere dei
“campi chiave” o semplicemente chiave, in quanto essi collegano una relazione con un’altra.
Qui due campi “anno” e “numero di campione” sono combinati e utilizzati come “campochiave “ composito.
Un concetto essenziale nella progettazione di un database relazionale è la normalizzazione, che è il
processo di conversione di relazioni complesse in un grande numero di relazioni più semplici che
soddisfino le regole relazionali. Il processo di normalizzazione è più facilmente spiegabile attraverso
un esempio. Supponiamo che una carta geologica sia stata digitalizzata e che una tabella iniziale sia
stata creata per collegare i poligoni (gli oggetti spaziali o le entità) ad una serie di attributi che
descrivono la litologia e l’età (tabella A nella Fig. 2-29). Nella convenzione dei database relazionali
questa relazione può essere riferita nel modo seguente:
POLIGONI (poly#,Fm_name,lithology,age)
Dove POLIGON è il nome della relazione, poly# è il campo chiave (sottolineato), Fm_name,
lithology e age sono attributi rappresentati in questo caso da stringhe di testo. “Fm_name” è il nome
della formazione geologica, “lithology” il nome del litotipo dominante e “age” l’età geologica
relativa. Considerando che gli attributi testuali possono essere causa di difficoltà (le definizioni
cambiano con il tempo e sono spesso soggettive), il primo passo nella riorganizzazione della
relazione di fig. 23A, è aggiungere un nuovo attributo numerico in sostituzione dell’attributo
testuale. Accanto al nome della formazione, si aggiunge il campo numerico Fm#; lo stesso per i
campi lith#, e age#. In questo modo la nuova tabella di Fig. 2-29B può essere espressa dalla
espressione:
POLIGONI (poly#,FM#,Fm_name,lith#,lithology,age#,age).
43
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-29 - A (in alto): la relazione Poligoni prima della normalizzazione: si noti che molte
formazioni sono ripetute più di una volta. Una grande tabella organizzata in questo modo
sarebbe di difficile editazione modifica, in quanto ogni cambio necessiterebbe di essere
ripetuto molte volte. B: la stessa tabella in A dopo l’aggiunta di alcuni campi numerici come
prima fase della normalizzazione.
Si noti come il numero delle formazioni sia ripetuto molte volte, perché più di un poligono
cartografato può appartenere alla stessa formazione. Anche in questo semplice esempio c’è una
considerevole ridondanza nella tabella, perché i poligoni 4,5,7 contengono tutti la stessa formazione,
che è ripetuta in tre tuple. Il primo passo nella normalizzazione consiste nella eliminazione delle
ripetizioni e delle ridondanze. A questo fine è indispensabile creare una nuova tabella chiamata
FORMAZIONE e una semplificazione della tabella POLIGONI nel modo seguente:
POLIGONI(poly#,Fm#), and
FORMAZIONE(Fm#,Fm_name,lith#,lithology,age#,age).
In una grande mappa con migliaia di poligoni, questa semplificazione porta già ad un considerevole
risparmio di memoria e, cosa più importante, ad una organizzazione dei dati più efficiente. Il numero
di formazione (Fm#) diviene in questo caso l’attributo di connessione fra le due relazioni, essendo il
campo chiave nella tabella FORMAZIONE. Questo consente alla tabella FORMAZIONE di essere
editata indipendentemente dalla tabella POLGONI e viceversa. In ogni caso la tabella
FORMAZIONE contiene ancora dei gruppi ripetuti perché le formazioni 2, 3 e 4 hanno la stessa età.
44
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Questo può essere rettificato semplificando la tabella FORMAZIONE creando una tabella ETA’
separata.
FORMAZIONE(Fm#,Fm_name,lith#,lithology,age#), e
ETA’(age#,age)
Ora ogni tupla nelle tabelle (o relazioni) POLIGONI, FORMAZIONE e ETA’ non contiene gruppi
ripetuti e la tabella (o relazione) ETA’ può essere editata singolarmente e aggiornata. In un database
reale la tabella ETA’ potrebbe avere oltre 100 tuple che riportano intervalli di età anche non legati a
una particolare formazione nella tabella FORMAZIONE. Nel lessico dei DBMS le relazioni senza
gruppi ripetuti sono definite in “prima forma normale” o “forma normale” (1NF).
La seconda fase di normalizzazione consiste nell’assicurare che ogni attributo non identificativo (gli
attributi che non sono chiave) sia in corrispondenza biunivoca stretta con il campo chiave. Il campo
chiave, (attributo identificativo) può essere definito su più attributi (attributi multipli). Ad esempio
supponiamo il caso di una tabella che contenga i record relativi a campioni di rocce; ogni campione
ha un suo numero, ma lo schema di campionatura prevede che si ricominci da 1 ogni volta che si
esegue un nuovo rilevamento. In questo caso potremmo utilizzare una tavola per il numero di
rilevamento e il numero di campione come attributo identificativo, per costituire una chiave
“composita” o “accoppiata”; è indispensabile ricordare che né il numero di campione né il numero di
rilevamento possono da soli definire la chiave. Le relazioni stabilite con questo criterio si dicono in
Seconda Forma Normale (2NF).
La terza fase di normalizzazione consiste nell’assicurare che gli attributi non identificativi siano
mutuamente indipendenti. Questo non è il caso della tabella FORMAZIONE perché lith# e lithology
sono “dipendenti” uno dall’altro in rapporto 1:1 nel senso che per ogni lith# si può sempre
individuare una litologia e viceversa. Anche il nome della formazione e il relativo numero sono
dipendenti l’uno dall’altro, ma il Fm# è un attributo identificativo, essendo un campo chiave, e
conseguentemente richiede una normalizzazione. Per rettificare il problema con la litologia, la tabella
FORMAZIONE, è ulteriormente semplificata ed è definita una nuova tabella chiamata LITOLOGIA:
FORMAZIONE(Fm#,Fm_nome,lith#,age#) e
LITOLOGIA(lith#, litology).
Questa operazione completa il processo di normalizzazione e ha il risultato di decomporre la tabella
originale in quattro tabelle più semplici che sono ora definite in terza forma normale (3FN). Queste
tabelle semplificate sono, come mostrato nella tabella di Fig. 2-30, riassumibili in:
POLIGONI (poly#,Fm#),
FORMAZIONE(Fm#,Fm_nome,lith#,age#),
LITOLOGIA(lith#, litology), e
ETA’(age#,age).
45
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-30 – Relazioni dalla tabella di Fig. 2-28 dopo la normalizzazione in “terza forma
normale”. Si noti che sono eliminate le ripetizioni, rendendo l’editing più facile come mostrato
nella Fig. 2-31.
Il processo di normalizzazione può essere portato ancora avanti, fino almeno alla “quinta forma
normale”.
Lo scopo primario di questa decomposizione quelle che sono note come anomalie, in altre parole
degli effetti indesiderati che ricorrono quando le relazioni non sono in forma normale. Queste
anomalie si verificano quando le tabelle vengono modificate aggiungendo o cancellando delle tuple.
E’ ovvio che quando si devono eseguire delle modifiche in relazioni non normalizzate, i cambiamenti
devono essere eseguiti in tutte le tuple in cui appare il valore da modificare (tabelle in Figg. 2-31 e 232). Paradossalmente la formalizzazione sacrifica la velocità del recupero dell’informazione. Per
aumentare la velocità del recupero dell’informazione “distribuita” nelle varie relazioni, queste
possono essere di nuovo unite e ordinate secondo vari criteri, sia per l’edizione sia per la
comprensione del modello. L’operatore che esegue questa unione si chiama JOIN.
Possono esistere tre tipi differenti di relazioni fra le tabelle
Relazione Uno-a-molti
Iniziamo con la relazione Uno-a-molti. Questo è il tipo di relazione che si ha fra le tabelle Clienti e
Ordini. Un unico numero cliente identifica ogni cliente. Questo cliente, identificato univocamente,
può fare diversi ordini dei prodotti indicati. Quindi il DBMS può trovare una corrispondenza tra ogni
singolo record della tabella Clienti (uno) e un infinito numero di record (molti) della tabella Ordini.
Le relazioni Uno-a-molti sono probabilmente quelle più comuni dei tre casi possibili; comunque non
bisogna dimenticare le altre due.
46
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-31 - Editing della relazione mostrata in Fig. 2-29 prima della normalizzazione.
Supponiamo che sia stato scoperto che la formazione di Mount. non sia un gabbro, bensì un
granito. Sebbene questo sia un esempio triviale è evidente che un caso del genere obbliga a
una correzione di 3 tuple nella tabella non-normalizzata
Fig. 2-32 –Dopo la normalizzazione le relazioni POLIGONI e ETA’ rimangono inalterate
mentre due piccoli cambiamenti sono necessari per le relazioni FORMAZIONI e
LITOLOGIA. Supponiamo che questo cambio sia fatto in una situazione reale di una carta
geologica contenente alcune migliaia di poligoni; anche in questo caso i cambiamenti
sarebbero della stessa entità di quelli dell’esempio in quanto la relazione POLIGONI rimane
inalterata.
Relazione Molti-a-uno
Questa relazione, opposta alla prima, è quella che si ha nel caso di una carta geologica o tematica e
la sua legenda; in un database possiamo avere numerose record relativi ai diversi poligoni in cui
affiora la stessa formazione. Per non ripetere a ogni record di questo tipo la descrizione della
formazione ecc. il DBMS può trovare una corrispondenza tra i Molti record relativi ai poligoni della
stessa formazione e una tabella in cui sono riportate unicamente le descrizioni delle formazioni. Una
relazione di questo tipo serve a definire la cosiddetta Look Up table di una carta.
Relazione Uno-a-uno
Un'altra possibilità è la relazione Uno-a-uno. In questo caso, un record di una tabella ha un solo
record corrispondente nella seconda tabella. Un esempio potrebbe essere una casa editrice che
permette ai suoi autori di scrivere uno e un solo libro. Se si ha una tabella autori e una tabella libri
47
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
per la situazione descritta, le quali condividono un campo comune, numero autore, si ottiene una
relazione Uno-a-uno. Ogni record di autore avrebbe un solo record di libro corrispondente.
Relazione Molti-a-molti
Il terzo tipo è la relazione Molti-a-molti. In questo tipo di relazione, ogni record nella prima tabella
della relazione, può avere diverse corrispondenze nella seconda tabella, e ogni record nella seconda
tabella può avere diverse corrispondenze nella prima tabella.
Supponiamo che la casa editrice pubblichi una serie di libri che sono stati scritti da gruppi di
collaboratori. La compagnia ha due tabelle nel proprio database: una per gli autori e una per i libri.
Ogni libro è scritto da un gruppo di autori quindi i record della tabella hanno più di una
corrispondenza nella tabella degli autori. Allo stesso tempo, ogni autore può essere impiegato nella
scrittura di più di un libro. Quindi anche i record nella tabella autori hanno più di una corrispondenza
nella tabella libri e concludendo la relazione è Molti-a-molti.
Le modo operative dei diversi tipi di unioni descritte saranno viste nella sezione dedicata al sistema
GIS ArcView.
Il modello relazionale non è molto utilizzato per le coordinate spaziali dei vertici nel modello
vettoriale perché la sequenza dei vertici è di vitale importanza per definire una linea. L’applicazione
del modello relazionale potrebbe portare a violare l’ultimo dei principi di Codd sulle proprietà del
modello relazionale è cioè che le tuple in una relazione possono essere riorganizzzate solo se non si
modificano i dati.
Prima di abbandonare l’argomento delle Tabelle degli Attributi è importante notare che esse
rappresentano un link unificante tra il modello raster e il modello vector. Supponiamo una mappa che
mostri diversi tipi di roccia, (Fig. 2-33); i poligoni riferiti a diversi tipi di roccia sono le entità spaziali
cui sono collegate le tabelle degli attributi sia nel modello vector (Fig.2-33A), che nel modello raster
ottenuto per conversione automatica dai dati vettoriali. Nel modello raster gli oggetti spaziali sono
ora divenuti pixel che nel loro complesso individuano le entità poligonali (Fig.2-33B). In questo
modo i due modelli condividono la stessa tabella degli attributi (Fig.2-33C). Questo esempio illustra
il dualismo tra il modello Raster e il modello Vector e che i pixel considerabili come oggetti spaziali
nel modello raster, possono essere considerati come membri di uno oggetto spaziale composito
(poligono) nel modello vettoriale.
48
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-33- A: Un carta geologica nel modello vettoriale. B: la stessa carta nel modello raster. C:
Entrambi i modelli utilizzano la stessa tabella degli attributi. La tabella degli attributi nel
modello raster è un puntatore (ha lo stesso codice) al numero del poligono.
MODELLI CONCETTUALI
Modelli concettuali
Permettono di rappresentare i dati in modo indipendente da ogni sistema e cercano di descrivere i
concetti del mondo reale.Sono utilizzati nelle fasi preliminari di progettazione.
Il più diffuso è il modello Entity-Relationship (M
Entità:
Rappresentano concetti (un raggruppamento di nomi, una classe o una categoria di “cose”),
significativi per l’applicazione e sui quali esiste la necessità di raccogliere informazioni.
Tutte le entità sono rappresentate da sostantivi, ma non tutti i sostantivi sono riconducibili a delle
entità. CITTA’, DIPARTIMENTO, IMPIEGATO, ACQUISTO e VENDITA sono esempi di entità
di una applicazione aziendale.
Un’occorrenza di una entità è un’istanza della classe che l’entità rappresenta.
Creazione di Entità
Esaminare i sostantivi e per ciascuno domandarsi: è significativo per l’applicazione? l’applicazione ha
necessità di raccogliere dati su di esso? è un gruppo o un’istanza di un gruppo?
Nominare l’entità (al singolare) associando gli eventuali sinonimi;
Descrivere formalmente l’entità, verificarne la conformità con le specifiche e verificare l’uniformità di
comprensione del significato attribuito;
49
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Relazioni
Rappresentano legami logici, significativi per l’applicazione, tra due o più entità.
RESIDENZA è un esempio di relazione che può intercorrere tra le entità CITTÀ e IMPIEGATO;
ESAME è un esempio di relazione che può sussistere tra le entità STUDENTE e CORSO.
Un’istanza di relazione è una ennupla (coppia nel caso più frequente di relazioni binarie) costituita da
istanze di entità, una per ciascuna delle entità coinvolte.
MODELLI FISICI
Il modello fisico di una base di dati descrive in dettaglio la struttura e le caratteristiche dell’insieme
delle tabelle che la costituiscono.
2.2.2 Rappresentazione continua e discreta della Realtà
Oggetti spaziali artificiali con limiti regolari
Ogni suddivisione regolare dello spazio produce oggetti spaziali poligonali di forma regolare, come i
pixel (quadrati) di un’immagine raster o i voxel, cubi aventi un pixel come base. La traccia di una
sezione o il piano di un profilo geologico sono un esempio di oggetti spaziali lineari e poligonali di
questo tipo.
Una differenza chiave tra i modelli dati raster e vector consiste nell’utilizzo di modelli spaziali
regolari per la trattazione raster, e di oggetti spaziali irregolari (artificiali o naturali) nella trattazione
vector (Figg.2-34 e 2-35).
Figura 2-34 – A: rappresentazione di un poligono nel modello vector. B: rappresentazione di
un poligono nel modello raster.
50
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-35. A Rappresentazione digitale di oggetti spaziali su una carta secondo il modello
vector. Il modello vector è un’astrazione della realtà nella quale gli oggetti spaziali sono
rappresentati come punti, linee e poligoni; questi ultimi sono geograficamente riferiti a un
sistema di coordinate. B: Rappresentazione di un’entità poligonale secondo il modello raster: i
dati spaziali vengono rappresentati come una matrice di celle, ognuna delle quali ha un valore
per un attributo. La posizione spaziale di un elemento è implicita nell’ordine delle celle del
grid.
2.2.2.1 Conoscere la rappresentazione della realtà attraverso il Modello Vettoriale.
Il modello vettoriale è molto utile alla rappresentazione di carte: punti, linee, poligoni e simboli
difficilmente possono essere rappresentati fedelmente mediante dati raster senza ricorrere a pixel
molto piccoli. Nella modo vettoriale le linee che racchiudono le aree sono delle poligonali che
passano da vertici, ognuno dei quali è ubicato in base a una coppia di coordinate nel sistema di
riferimento prescelto. Se i vertici di queste poligonali sono molto fitti, i perimetri e gli archi
rappresentano molto precisamente le forme delle entità geografiche cui si riferiscono.
La struttura dati necessaria alla registrazione dei dati vector è considerevolmente più complessa
rispetto all’omologa struttura raster e la rappresentazione al monitor o la stampa dei dati richiede
comunque la conversione Vector >Raster.
Rappresentazioni raster e vector possono essere differenziate sulla base di come rappresentano lo
spazio, oppure mediante il tipo di oggetti spaziali che utilizzano. Il modello raster utilizza una
enumerazione areale o volumetrica ; il modello vector utilizza linee o superfici per rappresentare
aree o volumi. Il modello raster descrive elementi poligonali o volumi direttamente. Il modello
vector registra i limiti degli oggetti e utilizza uno schema di collegamento (etichettamento o labeling)
che lega gli oggetti ai loro specifici attributi.
Il labeling implica la definizione degli attributi topologici: attributi spaziali (coordinate, lunghezze,
perimetri e aree) che definiscono le relazioni di adiacenza e contenimento fra gli oggetti spaziali.
51
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Il tipo fondamentale di modello vector è rappresentato dal modello a “spaghetti” dove i punti sono
rappresentati da coppie di coordinate spaziali, le linee da poligonali che passano da vertici di
coordinate note e i poligoni sono delimitati da linee chiuse. Se ogni punto, linea, poligono di una
carta geologica è digitalizzato mediante un digitalizzatore (manuale o automatico) la struttura che
otteniamo è quella riportata in Fig. 2-36.
Fig. 2-36– A: Nel modello a spaghetti le linee sono definite dai vertici le cui localizzazioni
spaziali sono registrate nelle tabelle delle coordinate geometriche. B: Il modello topologico
fornisce delle informazioni addizionali circa la adiacenza, contenimento, e connettività degli
archi e dei nodi.
Se gli oggetti spaziali sono registrati con i loro attributi informativi, generalmente con dati spaziali e
non-spaziali nello stesso file, i punti le linee e i poligoni possono essere stampati utilizzando diversi
simboli, spessori di linee o riempimenti di poligoni, a seconda attributi informativi registrati assieme
agli oggetti. Con una gestione di database minima degli oggetti spaziali e dei loro attributi, questi
possono essere selezionati ed elaborati per mostrare le caratteristiche selezionate. I cambi di scala e
di proiezione geografica applicate ai dati vettoriali sono dirette, permettendo l’ingrandimento di zone
specifiche e la loro modifica per una enorme varietà di scopi. Molti pacchetti software commerciali di
basso costo offrono questo tipo di funzionalità e per molte applicazioni, in scienze della terra,
rappresentano una soluzione ad elevato rapporto qualità/prezzo. Molti software (sw), come i
programmi di disegno tecnico tipo AUTOCAD™, sono in grado gestire automaticamente dati
cartografici o spaziali e offrono grandi possibilità di visualizzazione cartografica. La differenza
sostanziale tra questi sistemi basati su modelli vector e i GIS consiste nell’uso di relazioni
52
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
topologiche o dati topologici per la descrizione di relazioni spaziali tra gli oggetti. Nell’uso del
modello vector gli attributi topologici sono essenziali per una efficiente sovrapposizione e
elaborazione dei dati cartografici. La strutturazione dei dati vettoriali secondo un criterio topologico
è una differenza chiave tra il modello a “spaghetti” e il modello topologico.
2.2.2.2 Conoscere la rappresentazione della realtà attraverso il Modello Raster.
Il termine raster (dall’inglese trama, reticolo, griglia o schermo televisivo) trae origine dalla
tecnologia televisiva analogica, ovvero dal termine che indica le righe orizzontali (dette anche scan
line) dei televisori o dei monitor). In computer grafica, indica la griglia ortogonale di punti che
costituisce un'immagine raster. Nella grafica raster l'immagine viene vista come una scacchiera e ad
ogni elemento della scacchiera, chiamato pixel, viene associato uno specifico colore. Il colore può
essere definito con due tecniche:
 se l'immagine contiene pochi colori (massimo 256) si crea un elenco dei colori da utilizzare e
nella scacchiera viene inserito l'indice che punta allo specifico colore del pixel;
 nel caso si vogliano utilizzare molti più colori il singolo pixel non definisce più l'indice a una
tavolozza di colori ma definisce il colore direttamente.
Il colore viene definito come un'unione delle componenti blu, rossa e verde. Questo non è l'unico
modo di definire un colore, esistono molti modi che vengono chiamati spazi di colore ma nel caso
delle immagini generate al computer il sistema RGB (RED Rosso, GREEN verde BLUE Blu) è il più
diffuso dato che le schede grafiche lo utilizzano in modo nativo per generare il segnale da
visualizzare con il monitor (Fig. 2-37).
Fig. 2-37 – Modalità di gestione del colore
in una immagine raster RGB
Proprietà della grafica raster
La bitmap è caratterizzata da due proprietà:
 risoluzione;
 profondità di colore.
La prima è determinata dal numero di pixel contenuti nell'unità di misura considerata (in genere il
pollice inglese, che misura 2,54 cm) ed è ottenuta moltiplicando il numero di pixel orizzontali per
quello dei pixel verticali; si misura in PPI (Points Per Inch o Dot Per Inch). La seconda è definita
53
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
dalla memoria che si dedica ad ogni pixel, ovvero dal numero di bit dedicati ad ogni pixel per
descrivere il colore, e si misura in BPP (Bit Per Pixel); maggiore è il numero di bit, maggiore è il
numero di colori che è possibile descrivere.
La grafica bitmap non è vantaggiosa se l'utente necessita di apportare modifiche all'immagine, perché
nel caso ad esempio di uno zoom, la risoluzione diventa bassissima e quindi la qualità dell'immagine
peggiora notevolmente. I software grafici, per ridurre il problema, sono in grado di ripristinare la
risoluzione inserendo nuovi pixel che vengono calcolati facendo una interpolazione di punti, il
processo inserisce, perciò, deliberatamente una quantità di informazioni presunte.
La grafica bitmap è invece ideale per rappresentare immagini della realtà, per modificare contrasti e
luminosità di queste, per applicare filtri di colore.
Formati di immagini raster
I dati raster possono essere memorizzati attraverso tipologie di file che sfruttando algoritmi di
compressione diversi, gravando in modo differente sul supporto di memorizzazione. I formati raster
più comuni sono i seguenti:
Non compressi
Questi formati di file hanno richieste di elaborazione minima, non essendo necessari algoritmi di
compressione (in fase di scrittura) e decompressione (in fase di lettura), tuttavia, mancando di
compressione, risultano particolarmente voluminosi, in termini di spazio occupato su disco (o altro
dispositivo di memorizzazione), rispetto agli altri formati:
 raw
 bmp (in alcuni casi i file bmp sono compressi con un algoritmo RLE)
Con compressione lossless
Le immagini salvate con un algoritmo di compressione dati lossless occupano meno spazio nei
dispositivi di memorizzazione, mantenendo inalterata tutta l'informazione originale:



png (certe applicazioni permettono anche la scrittura di file png non compressi)
tga
tiff (sebbene questo sia l'uso più comune, questo formato permette diversi tipi di
compressione)
 gif (per immagini fino a 256 colori)
Con compressione lossy
Le immagini memorizzate con un algoritmo di compressione lossy, subiscono una perdita di
informazione; pertanto questa tecnica non è adatta per salvare le immagini che vengono rielaborate
coi programmi di fotoritocco (le continue modifiche comporterebbero un progressivo degrado
dell'immagine ad ogni salvataggio e riapertura); invece, in virtù delle ridotte dimensioni del file, sono
particolarmente indicate per la trasmissione di immagini o per ridurre le dimensioni di un'applicazione
o di un prodotto da distribuire.
 jpeg
 gif (per immagini con più di 256 colori si ottiene una compressione lossy poiché vengono
eliminate la maggior parte delle sfumature di colore)
Altre applicazioni
Nel campo dei Sistemi informativi territoriali o GIS, il termine raster è usato per indicare la tipologia
di dato impiegata nella rappresentazione cartografica digitale. Con i dati raster il territorio viene
54
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
riprodotto attraverso una matrice di pixel di forma quadrata o rettangolare. A ciascun pixel è
associato un attributo che definisce le caratteristiche dell'elemento rappresentato. Ad esempio in un
modello digitale di elevazione a ciascun pixel è associato il valore della quota sul livello del mare in
quel punto. La dimensione dei pixel è inversamente proporzionale alla precisione della carta. I dati
raster possono essere implementati in un sistema GIS mediante acquisizione diretta con
apparecchiature a lettura ottica quali ad esempio scanner d'immagini o attraverso l'elaborazione di
dati, raster o vettoriali, già acquisiti.
(da Wikipedia, 2009)
Uno dei vantaggi del modello raster e che i dati diversi tipi di dati spaziali possono essere
sovrapposti senza la necessità di complessi calcoli numerici o geometrici che sono invece
indispensabili nella trattazione vettoriale. Nel modello raster ogni strato di reticolo di celle registra un
attributo separato. Le celle sono costanti in forma e sono generalmente quadrate sebbene siano
utilizzate rettangoli, triangoli, equilateri o esagoni per questo le coordinate spaziali non sono
generalmente esplicitate per ogni cella e la a localizzazione delle celle è ottenuta mediante la
numerazione di file e colonne. La risoluzione spaziale di un raster è la dimensione sul terreno di un
pixel. Con una risoluzione di 100 m, un’area quadrata di 100 km di lato richiede un raster di 1000
file per 1000 colonne per un totale di 1.000.000 di pixel.
2.2.3 Topologia
2.2.3.1 Conoscere il concetto di topologia.
La realtà fisica o geografica può essere rappresentata mediante entità geometriche semplici: punti,
linee e poligoni. Quando studiamo una carta, la nostra mente ottiene delle informazioni addizionali
interpretando le relazioni spaziali tra le feature geografiche che stiamo studiando e quelle vicine. Ad
esempio, si può tracciare un percorso lungo una carta stradale per individuare la strada tra un
aeroporto e un albergo oppure individuare due particelle di terreno contigue e la strada lungo la
quale esse sono ubicate.
Nella cartografia numerica (o digitale), tali relazioni spaziali sono definite utilizzando la topologia.
La topologia o studio dei luoghi (dal greco τοπος, luogo, e λογος, studio) è una delle più importanti
branche della matematica moderna. Si caratterizza come lo studio delle proprietà delle figure e delle
forme che non cambiano quando viene effettuata una deformazione senza "strappi",
"sovrapposizioni" o "incollature". Concetti fondamentali come convergenza, limite, continuità,
connessione o compattezza trovano nella topologia la loro migliore formalizzazione.
La topologia si basa essenzialmente sui concetti di spazio topologico, funzione continua e
omeomorfismo. Col termine topologia si indica anche la collezione di aperti che definisce uno spazio
topologico.
Per esempio un cubo e una sfera sono oggetti topologicamente equivalenti (cioè omeomorfi), perché
possono essere deformati l'uno nell'altro senza ricorrere a nessuna incollatura, strappo o
sovrapposizione; una sfera e un toro invece non lo sono, perché il toro contiene un "buco" che non
può essere eliminato da una deformazione (da Wikipedia, 2009)
2.2.3.2 Conoscere i concetti di adiacenza, connettività e “definizione di area” (Contenimento).
La topologia è il termine utilizzato per riferirsi alla continuità di spazio e proprietà spaziali, quali la
connettività, che restano inalterate dalle distorsioni. Nella rappresentazione delle entità spaziali dei
modelli vettoriali una proprietà topologica, come la connettività, è definita esplicitamente da un
puntatore diretto fra i record di oggetti che sono tra loro legati nello spazio (ad esempio il punto la
connessione tra due strade). La topologia è una relazione matematica per definire esplicitamente le
55
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
relazioni spaziali tra le entità. Il principio è in pratica semplice: la topologia esprime le diverse
relazioni spaziali come una lista di feature geografiche (es. un’area è definita da archi che ne
delimitano i bordi).
L’abilità di creare è immagazzinare le relazioni topologiche ha un gran numero di vantaggi. La
topologia consente di immagazzinare i dati in modo più efficiente permettendo l’elaborazione di una
grossa mole di dati in tempi minori. Nel modello vettoriale le entità lineari (archi) sono
geometricamente descritte da un set di coordinate che individuano i vertici di una poligonale. Da un
punto di vista delle proprietà topologiche le coordinate dei vertici assumono il significato espresso
nei tre principi che seguono:
1. Gli archi si connettono l’uno all’altro in corrispondenza dei nodi (Principio di
CONNETTIVITA’)
2. Gli archi che connettendosi racchiudono un’area definiscono un poligono (Principio di
DEFINIZIONE DELL’AREA)
3. Gli archi hanno una direzione ed un poligono di destra e un poligono di sinistra
(Principio di CONTIGUITA’)
Principio di CONNETTIVITA’
I punti (di coordinate x, y) lungo l’arco sono definiti vertici e definiscono la forma dell’arco. Le
terminazioni dell’arco sono dette nodi. Ogni arco ha due nodi: un nodo di partenza (a from-node ) e
un arco di arrivo (a to-node).Gli archi si connettono ai nodi. Tracciando tutti gli archi che si
connettono a un nodo, Arc/Info riconosce quali archi connettere. Nella Fig. 2-38 gli archi 3,4,5, e 6,
tutti si connettono al nodo 3. Con questa informazione il computer sa che è possibile viaggiare lungo
l’arco 5 e girare lungo l’arco3 perché loro condividono il nodo 3, ma non è possibile andare
direttamente dall’arco5 all’arco 9 perché l’arco5 e l’arco 9 non condividono nessun nodo comune.
56
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-38 – Il principio di connettività degli archi.
Principio di DEFINIZIONE DELL’AREA
I poligoni sono rappresentati da una serie di coordinate x, y che una volta connesse delimitano
un’area. Il sw Arc/Info immagazzina gli archi che delimitano i poligoni, piuttosto che un set di
coordinate chiuse. Una lista di archi che costituiscono ogni poligono è immagazzinata ed utilizzata,
se necessario, (per esempio per disegnare i poligoni). Nella Fig. 2-39 gli archi 4,6,7,10 e 8
comprendono il poligono 2. Lo 0 prima dell’8 indica che gli archi formano un’isola all’interno del
poligono 2. Sebbene un arco possa apparire nella lista dei poligoni per alcune volte, esso è
immagazzinato una sola volta. Immagazzinando le entità geografiche una sola volta si economizza
molto sulla memoria impegnata dal data base e inoltre i bordi dei poligoni adiacenti non si
sovrappongono.
2.2.3.3 Saper distinguere i termini di struttura di dati vettoriali a spaghetti (o CAD) e
struttura di dati vettoriali topologica.
Nel modello topologico, i limiti tra i poligoni sono interrotti in una serie di archi e nodi e le relazioni
spaziali tra queste entità sono registrate nella Tabella degli Attributi (Fig. 2-40). Nel modello a
spaghetti il limite tra due poligoni adiacenti è registrato due volte, uno per ogni poligono; questo
approccio porta a una duplicazione della memoria impegnata e a una non esatta corrispondenza tra i
due limiti del poligono. Nel modello topologico il poligono a destra e a sinistra di ogni arco è
definito esplicitamente e di conseguenza i limiti dei poligoni non sono mai ripetuti. Una importante
differenza tra il modello a spaghetti e il modello topologico riguarda le aree completamente coperte
da poligoni. Nel modello a spaghetti non è necessario che i poligoni occupino tutto lo spazio
formando un mosaico interconnesso, spazialmente esaustivo e non-ripetitivo. Ad esempio se la
regione è sottoposta a inondazioni regolari e la carta mostra le estensioni dell’area inondabile in
diverse date, nel modello a spaghetti i poligoni possono sovrapporsi e non è necessario che ricoprano
tutta l’area. Per un database di piccole dimensioni, questo modello organizzativo è molto
conveniente sia per interrogazioni spaziali semplici come determinare quale area , se è tra queste, tra
quelle inondate contiene la localizzazione geografica richiesta. Per i database di grandi dimensioni
con migliaia di aree poligonali e per le interrogazioni che richiedono una copertura completa delle
aree senza aree nulle, il modello a spaghetti non è sufficiente.
57
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-39- Il principio di definizione dell'area
Fig. 2- 40 - Il principio di contiguità
Questa situazione è superata nel modello topologico dal cosidetto Planar Enforcement, che porta
alla creazione di un set di poligoni che riempiono completamente la superficie da rappresentare. In
questo modo ogni punto della superficie è contenuto all’interno di un poligono. Sia il modello
topologico sia il modello raster soddisfano questa condizione. La Fig. 2-41 illustra il concetto di
Planar Enforcement per una carta che mostra la sovrapposizione tra due aree rilevate.
Gli attributi topologici degli oggetti spaziali sono delle caratteristiche che non variano anche nel caso
di trasformazioni come traslazione, cambio di scala, rotazione e taglio. Le coordinate spaziali e
58
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
alcuni attributi geometrici degli oggetti spaziali, come l’area il perimetro e l’orientazione sono
soggetti da tali trasformazioni, tuttavia la contiguità, la definizione dell’area e la connettività sono
caratteristiche topologiche che rimangono invariate (Fig. 2-42).
Nel modello topologico, gli attributi degli oggetti spaziali sono definiti in aggiunta alle coordinate
spaziali del modello a spaghetti. La costruzione della topologia significa aggiungere una struttura
topologica a una struttura a spaghetti e realizzare un Planar Enforcement dello spazio rappresentato.
Si consideri l’esempio in una carta di entità poligonali che sia digitalizzata mediante un CAD con un
modello a spaghetti: la topologia può essere aggiunta o costruita in un GIS prima di eseguire delle
operazioni di analisi spaziale che richiedono la presenza di attributi topologici. Una volta che i dati
spaziali sono rappresentati mediante un modello topologico la cancellazione di vertici, linee,
poligoni, influenza non solo la struttura geometrica (le coordinate spaziali), ma anche la struttura
topologica.
Per questo motivo, dopo ogni operazione di questo genere (cancellazione, aggiunta o aggiornamento
della geometria), è indispensabile ricostruire di nuovo la topologia.
Fig. 2-41 – A: In A sono mostrati i limiti di tre rilevamenti portati avanti in diversi anni; si
noti che le aree rilevate si sovrappongono in alcune aree, mentre altre sono completamente
assenti. Nella struttura dai a spaghetti questa suddivisione delle aree è ammessa. B: Le stesse
aree di rilevamento dopo il Planar Enforcment creato dal modello topologico, sono divise in 7
poligoni. Applicando, come in questo caso, il modello topologico è indispensabile la creazione
di una tabella degli attributi per mettere in relazione i poligoni con i rilevamenti.
59
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-42 - A: Entità poligonale su una carta geologica. B: La stessa entità dopo aver applicato
una trasformazione di taglio: area, perimetro e orientazione sono variate, restano invariate
solo le caratteristiche che dipendono dai principi di contiguità, definizione d’area o
contenimento e connettività.
Il modello vector è più adatto alla rappresentazione delle entità geografiche su una carta, perché le
curve che rappresentano i limiti dei poligoni o di altre entità sono approssimabili in modo migliore
con un sistema di coordinate piuttosto che con una matrice di punti regolarmente spaziati come nel
modello raster. Tuttavia è da tenere presente che la fedeltà cartografica è spesso più apparente che
reale a causa del livello di campionatura che hanno i limiti delle feature poligonali riportate nelle
carte. Il modello topologico risulta indispensabile quando sono richieste nelle forme di interrogazione
attributi topologici, come “trovare tutti i poligoni che hanno i graniti su un lato”. L’aspetto negativo
del modello topologico è il notevole impegno di elaborazione richiesto alla CPU del computer
Di notevole interesse sono anche i modelli dati che utilizzano poligoni irregolari per modellare le
superfici. Il Triangular Irregular Network (TIN) è utilizzato principalmente per rappresentare
l’elevazione digitale delle superfici. Il modello di Voronoi suddivide una regione in poligoni di
Voronoi e Thiessen; in entrambi i modelli i dati derivano dagli attributi dei punti. La superficie da
rappresentare è l’altitudine di un’area (Fig.2-43), e l’obiettivo della modellizzazione è di convertire
degli oggetti puntuali in un mosaico di oggetti areali che approssimino al meglio una superficie. Il
metodo preferito è la triangolazione di Delunay, che produce un unico set di triangoli. Le faccette
triangolari risultanti formano un mosaico di una superficie piana le cui geometrie nello spazio sono
definite dall’altezza (coordinata z) dei vertici del triangolo; il rilevo topografico del terreno risulta
ben approssimato da questo set di triangoli. La rete di triangoli risulta vantaggiosa perché la
dimensione dei triangoli varia al variare della densità dei punti, con una dimensione maggiore dove i
punti sono distanziati e una dimensione minore dove i punti sono fitti.
60
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-43 - Relazioni tra i triangoli di Delunay (linee tratteggiate) con i punti di partenza ai
vertici dei triangoli e i poligoni di Thiessen e Voronoi (linee intere) , ognuno dei quali contiene
un solo punto. I triangoli formano un modello vettoriale costituito da una rete irregolare di
triangoli (TIN).
Dove i punti traggono origine da una superficie a curve di livello la densità dei punti incrementa con
la densità delle linee, fornendo una maggiore densità di piccoli triangoli sui versanti a maggiore
pendenza rispetto alle zone meno inclinate. Il modello TIN risulta vantaggioso per le discontinuità
morfologiche che riesce a rappresentare implementandolo con le Breakline, superfici di discontinuità
netta che inserite nel modello TIN permettono di evidenziare pareti verticali, falesie, faglie.
2.2.3.4 Conoscere le relazioni topologiche dei dati raster (essenzialmente basata sul concetto di
adiacenza/vicinanza).
Nello spazio definito tramite un modello dati raster, il concetto topologico di base che caratterizza i
dati vettoriali (la Connettività) è implicitamente ereditato dalla struttura geometrica dei dati. Infatti
come sopra descritto, la regione di interesse e completamente suddivisa da pixel , in cui la
dimensione x=y. Inoltre tale spazio è definito dalle coordinate X max, X min; Ymax; Ymin (Fig.
2-44).
61
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-44 (mod. da geoserver.disat.unimib.it)
Ogni cella possiede otto celle confinanti con essa: 4 nelle direzioni cardinali e 4 nelle direzioni
diagonali. Le celle sono identificate attraverso la loro posizione nella griglia e la localizzazione di una
cella può essere calcolata in base alla sua posizione e alla sua dimensione
position in the grid
2.3 DBMS 2.3.1 DBMS e GIS (SIT)
2.3.1.1 Sapere cosa è un DBMS.
Definiamo prima una Base di dati secondo una accezione generica e metodologica. Una base di dati è
un “Insieme organizzato di dati utilizzati per il supporto allo svolgimento delle attività di un ente
(azienda, ufficio, persona) (accezione specifica, metodologica e tecnologica)”
Una base di dati la si può definire anche come un “Insieme di dati gestito da un DBMS”
I DATABASE MANAGEMENT SYSTEM (DBMSs)
Un database è una grande raccolta di dati tra loro inter-relazionati immagazzinati all’interno di un
ambiente computerizzato. I dati immagazzinati in questi ambienti sono persistenti, (indipendenti dalla
evoluzione e durata dei sistemi hardware e software). Molte applicazioni “non standard” dei DB
sono emerse negli ultimi 15 anni e riguardano i database spaziali, le immagini, il computer-aided
design (CAD) e il manifacturing-aided design (CAM), il DB testuale, l’ingegneria del software e la
bionformatica. Un database può essere visto come un unico o più file immagazzinati su un device di
memoria (disco).
Un Data Base Management System (DBMS) è una raccolta di software che gestisce la
struttura del DB e controlla l’accesso dei dati che sono immagazzinati nel database.
Generalmente parlando un DBMS facilita il processo di:
 Definire un database; cioè specificare il tipo di dato, la struttura ed i constraint che devono
essere considerati
 Costruire il database; cioè immagazzinare i dati all’interno di memorie persistenti
62
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
 Manipolare il database
 Interrogare il database per recuperare dati specifici
 Aggiornare il database (changing value)
Un DBMS dipende dal fondamentale concetto della indipendenza dei dati. L’utente interagisce con la
rappresentazione dal reale immagazzinamento fisico, ed il DBMS è incaricato di tradurre le
manipolazioni dell’utente in efficienti operazioni sulla struttura fisica dei dati.
Questo meccanismo si ottiene attraverso l’uso di differenti livelli di astrazione. E’ comune nei DB
distinguere tre livelli di ambiente dei sistemi:
 Il livello fisico che si occupa dell’immagazzinamento delle strutture
 il livello logico che definisce la rappresentazione dei dati proposta all’utente
 il livello esterno che corrisponde ad una parziale vista del database fornita in una particolare
applicazione
La distinzione tra il livello fisico ed il livello logico è centrale nel campo dei database. Questa separa
chiaramente i compiti funzionali al sistema dalle rappresentazioni e sistemi di manipolazioni
semplificate che sono offerte all’utente (Fig.2-45).
Fig. 2-45- Schematizzazione dell’ambiente di sistema di un DBMS
2.3.1.2 Conoscere le strutture logiche dei DBMS nei GIS (SIT).
Ciascun DB consiste di strutture logiche di memorizzazione, per immagazzinare e gestire i dati,
(tabelle, indici, etc.) e di strutture fisiche di memorizzazione che contengono le strutture logiche.
Un DBMS fornisce la capacità a diversi utenti di condividere i dati ed i processi che li riguardano.
Dal momento che possono esistere diversi utenti, ci sono diverse esigenze che riguardano il db. La
domanda che ne consegue è come può un singolo database rispondere alla esigenze di molti utenti.
Un DBMS minimizza questo problemi fornendo due “viste” (modalità di visualizzazione) dei dati
registrati nel db: una vista esterna detta LOGICA ed una vista interna detta FISICA. La vista logica è
63
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
la vista a cui accede l’utente e le strutture logiche sono appunto le strutture utilizzabili dallutente per
interagire con i dati; queste strutture rappresentano i dati per l’utente in modo che essi siano
significativi sia per quest’ultimo che per i programmi dedicati al processing dei dati. Con la
visualizzazione logica gli utenti possono vedere i dati differentemente da come essi sono in effetti
memorizzati nel db, ed è loro consentita la manipolazione dei dati senza conoscere i dettagli tecnici
della registrazione fisica. In questo senso una delle principali capacità dei DBMS è che mentre può
esiste all’interno di un db una sola modalità di registrazione fisica dei dati, possono esistere una
serie(teoricamente) infinita di viste logiche. In pratica la vista logica è la modalità con cui gli utenti si
riferiscono ai dati, mentre la vista fisica è la modalità con cui i dati sono elaborati e registrati. In un
dbms spaziale o in un applicativo GIS come ArcGis™ l’accesso ai dati tramite il modulo
ArcCatalog™ permette di utilizzare le strutture logiche del software per interagire con i dati a diversi
livelli, prescindendo dalle modalità di registrazione fisica che talora possono anche essere molto
diverse tra loro; basti pensare alle modalità di registrazione delle Coverage, degli Shapefile o delle
Feature Class nel Geodabase.
2.3.1.3 Conoscere le principali operazioni sui dati contenuti in un DBMS (selezione, inserimento,
aggiornamento, eliminazione).
SELEZIONE
Le operazioni sui dati contenuti in un DBMS sono realizzate tramite l’uso del linguaggio "Structured
Query Language". E’ un linguaggio con varie funzionalità: contiene sia il DDL (data definition
linguage) sia il DML (data manipolation linguage).Esistono varie versioni di SQL.
Il comando fondamentale di SQL è SELECT.
La struttura essenziale di una SELECT è la seguente
SELECT ListaAttributi
FROM ListaTabelle
[ WHERE Condizione ]
Le tre parti di cui si compone un‘istruzione SELECT vengono spesso chiamate clausola „SELECT“
(detta anche target list), clausula „FROM“ e clausula „Where“.
Le forme del comando SELECT sono moltissime; qui vedremo la sintassi principale; per una più
approfondita esemplificazione dell’uso del comando SELECT si rimanda al Modulo 3.
La forma più semplice di SELECT è la seguente:
SELECT colonna1, colonna2
FROM tabelle
WHERE (condizioni)
ORDER BY colonna1, colonna2
Quindi è essenziale specificare le colonne (campi o attributi) da visualizzare, la tabella sorgente,
eventuali condizioni ed eventuale ordine. Invece di scrivere un elenco di colonne è possibile scrive *
che indica tutte le colonne della tabella.
Per visualizzare una intera tabella si scrive il comando:
SELECT *
FROM studenti;
Per visualizzare un sottoinsieme di colonne, orinate secondo un certo criterio (l’età in questo caso) si
scrive il comando:
SELECT nome, eta
FROM studenti
ORDER BY eta
64
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Possiamo scegliere di visualizzare solo alcune righe per tabella:
SELECT nome
FROM studenti
WHERE eta < 30
AND codice_corso = 1;
In questo esempio le condizioni imposte sono due: gli student che siano più giorvani di 30 anni e che
abbiamo sostenuto l’esame avente codice_corso = 1 (es. Analisi Matematica)
INSERIMENTO
I comandi che permettono la modifica dei dati in una tabella sono
INSERT : inserisce righe in una tabella
DELETE: cancella le righe di una tabella
UPDATE: Modifica i dati di una riga di tabella
La struttura del comando INSERT è la seguente:
INSERT INTO nome_tabella
(nome_colonna1, nome_colonna2, …)
VALUE (valore1, valore2,..)
Bisogna specificare la tabella, l’elenco delle colonne, che vogliamo inserire, quindi l’elenco
corrispondente dei valori.
CANCELLAZIONE (ELIMINAZIONE)
Il comando DELETE permette di cancellare le righe di una tabella; la sua forma più semplice è:
DELETE FROM nome_tabella;
Questo comando elimina tutte le righe dalla tabella. La forma che invece viene solitamente utilizzata
è:
DELETE FROM nome_tabella
WHERE condizione;
La specifica condizione permette di eliminare solo quelle occorrenze che rispettano la condizione:
DELETE FROM studenti
WHERE eta<30;
AGGIORNAMENTO
I dati si modificano con il commando UPDATE.
La struttura del comando UPDATE è:
UPDATE nome_tabella
SET nome_colonna=valore
WHERE (condizione)
EsempioU
UPDATE studenti
SET codice_corso=2
WHERE nome=’rossi giorgio’
2.4 Analisi dei dati
2.4.1 Analisi spaziale
2.4.1.1 Conoscere le analisi spaziali tipiche sui dati raster.
La sovrapposizione di dati raster
65
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
I dati raster sono costituiti di celle equidimensionali regolarmente spaziate; conseguentemente non
c’è formazione di “sliver polygon” come nel caso della sovrapposizione vettoriale e non esiste la
necessità di distinguere fra poligoni, linee e punti perché i dati raster sono esclusivamente composti
di celle.
L’analisi dei dati raster varia da semplice a molto complessa, principalmente a causa della semplicità
e flessibilità del modello dati raster.
Come è stato definito i dati raster sono basati su insiemi di dati omogenei e bidimensionali e da
strutture di dati che sono utilizzate da molti linguaggi informatici inclusi quelli di prima generazione.
MAP ALGEBRA
La Map Algebra è la combinazione “cella-cella” degli strati informativi raster. La combinazione
richiede l’applicazione ai dati raster di un insieme di funzioni locali e di prossimità e di una minore
quantità di funzioni globali. Il concetto della Map Aplgebra si basa sulla semplicità e flessibilità della
struttura di immagazzinamento dei valori delle griglie raster. Ogni numero rappresenta un valore
nella esatta posizione della cella raster.
Le semplici operazioni aritmetiche (addizione, sottrazione, moltiplicazione) possono essere realizzate
tramite i numeri immagazzinati da un insieme di dati raster che abbiano la stessa risoluzione spaziale:
per ogni posizione, i valori delle corrispondenti celle raster forniscono i fattori delle operazioni
aritmetiche in questione. La Map Algebra prevede l’esecuzione di operazioni tra uno o più strati
informativi: unaria (unary), sono le operazioni applicate ad un solo layer, binarie (binary) sono le
operazioni applicate a due layer ed infine operazioni di ordine superiore implicano più strati
informativi. Una semplice operazione su un solo strato informativo (unaria) applica la funzione ad
ogni cella del raster e registra il valore calcolato su un raster di ouput. La Fig.2-46 illustra il risultato
di una moltiplicazione x 2 di ogni cella. Ogni cella che rappresenta il risultato della operazione
Outlayer=Inlayer x 2, viene posizionato dove si trova la cella su cui è stata eseguita l’operazione.
Fig. 2-46 (da Bolstad, 2008) – Esempio di operazioni raster. A sinistra ogni cella del raster è
moltiplicata per il valore 2 ed il valore risultante è inserito nella cella corrispondente. A destra
è illustrata una operazione di addizione tra due raster
Sono possibili altri tipi di operazioni quali elevazione a potenza, divisione, conversione, etc. Le
operazioni binarie sono simili a quelle descritte, con la differenza che implicano più dati strati
informativi ed il calcolo avviene tra le celle che occupano la stessa posizione. La somma tra due layer
può essere descritta come segue:
sumlayer = layer A + layer b
66
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Il raster risultante avrà le celle nelle stesse posizioni di quelli di partenza, con la caratteristica che
ogni cella del raster risultante sarà la somma dei valori delle celle in ingresso.
Negli esempi riportati in Fig. 10.1 i due layer utilizzati hanno la stessa risoluzione e la stessa
estensione spaziale. Questo può non essere sempre vero ed in questi casi è necessario ricorrere al
ricampionamento degli strati informativi per ottenere la stessa risoluzione e la stessa estensione
spaziale (Fig. 2-47).
Fig. 2-47(da Bolstad, 2008) – esempio di dati raster con diversa risoluzione spaziale
Nel caso in cui la sovrapposizione dei due raster non sia completa (cioè i due raster non si ricoprano
identicamente), nelle celle prive di dati il nuovo strato informativo sarà caratterizzato da celle recanti
i valori “no data” oppure un valore convenzionale tipo “-9999”.
Come le operazioni tramite dati vettoriali, le operazioni raster sono classificabili come locali, di
prossimità o vicinanza (dette anche funzioni focali) e globali (dette anche funzioni zonali).
Le operazioni locali sono utilizzate soltanto per i dati in cella singola, le operazioni di prossimità
sono basate sui dati di un insieme di celle, le operazioni globali utilizzano tutti i dati da ogni singolo
layer di dati (Fig. 2-48)
67
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-48 (da Bolstad, 2008) – Esempio di applicazioni
di funzioni locali e globali in dati raster
2.4.1.2 Conoscere le analisi spaziali tipiche sui dati vettoriali su singolo strato informativo.
La principale funzione di analisi spaziale su un singolo layer è il BUFFER (Fig. 2-49).
Il Buffer è una delle più utilizzate funzioni di prossimità. Il buffer è un’area di rispetto, ampia a
piacere, creata attorno ad ogni occorrenza di uno strato vettoriale, sia esso costiuito da punti, linee o
poligoni. E’ una delle funzioni di analisi spaziale più utilizzata
68
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-49 – Funzione di Buffer
2.4.1.3 Conoscere le analisi spaziali tipiche sui dati vettoriali su più strati informativi
Una delle forme più semplici di processing integrato delle geometrie e degli attributi è quello di
selezionare un’entità grafica sul monitor e chiedere al sistema di mostrare le informazioni registrate
nel DB. Una volta ricevuta l’ordine d’interrogazione, il GIS cerca all’interno del DB gli attributi
dell’entità selezionata; le informazioni possono successivamente essere trasferite in altri programmi o
stampate.
Una forma di processing avanzato è basata sulle condizioni che ogni tipo di entità venga
rappresentata sia geometricamente sia nella tabella degli attributi e che la geometria sia esprimibile
attraverso una carta tematica. Tutte le carte tematiche che esprimono le caratteristiche dei diversi
attributi possono essere “sovrapposte” e integrate l’una con l’altra, per elaborare una carta tematica
finale contenente tutte le informazioni geometriche di ognuna delle carte sovrapposte. Inoltre la carta
finale integrata è costituita da una nuova tabella comprensiva di tutti gli attributi (Fig.2-50).
La sovrapposizione topologica (“overlay” topologico) di poligoni
La sovrapposizione di poligoni è un’operazione spaziale nella quale un layer tematico contenente
poligoni viene sovrapposto a un altro per formare un nuovo layer con altri poligoni. Gli angoli di
ogni nuovo poligono sono le intersezioni tra i lati dei poligoni originari giacenti su i diversi layer, per
questo il calcolo di tutte le possibili intersezioni può richiedere al computer molto tempo. Se le aree
sono già registrate nel computer come secondo un modello topologico le aree da calcolare ex novo
sono ridotte, e ridotto e anche il tempo impiegato dal computer. Le nuove intersezioni sono
identificate come nodi e le linee come connessioni (“links”) tra questi ultimi; i nuovi nodi e le
connessioni costituiscono la nuova struttura topologica.
69
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig.2-50– Una sovrapposizione computerizzata può essere assimilata a una serie di carte
sovrapposte. Questa sovrapposizione porta a una espansione della tabella degli attributi oltre
che a una variazione della geometria.
Per esempio, consideriamo il poligono C4 della Fig. 2-51 che risulta dalla combinazione del poligono
C e del poligono quattro. Il sistema non potrà associare attributi con C4 se non esista una topologia
associata con i dati originari e i nuovi dati. Con la topologia associata ai nuovi dati, il sistema
riconosce che il poligono C4 comprende 22 linee e parte della linea 23 e della linea uno. Inoltre il
sistema “è avvertito” che il poligono quattro è sulla parte destra della linea 22 e sulla parte sinistra
della linea 23 e che il poligono C è sulla parte sinistra del poligono uno. In conformità a queste
informazioni il sistema “è informato” che il poligono C4 è una composizione del poligono quattro e
del poligono C sia geometricamente che in termini d’attributi.
70
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-51– Esempio di sovrapposizione topologica di strati informativi: il poligono C4 è
composto dall’intersezione del poligono C e del poligono quattro.
Ogni nuovo poligono è un nuovo oggetto che è rappresentato da una nuova fila (un “record”) nella
tabella degli attributi (FAT).Ogni nuova occorrenza ha un nuovo attributo, che è rappresentato da
una nuova colonna nella tabella degli attributi. La sovrapposizione e la comparazione di due “data
set” di diversa accuratezza geometrica portano spesso alla formazione di un grosso numero di piccoli
poligoni. Questi piccoli poligoni detti “sliver polygon” possono essere rimossi successivamente
utilizzando le loro caratteristiche d’area, forma e altri criteri informativi. Una delle procedure più
utilizzate per rimuovere questi poligoni è quella di accorparli a quelli di maggiore area che gli sono
vicini (Fig. 2-52).
Figura 2-52 – La topologia dei dati deve essere completata prima della loro sovrapposizione.
Oltre ad eseguire una sovrapposizione geometrica e informativa di poligoni, il sistema può presentare
un nuova immagine della nuova struttura dei dati, eliminando i bordi tra i poligoni che hanno lo
stesso significato (ad esempio i poligoni riferiti alla stessa unità geologica). Questo processo
d’accorpamento può essere automatico oppure controllato dall’utente.
La procedura generale per una sovrapposizione di poligoni è la seguente:
1. Calcolo dei punti d’intersezione
2. Formazione dei nodi e delle connessioni (link)
3. Definizione della topologia e dei conseguentemente dei nuovi oggetti
4. Rimozione degli “sliver polygon” in eccesso e, se necessario, dissoluzione dei limiti tra i poligoni
d’uguale significato
5. Compilazione dei nuovi attributi
La sovrapposizione di poligoni può essere utilizzata per ritagliare una “finestra geografica” in un
database; per esempio “ritagliare” le informazioni del database esattamente lungo i limiti
amministrativi della città.
Infine elenchiamo i tre tipi fondamentali di sovrapposizione tra poligoni
 UNIONE
 INTERSEZIONE
 IDENTITA’
Queste operazioni differiscono soltanto nelle caratteristiche spaziali del risultato finale (Fig. 2-53)
71
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-53 - I tre diversi tipi di sovrapposizione poligonale
(da ESRI, Understanding GIS)
Altri tipi di sovrapposizione spaziale comprendono:
 Punti su poligoni
 Linee su poligoni
Punti su poligoni
Nello stesso modo delle entità poligonali anche le entità puntuali possono essere sovrapposte ai
poligoni: il risultato sarà un nuovo set di punti che ricevono gli attributi dei poligoni entro cui sono
compresi (Fig.2-54).
Fig. 2-54- Sovrapposizione di punti su poligoni
72
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Linee su poligoni
Gli archi possono essere sovrapposti ai poligoni: il risultato sarà un nuovo set d’archi contenenti gli
attributi degli archi originari e dei poligoni cui sono stati sovrapposti (Fig. ). Tutte queste
sovrapposizioni sono simili a quelle utilizzate nel caso della sovrapposizione poligonale: calcolo delle
intersezioni, formazione dei nodi e delle intersezioni, formazione della topologia e infine
aggiornamento delle tabelle delle attributi (FAT: “Feature Attribute Table”).
Fig. 2-56 - sovrapposizione di linee su poligoni
2.4.1.4 Saper distinguere le procedure di calcolo di distanze ed aree nel modello vettoriale e
raster.
Le procedure di calcolo dei parametri geometrici fondamentali di linee e poligoni differiscono
profondamente nelle due tipologie di dati raster e vettoriale. Nel modello vettoriale tali valori sono
calcolati in base alle caratteristiche geometriche della stessa feature e sono riportati nella tabella degli
attributi. Nel Geodatabase in particolare,(come anche nelle Coverage), tali valori sono
automaticamente aggiornati quando si adottano delle variazioni di forma e lunghezza che incidono su
aree e distanze.
Nei dati raster una tale procedura non è possibile in quanto non esistono primitive geometriche ma
solo pixel geometricamente indipendenti l’uno dall’altro. Per calcolare lunghezze, distanze e aree in
questi casi si deve ricorrere ai metodi di analisi spaziale (intersecando strati vettoriali con strati
raster, oppure alle operazioni di map algebra sopra descritte), oppure attraverso le funzioni di analisi
e misura di cui sono dotati gli applicativi GIS.
2.4.2 Analisi basate sugli attributi
2.4.2.1 Conoscere il processo di selezione di oggetti in funzione degli attributi.
Delle operazioni di SELECT si è parlato nei paragrafi precedenti; vediamo ora altre operazioni di
ricerca basate sugli attributi.
Operazioni logiche
Le selezioni o ricerche logiche in un database impiegano normalmente l’algebra d’insieme o l’algebra
Booleana.
73
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
L’algebra degli insiemi (set algebra) usa tre tipi d’operatori: uguale a (“eq” o “=”), maggiore di (“ge”
o “>”), minore di (“lt” o “<”) e una combinazione tra questi operatori, perciò il risultato finale è:
=, >, <, >, <,
Questi operatori sono inclusi nel inguaggio Structured Query Linguage (SQL).
Le entità possono essere selezionate o riclassificate in base ai loro attributi gli operatori algebrici
sopradescritti e le regole dell’algebra Boolena che sono incorporati nei linguaggi di database come
ad esempio il SQL. L’algebra Booleana usa gli operatori logici AND, OR, XOR, NOT per
determinare se una particolare condizione è vera o falsa. Ogni attributo è pensato come se definisse
un insieme di valori. L’operatore AND è l’intersezione di due insiemi di valori (quelle entità che
appartengono ad A e B); l’operatore OR è l’unione dei due insiemi (quelle entità che appartengono
sia ad A sia a B); l’operatore NOT rappresenta la differenza, in altre parole identifica quelle entità
che appartengono ad A ma a B; l’operatore XOR identifica le entità che appartengono
esclusivamente ad A o a B, ma non a entrambi gli insiemi di dati. Questo semplice insieme di
relazioni sono spesso rappresentate visivamente nella forma del diagramma di Venn (fig. 42). Notare
che tutte le operazioni logiche viste possono essere applicate a tutti i tipi di dati, siano essi booleani,
nominali, ordinali, scalari o direzionali.
Due semplici esempi illustrano i principi esposti. Consideriamo di avere a disposizione un database
spaziale di tipo immobiliare. Una tipica interrogazione che può essere posta da un acquirente è la
seguente: “trovare la localizzazione di tutte le case il cui costo è compreso tra Euro 200.000 e Euro
400.0000 con quattro stanze da letto e una superficie complessiva di 300 m2”. Se il database
contiene i dati presenti nella richiesta, allora la risposta può essere facilmente ottenuta impostando
una query principalmente basata sull’operatore AND, e sugli operatori algebrici =, >, <, >, <,. La
sintassi esatta è la seguente (si noti l’impiego di IF e THEN)
IF COST GE 200000 AND COST LT 400000 AND BEDROOM_N° = 4 AND PLOT_AREA
GE 300 THEN ITEM=1 ELSE ITEM=0.
Dove:
IF e THEN : sono un operatori che descrivono l’istanza di ricerca (esempio: SE il costo è maggiore
di….. e il n° di stanze è uguale a ……..e la superficie è maggiore di ….. ALLORA ……)
ITEM=1 ELSE ITEM =0: nel caso che l’istanza di ricerca sia VERA alle entità che rispondono ai
requisiti sarà assegnato nel campo denominato ITEM un valore = 1, oppure nel caso che l’istanza di
ricerca sia FALSA alle entità che non rispondono ai requisiti assegnato nel campo denominato ITEM
un valore = 0.
GE, LT, = : operatori di “Set Algebra”
COST, BEDROOM_N°, PLOT_AREA, ITEM: Campi presenti nel data base.
Consideriamo ora un’interrogazione rivolta alla classificazione di uso del suolo.
In un database di uso del suolo, ogni unità cartografata può avere un attributo che descrive la
tessitura e il Ph del terreno.
Se consideriamo un insieme A delle unità cartografate che chiamiamo “Cerrado” (una denominazione
di uso del suolo), e B costituisce un insieme di unità cartografiche in cui il Ph del suolo è superiore a
sette, allora le seguenti sintassi esprimono:
X= A AND B trova tutte le occorrenze in cui il “Cerrado” ha un Ph >7
X= A OR B trova tutte le occorrenze di “Cerrado”, e tutte le occorrenze in cui il suolo ha un Ph >7
74
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
X= A XOR B trova tutte le occorrenze che sono o “Carrado” o hanno un suolo con Ph>7
X= A NOT B trova tutte le occorrenze che sono o “Carrado” o hanno un suolo con Ph<7
Alle occorrenze selezionate si può assegnare un nuovo valore (es. “suolo utilizzabile”) attraverso una
sintassi del tipo “IF …..THEN” con una sintassi del tipo:
“Assegna il valore “Utilizzabile” a tutte le unità cartografate in cui tessitura_suolo = Cerrado and
Ph>=5.5”. Notare l’utilizzo degli operatori IF e THEN: IF (SE) la condizione C è vera THEN
(Allora) esegui il compito specificato (assegna il valore “Utilizzabile”).
Fig.2-57 – Diagramma di Venn mostrante il risultato dell’applicazione della logica Boleana
alla unione e intersezione di due o più insiemi. In tutti i casi l’area in nero rappresenta la
condizione “TRUE” (vera)
Si noti che a differenza degli operatori aritmetici gli operatori Booleani non sono commutativi. Il
risultato della sintassi “A AND B OR C “ dipende dalla priorità di AND rispetto ad OR. Le parentesi
sono utilizzate per indicare un chiaro ordine di valutazione, quando ci sono più di due insiemi (Fig.257). Per esempio se l’insieme C contiene unità cartografiche di suolo scarsamente drenato, allora la
sintassi : X=(A AND B) OR C seleziona tutte le unità cartografiche di “Cerrado” insieme a quelle un
suolo con Ph >=7 e un drenaggio scarso.
Aspetti spaziali degli della selezione mediante operatori booleani
75
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
L’esecuzione di una selezione logica e di una riclassificazione degli attributi non-spaziali di entità
geografiche produce uno scarso effetto sull’immagine cartografica, eccetto che in termini di
simbolismi e elaborazione dei limiti.
La computazione di un nuovo attributo, secondo una selezione logica richiede la preparazione di una
legenda e la “ricolorazione” delle entità selezionate (Fig.2-58). Quando la selezione individua
poligoni adiacenti con lo stesso significato, può essere utile la dissoluzione del limite tra queste
entità, in modo da ottenere una carta generalizzata (Fig. 2-59). Gli operatori Booleani non sono solo
applicabili agli attributi non-spaziali delle entità geografiche, perché loro sono applicabili anche alla
localizzazione geografica e agli attributi spaziali delle entità. Ad esempio si potrebbe richiedere
l’individuazione delle unità cartografiche che hanno una superficie superiore a cinque ha, con un
particolare tipo di suolo con un Ph>7.0. Una ricerca più complessa potrebbe coinvolgere la forma
dell’area, le caratteristiche dei limiti dell’area in rapporto alle aree vicine (come ad esempio le aree
verdi che bordano quelle urbane). In questi casi i risultati della ricerca produrrebbero un effetto
anche sul pattern spaziale delle entità e non solo sugli attributi non-spaziali.
Fig.2-58 –La ricerca delle entità sulla base di attributi presenti nel DB oppure la creazione di
nuovi attributi sulla base di operazioni su quelli già presenti, non cambia la forma ma solo la
colorazione dei poligoni. Lo stesso succede nel caso di operazioni di ricerca “punti entro
poligoni, utili per ricercare i poligoni che racchiudono punti.
76
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-59 – Se durante una ricerca o una riclassificazione, due poligoni adiacenti ricevono lo
stesso codice, il limite tra i due poligoni può essere dissolto, fino ad ottenere una carta
“generalizzata”.
PROCESSING DEGLI ATTRIBUTI : OPERAZIONI ARITMETICHE SEMPLICI E
COMPLESSE SUGLI ATTRIBUTI DELLE SINGOLE ENTITÀ
I nuovi attributi possono essere computati utilizzando tutte le normali regole aritmetiche (+, -, /, *,
lg, exp, le funzioni trigonometriche, e tutte le combinazioni che includono modelli matematici
complessi). Le funzioni aritmetiche e trigonometriche possono essere utilizzati su dati scalari e certi
tipi di dati cardinali. Le operazioni aritmetiche su tipi di dati Booleani e nominali non hanno senso
(un’espressione come X=sqrt (Londra) non ha significato). Alcuni esempi ipotetici di calcolo di
nuovi attributi per una data area amministrativa (entità poligonale) sono:
L’incremento di popolazione = Popolazione 1990 – Popolazione 1980
Il totale della spesa per l’energia elettrica = Incasso medio x n° di persone
La produttività media di prodotti agricoli (es. grano) = Quantità totale / n° delle fattorie
La produttività media prevista = f(crop) (Dove f è un modello matematico complesso che calcola la
produttività in funzione dell’umidità, della fertilità del suolo ecc.)
L’allocazione di classi = Risultato di una classificazione multivariata (dove la classificazione
multivariata potrebbe essere un criterio statistico per elaborare gli attributi delle entità)
2.4.2.2 Conoscere l’utilità delle relazioni e collegamenti tra tabelle.
Il modello relazionale è basato su valori e dettagli su questo modello e sul Join sono stati forniti nel
paragrafo 2.2.1.3 (Conoscere i concetti di modello concettuale, modello logico, modello fisico). Di
seguito vengono schematizzate le principali caratteristiche dell’operatore Join.
I riferimenti fra dati in relazioni diverse sono rappresentati per mezzo di valori dei domini che
compaiono nelle ennuple (Fig. 2-60)
77
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-60 – Esempio di collegamento tra tabelle basato sui
valori di un campo chiave (Da Atzeni et al, 2006)
Campo/i Chiave
Insieme di attributi che identificano le ennuple di una relazione
Definizione di Join
Il join è l'operatore più interessante dell'algebra relazionale permette di correlare dati in relazioni
diverse; attraverso questo operatore le tabelle possono essere collegate in modo da fornire una
informazione completa.
Esempio: Prove scritte in un concorso pubblico (Fig. 2-61)
I compiti sono anonimi e ad ognuno è associata una busta chiusa con il nome del candidato
Ciascun compito e la relativa busta vengono contrassegnati con uno stesso numero
Fig. 2-61 – applicazione del Jooin per ricostruire il collegamento tra tabella
2.4.2.3 Conoscere i principali elementi di statistica, quali concetti di media, deviazione
standard, minimi quadrati, scarto quadratico medio.
MEDIA
In statistica la media è un insieme di indicatori di posizione, anche se spesso con questo termine si
intende la media aritmetica
78
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Le principali medie sono
 la media aritmetica
 la media geometrica
 la media armonica
 la media di potenza
le quali a loro volta possono essere
 semplici
 ponderate
Nella lingua italiana, in statistica, spesso viene chiamata media (intendendo implicitamente
"aritmetica") ciò che realmente si chiama Valore atteso, in quanto vengono calcolati nello stesso
modo, ma hanno significati teorici differenti: per taluni la media aritmetica viene applicata soltanto
nella statistica descrittiva e il valore atteso nell'ambito della probabilità e delle variabili casuali in
particolare. La formula della media è:
ovvero
La media, come tutti gli indici di posizione, ci dice all'incirca l'ordine di grandezza (la posizione sulla
scala dei numeri, appunto) dei valori esistenti. In particolare dice che: se abbiamo N valori, con
media Ma, allora per conoscere la somma di tutti questi valori è sufficiente moltiplicare N con Ma.
Ci permette così di avere un'idea della quantità complessiva conoscendo soltanto il valore medio e
quanti valori ci sono. Che si tratti di un indicatore di posizione lo si verifica facilmente, in quanto se
aggiungiamo a tutti i valori una stessa quantità allora la media è anch'essa aumentata di quella stessa
quantità. Inoltre, se moltiplichiamo tutti i valori con un determinato numero, allora anche la media
aritmetica viene moltiplicata con tale numero.
DEVIAZIONE STANDARD
La deviazione standard (in inglese: standard deviation) o scarto tipo o scarto quadratico medio è un
indice di dispersione (vale a dire una misura di variabilità di una popolazione o di una variabile
casuale) derivato direttamente dalla varianza, ha la stessa unità di misura dei valori osservati (mentre
la varianza ha come unità di misura il quadrato dell'unità di misura dei valori di riferimento). La
deviazione standard misura la dispersione dei dati intorno al valore atteso (Fig. 2-62).
79
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-62- Rappresentazione grafica della
deviazione standard in un data set con una media
di 50 (in blu) e una deviazione standard (σ) di 20.
MINIMI QUADRATI
Il metodo dei minimi quadrati (in inglese OLS: Ordinary Least Squares) è una tecnica di
ottimizzazione che permette di trovare una funzione che si avvicini il più possibile ad
un'interpolazione di un insieme di dati (tipicamente punti del piano). In particolare la funzione trovata
deve essere quella che minimizza la somma dei quadrati delle distanze dai punti dati. Questo metodo
va distinto da quelli per l'interpolazione dove si richiede che la funzione calcolata passi esattamente
per i punti dati.
L'utilizzo più frequente è nell'approssimare l'andamento di dati sperimentali con linee di tendenza.
SCARTO QUADRATICO MEDIO
Lo scarto quadratico medio σ (sigma) di una distribuzione è la media quadratica degli scarti dei
singoli dati dalla loro media aritmetica M.
Indicati con x1 x2,...,xn i dati, con M la media aritmetica e con σ lo scarto quadratico medio si ha:
Lo scarto quadratico medio è un numero sempre positivo ed è nullo solo se tutti i valori sono uguali
tra loro.
(da Wikipedia, 2009)
80
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
2.4.2.4 Saper distinguere i principali metodi di classificazione (quali quantili, deviazione
standard, interruzioni naturali).
QUANTILE
Nella classificazione per Quantili, ogni classe di legenda un egual numero di occorrenze. Una
classificazione per quantili è adatta ad una distribuzione lineare dei dati. Poiché le occorrenze sono
raggruppate per numero in ogni classe, la mappa risultante può essere fuorviante. Utilizzando questa
modalità di classificazione occorrenze molto simili possono essere poste in classi adiacente (ma
comunque diverse), così come occorrenze con valori molto diversi tra loro possono essere inserite
nella stessa classe. Si possono minimizzare tali distorsioni incrementando il numero di classi (Fig. 263)
Fig. 2-63 – Esempio di classificazione per quantili
Deviazione standard
Questa classificazione mostra quanto i valori delle occorrenze variano rispetto al valore medio; le
divisioni tra le classi sono create sulla base di questi valori. In genere una legenda di colori (color
81
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
ramp) a due colori enfatizza i valori che i trovano al di sopra e al di sotto della media (Fig. 2-64).
Fig. 2-64 – Esempio di classificazione per deviazione standard
INTERRUZIONI NATURALI
Le classi sono basate su raggruppamenti naturali inerenti ai dati. I punti di separazione di una classe
corrispondono alle interruzioni di classificazione che raggruppano al meglio i dati tra loro simili; tali
differenze naturali dei dati sono massimizzate per evidenziare al meglio le classi. Le occorrenze sono
divise in classi i cui limiti sono posti in corrispondenza dei “salti” di valore più grandi (Fig. 2-65).
Fig. 2-65 – Esempio di classificazione per interruzioni
naturali (natural breaks)
2.5 Cartografia tematica
2.5.1 La rappresentazione tematica
2.5.1.1 Saper definire il termine carta tematica.
82
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
La cartografia tematica è una mappa che esprime uno specifico significato diverso dal normale
contenuto di una carta topografica o geografica; tale significato prende il nome di tema. Nelle carte
tematiche gli elementi topo-cartografici quali, orografia, idrografia, viabilità, toponomastica, centri
urbani, etc., sono utilizzati come riferimenti per la georeferenziazione del tema specifico. Mentre la
cartografia topografica si definisce come carta di base, la cartografia tematica spesso si definisce
anche come cartografia derivata, in quanto il tema espresso dalla carta è spesso frutto di
elaborazione o specifico rilevamento: ad esempio la cartografia geologica, la cartografia dell’uso del
suolo, la cartografia della vegetazione o della forestazione, sono tipici esempi di cartografie
tematiche che sono ottenute attraversi specifici rilevamenti di campagna, basati tutti sulla cartografia
topografica di riferimento. In questo senso, la scala della cartografia topografica utilizzata per il
rilevamento di questi temi, definisce la scala del rilevamento tematico.
Il tematismo è quindi la rappresentazione del fenomeno su una cartografia raster o vettoriale nella
quale tramite punti, linee o superfici associate a simboli, retini o colori si visualizza il risultato di
un'analisi di qualità (uso del suolo, zone di piano regolatore, intensità del traffico su una strada, ecc.).
La caratteristica principale attribuibile ad una cartografia tematica è quella di rendere
immediatamente leggibili i differenti aspetti di un fenomeno diffuso sul territorio, con un approccio
che associ la simbologia utilizzata per la rappresentazione all’andamento dello stesso. Questa
tipologia di associazione viene definita Convenzione Geografica. Essa è da intendersi come
assegnazione di codici cromatici per le unità indicate, in base a corrispondenza tra colori base e
fattori principali. Si ottengono così delle carte che permettono di avere una visione d’insieme del
territorio, con variazioni colorimetriche o di simbologia, facilmente e intuitivamente correlabili alla
variazione nello spazio, di quello che si è scelto come tematismo. Si utilizzano metodi diversi per
rendere visibili le variazioni del tematismo nello spazio (da Maiellaro, ITC-CNR-IT)
2.5.1.2 Saper elencare gli elementi fondamentali di una carta tematica.
In linea di principio i cartografi utilizzano sei parametri grafici per la simbolizzazione dei fenomeni
geografici (Fig.2-66):
 La dimensione
 La densità
 La tessitura
 Il colore
 L’orientazione
 La forma
Questi sei parametri differiscono a seconda dell’applicazione - per esempio nell’illustrare le
caratteristiche qualitative dei vari tipi di oggetti, come le specie vegetali, oppure le caratteristiche
quantitative dei vari attributi, come l’intensità’ delle emissioni gassose, il numero degli abitanti, etc.
La dimensione
La variazione della dimensione dei simboli e’ il modo più semplice per illustrare le variazioni
quantitative. Le dimensioni dei simboli possono essere definite in funzione delle intensità’ misurate.
Anche alcuni tipi di diagrammi, come i diagrammi “a torta”, qualche volta possono essere utili a
rappresentazioni cartografiche.
In ogni caso, le differenze di dimensioni non sono sempre direttamente percepibili dall’occhio
umano. Come nella maggior parte delle percezioni sensoriali, la differenza di intensità è ben percepita
solo su base comparativa e esagerando le differenze: per questo il diametro di simboli circolari che
rappresentano una data quantità deve essere quasi triplicato per esprimere i valori che sono solo
raddoppiati.
83
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
La densità’
La scala dei grigi, o la variazione di densità, è il modo principalmente utilizzato per illustrare dati
secondo una schema classificativo quantitativo. Come in tutti i parametri cartografici, c’è un limite
inferiore alla dimensione che può essere percepita dall’utente. La scala dei grigi, ed esempio, non
deve essere divisa in più di 10 classi, in modo da evitare che le classi vicine si confondano.
Per essere percepita regolarmente, gli incrementi di grigio devono essere scalati come segue: (0%),
9%, 19%, 31%, 45%, 74%, 84%, 91%, 100%. Le proprietà della densità sono espresse in Fig. 2-67.
La prima impressione e’ che siano rappresentate le varie intensità, mentre in realtà sono espressi solo
dati qualitativi. Le aree più scure sono più facilmente percepibili delle aree chiare; questo mostra che
la variazione di densità porta a una differente visualizzazione delle aree rappresentate. Le carte in cui
sono utilizzati i simboli per coprire le aree sono spesso definite “choroplethe” dal greco “choros”
(luogo) e “plethos” (intensità).
I Colori
I colori sono lo strumento migliore e il più elegante per distinguere le varie qualità dei dati
cartografici. Sfortunatamente i colori sono spesso utilizzati senza criterio per tutti i parametri
cartografici. Sebbene i colori siano spesso codificati in scale e utilizzati per indicare proprietà
quantitative come area, dentista di popolazione, temperature mensili, grado di industrializzazione,
etc., non esiste un loro utilizzo condiviso, nella rappresentazione di dati classificati.
84
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-66 – In linea di principio esistono 6 tipologie di parametri grafici che possono essere
utilizzati per simbolizzare i fenomeni geografici; forma, orientazione, colore, tessitura, densità
e dimensione.
Il rosso, il blu, il verde e l’arancione potrebbero
rappresentare i valori del 10, 20, 30 e 40 di una grandezza misurabile e riportata in carta, ma l’utente
può interpretare correttamente i valori classificati solo se esiste una scala colorimetrica di
85
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
riferimento. Il tono dei colori è spesso relativo all’incremento quantitativo: colori di tonalità più forte
indicano valori (della stessa categoria) più elevati.
La variazione nei toni di un singolo colore è in effetti più comprensibile di una variazione di colori.
In linea di principio i colori potrebbero essere variati con continuità in quanto lo spettro dei colori
visibili è continuo. Comunque è praticamente impossibile ottenere una variazione continua dei colori
su carta stampata. L’uso del colore consente spesso lo sfruttamento delle associazioni più comuni: ad
esempio il rosso è comunemente associato con il pericolo e potrebbe essere utilizzato per indicare in
carta le aree proibite.
Figura 2-67 - Esempio di uso scorretto della densità dei parametri grafici. L’impressione che
si ha guardando la carta ( a causa del figurato a righe) e che quest’ultima esprima valori
quantitativi, mentre in realtà si riferisce a caratteristiche qualitative (tipologie vegetali).
La Forma
Le variazioni geometriche delle forme sono molto valide per indicare le differenze qualitative. L’uso
delle forme non trasmette nessuna impressione generale, ma può essere utilizzato per trasmettere
dettagli. Le forme sono normalmente utilizzabili per tutti i parametri cartografici.
La tessitura
Molto raramente la variazione della tessitura è utilizzata per una differenza qualitativa: solo nel caso
di una maggiore concentrazione di punti si può trasmettere l’idea di una maggiore o minore intensità.
L’orientazione
I simboli lineari, nelle loro diverse orientazioni, sono utilizzati per illustrare le differenze qualitative.
LA SELEZIONE DEI SIMBOLI CARTOGRAFICI
Nella Fig. 2-68., i parametri cartografici, sono definiti in termini della loro percezione visiva, della
loro capacità di distinguere tra diversi fenomeni e di rappresentare diverse classi.
86
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-68 – Illustrazione delle relazioni fra parametri grafici visivi e loro capacità a
rappresentare le fenomenologie
Nelle carte che contengono diversi parametri cartografici, il disegno basato sulle dimensioni dei
simboli e in scala di grigio, sono più visibili dei disegni basati sulla forma del simbolo e a colori. I
parametri cartografici possono essere combinati possono essere combinati per mostrare diversi
fenomeni simultaneamente. Per esempio, l’impiego dei colori può essere variato nelle linee o nei
punti utilizzati nel disegno. La scelta dei simboli cartografici è raramente semplice e le seguenti
indicazioni possono servire da guida:
1. Individuare e separare quello che può essere espresso mediante simboli puntuali, lineari o areali
2. Considerare lo scopo finale della carta (turistica, geologica, applicativa, etc)
3. Considerare le caratteristiche dei parametri cartografici
4. Utilizzare i simboli di uguale impatto per rappresentare variabili di uguale importanza
5. Utilizzare simboli relativi per fenomeni relativi
6. Considerare i fenomeni visuali e le loro caratteristiche. Per esempio:
 La simmetrica dei simboli (strade, ferrovie)
 I simboli appaiono più piccoli quando sono circondati da simboli (anche di altra forma) più
grandi
 Nel caso di due aree non separate da una linea di confine, la differenza del tono di colore tra le
due aree viene incrementata (le aree più chiare sembreranno più chiare e viceversa)
7. La tradizione della simbolizzazione cartografica (es. il rosso significa pericolo, il blu significa
acqua, etc), e gli standard esistenti.
I più comuni errori nella rappresentazione cartografica includono:
 L’uso scorretto dei parametri cartografici
 Il colore di sfondo troppo intenso per i simboli da rappresentare in “primo piano”
 Eccessivo numero di temi diversi (qualitativi e quantitativi), da rappresentare
 Legenda inadeguata e materiale illustrativo insufficiente.
Nelle carte che rappresentano diversi fenomeni, spesso presentano delle aree dove fenomeni
adiacenti si sovrappongono. In questo caso i parametri grafici devono essere utilizzati attentamente,
in modo che l’utilizzatore possa rapidamente comprendere la sovrapposizione e non interpretare i
temi come fenomeni separati (Fig. 2-69).
87
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
Fig. 2-69 – In questa rappresentazione della diversificazione delle aree linguistiche, e delle aree
di coesistenza nella stessa area di gruppi linguistici si hanno due inconvenienti: nello schema
di sinistra, nella zona di sovrapposizione, si ha l’impressione dell’esistenza di un nuovo
gruppo, mentre nello schema di destra la rappresentazione è chiara.
2.5.1.3 Saper distinguere i tipi di carte tematiche (quali coroplete, isoplete, a simboli
proporzionali, a densità di punti).
COROPLETE
Nelle mappe di questo tipo sono rappresentati quantitativamente dei significati che si esprimono sul
territorio, attraverso l’uso di classi a cui sono associati dei colori. La variazione dei colori esprima la
variazione del significato: ad esempio in una carta della precipitazione su possono utilizzare colori
più intensi per valori di precipitazione maggiori. La gamma di colori utilizzata prende nome di rampa
dei colori.
ISOPLETE
Le mappe isoplete mostrano la distribuzione di un valore in termini di entità geometriche (spesso
linee o poligoni), che collegano parti del territorio caratterizzate da valori uguali.
Una importante differenza tra le mappe cloropete e isoplete consiste nel fatto che queste ultime
tipologie di mappe non aggregano i valori all’interno di classi o entità predefinite.
Le mappe isoplete possono essere di due tipi
 linee di uguale valore dell'attributo
 aree di uguale intervallo di attributo.
SIMBOLI PROPORZIONALI
E’ possibile rappresentare le quantità di un fenomeno su una mappa utilizzando una dimensione
variabile dei simboli; ad esempio si possono utilizzare cerchi di dimensione variabile per
rappresentare città con diversa quantità di popolazione.
Anche in questo caso, quando si utilizzano simboli graduati, i valori quantitativi sono raggruppati
entro classi e all’interno di una classe tutte le feature sono disegnate con lo stesso simbolo.
DENSITÀ DI PUNTI
Un altro metodo di rappresentazione dei fenomeni quantitativi è quello di utilizzare una mappa a
densità di punti. Maggiore e’ la densità di punti all’interno di un’area, maggiore è l’entità del
fenomeno in quel definito areale. Ogni punto ha rappresenta una definita quantità di valori, per
esempio 1000 abitanti oppure 1000 automobili. I punti sono distribuiti casualmente all’interno di
88
Dispense per il Corso “ I Sistemi Informativi Territoriali e l’utilizzo del GIS (Geographic Information
System) finalizzato al conseguimento della licenza ECDLGIS. Scuola regionale di formazione della
Pubblica Amministrazione della Regione Marche
Dispense per il corso Modulo 2 – GIS
ogni area e non rappresentano una localizzazione di feature. Più vicino sono i punti tra loro,
maggiore è la densità di elementi in quell’area.
2.5.1.4 Comprendere i termini di mappe quantitative e qualitative.
Le mappe quantitative esprimono in ogni punto della mappa una variazione quantitativa di un
significato che si esprime con un parametro misurabile in valori numerici interi o decimali (es. una
carta orografica o delle acclività). La mappa qualitativa individua invece delle categorie di dati che
appartengono a classificazioni sistematiche che non si esprimo necessariamente attraverso valori
numerici (es una carta geologica, geomorfologica, della forestazione)
89