Fotogrammetria Scopo della fotogrammetria è la determinazione

Fotogrammetria
Scopo della fotogrammetria è la determinazione delle posizioni di punti nello spazio fisico a partire
dalla misura delle posizioni dei punti corrispondenti su un’immagine fotografica. Ovviamente,
affinché questo sia possibile, è necessario che siano note in modo preciso le relazioni geometriche
fra le posizioni spaziali dei punti dell’oggetto rappresentato e quelle delle loro immagini sul piano
della fotografia.
In generale, la descrizione di queste corrispondenze non è semplice e richiede una conoscenza
dettagliata del cammino ottico dei raggi luminosi attraverso il sistema i lenti che costituisce
l’obiettivo della macchina fotografica. Tuttavia è possibile adottare, con buona approssimazione,
una schematizzazione, in base alla quale si può affermare che i segmenti che congiungono i punti
dell’oggetto rappresentato con le loro immagini si incontrano tutti in un punto, generalmente
distante qualche cm dal piano della fotografia, detto centro di presa (fig.1). La distanza del centro
di presa dal piano dell’immagine è detta distanza principale, e dipende dalla configurazione
dell’obiettivo; pertanto, essa si mantiene fissa finché l’assetto del sistema di lenti non viene
modificato. Negli apparecchi fotografici usati per fotogrammetria, quindi, operazioni come la messa
a fuoco, che comportano un movimento relativo delle lenti, in generale non possono essere eseguite,
o richiedono in ogni caso un controllo rigoroso.
A
C’
B’
A’
distanza
principale
B
O
centro
di presa
C
fig.1 – Geometria della presa fotogrammetrica
Il rapporto fra la distanza principale p e la distanza dell'oggetto dal centro di presa fornisce la scala
dell'immagine. Ad esempio, con riferimento a fotografie aeree di una porzione di territorio, posto
p=15cm (che è un valore tipico per gli apparecchi fotografici in uso), una quota di volo di 450m
corrisponde a una scala di 1:3000, una quota di 900m a una scala di 1:6000, una quota di 1800m a
una scala di 1:12000, e così via.
Per poter eseguire misure di posizione sull’immagine, è necessario che sul suo piano sia definito un
sistema di assi cartesiani, che in generale è visualizzato da un insieme di marche impresse sui bordi
dell’immagine (fig.2) . Idealmente, l’obiettivo dovrebbe essere costruito in modo che la
perpendicolare condotta dal centro di presa al piano dell’immagine cada esattamente nell’origine
delle coordinate. Generalmente questo non avviene in modo esatto: la proiezione del centro di presa
sul piano dell’immagine dista alcuni μm (micron, ossia millesimi di millimetro) dall’origine.
Tuttavia le sue coordinate x e y possono essere misurate esattamente e dichiarate dalla casa
costruttrice insieme con la distanza principale. Questi 3 numeri sono detti parametri di
orientamento interno.
y
x
marche
O’
proiezione
ortogonale del del
centro di presa
fig.2 – Orientamento interno
Inoltre, per le caratteristiche ottiche dell’obiettivo, la posizione dei punti sull’immagine si discosta
leggermente (anche in questo caso di alcuni micron) da quella prevista in base allo schema
geometrico sopra descritto. Sono cioè presenti delle deformazioni ottiche. Anche queste, tuttavia, si
mantengono fisse per una data configurazione dell’obiettivo, e possono essere misurate,
modellizzate e dichiarate dalla casa costruttrice. In genere la parte prevalente di queste
deformazioni è radiale (ossia, dipende solo dalla distanza dall’origine) ed è ben descritta da un
polinomio:
δ r = k1 r 3 + k 2 r 5
con k1 >> k 2 . Questi coefficienti, insieme con i parametri di orientamento interno, sono inseriti nel
certificato di calibrazione. Con l’uso dell’apparecchio queste quantità possono subire lievi
variazioni nel tempo, ed è quindi consigliabile ricalibrare periodicamente l’apparecchio.
Per eseguire un rilievo fotogrammetrico è quindi in linea di massima necessario disporre di
apparecchi speciali (camere metriche o semimetriche) molto più costosi di quelli reperibili sul
mercato a scopo amatoriale, che non offrono la possibilità di controllare in modo rigoroso la
geometria della presa.
Immagini digitali
Negli ultimi anni hanno avuto grande diffusione, anche per scopi fotogrammetrici, apparecchi
fotografici digitali.
Come è noto, le immagini memorizzate per l'elaborazione informatica sono discretizzate, ossia
suddivise in un reticolo regolare di piccole aree (pixel, che significa picture elements), a ciascuna
delle quali viene attribuito un tono di grigio (per le immagini in bianco e nero) secondo una scala,
anch'essa discretizzata, che, nelle applicazioni più comuni, contiene 2 8 = 256 livelli. Ogni pixel
occupa quindi in memoria 8bit=1byte. Le immagini a colori risultano dalla composizione di un
certo numero (ad esempio 3) di colori fondamentali, per ciascuno dei quali si ha una scala di 256
livelli. In questo caso, i livelli di colore sono 2 24 , ossia circa 16 milioni.
Tipicamente un’immagine fotografica digitale contiene alcuni milioni di pixel. Per fare un esempio
numerico, si consideri un’immagine con 2000 × 2600 = 5200000 pixel. Se quest’immagine è
rappresentata in un formato 10 × 13 cm, ogni mm lineare contiene 20 pixel, e quindi ogni pixel
misura 50μm . Spesso la risoluzione di un’immagine viene misurata in dpi (dots per inch, ossia
punti per pollice lineare); poiché un pollice corrisponde a circa 25.4mm, nell’esempio visto sopra la
risoluzione è 25.4 × 20 = 508 dpi.
Nella memoria del computer l’immagine si configura come una matrice numerica le cui righe e
colonne corrispondono alle righe e colonne di pixel e i cui valori numerici rappresentano i toni di
grigio o di colore. L’occupazione di memoria è 1byte per pixel; quindi nell’esempio visto sono
5200000 byte ≅ 4.96 Mbyte (1Mbyte= 2 20 byte).
Tuttavia, è possibile eseguire una compressione di immagine, che comporta in generale una
significativa riduzione della memoria occupata. La compressione consiste in un modo diverso di
organizzare l’informazione sui toni di colore contenuti nell’immagine, che, anziché indicare i toni
di colore pixel per pixel, utilizza opportune funzioni che descrivono le variazioni dei toni di colore
sulla superficie dell’immagine, sfruttando il fatto che vaste zone dell’immagine spesso sono
occupate da pixel il cui tono di colore è rappresentato da numeri che variano lentamente (ad
esempio, porzioni di cielo). Questo fa sì che in genere foto con una distribuzione uniforme di colori
occupino meno memoria di foto con forti contrasti. L’utilizzo di questo sistema di memorizzazione
richiede in generale una lieve modifica dei toni di colore, che però, se si usa una compressione ad
alta qualità, risulta pressoché impercettibile all’occhio.
Raddrizzamento
Poiché l’immagine è piana (quindi 2-dim.), mentre l’oggetto riprodotto è 3-dim., non è possibile, in
base alla geometria della presa, determinare in modo univoco la posizione dei punti dell’oggetto
dalle misure della posizione dei punti corrispondenti su una singola immagine. Infatti, una volta
individuata la retta congiungente un punto dell’immagine con il centro di presa, pur sapendo che il
punto corrispondente sull’oggetto deve stare su questa retta, l’immagine non fornisce alcuna
ulteriore informazione sulla distanza dal centro di presa a cui questo punto si trova.
Tuttavia, se anche l’oggetto è piano (ad esempio la facciata di un edificio, ignorando tutti gli aggetti
e le rientranze presenti, la cui profondità è spesso piccola rispetto alle dimensioni della facciata), è
possibile, analizzando le deformazioni prospettiche, ricostruire l’orientazione relativa del piano
dell’oggetto rispetto al piano dell’immagine, e quindi, utilizzando anche un piccolo numero di
misure eseguite direttamente sull’oggetto, stabilire precise relazioni fra le posizioni dei punti
sull’immagine e quelle dei punti corrispondenti sull’oggetto.
A causa delle deformazioni prospettiche, dovute al fatto che i piani dell’oggetto e dell’immagine
non sono paralleli, fasci di rette parallele sull’oggetto vengono trasformati sull’immagine in fasci di
rette che si incontrano tutte in un unico punto, detto punto di fuga. Se si considera ad esempio una
facciata rettangolare, e se si assume che la perpendicolare al piano dell’immagine sia inclinata sia
rispetto ad un piano orizzontale sia lateralmente, i fasci di rette parallele agli spigoli verticali e a
quelli orizzontali della facciata vengono entrambi trasformati in fasci di rette convergenti in due
punti di fuga (fig.3). Introducendo un sistema di assi xy sull’immagine e un sistema di assi XY
sull’oggetto (quest’ultimo generalmente scelto in modo che l’asse X sia orizzontale e l’asse Y
verticale), l’espressione matematica della trasformazione (detta trasformazione omografica) è
ax + by + c
px + qy + 1
a ' x + b' y + c '
Y=
px + qy + 1
X =
(1)
Si verifica che la trasformazione inversa, che esprime le coordinate sull’immagine in funzione di
quelle sull’oggetto ha un’espressione simile:
mX
rX
m' X
y=
rX
x=
+ nY + k
+ sY + 1
+ n' Y + k '
+ sY + 1
(2)
fig.3 – Deformazioni prospettiche
La trasformazione dipende da 8 parametri (nella (1), a, b, c, a' , b' , c' , p, q ). Poiché questi parametri
dipendono dall’orientazione del piano dell’immagine rispetto al piano dell’oggetto, oltre che dai
parametri di orientamento interno, il loro valore è diverso da foto a foto, e va quindi determinato per
ogni immagine. A tale scopo, è necessario che nella (1) i parametri siano le uniche incognite, e
quindi per alcuni punti devono essere note non soltanto le coordinate x,y sull’immagine, ma anche
le coordinate X,Y dei corrispondenti punti sull’oggetto. Più precisamente, dato che i parametri da
determinare sono 8, è necessario scrivere 8 equazioni. Poiché per ogni punto si possono scrivere le
2 equazioni di (1), bisogna considerare 4 punti di cui devono essere note sia le coordinate
sull’immagine sia le coordinate sull’oggetto. Si noti che le equazioni (1) sono lineari nei parametri:
ad esempio, la prima si può scrivere xXp + yXq − xa − yb − c = − X .
Per poter conoscere le coordinate sull’oggetto è necessario eseguire misure topografiche. I punti di
coordinate note sull’oggetto sono detti punti d’appoggio.
Una volta calcolati i valori dei parametri, è possibile utilizzare la (1) per calcolare le coordinate X,Y
di qualsiasi punto sull’oggetto diverso dai punti d’appoggio dopo aver misurato le sue coordinate
x,y sull’immagine.
Naturalmente eventuali errori nella misura delle coordinate sull’immagine e sull’oggetto si
ripercuotono sui valori calcolati dei parametri, e quindi sulle coordinate sull’oggetto dei punti
diversi dai punti d’appoggio. Poiché in generale il sistema di equazioni ammette un’unica
soluzione, non c’è modo di accorgersi degli errori di misura commessi.
Se invece si misura un numero ridondante (maggiore di 4) di punti d’appoggio, si può scrivere un
numero di equazioni più grande del numero di parametri. In generale queste equazioni risultano
incompatibili a causa della presenza degli errori di misura, distribuiti casualmente. Questo significa
che in generale non esiste una soluzione esatta, e ci si deve accontentare di una soluzione
approssimata, determinata, come si vedrà in seguito, con il metodo dei minimi quadrati; l’entità
degli scarti presenti nelle diverse equazioni riflette in qualche modo l’entità degli errori commessi.
Il prodotto finale del raddrizzamento (fig.4) è una nuova immagine i cui punti sono ottenuti da
quelli dell’immagine originaria eseguendo una trasformazione omografica con i parametri calcolati,
e che quindi rappresenta correttamente l’oggetto in scala. Bisogna però tenere presente che, se
l’immagine è digitale, il trasformato di un pixel, che è di forma quadrata o tutt’al più rettangolare,
non è in generale un pixel: infatti un rettangolo si trasforma in un quadrilatero i cui lati non sono
paralleli. E' quindi necessario definire con un opportuno algoritmo il tono di grigio da attribuire a
ciascun pixel dell'immagine trasformata. Ad esempio, si può attribuire a ciascun pixel il tono di
grigio del pixel dell'immagine originaria a cui appartiene il punto il cui trasformato è il suo punto
centrale, oppure, considerati tutti i pixel contenenti punti i cui trasformati appartengono ad un dato
pixel dell'immagine raddrizzata, attribuire a quest'ultimo il valore medio dei loro toni di grigio.
Queste procedure, che sono classificate fra le procedure di ricampionamento, modificano
qualitativamente l'immagine e possono anche portare a un suo deterioramento.
fig.4 – presa inclinata e raddrizzamento
Il raddrizzamento può essere eseguito direttamente sull'immagine anche se non si dispone di
posizioni di punti sull'oggetto; in tal caso, per ottenere unicità della soluzione, occorre imporre 8
vincoli direttamente sull’immagine. Per ottenere questo risultato si può individuare la posizione
sull'immagine dei due punti di fuga (2 coordinate per ciascuno di essi, ossia 4 condizioni), ricavabili
come punti di incontro di linee ben individuabili sull'immagine e corrispondenti sull'oggetto a
segmenti di rette parallele agli assi del sistema di coordinate, e inoltre un punto che rimane fisso (2
condizioni), e un fattore di scala per ciascuno dei due assi (2 condizioni). Questa operazione viene
eseguita automaticamente da molti programmi di trattamento di immagini digitali. Tuttavia, dato
che è necessario introdurre due distinti fattori di scala nelle direzioni dei due assi, in generale
l'immagine risultante non dà una rappresentazione fedele dell'oggetto, a meno che il rapporto fra i
due fattori di scala non sia derivato da un'informazione ricavata direttamente da misure sull'oggetto
stesso.
Ricostruzione stereoscopica del modello 3D
Si è già osservato che un’immagine 2D non fornisce informazioni sufficienti per la ricostruzione
tridimensionale di un oggetto. Queste informazioni possono essere ottenute se si dispone di 2
immagini che riproducono l’oggetto osservato da 2 punti di vista differenti (fig.5).
E’ facile capire che, se sono note le posizioni dei 2 centri di presa e le orientazioni delle 2 immagini
al momento dello scatto, la posizione di un punto sull’oggetto è univocamente determinata dalle
posizioni dei punti che lo rappresentano sulle immagini (detti punti omologhi); infatti il punto
sull’oggetto è il punto di incontro delle 2 rette che congiungono i 2 punti omologhi con i centri di
presa corrispondenti (fig.6).
In generale, tuttavia, le informazioni sulle posizioni dei centri di presa e sull’orientazione delle
immagini non sono disponibili. Soltanto in tempi recenti, in fotogrammetria aerea, sono state
sviluppate delle tecniche che consentono, con l’uso di strumentazione GPS e di accelerometri a
bordo dell’aereo, di ricostruire istante per istante posizione e orientazione del sensore fotografico.
E’ però possibile ricavare queste informazioni dall’esame delle immagini fotografiche, con
l’aggiunta della conoscenza delle posizioni di un piccolo numero di punti sull’oggetto, ricavata da
misure topografiche.
Date 2 immagini che rappresentano lo stesso oggetto, per individuare la loro posizione relativa
all’istante dello scatto, occorre disporle in modo che, per ogni coppia di punti omologhi, le rette che
li congiungono con i centri di presa corrispondenti si incontrino. Ovviamente, dato che le coppie di
punti omologhi sono infinite (o in ogni caso, per un’immagine discretizzata, un numero molto
elevato), è impossibile verificare che tutte soddisfino questa condizione; tuttavia, come si vedrà, è
sufficiente fare la verifica per un piccolo numero di coppie.
Questa operazione è detta orientamento fotogrammetrico. Una volta determinata la posizione e
l’orientazione delle immagini, è possibile determinare la posizione 3D di un qualsiasi punto le cui
rappresentazioni sulle immagini siano ben identificabili; si può così eseguire la restituzione
stereoscopica del modello 3D.
Bisogna però osservare che la condizione imposta di incontro delle rette congiungenti i punti
omologhi con i corrispondenti centri di presa non definisce in modo univoco le posizioni delle 2
immagini e dell’oggetto.
Innanzitutto, la configurazione dell’oggetto e delle immagini è invariante per roto-traslazioni, e
quindi, come è ovvio, è necessario fissare una terna di assi ad essa solidale. Inoltre, una volta
stabilita una configurazione, la condizione di incontro delle rette viene mantenuta se i centri di presa
vengono spostati lungo la loro congiungente, mantenendo invariata l’orientazione delle immagini:
infatti in questo caso le rette corrispondenti a ciascuna coppia di punti omologhi si mantengono
sempre nello stesso piano (fig.7). Quindi, qualunque sia la posizione dei centri di presa lungo la
retta congiungente, i punti di incontro delle rette uscenti da punti omologhi generano un modello 3D
che è una rappresentazione dell’oggetto in una scala proporzionale alla distanza dai centri di presa.
A
B
fig.5 – coppie stereoscopiche di fotogrammi
A – architettonica
B – aerea
La ricostruzione dell’oggetto può quindi essere descritta individuando due fasi distinte (tuttavia non
necessariamente separate sul piano operativo, come si vedrà). La prima, detta orientamento relativo,
consiste nell’introdurre una terna di assi arbitraria solidale alle immagini e una distanza arbitraria
fra i 2 centri di presa, in modo da avere l’unicità della soluzione ottenuta imponendo l’incontro
delle rette e costruire un modello 3D dell’oggetto in una posizione e in una scala arbitraria; la
seconda, detta orientamento assoluto, consiste nel riportare il modello alla scala dell’oggetto e
nell’eseguire una roto-traslazione dal sistema di assi fissato arbitrariamente ad un sistema solidale
con l’oggetto.
fig.6 - schema di coppia stereoscopica
Per entrare più in dettaglio, si assuma, ad esempio, che il sistema di assi solidale alle immagini
abbia l’origine nel centro di presa di una delle immagini, l’asse Z perpendicolare a questa
immagine, con il verso positivo diretto dall’origine verso l’immagine, gli assi X e Y paralleli agli
assi definiti dalle marche sull’immagine stessa. In questo modo, le coordinate X,Y,Z di un punto
appartenente a questa immagine sono determinate in modo molto semplice: se x,y sono le
coordinate del punto nel sistema di assi definito dalle marche, e se ξ ,η sono le coordinate in questo
stesso sistema della proiezione ortogonale del centro di presa sull’immagine, si ha
X = x − ξ , Y = y −η , Z = p
(p=distanza principale).
(3)
Per quanto riguarda l’altra immagine, se si vogliono conoscere le coordinate di punti ad essa
appartenenti nel sistema di assi XYZ, è necessario conoscere la posizione del suo centro di presa,
definita dalle coordinate X,Y,Z, e la sua orientazione, descritta da 3 angoli: 2 per definire la
direzione della retta ad essa perpendicolare (per esempio, l’angolo con l’asse Z e l’angolo della sua
proiezione sul piano XY con l’asse X), e 1 per individuare l’orientazione degli assi legati alle marche
nel piano dell’immagine. Quindi complessivamente 6 parametri incogniti da determinare.
fig.7 - variazione di scala del modello
Bisogna però ricordare che, per risolvere in modo univoco il problema dell’orientamento relativo,
occorre fissare la distanza fra i centri di presa. Di conseguenza, le coordinate X,Y,Z del centro di
presa non sono fra di loro indipendenti, e possono essere tenuti come incogniti, ad esempio, soltanto
i 2 angoli che definiscono l’orientazione della retta congiungente i centri di presa.
Complessivamente, quindi, i parametri di orientamento che vanno considerati incogniti sono
soltanto 5.
Per determinare questi parametri devono essere imposte le condizioni di incontro delle rette
congiungenti le coppie di punti omologhi con i corrispondenti centri di presa. Si scrivono quindi le
equazioni di tali rette (dette equazioni di collinearità), che sono della forma
X 1 − X 0 Y1 − Y0
Z − Z0
=
= 1
X 2 − X 0 Y2 − Y0 Z 2 − Z 0
(4)
dove X 0 , Y0 , Z 0 sono le coordinate del centro di presa, X 1 , Y1 , Z 1 le coordinate del punto
sull’immagine, X 2 , Y2 , Z 2 le coordinate del punto sull’oggetto. Per la retta relativa alla prima
⎛ X 0 ⎞ ⎛ 0⎞
⎜ ⎟ ⎜ ⎟
immagine, si ha ⎜ Y0 ⎟ = ⎜ 0 ⎟ , X 1 , Y1 , Z 1 sono date dalla (3) , mentre X 2 , Y2 , Z 2 sono incognite.
⎜ Z ⎟ ⎜ 0⎟
⎝ 0⎠ ⎝ ⎠
Per la retta relativa alla seconda immagine, invece, le coordinate del centro di presa e quelle del
punto sull’immagine possono essere espresse in funzione dei 5 parametri incogniti di orientamento,
mentre la condizione di incontro fra le 2 rette viene espressa semplicemente imponendo che le
coordinate incognite X 2 , Y2 , Z 2 della seconda retta siano uguali a quelle della prima retta.
Quindi complessivamente le equazioni di collinearità per una coppia di punti omologhi (che sono
4, dato che ogni retta è espressa da 2 equazioni) contengono 8 incognite. Più in generale, se
vengono prese in considerazione le equazioni di collinearità per n coppie di punti omologhi, le
equazioni sono 4n , mentre le incognite sono 3n+5, dato che le coordinate sull’oggetto sono
diverse per le diverse coppie, mentre i parametri di orientamento sono sempre gli stessi.
Per n<5 il numero di incognite è superiore al numero di equazioni, e non è possibile determinare
una soluzione unica. Il bilancio fra numero di equazioni e numero di incognite si raggiunge per n=5.
E’ quindi possibile determinare l’orientamento se la condizione di incontro delle rette è soddisfatta
per 5 coppie di punti omologhi.
Per n>5 il numero di equazioni è superiore al numero di incognite, e in generale in questo caso,
come si è già visto per il problema del raddrizzamento, è possibile soltanto trovare una soluzione
approssimata.
Come si è già detto, con l’orientamento assoluto il modello 3D viene riportato alla scala
dell’oggetto e inserito in un sistema di riferimento legato all’oggetto.
Il cambiamento di scala è dato da un singolo parametro (costante moltiplicativa). La trasformazione
fra i 2 sistemi di assi è una roto-traslazione, descritta da 3 parametri di traslazione (le 3 componenti
del vettore che congiunge le origini dei 2 sistemi) e da 3 parametri di rotazione. Gli aspetti algebrici
delle trasformazioni fra sistemi di riferimento saranno descritti in un capitolo successivo; che i
parametri di una rotazione siano effettivamente 3, lo si può capire dal fatto, discusso in precedenza,
che per descrivere l’orientamento relativo di 2 immagini sono necessari 3 angoli.
Per determinare questi 7 parametri incogniti bisogna risolvere almeno 7 equazioni di trasformazione
che legano fra di loro le coordinate nei 2 sistemi di assi, in cui le uniche incognite siano i parametri;
per questo devono essere note, oltre alle coordinate sul modello 3D calcolabili a partire dalle misure
eseguite sulle 2 immagini, almeno 7 coordinate nel sistema di assi legato all’oggetto (ossia le
coordinate di 2 punti più 1 coordinata di un terzo punto (punti d’appoggio); per evitare
indeterminazione, il terzo punto non deve essere allineato con gli altri due, e inoltre è opportuno che
la coordinata nota sia riferita ad un asse la cui direzione è il più possibile distante da quella della
congiungente gli altri 2 punti).
E’ possibile dare una descrizione in termini intuitivi di questa operazione:
- se sono note le coordinate di 2 punti nel sistema dell’oggetto, è possibile calcolare la loro
distanza; la variazione di scala è data dal rapporto fra questa distanza e la distanza fra i
corrispondenti punti nel modello 3D;
-
-
una volta eseguita la variazione di scala, si considerino i vettori congiungenti le 2 coppie di
punti sull’oggetto e sul modello, che a questo punto hanno la stessa lunghezza. E’ allora
possibile rendere i 2 vettori paralleli con una rotazione e sovrapporli con una traslazione
rimane l’indeterminatezza di una rotazione attorno alla congiungente i 2 punti; se però è
nota una coordinata di un terzo punto non allineato lungo un asse non parallelo a questa
direzione, anche questa indeterminatezza può essere risolta.
Le coordinate dei punti d’appoggio vengono determinate con misure topografiche; anche in questo
caso, per il controllo degli errori casuali di misura, si usa determinare un numero ridondante di punti
e cercare una soluzione approssimata.
Tecniche di restituzione
Nella pratica, si sono succedute nel tempo diverse tecniche per la restituzione stereoscopica del
modello 3D:
-
-
restituzione analogica: un'apparecchiatura detta stereocomparatore (fig.8) consente di
realizzare meccanicamente l'orientazione relativa di due lastre fotografiche, appoggiate su
due supporti mobili, in modo da riprodurre quella che le lastre avevano al momento dello
scatto. L'operatore attua manualmente i movimenti necessari, basandosi sulla visione
stereoscopica realizzata da un binocolo che consente di vedere con ciascun occhio una lastra
diversa. Sempre meccanicamente è possibile determinare per ogni punto del modello,
collimato con una marca che l’operatore ha l’impressione di vedere e di poter muovere in
uno spazio 3D, la "quota" del punto in cui si incontrano le rette congiungenti i punti
omologhi sulle due immagini con i centri di presa corrispondenti, e quindi ricostruire il
modello tridimensionale.
fig.8 – schema di stereocomparatore
-
-
restituzione analitica: le due lastre sono in posizione fissa; la visione stereoscopica e il
conseguente orientamento relativo sono realizzati da movimenti dell’ottica. Lo
stereocomparatore, collegato ad un computer, legge automaticamente le coordinate dei punti
omologhi sulle lastre. Se sono stati inseriti i parametri di orientamento interno, il software
del computer è in grado di risolvere le equazioni di col linearità e di determinare le
coordinate del punto sul modello 3D, ed eventualmente gli scarti della soluzione
approssimata se il numero di punti collimati è ridondante. Se vengono inserite le coordinate
dei punti d’appoggio nel sistema di riferimento dell’oggetto, viene fatto direttamente
l’orientamento assoluto.
fotogrammetria digitale: le immagini sono in forma numerica e vengono visualizzate sullo
schermo di un computer. Esistono dispositivi che consentono all'operatore, dotato di appositi
occhiali, di vedere in rapida alternanza l'immagine sinistra di una coppia stereoscopica con il
solo occhio sinistro e l'immagine destra con il solo occhio destro, realizzando cos\`i la
visione stereoscopica.
L'aspetto più interessante della fotogrammetria digitale, tuttavia, non è la realizzazione sul
computer delle procedure tradizionali della restituzione fotogrammetrica, ma la possibilità di
introdurre procedure automatiche basate sulle tecniche dell'analisi e della produzione di immagini
digitali. Un aspetto fondamentale è l'introduzione di tecniche automatiche per l'individuazione di
punti omologhi su due immagini che rappresentano lo stesso oggetto da due punti di vista diversi e,
pur non essendo identiche, presentano forti correlazioni (image matching). Avendo selezionato su
una delle due immagini una piccola area, viene ricercata fra tutte le aree della seconda immagine
che hanno le stesse dimensioni quella che ha la massima correlazione in termini di toni di grigio o
di colore con l'area selezionata.
Per avere un’idea di come si può misurare numericamente il grado di correlazione, si supponga che
le aree selezionate sulle 2 immagini abbiano N pixel, e si indichino con xi(k ) i numeri
corrispondenti al colore dell’i-esimo pixel sulle 2 immagini. Si possono allora calcolare i numeri
x ( k ) = N1 ∑i xi( k ) (media) , ε i( k ) =xi( k ) − x ( k ) (scarti dalla media) . Evidentemente gli ε i(k ) sono in
parte positivi, in parte negativi. Si consideri ora la quantità
∑ε
i
ε
(1) ( 2 )
i
i
. Se le 2 porzioni di
immagine sono molto dissimili, non c’è relazione fra il segno di ε i(1) e quello di ε i( 2) ; di
conseguenza fra gli addendi della sommatoria ce ne sono molti con segno positivo e molti con
segno negativo. Quindi sommando i segni discordi si compensano e si ottiene un numero piccolo.
Se invece le 2 porzioni di immagine sono simili, è molto probabile che ε i(1) e ε i( 2) abbiano lo
stesso segno; quindi la maggior parte degli addendi ha segno positivo e la somma è grande.
Per realizzare l’image matching si può ad esempio rendere massima la quantità
ρ=
∑ε
ε
(1) ( 2 )
i
i i
1/ 2
1/ 2
2
(1)
( 2) 2
i
i
i
(∑ ε ) (∑ ε )
i
(coefficiente di correlazione empirico).
Ortofoto e DTM
Prodotti tipici della fotogrammetria, che vengono realizzati in modo automatico da molti software
di fotogrammetria digitale sono le ortofoto e i DTM (Digital Terrain Models).
Le ortofoto sono immagini che rappresentano la proiezione ortogonale di un modello 3D su un
piano particolare (ad esempio, per foto aeree, un piano ortogonale alla verticale in un punto della
superficie terrestre). Queste immagini, come si può facilmente intuire (fig.9), sono diverse da quello
che appare nel campo di vista di un obiettivo orientato ortogonalmente al piano (presa nadirale), e
non corrispondono ad alcuna visione realizzabile da un singolo punto di vista. Per poterle realizzare
è necessario produrre preliminarmente un modello 3D.
A’ B’ C’
B
A
BE A
C
D
E’
presa nadirale
ortofoto
AD non è visibile
CB è rappresentato da C’B’
BA da B’A’
viene rappresentato solo BA
fig.9 – presa nadirale e ortofoto
I DTM rappresentano le quote rispetto ad un piano di riferimento di un insieme di punti in generale
appartenenti ad un reticolo regolare; anch'essi possono essere ricavati da un modello 3D.
Dal punto di vista del linguaggio del computer, sia le ortofoto sia i DTM sono matrici numeriche
corrispondenti alla suddivisione in celle di una porzione di territorio (o di un altro qualsiasi
oggetto). Nelle ortofoto i numeri rappresentano toni di grigio o di colore, nei DTM rappresentano
quote.
Le immagini da utilizzare in fotogrammetria digitale possono essere prodotte direttamente in forma
numerica da camere digitali, che sono ormai molto diffuse in ambito amatoriale, ma di uso ancora
limitato in fotogrammetria, soprattutto quella aerea, per cui soltanto in questi ultimi anni si stanno
imponendo sul mercato e non hanno ancora del tutto soppiantato gli apparecchi tradizionali; è
quindi ancora molto diffuso l’uso di scanner di alta precisione per la trasformazione di immagini su
pellicola in immagini digitali.
Fotogrammetria aerea
La fotogrammetria aerea è oggi lo strumento fondamentale per la produzione cartografica. Un volo
fotogrammetrico è costituito da una sequenza di percorsi rettilinei affiancati (strisciate, fig.10). In
generale si richiede che 2 immagini successive prese in una strisciata rappresentino una parte
comune di territorio per almeno il 60%; di conseguenza, su ogni immagine ci sono fasce che
rappresentano porzioni di territorio a comune con altre due immagini. Inoltre, si richiede che
strisciate adiacenti rappresentino porzioni comuni di territorio per almeno il 10% (fig.11). Poiché
ogni coppia di immagini consecutive di una strisciata permette di ricavare un modello stereoscopico
tridimensionale, i punti appartenenti a più di due immagini di una stessa strisciata o di strisciate
adiacenti (detti punti di legame) appartengono a più modelli stereoscopici e possono essere utilizzati
per concatenare fra di loro i diversi modelli. Questa operazione, detta triangolazione aerea,
consente di riportare i vari modelli in un unico sistema di riferimento stimando i parametri delle
roto-traslazioni fra i diversi sistemi ed eseguendo una compensazione delle coordinate con il
metodo dei minimi quadrati.
fig.10 – blocco di strisciate
fig.11 – sovrapposizione di fotogrammi
Per riportare il rilievo nel sistema di riferimento del terreno è necessario disporre di punti di
appoggio, le cui posizioni sono determinate a terra per via topografica. In virtù della concatenazione
fra i diversi modelli, non è necessario eseguire separatamente l’orientamento assoluto di ciascuno di
essi, e di conseguenza il numero di punti di appoggio necessari risulta ridotto.
La presenza a bordo dell'aereo di uno o più ricevitori GPS e di accelerometri consente di rilevarne
la posizione e l'assetto al momento della presa del fotogramma, rendendo inutile in linea di
principio la rete di appoggio a terra. Oggi le tecniche per raggiungere questo risultato non sono
ancora pienamente sviluppate, ed è possibile soltanto semplificare significativamente la rete di
appoggio, in modo da ridurne il costo.
Per l'orientamento esterno di una coppia in fotogrammetria aerea si può scegliere un sistema di
riferimento in cui l'asse x sia orientato lungo la direzione prevista della strisciata (che si suppone in
un piano orizzontale), l'asse z lungo la verticale e l'asse y a completare la terna (ovviamente
anch'esso in un piano orizzontale), e fissare, in fase di orientamento relativo, la distanza fra i centri
di presa approssimativamente uguale alla distanza percorsa fra due scatti successivi, deducibile
dalla velocità dell'aereo e dall'intervallo temporale fra gli scatti; in questo modo, in fase di
orientamento assoluto, il fattore di scala differisce di poco da 1, e questa differenza può essere
trattata come una quantità infinitesima.
Dato che la lastra fotografica è rigidamente fissata al corpo dell'aereo, la sua orientazione dipende
dall'assetto di volo, ed è descritta da 3 angoli, che in generale sono piccoli: un angolo ω di
rotazione attorno all'asse x, che rappresenta una deviazione rispetto all'assetto orizzontale dell'aereo,
un angolo ϕ di rotazione attorno all'asse y, che rappresenta una deviazione della direzione di volo
dal piano orizzontale, e un angolo κ di rotazione attorno all'asse z, che rappresenta una deviazione
nel piano orizzontale rispetto alla direzione di volo prevista. In generale la composizione di
rotazioni attorno ad angoli diversi dipende dall’ordine in cui sono applicate; tuttavia in questo caso,
essendo gli angoli piccoli, la loro composizione è approssimativamente indipendente dall’ordine.
Compensazione di un blocco fotogrammetrico
Un blocco fotogrammetrico è un insieme di immagini con punti di legame che fanno in modo che i
diversi modelli stereoscopici generati da coppie di immagini possano essere concatenati fra loro. Ad
esempio, una strisciata o un insieme di strisciate adiacenti prodotte secondo le specifiche per la
fotogrammetria aerea cui si è accennato sopra costituisce un blocco fotogrammetrico.
In un blocco fotogrammetrico si può produrre un modello stereoscopico per ogni coppia di
immagini adiacenti, ciascuno in un suo sistema di riferimento e in una sua scala. E’ quindi
necessario, per costruire un unico modello 3D per tutta l’area rilevata, determinare per ciascun
modello stereoscopico la roto-traslazione con cambiamento di scala (7 parametri) che trasforma il
sistema di riferimento di quel modello nel sistema di riferimento generale. Disponendo di un
numero sufficiente di coordinate di punti di appoggio, è possibile riportarsi ad un sistema di
riferimento generale legato all’oggetto.
In ogni modello stereoscopico sono note, in quanto determinate dall’orientamento relativo, le
coordinate di un certo numero di punti osservati. Per ciascuna di esse si può scrivere un’equazione
di trasformazione, che dipende da parametri incogniti. Per determinare questi parametri, occorre che
si possa scrivere un numero di equazioni almeno uguale al numero delle incognite, tenendo conto
che sono incognite anche le coordinate nel sistema di riferimento generale, a parte quelle dei punti
di appoggio. Inoltre occorre che il sistema di riferimento generale sia ben definito (mediante le
coordinate dei punti d’appoggio), altrimenti si perde l’unicità della soluzione del sistema di
equazioni.
Anche in questo caso si cerca di fare in modo che il numero di equazioni sia ridondante; in questo
caso, come si è già detto, si può ottenere soltanto una soluzione approssimata, ma è possibile avere
un controllo sugli errori casuali di misura.
Poiché gli effetti degli errori di misura in generale si amplificano quando ci si allontana dai punti
d’appoggio, è opportuno che si disponga di punti d’appoggio distribuiti il più possibile
uniformemente in prossimità dei bordi dell’area rilevata.
fig.12 – compensazione di un blocco fotogrammetrico a modelli indipendenti
Ad esempio, con riferimento alla fig.12 (dove i punti contrassegnati da triangoli sono punti
d’appoggio), si hanno:
- 4 modelli, quindi 7 × 4 = 28 parametri di trasformazione
- 4 punti osservati per ogni modello, quindi 4 × 4 × 3 = 48 osservabili
- 5 punti di legame, quindi 15 coordinate incognite
- 4 punti di appoggio.
Complessivamente si hanno quindi 48 equazioni di osservazione, con 28+15=43 incognite.
Questa procedura prende il nome di compensazione a modelli indipendenti (il termine
compensazione, come si vedrà in seguito, sta proprio a indicare gli aggiustamenti che si devono fare
nella soluzione approssimata per superare le incompatibilità dovute agli errori di misura). Essa era
l’unica procedura possibile quando, con lo stereocomparatore analogico, i modelli 3D dovevano
essere costruiti uno per volta.
Oggi è possibile al computer generare direttamente il modello 3D generale utilizzando
contemporaneamente tutte le immagini, senza bisogno di passare per i modelli generati dalle singole
coppie. La procedura, detta compensazione a stelle proiettive, consiste nel risolvere
contemporaneamente tutte le equazioni di collinearità, introducendo come osservabili direttamente
le coordinate sulle immagini dei punti di legame e dei punti d’appoggio, essendo assunti come noti i
parametri di orientamento interno delle immagini e le coordinate sull’oggetto dei punti d’appoggio.
Le incognite sono le coordinate sul terreno dei punti di legame, le coordinate dei centri di presa e i
parametri di orientamento dei fotogrammi.
Con riferimento all'esempio in fig.13
- le osservabili sono 2 × 6 × 4 = 48 ;
- le coordinate incognite sul terreno sono 3 × 4 = 12 ;
- le coordinate dei centri di presa sono 3 × 4 = 12 ; i parametri di orientamento assoluto sono
3 × 4 = 12 ;
- ci sono inoltre 4 punti di appoggio sul terreno.
Complessivamente si hanno quindi 48 equazioni di osservazione, con 12+12+12=36 incognite.
fig.13 – compensazione di un blocco fotogrammetrico a stelle proiettive