Fotogrammetria Scopo della fotogrammetria è la determinazione delle posizioni di punti nello spazio fisico a partire dalla misura delle posizioni dei punti corrispondenti su un’immagine fotografica. Ovviamente, affinché questo sia possibile, è necessario che siano note in modo preciso le relazioni geometriche fra le posizioni spaziali dei punti dell’oggetto rappresentato e quelle delle loro immagini sul piano della fotografia. In generale, la descrizione di queste corrispondenze non è semplice e richiede una conoscenza dettagliata del cammino ottico dei raggi luminosi attraverso il sistema i lenti che costituisce l’obiettivo della macchina fotografica. Tuttavia è possibile adottare, con buona approssimazione, una schematizzazione, in base alla quale si può affermare che i segmenti che congiungono i punti dell’oggetto rappresentato con le loro immagini si incontrano tutti in un punto, generalmente distante qualche cm dal piano della fotografia, detto centro di presa (fig.1). La distanza del centro di presa dal piano dell’immagine è detta distanza principale, e dipende dalla configurazione dell’obiettivo; pertanto, essa si mantiene fissa finché l’assetto del sistema di lenti non viene modificato. Negli apparecchi fotografici usati per fotogrammetria, quindi, operazioni come la messa a fuoco, che comportano un movimento relativo delle lenti, in generale non possono essere eseguite, o richiedono in ogni caso un controllo rigoroso. A C’ B’ A’ distanza principale B O centro di presa C fig.1 – Geometria della presa fotogrammetrica Il rapporto fra la distanza principale p e la distanza dell'oggetto dal centro di presa fornisce la scala dell'immagine. Ad esempio, con riferimento a fotografie aeree di una porzione di territorio, posto p=15cm (che è un valore tipico per gli apparecchi fotografici in uso), una quota di volo di 450m corrisponde a una scala di 1:3000, una quota di 900m a una scala di 1:6000, una quota di 1800m a una scala di 1:12000, e così via. Per poter eseguire misure di posizione sull’immagine, è necessario che sul suo piano sia definito un sistema di assi cartesiani, che in generale è visualizzato da un insieme di marche impresse sui bordi dell’immagine (fig.2) . Idealmente, l’obiettivo dovrebbe essere costruito in modo che la perpendicolare condotta dal centro di presa al piano dell’immagine cada esattamente nell’origine delle coordinate. Generalmente questo non avviene in modo esatto: la proiezione del centro di presa sul piano dell’immagine dista alcuni μm (micron, ossia millesimi di millimetro) dall’origine. Tuttavia le sue coordinate x e y possono essere misurate esattamente e dichiarate dalla casa costruttrice insieme con la distanza principale. Questi 3 numeri sono detti parametri di orientamento interno. y x marche O’ proiezione ortogonale del del centro di presa fig.2 – Orientamento interno Inoltre, per le caratteristiche ottiche dell’obiettivo, la posizione dei punti sull’immagine si discosta leggermente (anche in questo caso di alcuni micron) da quella prevista in base allo schema geometrico sopra descritto. Sono cioè presenti delle deformazioni ottiche. Anche queste, tuttavia, si mantengono fisse per una data configurazione dell’obiettivo, e possono essere misurate, modellizzate e dichiarate dalla casa costruttrice. In genere la parte prevalente di queste deformazioni è radiale (ossia, dipende solo dalla distanza dall’origine) ed è ben descritta da un polinomio: δ r = k1 r 3 + k 2 r 5 con k1 >> k 2 . Questi coefficienti, insieme con i parametri di orientamento interno, sono inseriti nel certificato di calibrazione. Con l’uso dell’apparecchio queste quantità possono subire lievi variazioni nel tempo, ed è quindi consigliabile ricalibrare periodicamente l’apparecchio. Per eseguire un rilievo fotogrammetrico è quindi in linea di massima necessario disporre di apparecchi speciali (camere metriche o semimetriche) molto più costosi di quelli reperibili sul mercato a scopo amatoriale, che non offrono la possibilità di controllare in modo rigoroso la geometria della presa. Immagini digitali Negli ultimi anni hanno avuto grande diffusione, anche per scopi fotogrammetrici, apparecchi fotografici digitali. Come è noto, le immagini memorizzate per l'elaborazione informatica sono discretizzate, ossia suddivise in un reticolo regolare di piccole aree (pixel, che significa picture elements), a ciascuna delle quali viene attribuito un tono di grigio (per le immagini in bianco e nero) secondo una scala, anch'essa discretizzata, che, nelle applicazioni più comuni, contiene 2 8 = 256 livelli. Ogni pixel occupa quindi in memoria 8bit=1byte. Le immagini a colori risultano dalla composizione di un certo numero (ad esempio 3) di colori fondamentali, per ciascuno dei quali si ha una scala di 256 livelli. In questo caso, i livelli di colore sono 2 24 , ossia circa 16 milioni. Tipicamente un’immagine fotografica digitale contiene alcuni milioni di pixel. Per fare un esempio numerico, si consideri un’immagine con 2000 × 2600 = 5200000 pixel. Se quest’immagine è rappresentata in un formato 10 × 13 cm, ogni mm lineare contiene 20 pixel, e quindi ogni pixel misura 50μm . Spesso la risoluzione di un’immagine viene misurata in dpi (dots per inch, ossia punti per pollice lineare); poiché un pollice corrisponde a circa 25.4mm, nell’esempio visto sopra la risoluzione è 25.4 × 20 = 508 dpi. Nella memoria del computer l’immagine si configura come una matrice numerica le cui righe e colonne corrispondono alle righe e colonne di pixel e i cui valori numerici rappresentano i toni di grigio o di colore. L’occupazione di memoria è 1byte per pixel; quindi nell’esempio visto sono 5200000 byte ≅ 4.96 Mbyte (1Mbyte= 2 20 byte). Tuttavia, è possibile eseguire una compressione di immagine, che comporta in generale una significativa riduzione della memoria occupata. La compressione consiste in un modo diverso di organizzare l’informazione sui toni di colore contenuti nell’immagine, che, anziché indicare i toni di colore pixel per pixel, utilizza opportune funzioni che descrivono le variazioni dei toni di colore sulla superficie dell’immagine, sfruttando il fatto che vaste zone dell’immagine spesso sono occupate da pixel il cui tono di colore è rappresentato da numeri che variano lentamente (ad esempio, porzioni di cielo). Questo fa sì che in genere foto con una distribuzione uniforme di colori occupino meno memoria di foto con forti contrasti. L’utilizzo di questo sistema di memorizzazione richiede in generale una lieve modifica dei toni di colore, che però, se si usa una compressione ad alta qualità, risulta pressoché impercettibile all’occhio. Raddrizzamento Poiché l’immagine è piana (quindi 2-dim.), mentre l’oggetto riprodotto è 3-dim., non è possibile, in base alla geometria della presa, determinare in modo univoco la posizione dei punti dell’oggetto dalle misure della posizione dei punti corrispondenti su una singola immagine. Infatti, una volta individuata la retta congiungente un punto dell’immagine con il centro di presa, pur sapendo che il punto corrispondente sull’oggetto deve stare su questa retta, l’immagine non fornisce alcuna ulteriore informazione sulla distanza dal centro di presa a cui questo punto si trova. Tuttavia, se anche l’oggetto è piano (ad esempio la facciata di un edificio, ignorando tutti gli aggetti e le rientranze presenti, la cui profondità è spesso piccola rispetto alle dimensioni della facciata), è possibile, analizzando le deformazioni prospettiche, ricostruire l’orientazione relativa del piano dell’oggetto rispetto al piano dell’immagine, e quindi, utilizzando anche un piccolo numero di misure eseguite direttamente sull’oggetto, stabilire precise relazioni fra le posizioni dei punti sull’immagine e quelle dei punti corrispondenti sull’oggetto. A causa delle deformazioni prospettiche, dovute al fatto che i piani dell’oggetto e dell’immagine non sono paralleli, fasci di rette parallele sull’oggetto vengono trasformati sull’immagine in fasci di rette che si incontrano tutte in un unico punto, detto punto di fuga. Se si considera ad esempio una facciata rettangolare, e se si assume che la perpendicolare al piano dell’immagine sia inclinata sia rispetto ad un piano orizzontale sia lateralmente, i fasci di rette parallele agli spigoli verticali e a quelli orizzontali della facciata vengono entrambi trasformati in fasci di rette convergenti in due punti di fuga (fig.3). Introducendo un sistema di assi xy sull’immagine e un sistema di assi XY sull’oggetto (quest’ultimo generalmente scelto in modo che l’asse X sia orizzontale e l’asse Y verticale), l’espressione matematica della trasformazione (detta trasformazione omografica) è ax + by + c px + qy + 1 a ' x + b' y + c ' Y= px + qy + 1 X = (1) Si verifica che la trasformazione inversa, che esprime le coordinate sull’immagine in funzione di quelle sull’oggetto ha un’espressione simile: mX rX m' X y= rX x= + nY + k + sY + 1 + n' Y + k ' + sY + 1 (2) fig.3 – Deformazioni prospettiche La trasformazione dipende da 8 parametri (nella (1), a, b, c, a' , b' , c' , p, q ). Poiché questi parametri dipendono dall’orientazione del piano dell’immagine rispetto al piano dell’oggetto, oltre che dai parametri di orientamento interno, il loro valore è diverso da foto a foto, e va quindi determinato per ogni immagine. A tale scopo, è necessario che nella (1) i parametri siano le uniche incognite, e quindi per alcuni punti devono essere note non soltanto le coordinate x,y sull’immagine, ma anche le coordinate X,Y dei corrispondenti punti sull’oggetto. Più precisamente, dato che i parametri da determinare sono 8, è necessario scrivere 8 equazioni. Poiché per ogni punto si possono scrivere le 2 equazioni di (1), bisogna considerare 4 punti di cui devono essere note sia le coordinate sull’immagine sia le coordinate sull’oggetto. Si noti che le equazioni (1) sono lineari nei parametri: ad esempio, la prima si può scrivere xXp + yXq − xa − yb − c = − X . Per poter conoscere le coordinate sull’oggetto è necessario eseguire misure topografiche. I punti di coordinate note sull’oggetto sono detti punti d’appoggio. Una volta calcolati i valori dei parametri, è possibile utilizzare la (1) per calcolare le coordinate X,Y di qualsiasi punto sull’oggetto diverso dai punti d’appoggio dopo aver misurato le sue coordinate x,y sull’immagine. Naturalmente eventuali errori nella misura delle coordinate sull’immagine e sull’oggetto si ripercuotono sui valori calcolati dei parametri, e quindi sulle coordinate sull’oggetto dei punti diversi dai punti d’appoggio. Poiché in generale il sistema di equazioni ammette un’unica soluzione, non c’è modo di accorgersi degli errori di misura commessi. Se invece si misura un numero ridondante (maggiore di 4) di punti d’appoggio, si può scrivere un numero di equazioni più grande del numero di parametri. In generale queste equazioni risultano incompatibili a causa della presenza degli errori di misura, distribuiti casualmente. Questo significa che in generale non esiste una soluzione esatta, e ci si deve accontentare di una soluzione approssimata, determinata, come si vedrà in seguito, con il metodo dei minimi quadrati; l’entità degli scarti presenti nelle diverse equazioni riflette in qualche modo l’entità degli errori commessi. Il prodotto finale del raddrizzamento (fig.4) è una nuova immagine i cui punti sono ottenuti da quelli dell’immagine originaria eseguendo una trasformazione omografica con i parametri calcolati, e che quindi rappresenta correttamente l’oggetto in scala. Bisogna però tenere presente che, se l’immagine è digitale, il trasformato di un pixel, che è di forma quadrata o tutt’al più rettangolare, non è in generale un pixel: infatti un rettangolo si trasforma in un quadrilatero i cui lati non sono paralleli. E' quindi necessario definire con un opportuno algoritmo il tono di grigio da attribuire a ciascun pixel dell'immagine trasformata. Ad esempio, si può attribuire a ciascun pixel il tono di grigio del pixel dell'immagine originaria a cui appartiene il punto il cui trasformato è il suo punto centrale, oppure, considerati tutti i pixel contenenti punti i cui trasformati appartengono ad un dato pixel dell'immagine raddrizzata, attribuire a quest'ultimo il valore medio dei loro toni di grigio. Queste procedure, che sono classificate fra le procedure di ricampionamento, modificano qualitativamente l'immagine e possono anche portare a un suo deterioramento. fig.4 – presa inclinata e raddrizzamento Il raddrizzamento può essere eseguito direttamente sull'immagine anche se non si dispone di posizioni di punti sull'oggetto; in tal caso, per ottenere unicità della soluzione, occorre imporre 8 vincoli direttamente sull’immagine. Per ottenere questo risultato si può individuare la posizione sull'immagine dei due punti di fuga (2 coordinate per ciascuno di essi, ossia 4 condizioni), ricavabili come punti di incontro di linee ben individuabili sull'immagine e corrispondenti sull'oggetto a segmenti di rette parallele agli assi del sistema di coordinate, e inoltre un punto che rimane fisso (2 condizioni), e un fattore di scala per ciascuno dei due assi (2 condizioni). Questa operazione viene eseguita automaticamente da molti programmi di trattamento di immagini digitali. Tuttavia, dato che è necessario introdurre due distinti fattori di scala nelle direzioni dei due assi, in generale l'immagine risultante non dà una rappresentazione fedele dell'oggetto, a meno che il rapporto fra i due fattori di scala non sia derivato da un'informazione ricavata direttamente da misure sull'oggetto stesso. Ricostruzione stereoscopica del modello 3D Si è già osservato che un’immagine 2D non fornisce informazioni sufficienti per la ricostruzione tridimensionale di un oggetto. Queste informazioni possono essere ottenute se si dispone di 2 immagini che riproducono l’oggetto osservato da 2 punti di vista differenti (fig.5). E’ facile capire che, se sono note le posizioni dei 2 centri di presa e le orientazioni delle 2 immagini al momento dello scatto, la posizione di un punto sull’oggetto è univocamente determinata dalle posizioni dei punti che lo rappresentano sulle immagini (detti punti omologhi); infatti il punto sull’oggetto è il punto di incontro delle 2 rette che congiungono i 2 punti omologhi con i centri di presa corrispondenti (fig.6). In generale, tuttavia, le informazioni sulle posizioni dei centri di presa e sull’orientazione delle immagini non sono disponibili. Soltanto in tempi recenti, in fotogrammetria aerea, sono state sviluppate delle tecniche che consentono, con l’uso di strumentazione GPS e di accelerometri a bordo dell’aereo, di ricostruire istante per istante posizione e orientazione del sensore fotografico. E’ però possibile ricavare queste informazioni dall’esame delle immagini fotografiche, con l’aggiunta della conoscenza delle posizioni di un piccolo numero di punti sull’oggetto, ricavata da misure topografiche. Date 2 immagini che rappresentano lo stesso oggetto, per individuare la loro posizione relativa all’istante dello scatto, occorre disporle in modo che, per ogni coppia di punti omologhi, le rette che li congiungono con i centri di presa corrispondenti si incontrino. Ovviamente, dato che le coppie di punti omologhi sono infinite (o in ogni caso, per un’immagine discretizzata, un numero molto elevato), è impossibile verificare che tutte soddisfino questa condizione; tuttavia, come si vedrà, è sufficiente fare la verifica per un piccolo numero di coppie. Questa operazione è detta orientamento fotogrammetrico. Una volta determinata la posizione e l’orientazione delle immagini, è possibile determinare la posizione 3D di un qualsiasi punto le cui rappresentazioni sulle immagini siano ben identificabili; si può così eseguire la restituzione stereoscopica del modello 3D. Bisogna però osservare che la condizione imposta di incontro delle rette congiungenti i punti omologhi con i corrispondenti centri di presa non definisce in modo univoco le posizioni delle 2 immagini e dell’oggetto. Innanzitutto, la configurazione dell’oggetto e delle immagini è invariante per roto-traslazioni, e quindi, come è ovvio, è necessario fissare una terna di assi ad essa solidale. Inoltre, una volta stabilita una configurazione, la condizione di incontro delle rette viene mantenuta se i centri di presa vengono spostati lungo la loro congiungente, mantenendo invariata l’orientazione delle immagini: infatti in questo caso le rette corrispondenti a ciascuna coppia di punti omologhi si mantengono sempre nello stesso piano (fig.7). Quindi, qualunque sia la posizione dei centri di presa lungo la retta congiungente, i punti di incontro delle rette uscenti da punti omologhi generano un modello 3D che è una rappresentazione dell’oggetto in una scala proporzionale alla distanza dai centri di presa. A B fig.5 – coppie stereoscopiche di fotogrammi A – architettonica B – aerea La ricostruzione dell’oggetto può quindi essere descritta individuando due fasi distinte (tuttavia non necessariamente separate sul piano operativo, come si vedrà). La prima, detta orientamento relativo, consiste nell’introdurre una terna di assi arbitraria solidale alle immagini e una distanza arbitraria fra i 2 centri di presa, in modo da avere l’unicità della soluzione ottenuta imponendo l’incontro delle rette e costruire un modello 3D dell’oggetto in una posizione e in una scala arbitraria; la seconda, detta orientamento assoluto, consiste nel riportare il modello alla scala dell’oggetto e nell’eseguire una roto-traslazione dal sistema di assi fissato arbitrariamente ad un sistema solidale con l’oggetto. fig.6 - schema di coppia stereoscopica Per entrare più in dettaglio, si assuma, ad esempio, che il sistema di assi solidale alle immagini abbia l’origine nel centro di presa di una delle immagini, l’asse Z perpendicolare a questa immagine, con il verso positivo diretto dall’origine verso l’immagine, gli assi X e Y paralleli agli assi definiti dalle marche sull’immagine stessa. In questo modo, le coordinate X,Y,Z di un punto appartenente a questa immagine sono determinate in modo molto semplice: se x,y sono le coordinate del punto nel sistema di assi definito dalle marche, e se ξ ,η sono le coordinate in questo stesso sistema della proiezione ortogonale del centro di presa sull’immagine, si ha X = x − ξ , Y = y −η , Z = p (p=distanza principale). (3) Per quanto riguarda l’altra immagine, se si vogliono conoscere le coordinate di punti ad essa appartenenti nel sistema di assi XYZ, è necessario conoscere la posizione del suo centro di presa, definita dalle coordinate X,Y,Z, e la sua orientazione, descritta da 3 angoli: 2 per definire la direzione della retta ad essa perpendicolare (per esempio, l’angolo con l’asse Z e l’angolo della sua proiezione sul piano XY con l’asse X), e 1 per individuare l’orientazione degli assi legati alle marche nel piano dell’immagine. Quindi complessivamente 6 parametri incogniti da determinare. fig.7 - variazione di scala del modello Bisogna però ricordare che, per risolvere in modo univoco il problema dell’orientamento relativo, occorre fissare la distanza fra i centri di presa. Di conseguenza, le coordinate X,Y,Z del centro di presa non sono fra di loro indipendenti, e possono essere tenuti come incogniti, ad esempio, soltanto i 2 angoli che definiscono l’orientazione della retta congiungente i centri di presa. Complessivamente, quindi, i parametri di orientamento che vanno considerati incogniti sono soltanto 5. Per determinare questi parametri devono essere imposte le condizioni di incontro delle rette congiungenti le coppie di punti omologhi con i corrispondenti centri di presa. Si scrivono quindi le equazioni di tali rette (dette equazioni di collinearità), che sono della forma X 1 − X 0 Y1 − Y0 Z − Z0 = = 1 X 2 − X 0 Y2 − Y0 Z 2 − Z 0 (4) dove X 0 , Y0 , Z 0 sono le coordinate del centro di presa, X 1 , Y1 , Z 1 le coordinate del punto sull’immagine, X 2 , Y2 , Z 2 le coordinate del punto sull’oggetto. Per la retta relativa alla prima ⎛ X 0 ⎞ ⎛ 0⎞ ⎜ ⎟ ⎜ ⎟ immagine, si ha ⎜ Y0 ⎟ = ⎜ 0 ⎟ , X 1 , Y1 , Z 1 sono date dalla (3) , mentre X 2 , Y2 , Z 2 sono incognite. ⎜ Z ⎟ ⎜ 0⎟ ⎝ 0⎠ ⎝ ⎠ Per la retta relativa alla seconda immagine, invece, le coordinate del centro di presa e quelle del punto sull’immagine possono essere espresse in funzione dei 5 parametri incogniti di orientamento, mentre la condizione di incontro fra le 2 rette viene espressa semplicemente imponendo che le coordinate incognite X 2 , Y2 , Z 2 della seconda retta siano uguali a quelle della prima retta. Quindi complessivamente le equazioni di collinearità per una coppia di punti omologhi (che sono 4, dato che ogni retta è espressa da 2 equazioni) contengono 8 incognite. Più in generale, se vengono prese in considerazione le equazioni di collinearità per n coppie di punti omologhi, le equazioni sono 4n , mentre le incognite sono 3n+5, dato che le coordinate sull’oggetto sono diverse per le diverse coppie, mentre i parametri di orientamento sono sempre gli stessi. Per n<5 il numero di incognite è superiore al numero di equazioni, e non è possibile determinare una soluzione unica. Il bilancio fra numero di equazioni e numero di incognite si raggiunge per n=5. E’ quindi possibile determinare l’orientamento se la condizione di incontro delle rette è soddisfatta per 5 coppie di punti omologhi. Per n>5 il numero di equazioni è superiore al numero di incognite, e in generale in questo caso, come si è già visto per il problema del raddrizzamento, è possibile soltanto trovare una soluzione approssimata. Come si è già detto, con l’orientamento assoluto il modello 3D viene riportato alla scala dell’oggetto e inserito in un sistema di riferimento legato all’oggetto. Il cambiamento di scala è dato da un singolo parametro (costante moltiplicativa). La trasformazione fra i 2 sistemi di assi è una roto-traslazione, descritta da 3 parametri di traslazione (le 3 componenti del vettore che congiunge le origini dei 2 sistemi) e da 3 parametri di rotazione. Gli aspetti algebrici delle trasformazioni fra sistemi di riferimento saranno descritti in un capitolo successivo; che i parametri di una rotazione siano effettivamente 3, lo si può capire dal fatto, discusso in precedenza, che per descrivere l’orientamento relativo di 2 immagini sono necessari 3 angoli. Per determinare questi 7 parametri incogniti bisogna risolvere almeno 7 equazioni di trasformazione che legano fra di loro le coordinate nei 2 sistemi di assi, in cui le uniche incognite siano i parametri; per questo devono essere note, oltre alle coordinate sul modello 3D calcolabili a partire dalle misure eseguite sulle 2 immagini, almeno 7 coordinate nel sistema di assi legato all’oggetto (ossia le coordinate di 2 punti più 1 coordinata di un terzo punto (punti d’appoggio); per evitare indeterminazione, il terzo punto non deve essere allineato con gli altri due, e inoltre è opportuno che la coordinata nota sia riferita ad un asse la cui direzione è il più possibile distante da quella della congiungente gli altri 2 punti). E’ possibile dare una descrizione in termini intuitivi di questa operazione: - se sono note le coordinate di 2 punti nel sistema dell’oggetto, è possibile calcolare la loro distanza; la variazione di scala è data dal rapporto fra questa distanza e la distanza fra i corrispondenti punti nel modello 3D; - - una volta eseguita la variazione di scala, si considerino i vettori congiungenti le 2 coppie di punti sull’oggetto e sul modello, che a questo punto hanno la stessa lunghezza. E’ allora possibile rendere i 2 vettori paralleli con una rotazione e sovrapporli con una traslazione rimane l’indeterminatezza di una rotazione attorno alla congiungente i 2 punti; se però è nota una coordinata di un terzo punto non allineato lungo un asse non parallelo a questa direzione, anche questa indeterminatezza può essere risolta. Le coordinate dei punti d’appoggio vengono determinate con misure topografiche; anche in questo caso, per il controllo degli errori casuali di misura, si usa determinare un numero ridondante di punti e cercare una soluzione approssimata. Tecniche di restituzione Nella pratica, si sono succedute nel tempo diverse tecniche per la restituzione stereoscopica del modello 3D: - - restituzione analogica: un'apparecchiatura detta stereocomparatore (fig.8) consente di realizzare meccanicamente l'orientazione relativa di due lastre fotografiche, appoggiate su due supporti mobili, in modo da riprodurre quella che le lastre avevano al momento dello scatto. L'operatore attua manualmente i movimenti necessari, basandosi sulla visione stereoscopica realizzata da un binocolo che consente di vedere con ciascun occhio una lastra diversa. Sempre meccanicamente è possibile determinare per ogni punto del modello, collimato con una marca che l’operatore ha l’impressione di vedere e di poter muovere in uno spazio 3D, la "quota" del punto in cui si incontrano le rette congiungenti i punti omologhi sulle due immagini con i centri di presa corrispondenti, e quindi ricostruire il modello tridimensionale. fig.8 – schema di stereocomparatore - - restituzione analitica: le due lastre sono in posizione fissa; la visione stereoscopica e il conseguente orientamento relativo sono realizzati da movimenti dell’ottica. Lo stereocomparatore, collegato ad un computer, legge automaticamente le coordinate dei punti omologhi sulle lastre. Se sono stati inseriti i parametri di orientamento interno, il software del computer è in grado di risolvere le equazioni di col linearità e di determinare le coordinate del punto sul modello 3D, ed eventualmente gli scarti della soluzione approssimata se il numero di punti collimati è ridondante. Se vengono inserite le coordinate dei punti d’appoggio nel sistema di riferimento dell’oggetto, viene fatto direttamente l’orientamento assoluto. fotogrammetria digitale: le immagini sono in forma numerica e vengono visualizzate sullo schermo di un computer. Esistono dispositivi che consentono all'operatore, dotato di appositi occhiali, di vedere in rapida alternanza l'immagine sinistra di una coppia stereoscopica con il solo occhio sinistro e l'immagine destra con il solo occhio destro, realizzando cos\`i la visione stereoscopica. L'aspetto più interessante della fotogrammetria digitale, tuttavia, non è la realizzazione sul computer delle procedure tradizionali della restituzione fotogrammetrica, ma la possibilità di introdurre procedure automatiche basate sulle tecniche dell'analisi e della produzione di immagini digitali. Un aspetto fondamentale è l'introduzione di tecniche automatiche per l'individuazione di punti omologhi su due immagini che rappresentano lo stesso oggetto da due punti di vista diversi e, pur non essendo identiche, presentano forti correlazioni (image matching). Avendo selezionato su una delle due immagini una piccola area, viene ricercata fra tutte le aree della seconda immagine che hanno le stesse dimensioni quella che ha la massima correlazione in termini di toni di grigio o di colore con l'area selezionata. Per avere un’idea di come si può misurare numericamente il grado di correlazione, si supponga che le aree selezionate sulle 2 immagini abbiano N pixel, e si indichino con xi(k ) i numeri corrispondenti al colore dell’i-esimo pixel sulle 2 immagini. Si possono allora calcolare i numeri x ( k ) = N1 ∑i xi( k ) (media) , ε i( k ) =xi( k ) − x ( k ) (scarti dalla media) . Evidentemente gli ε i(k ) sono in parte positivi, in parte negativi. Si consideri ora la quantità ∑ε i ε (1) ( 2 ) i i . Se le 2 porzioni di immagine sono molto dissimili, non c’è relazione fra il segno di ε i(1) e quello di ε i( 2) ; di conseguenza fra gli addendi della sommatoria ce ne sono molti con segno positivo e molti con segno negativo. Quindi sommando i segni discordi si compensano e si ottiene un numero piccolo. Se invece le 2 porzioni di immagine sono simili, è molto probabile che ε i(1) e ε i( 2) abbiano lo stesso segno; quindi la maggior parte degli addendi ha segno positivo e la somma è grande. Per realizzare l’image matching si può ad esempio rendere massima la quantità ρ= ∑ε ε (1) ( 2 ) i i i 1/ 2 1/ 2 2 (1) ( 2) 2 i i i (∑ ε ) (∑ ε ) i (coefficiente di correlazione empirico). Ortofoto e DTM Prodotti tipici della fotogrammetria, che vengono realizzati in modo automatico da molti software di fotogrammetria digitale sono le ortofoto e i DTM (Digital Terrain Models). Le ortofoto sono immagini che rappresentano la proiezione ortogonale di un modello 3D su un piano particolare (ad esempio, per foto aeree, un piano ortogonale alla verticale in un punto della superficie terrestre). Queste immagini, come si può facilmente intuire (fig.9), sono diverse da quello che appare nel campo di vista di un obiettivo orientato ortogonalmente al piano (presa nadirale), e non corrispondono ad alcuna visione realizzabile da un singolo punto di vista. Per poterle realizzare è necessario produrre preliminarmente un modello 3D. A’ B’ C’ B A BE A C D E’ presa nadirale ortofoto AD non è visibile CB è rappresentato da C’B’ BA da B’A’ viene rappresentato solo BA fig.9 – presa nadirale e ortofoto I DTM rappresentano le quote rispetto ad un piano di riferimento di un insieme di punti in generale appartenenti ad un reticolo regolare; anch'essi possono essere ricavati da un modello 3D. Dal punto di vista del linguaggio del computer, sia le ortofoto sia i DTM sono matrici numeriche corrispondenti alla suddivisione in celle di una porzione di territorio (o di un altro qualsiasi oggetto). Nelle ortofoto i numeri rappresentano toni di grigio o di colore, nei DTM rappresentano quote. Le immagini da utilizzare in fotogrammetria digitale possono essere prodotte direttamente in forma numerica da camere digitali, che sono ormai molto diffuse in ambito amatoriale, ma di uso ancora limitato in fotogrammetria, soprattutto quella aerea, per cui soltanto in questi ultimi anni si stanno imponendo sul mercato e non hanno ancora del tutto soppiantato gli apparecchi tradizionali; è quindi ancora molto diffuso l’uso di scanner di alta precisione per la trasformazione di immagini su pellicola in immagini digitali. Fotogrammetria aerea La fotogrammetria aerea è oggi lo strumento fondamentale per la produzione cartografica. Un volo fotogrammetrico è costituito da una sequenza di percorsi rettilinei affiancati (strisciate, fig.10). In generale si richiede che 2 immagini successive prese in una strisciata rappresentino una parte comune di territorio per almeno il 60%; di conseguenza, su ogni immagine ci sono fasce che rappresentano porzioni di territorio a comune con altre due immagini. Inoltre, si richiede che strisciate adiacenti rappresentino porzioni comuni di territorio per almeno il 10% (fig.11). Poiché ogni coppia di immagini consecutive di una strisciata permette di ricavare un modello stereoscopico tridimensionale, i punti appartenenti a più di due immagini di una stessa strisciata o di strisciate adiacenti (detti punti di legame) appartengono a più modelli stereoscopici e possono essere utilizzati per concatenare fra di loro i diversi modelli. Questa operazione, detta triangolazione aerea, consente di riportare i vari modelli in un unico sistema di riferimento stimando i parametri delle roto-traslazioni fra i diversi sistemi ed eseguendo una compensazione delle coordinate con il metodo dei minimi quadrati. fig.10 – blocco di strisciate fig.11 – sovrapposizione di fotogrammi Per riportare il rilievo nel sistema di riferimento del terreno è necessario disporre di punti di appoggio, le cui posizioni sono determinate a terra per via topografica. In virtù della concatenazione fra i diversi modelli, non è necessario eseguire separatamente l’orientamento assoluto di ciascuno di essi, e di conseguenza il numero di punti di appoggio necessari risulta ridotto. La presenza a bordo dell'aereo di uno o più ricevitori GPS e di accelerometri consente di rilevarne la posizione e l'assetto al momento della presa del fotogramma, rendendo inutile in linea di principio la rete di appoggio a terra. Oggi le tecniche per raggiungere questo risultato non sono ancora pienamente sviluppate, ed è possibile soltanto semplificare significativamente la rete di appoggio, in modo da ridurne il costo. Per l'orientamento esterno di una coppia in fotogrammetria aerea si può scegliere un sistema di riferimento in cui l'asse x sia orientato lungo la direzione prevista della strisciata (che si suppone in un piano orizzontale), l'asse z lungo la verticale e l'asse y a completare la terna (ovviamente anch'esso in un piano orizzontale), e fissare, in fase di orientamento relativo, la distanza fra i centri di presa approssimativamente uguale alla distanza percorsa fra due scatti successivi, deducibile dalla velocità dell'aereo e dall'intervallo temporale fra gli scatti; in questo modo, in fase di orientamento assoluto, il fattore di scala differisce di poco da 1, e questa differenza può essere trattata come una quantità infinitesima. Dato che la lastra fotografica è rigidamente fissata al corpo dell'aereo, la sua orientazione dipende dall'assetto di volo, ed è descritta da 3 angoli, che in generale sono piccoli: un angolo ω di rotazione attorno all'asse x, che rappresenta una deviazione rispetto all'assetto orizzontale dell'aereo, un angolo ϕ di rotazione attorno all'asse y, che rappresenta una deviazione della direzione di volo dal piano orizzontale, e un angolo κ di rotazione attorno all'asse z, che rappresenta una deviazione nel piano orizzontale rispetto alla direzione di volo prevista. In generale la composizione di rotazioni attorno ad angoli diversi dipende dall’ordine in cui sono applicate; tuttavia in questo caso, essendo gli angoli piccoli, la loro composizione è approssimativamente indipendente dall’ordine. Compensazione di un blocco fotogrammetrico Un blocco fotogrammetrico è un insieme di immagini con punti di legame che fanno in modo che i diversi modelli stereoscopici generati da coppie di immagini possano essere concatenati fra loro. Ad esempio, una strisciata o un insieme di strisciate adiacenti prodotte secondo le specifiche per la fotogrammetria aerea cui si è accennato sopra costituisce un blocco fotogrammetrico. In un blocco fotogrammetrico si può produrre un modello stereoscopico per ogni coppia di immagini adiacenti, ciascuno in un suo sistema di riferimento e in una sua scala. E’ quindi necessario, per costruire un unico modello 3D per tutta l’area rilevata, determinare per ciascun modello stereoscopico la roto-traslazione con cambiamento di scala (7 parametri) che trasforma il sistema di riferimento di quel modello nel sistema di riferimento generale. Disponendo di un numero sufficiente di coordinate di punti di appoggio, è possibile riportarsi ad un sistema di riferimento generale legato all’oggetto. In ogni modello stereoscopico sono note, in quanto determinate dall’orientamento relativo, le coordinate di un certo numero di punti osservati. Per ciascuna di esse si può scrivere un’equazione di trasformazione, che dipende da parametri incogniti. Per determinare questi parametri, occorre che si possa scrivere un numero di equazioni almeno uguale al numero delle incognite, tenendo conto che sono incognite anche le coordinate nel sistema di riferimento generale, a parte quelle dei punti di appoggio. Inoltre occorre che il sistema di riferimento generale sia ben definito (mediante le coordinate dei punti d’appoggio), altrimenti si perde l’unicità della soluzione del sistema di equazioni. Anche in questo caso si cerca di fare in modo che il numero di equazioni sia ridondante; in questo caso, come si è già detto, si può ottenere soltanto una soluzione approssimata, ma è possibile avere un controllo sugli errori casuali di misura. Poiché gli effetti degli errori di misura in generale si amplificano quando ci si allontana dai punti d’appoggio, è opportuno che si disponga di punti d’appoggio distribuiti il più possibile uniformemente in prossimità dei bordi dell’area rilevata. fig.12 – compensazione di un blocco fotogrammetrico a modelli indipendenti Ad esempio, con riferimento alla fig.12 (dove i punti contrassegnati da triangoli sono punti d’appoggio), si hanno: - 4 modelli, quindi 7 × 4 = 28 parametri di trasformazione - 4 punti osservati per ogni modello, quindi 4 × 4 × 3 = 48 osservabili - 5 punti di legame, quindi 15 coordinate incognite - 4 punti di appoggio. Complessivamente si hanno quindi 48 equazioni di osservazione, con 28+15=43 incognite. Questa procedura prende il nome di compensazione a modelli indipendenti (il termine compensazione, come si vedrà in seguito, sta proprio a indicare gli aggiustamenti che si devono fare nella soluzione approssimata per superare le incompatibilità dovute agli errori di misura). Essa era l’unica procedura possibile quando, con lo stereocomparatore analogico, i modelli 3D dovevano essere costruiti uno per volta. Oggi è possibile al computer generare direttamente il modello 3D generale utilizzando contemporaneamente tutte le immagini, senza bisogno di passare per i modelli generati dalle singole coppie. La procedura, detta compensazione a stelle proiettive, consiste nel risolvere contemporaneamente tutte le equazioni di collinearità, introducendo come osservabili direttamente le coordinate sulle immagini dei punti di legame e dei punti d’appoggio, essendo assunti come noti i parametri di orientamento interno delle immagini e le coordinate sull’oggetto dei punti d’appoggio. Le incognite sono le coordinate sul terreno dei punti di legame, le coordinate dei centri di presa e i parametri di orientamento dei fotogrammi. Con riferimento all'esempio in fig.13 - le osservabili sono 2 × 6 × 4 = 48 ; - le coordinate incognite sul terreno sono 3 × 4 = 12 ; - le coordinate dei centri di presa sono 3 × 4 = 12 ; i parametri di orientamento assoluto sono 3 × 4 = 12 ; - ci sono inoltre 4 punti di appoggio sul terreno. Complessivamente si hanno quindi 48 equazioni di osservazione, con 12+12+12=36 incognite. fig.13 – compensazione di un blocco fotogrammetrico a stelle proiettive