La percezione dello spazio:
visione stereoscopica
Corso di Principi e Modelli della Percezione
Prof. Giuseppe Boccignone
Dipartimento di Scienze dell’Informazione
Università di Milano
[email protected]
http://homes.dsi.unimi.it/~boccignone/GiuseppeBoccignone_webpage/Modelli_Percezione.html
La percezione dello spazio
//indizi binoculari
• Per ricostruire gli aspetti tridimensionali dell’ambiente il sistema visivo fa uso
di una serie di indizi di profondità.
• informazioni contenute nell’ambiente circostante.
• Distinguiamo fra:
• Indizi di profondità monoculari.
• Indizi di profondità binoculari.
• Tali indizi si combinano per fornire una rappresentazione coerente dello
spazio.
La percezione dello spazio
//indizi binoculari
• Avere due occhi invece comporta molti vantaggi:
1. un campo visivo più esteso
2. un sistema ridondante capace di permettere la visione anche nel caso che uno
dei due occhi venga gravemente danneggiato
3. poter ottenere sommazione binoculare
• Uno dei modi per ottenere indici di profondità dalle informazioni provenienti
dai due occhi è quello di considerare la geometria delle piccole differenze
nelle immagini retiniche (disparità binoculari) prodotte da gli stimoli visivi ad
una certa distanza dall’osservatore. Ciò permette la visione della profondità
tramite stereopsi
La percezione dello spazio
//indizi binoculari: visione stereoscopica
• Sommazione binoculare: vantaggio nel percepire gli oggetti fornito dal fatto di
avere due occhi invece di uno
• Disparità binoculare: differenza fra le immagini retiniche dei due occhi della
stessa immagine visiva.
• Stereopsi: una vivida impressione della tridimensionalità del mondo che non è
acquisibile attraverso la visione monoculare.
• dipende in parte dalla disparità binoculare
Visione stereoscopica:
// disparità binoculare
• Le immagini retiniche dei due occhi del mondo esterno non sono esattamente
le stesse!
immagine retinica destra
immagine retinica sinistra
Visione stereoscopica:
// disparità binoculare
• Il sistema visivo percepisce contemporaneamente due immagini retiniche
diverse
• Il risultato è che noi vediamo le due dita e il punto di fissazione a differenti
profondità nella spazio
• La disparità binoculare ha molto in comune con la parallasse di movimento:
• la parallasse di movimento confronta due diverse immagini retiniche in modo
sequenziale.
• la disparità binoculare due diverse immagini retiniche contemporanemente.
• Direzione e grandezza della disparità ci dicono quali punti sono vicini e quali
lontani
Visione stereoscopica:
// disparità binoculare: la corrispondenza
• Posizioni corrispondenti sulla retina:
• Posizioni sulla retina che coincidono se le due fovee sono sovrapposte.
• La disparità binoculare emerge quando un dato punto nell’ambiente esterno
proietta su punti differenti sulle due retine.
Visione stereoscopica:
// disparità binoculare: la corrispondenza
punto di fissazione
(centro fovea)
Visione stereoscopica:
// disparità binoculare: la corrispondenza
punto di fissazione
(centro fovea)
immagine retinica sinistra
punto di fissazione
(centro fovea)
immagine retinica destra
Visione stereoscopica:
// disparità binoculare: la corrispondenza
disparità = 0
punti retinici
corrispondenti
disparità non nulla
immagine retinica sinistra
immagine retinica destra
Visione stereoscopica:
// disparità binoculare: l’oroptere
• Non tutti i punti nell’ambiente producono disparità sulle retine destra e
sinistra.
immagine retinica sinistra
immagine retinica destra
• L’insieme dei punti che stimolano posizioni corrispondenti sulle due retine si
dice Oroptere.
• Dal punto di vista geometrico l’oroptere coincinde con il circolo di Vieth-Muller
Visione stereoscopica:
// disparità binoculare: l’oroptere
• Non tutti i punti nell’ambiente producono disparità sulle retine destra e
sinistra.
oroptere
• L’insieme dei punti che stimolano posizioni corrispondenti sulle due retine si
dice Oroptere.
• Dal punto di vista geometrico l’oroptere coincinde con il circolo di Vieth-Muller
Visione stereoscopica:
// disparità binoculare: l’oroptere
• L’insieme dei punti che stimolano posizioni corrispondenti sulle due retine si
dice Oroptere.
• Dal punto di vista geometrico l’oroptere coincinde con il circolo di Vieth-Muller
• Diplopia:
• Gli oggetti sull’oroptere vengono percepiti come oggetti singoli.
• Quelli sensibilmente più vicini o più lontani sono percepiti doppi.
Visione stereoscopica:
// disparità binoculare: diplopia
immagine
retinica
sinistra
immagine
retinica
sinistra
immagine
retinica
destra
immagine
retinica
destra
Visione stereoscopica:
// disparità binoculare: diplopia
Sx e Dx
disparità
nulla
Dx
Sx
disparità
grande
Sx e Dx
disparità
nulla
Dx
Sx
disparità
piccola
Visione stereoscopica:
// disparità binoculare: area di fusione di Panum
• L’insieme dei punti che stimolano posizioni corrispondenti sulle due retine si
dice Oroptere.
• Dal punto di vista geometrico l’oroptere coincinde con il circolo di Vieth-Muller
• Diplopia:
• Gli oggetti sull’oroptere vengono percepiti come oggetti singoli.
• Quelli sensibilmente più vicini o più lontani sono percepiti doppi.
• Gli oggetti che sono in prossimità dell’oroptere, tuttavia, possono essere
percepiti come unici.
• L’area dello spazio in cui è possibile la visione singola binoculare, ma che non
coincide geometricamentecon l’oroptere si dice Area di Fusione di Panum (Peter
Ludvig Panum 1820-1885)
Visione stereoscopica:
// disparità binoculare: segno
• La direzione della profondità è data dal segno della disparità
Disparità incrociata
occhio sx
punto a dx
occhio dx
punto a sx
Disparità non incrociata
occhio sx
punto a sx
occhio dx
punto a dx
Visione stereoscopica:
//stereoscopio
• Un macchinario per presentare due immagini diverse ai due occhi in modo da
ottenere una sola ed unica immagine tridimensionale (Sir Charles
Wheatstone)
Visione stereoscopica:
//stereoscopio
• Un macchinario per presentare due immagini diverse ai due occhi in modo da
ottenere una sola ed unica immagine tridimensionale (Sir Charles
Wheatstone)
Visione stereoscopica:
//stereoscopio
• Un macchinario per presentare due immagini diverse ai due occhi in modo da
ottenere una sola ed unica immagine tridimensionale (Sir Charles
Wheatstone)
Visione stereoscopica:
//stereogrammi
• Gli stereogrammi furono inventati sempre
da Charles Wheatstone nel 1838.
• Coppie di immagini che differiscono per il
posizionamento laterale relativo degli
elementi.
• Quando vengono viste
stereoscopicamente producono
un’illusione di profondità
• Gli stereogrammi “Random dot” possono
solo essere visti utilizzando indici di
profondità binoculari, essi infatti non
contengono indici di profondità monoculari
Visione stereoscopica:
//stereogrammi
Visione stereoscopica:
//stereogrammi
• Fusione libera: La tecnica di incrociare o divergere gli occhi in modo da
vedere uno stereogramma senza avere a disposizione uno stereoscopio
• Per fondere stereoscopicamente le due immagini è necessario sovrapporre le
due immagini percepite dai due occhi di modo che il cervello possa fonderle in
una.
• CONVERGENZA INCROCIATA (incrocio gli occhi).
• CONVERGENZA NON INCROCIATA (guardo l’immagine come se fissassi un punto
più lontano).
Visione stereoscopica:
//stereogrammi
Visione stereoscopica:
//stereogrammi
Visione stereoscopica:
//stereogrammi
• Se non ci riuscite.....STEREOCECITA’
• Non tutti percepiscono la profondità ottenuta dalla stereopsi, una condizione
conosciuta come stereocecità (stereoblindness)
• Una condizione di impossibilità di usare la stereopsi per vedere la profondità
• Ciò può esser causa per esempio di disturbi visivi patiti durante l’infanzia come
lo strabismo che consiste in un errato allineamento dei due occhi
Visione stereoscopica:
//stereogrammi di punti casuali (random dot)
• Bela Julesz (1971).
• La stereopsi può essere utilizzata per
individuare oggetti e superfici
nell’ambiente.
• Negli steregrammi di punti casuali noi
percepiamo una nuova immagine
tridimensionale, che non è rintracciabile
in nessuno delle due immagini fuse
• Gli stereogrammi con random dot
dimostrano che non è indispensabile
sapere quello che si sta osservando
prima di vedere l’immagine in profondità
tramite stereopsi. La sola disparità
binoculare è sufficiente per la percezione
della forma
Visione stereoscopica:
//stereogrammi di punti casuali
Visione stereoscopica:
//stereogrammi di punti casuali
Sinistra
Destra
Visione stereoscopica:
//stereogrammi di punti casuali
• Sir Charles Wheatstone dimostrò che la disparità binoculare è una condizione
necessaria alla stereopsi.
• Bela Julesz dimostrò che la disparità binoculare è anche condizione
sufficiente per la stereopsi
Visione stereoscopica:
//il problema della corrispondenza
• Il problema di trovare quale parte di una immagine nell’occhio sinistro deve
corrispondere ad una parte dell’immagine nell’occhio destro
• Problema: le immagini retiniche sono più numerose degli stimoli distali
Visione stereoscopica:
//il problema della corrispondenza
Visione stereoscopica:
//il problema della corrispondenza
ciò che vediamo
Visione stereoscopica:
//il problema della corrispondenza
1 2 3
ciò che vediamo
1
3
4
5
esistono due possibili interpretazioni
geometriche dello stimolo
Visione stereoscopica:
//il problema della corrispondenza
Cosa succede se l’immagine retinica sinistra del cerchio 2 viene messa in corrispondenza con
l’immagine retinica destra del cerchio 1 e l’immagine retinica sinistra del cerchio 3 viene messa
in corrispondenza con l’immagine retinica destra del cerchio 2?
1 2 3
1
3
4
5
• Si vedono quattro cerchi anziché tre, con i due centrali fluttuanti
Visione stereoscopica:
//il problema della corrispondenza: soluzione
• Il sistema visivo segue un’euristica: confronta
prima le due immagini foveali,poi quelle sulla
destra della fovea, infine quelle sulla sinistra
• Vincolo di unicità (Uniqueness constraint):
• un elemento dell’ambiente viene solitamente
rappresentato una sola volta in un immagine
retinica
• Vincolo di continuità (Continuity constraint) :
• i punti nell’ambiente che sono vicini ricadono
a distanze simili dell’osservatore - ad
eccezione dei bordi (in un mondo senza
porcospini)
Visione stereoscopica:
//il problema della corrispondenza: soluzione
• Questa soluzione non funziona per gli
stereogrammi a punti casuali.
• Il sistema visivo dovrebbe confrontare
centinaia di punti casuali identici fra
loro.
• Come potrebbe decidere che il punto
che cade in una regione della retina di
un occhio è proprio lo stesso che cade
in una regione della retina dell’altro
occhio??
Visione stereoscopica:
//il problema della corrispondenza: soluzione (2)
• Il sistema visivo filtra le immagini conservando solo le basse
frequenza spaziali.
• Procede ad un matching nel range delle basse frequenze spaziali
prima di passare a fare una analisi “fine” nello spettro delle frequenze
spaziali più alte
• In questo modo si ottiene una risposta approssimativa, ma sufficiente
a determinare una certa corrispondenza
Visione stereoscopica:
//il problema della corrispondenza: soluzione (2)
Visione stereoscopica:
//il problema della corrispondenza: soluzione (2)
Visione stereoscopica:
//rivalità binoculare
• Il sistema visivo è predisposto a risolvere le differenze fra l’informazione
proveniente dalle due retine.
• Tuttavia, cosa succede se presentiamo due stimoli diversi rispettivamente ai
due occhi?
• Provate a fissare un orologio da muro e poi ad alzare una mano fino ad
occludere con le dita l’oggetto nell!occhio destro.
• Vedete l’orologio o le vostre dita?
Visione stereoscopica:
//rivalità binoculare
• Quando le immagini proiettate dai due occhi sono sensibilmente differenti fra loro
si innesca una competizione fra i due flussi di informazione.
• L’informazione che vince diviene percezione cosciente.
• Questo fenomeno si dice rivalità binoculare.
• In realtà nessuna percezione vince la rivalità binoculare definitivamente
Visione stereoscopica:
//rivalità binoculare
Visione stereoscopica:
//rivalità binoculare
Visione stereoscopica:
//rivalità binoculare
Visione stereoscopica:
//rivalità binoculare
• La rivalità binoculare è un fenomeno comune
• sono molti gli stimoli che generano questo fenomeno.
• Tutto ciò che è fuori dall’area di fusione di Panum è soggetto a diplopia.
• In linea di massima, un oggetto fuori dall’area di Panum viene visto doppio e il
sistema visivo ne “sopprime” una copia.
Visione stereoscopica:
//il livello neurofisiologico
• Le info provenienti dai due occhi devono convergere nelle stesse cellule
• Molti neuroni binoculari rispondono in maniera ottimale quando le immagini
retiniche si trovano su punti corrispondenti delle due retine: Questa è la base
fisiologica dell’ horopter
• Molti altri neuroni binoculari rispondono in maniera ottimale quando la stessa
immagine occupa due punti leggeremente distinti sulle retine dei due occhi
(sono cioè regolati su una determinata disparità binoculare)
Visione stereoscopica:
//il livello neurofisiologico: area V1
• Singoli neuroni nella corteccia visiva
primaria (V1) e delle aree successive
a questa hanno campi recettivi che
coprono una regione di spazio
TRIDIMENSIONALE non solo
bidimensionale.
• alcuni neuroni rispondono ad una
ampia gamma di profondità ( per
esempio agli stimoli che stanno oltre
il punto di fissazione)
• altri molto più selettivi, rispondono a
stimoli ad un determinata profondità
ma non ad altre.
David Hubel and Torsten Wiesel
Visione stereoscopica:
//la corteccia striata: selezione informazione
Via magnocellulare:
localizzazione e
movimento
(dove)
Vie parvicellulare- blob:
percezione dei colori
e parvicellulare-interblob:
analisi delle forme
(cosa)
Vie binoculari
tridimensionalità
dell’oggetto
Visione stereoscopica:
//corteccia striata: neuroni insensibili alla disparità
Visione stereoscopica:
//la corteccia striata: neuroni sensibili alla disparità
Visione stereoscopica:
//la corteccia striata: neuroni sensibili alla disparità
neurone sensibile a disparità 0
Visione stereoscopica:
//la corteccia striata: neuroni sensibili alla disparità
neurone sensibile a disparità non crociata (far cell)
Visione stereoscopica:
//modelli computazionali
Ipotesi:
1.due camere con i loro assi
ottici paralleli e separati da una
distanza d detta baseline B
3.i fuochi alla stessa altezza
5.l'asse x del nostro sistema di
riferimento parallelo alla baseline
un qualsiasi punto nell'immagine
sinistra, questo avrà la stessa
ordinata nella corrispondente
immagine destra
Visione stereoscopica:
//modelli computazionali
il triangolo POF1 e' simile a F1O1P1
il triangolo POF2 e' simile a F2O2P
PO / F1O1 =
F1 F2 / (P1 O1+ O2 P2)
un qualsiasi punto nell'immagine
sinistra, questo avrà la stessa
ordinata nella corrispondente
immagine destra
Visione stereoscopica:
//modelli computazionali
PO / F1O1 =
F1 F2 / (P1 O1+ O2 P2)
distanza del punto dall'immagine / distanza focale =
Baseline / somma delle basi
H/f=
B / delta
Pixel!!!!!!!!!!!!!!!!!!!!!!! : 0,008333 mm
H = f * B / delta
nota
6 mm
nota corrispondenza?
12,8 mm
Pixel: 0,008333 mm
Visione stereoscopica:
//modelli: ricerca di punti significativi
Visione stereoscopica:
//modelli: ricerca delle corrispondenze
Visione stereoscopica:
//modelli: mappa di profondità
Visione stereoscopica:
//modelli: mappa di disparità
• In generale si cerca di risolvere le corrispondenze inferendo una mappa di
disparità D, osservando le immagini sinistra (left) e destra (right)
D
I= {IL, IR}
Visione stereoscopica:
//modelli: mappa di disparità
• Modello generativo probabilistico
D
D
P(D, I) = P(I | D) P(D)
= P(IL, IR | D) P(D)
I
I= {IL, IR}
Visione stereoscopica:
//modelli: mappa di disparità
• Inferenza con la regola di Bayes
P(D | I) =
P(IL, IR | D) P(D)
P(IL, IR )
D
max P(D | I) = max P(IL, IR | D) P(D)
• se P(D) = costante (e.g., uniforme)
max P(D | I) = max P(I | D)
= max !s e-F(s, d(s), I)
max log P(I | D)
min !s F(s, d(s), I)
I= {IL, IR}
Visione stereoscopica:
//modelli: mappa di disparità
• Minimizzazione di una funzione di costo
min !s F(s, d(s), I)
• Un esempio semplice:
• Per ogni punto dell’immagine di riferimento
• si confronta la finestra centrata sul punto corrente con tutte le finestre corrispondenti
nell’altra immagine che rientrano all’interno del range di disparità specifico per la
coppia stereo.
• il confronto si effettua usando come misura di matching la funzione SAD (Sum of
Absolute Differences) su pixel in scala di grigio.
• la finestra corrispondente al minimo della SAD determina la disparità per il punto
Visione stereoscopica:
//modelli: mappa di disparità
• Minimizzazione di una funzione di costo
min !s F(s, d(s), I)
dispMap=zeros(nrLeft, ncLeft); %mappa di disparità
win=(windowSize-1)/2;
%ciclo su tutti i pixel delle immagini IL IR
for(i=1+win:1:nrLeft-win)
for(j=1+win+dispMax:1:ncLeft-win)
prevSAD = 65532;
temp=0.0;
bestMatchSoFar = dispMin;
win
%per tutte le disparità ammissibili
for(dispRange=-dispMin:-1:-dispMax)
%CALCOLA LA DISPARITA A MINIMA SAD
sad=0.0;
for(a=-win:1:win)
leftImage
for(b=-win:1:win)
if (j-win+dispRange > 0)
temp=abs(leftImage(i+a,j+b)-rightImage(i+a,j+b+dispRange));
sad=sad+temp;
end
end
end
if (prevSAD > sad)
prevSAD = sad;
bestMatchSoFar = dispRange;
end
end
dispMap(i,j) = -bestMatchSoFar;
end
end
rightImage
Visione stereoscopica:
//modelli: mappa di disparità
mappa ideale
(ground truth)
mappa inferita
D
I= {IL, IR}
I= {IL, IR}
Percezione dello spazio
//conclusione: integrazione
Percezione dello spazio
Percezione dello spazio
//integrazione neurofisiologica
Percezione dello spazio
//integrazione: accoppiamento euristico
Percezione dello spazio
//integrazione: accoppiamento debole
Percezione dello spazio
//integrazione: accoppiamento debole/forte
Percezione dello spazio
//integrazione: accoppiamento forte