Matematica della visione - Dipartimento di Matematica

Master in Matematica per le Applicazioni
Matematica della visione
Massimo Ferri
http://www.dm.unibo.it/~ferri
[email protected]
Testi ed altro
• E. Trucco, A. Verri, Introductory Techniques for 3-D Computer
Vision, Prentice Hall 1998.
• http://www.cs.berkeley.edu/~daf/bookpages/slides.html diapositive tratte
dal testo:
• D.A.Forsyth, J. Ponce, Computer Vision - A Modern Approach,
Prentice Hall 2003.
• V.S. Nalwa, A Guided Tour of Computer Vision, Addison-Wesley
1993.
• L. Di Stefano, dispense di un corso di Teoria e tecniche di
elaborazione dell'immagine (http://www.dm.unibo.it/~ferri/hm/ttei.zip).
Attenzione: 17 MB.
La visione artificiale
La visione artificiale consiste nelle tecniche
destinate a ricavare in modo automatico informazioni
su un ambiente tridimensionale (detto scena) a partire
da una o più immagini.
Applicazioni:
• Appl. Biomediche
– Diagnosi
– Ausilii per la chirurgia
– Ausilii per disabili
• Appl. Industriali
– Ispezione
– Manipolazione
•Riconoscimento di caratteri
•Telerilevamento
•Realtà aumentata
•Navigazione robotica
•…
I “livelli” della visione artificiale
• Basso livello
– Rilevamento di caratteristiche elementari
• Allineamenti
• Giunzioni
• …
– Segmentazione
• Contorni
• Regioni
– Tessiture
– …
I “livelli” della visione artificiale
• Medio livello
– Corrispondenze
• Stereovisione
• Moto
– Forma
• Rappresentazione
• Topologia
• Distanze
– Geometria
•
•
•
•
•
Convessità
Visibilità
Scomposizioni
Invarianti
Trasformate
– 3D
• Forma da
–
–
–
–
–
Ombreggiatura
Tessitura
Moto
Stereovisione
Sfocatura
• Visione attiva
– Interferometria
– Luce strutturata
I “livelli” della visione artificiale
• Alto livello
–
–
–
–
–
Riconoscimento
Stima della posa
Recupero in database
Descrizione
Interazione umano-macchina
Che cos’è un’immagine
• Modello continuo:
f: DR, D  Rn
x  D
0  f(x)  M
• Immagine digitale:
–
–
–
–
Campionamento (insieme finito di punti)
Quantizzazione (insieme finito di valori)
Tassellazione (ricoprimento: pixel)
Rappresentazione (in bit)
Che cos’è un’immagine
Top down
Organizzazione spontanea
Top down
Triangoli di Kanisza
Top down
Bottom up
Stereogramma a punti casuali di Julesz
Bottom up
Un algoritmo in grado di interpretare lo stereogramma
Convoluzione
Modello continuo:
La convoluzione della funzione f con il nucleo h è
definita come segue
Convoluzione
Modello discreto:
Le funzioni sono sostituite da matrici e gli integrali
da sommatorie
Convoluzione
Smoothing: spesso, per eliminare dettagli irrilevanti
o spurii (rumore) si effettua la convoluzione
dell’immagine con un nucleo gaussiano.
La discretizzazione si effettua riportando a 1 il
minimo valore all’interno della matrice (maschera),
esprimendo gli altri valori come interi, e dividendo
tutta la matrice per la somma dei suoi elementi.
Convoluzione
Regola empirica: la larghezza 2m+1 della maschera
deve essere circa uguale a 5.
Esempio con =3/5 di pixel:
Repeated Averaging: la convoluzione ripetuta n volte
con una maschera gaussiana 3x3 approssima
efficacemente una singola convoluzione con una
maschera di larghezza 2n+3, relativa a
Convoluzione
Rilevamento dei contorni (edge detection)
Rilevamento dei contorni (edge detection)
Una tecnica di edge detection: convoluzione con il laplaciano
di una gaussiana e rilevamento dell’attraversamento degli zeri.
Rilevamento dei contorni (edge detection)
Rilevamento dei contorni (edge detection)
Rilevamento dei contorni (edge detection)