La visione artificiale - Computer Vision and Multimedia Lab

La Visione Artificiale
La vis ione delle macchine
La vis ione umana
Acquis izione di immag ine
Copyright
•
Alcune slide sono tratte dal testo:
– Digital Image Processing
– Materiale didattico relativo si trova al sito
• www.imageprocessingbook.com
Visione Artificiale 11/12
La visione artificiale
2
Attività della Visione Artificiale
•
•
•
•
•
Visione Artificiale 11/12
Signal processing
Computer Graphic
Pattern Recognition
Computer Vision
Multimedia
‘50
‘60
‘70
‘80
‘90
La visione artificiale
3
Visione Artificiale
•
•
È l’insieme dei processi che mirano a costruire una
descrizione del mondo a partire da immagini
Ha lo scopo di emulare la visione umana attraverso:
– L’acquisizione
– L’eleborazione al calcolatore
– La comprensione delle immagini
Visione Artificiale 11/12
La visione artificiale
4
Visione Artificiale
•
Sono coinvolti molti aspetti, ma il più importante è la
Elaborazione delle Immagini
– Il settore dell’informatica che definisce tecniche ed algoritmi per
trattare immagini digitali
•
Obiettivi:
– Produrre sistemi artificiali (completamente automatici e basati
sul calcolatore) che manifestano un comportamento visivo con
prestazioni paragonabili a quelle di un sistema biologico
Visione Artificiale 11/12
La visione artificiale
5
Interdisciplinarità
•
La Visione Artificiale è un campo altamente multidisciplinare
che include competenze di
– Image processing
– Informatica
– Intelligenza artificiale
– Neurofisiologia
– Psicologia
– Fisica
– …
Visione Artificiale 11/12
La visione artificiale
6
La visione umana
Visione Artificiale 11/12
La visione artificiale
7
La visione umana
•
L’occhio umano è
paragonabile ad una
macchina fotografica in
cui:
– La cornea e il
cristallino
costituiscono
l’obiettivo
– L’iride e la pupilla
corrispondono al
diaframma
– La retina è l’elemento
sensibile
Visione Artificiale ༡༡/༡༢
La visione artificiale
༨
La visione umana
•
•
Sulla retina si forma l’immagine degli oggetti osservati
Esistono due tipi di recettori:
– Coni
– Bastoncelli
Visione Artificiale 11/12
La visione artificiale
9
La visione umana - Coni
•
•
•
•
•
•
Visione Artificiale 11/12
Circa 6 o 7 milioni per occhio
Siti nella parte centrale della retina, detta fovea
Altamente sensibili al colore e ad alti livelli di illuminazione
Forniscono anche piccoli dettagli
Responsabili della visione diurna
Connessione 1 a 1 con le terminazioni nervose
La visione artificiale
10
La visione umana - Bastoncelli
•
•
•
•
•
•
•
Visione Artificiale 11/12
Circa 100 milioni per occhio
Consentono una visione globale della scena
Distribuiti in modo più uniforme sull’intera superficie della
retina
Praticamente insensibili al colore
Sensibili a bassi livelli di illuminazione
Responsabili della visione notturna
Connessione n a 1 con le terminazioni nervose
La visione artificiale
11
Sensibilità di coni e bastoncelli
Visione Artificiale 11/12
La visione artificiale
12
Distribuzione di coni e bastoncelli
Visione Artificiale 11/12
La visione artificiale
13
Distribuzione di coni e bastoncelli
•
•
•
•
Visione Artificiale 11/12
Fino a 150000 coni per mm2
La tecnologia attuale del silicio è
in grado di ottenere una simile
densità di sensori
I problemi della visione artificiale
non sono quindi nei sensori, ma
nel processo di elaborazione
Occorre quindi integrare
l’intelligenza e l’esperienza
umana
La visione artificiale
14
La percezione umana
Visione Artificiale 11/12
La visione artificiale
15
La percezione umana
Visione Artificiale 11/12
La visione artificiale
16
Illusioni Ottiche
Visione Artificiale 11/12
La visione artificiale
17
Lo spettro elettromagnetico
Visione Artificiale 11/12
La visione artificiale
18
Raggi Gamma e X
Visione Artificiale 11/12
La visione artificiale
19
Ultravioletto
Visione Artificiale 11/12
La visione artificiale
20
Lo spettro visibile
Visione Artificiale 11/12
La visione artificiale
21
Radiazione infrarossa
Visione Artificiale 11/12
La visione artificiale
22
Lo spettro elettromagnetico
Visione Artificiale 11/12
La visione artificiale
23
Immagini a ultrasuoni
Visione Artificiale 11/12
La visione artificiale
24
L’Immagine
•
Una immagine è una rappresentazione spaziale
bidimensionale di un oggetto 2D o 3D o di una scena.
•
Nel campo dell’elaborazione di immagini per immagine si
intende generalmente la rappresentazione dopo il
processo di digitalizzazione.
•
Dal punto di vista del programmatore un’immagine è una
matrice bidimensionale di valori omogenei.
Visione Artificiale 11/12
La visione artificiale
25
Sistema di acquisizione
Componenti di un sistema di acquisizione
♦ La telecamera (in generale un sensore elettronico)
♦ Memoria immagine (frame grabber)
♦ Monitor
♦ Calcolatore
♦ Database
♦ Attuatore
Visione Artificiale 11/12
La visione artificiale
26
Sistema di acquisizione
Monitor
comandi di controllo
A/D
Memoria
D/A
Immagine
A/D: convertitore analogico/digitale
D/A: convertitore digitale/analogico
Database
Immagini
risultati numerici
comandi di controllo
Visione Artificiale 11/12
La visione artificiale
27
Sensore elettronico
Visione Artificiale 11/12
La visione artificiale
28
Esempi di sensori
Visione Artificiale 11/12
La visione artificiale
29
Esempi di sensori
Visione Artificiale 11/12
La visione artificiale
30
L’acquisizione
Visione Artificiale 11/12
La visione artificiale
31
L’acquisizione
Visione Artificiale 11/12
La visione artificiale
32
L’acquisizione
Visione Artificiale 11/12
La visione artificiale
33
Illuminazione
•
L’illuminazione non sempre è un parametro controllabile:
– In applicazioni indoor è in genere possibile realizzare un
impianto di illuminazione adatto al problema da risolvere
– In applicazioni outdoor normalmente l’illuminazione non è sotto
controllo
Visione Artificiale 11/12
La visione artificiale
34
Back lighting
Diffusore
Visione Artificiale 11/12
La visione artificiale
35
Luce strutturata
•
Visione Artificiale 11/12
Usata per l’acquisizione
e la ricostruzione 3D
La visione artificiale
36
Luce strutturata
Visione Artificiale 11/12
La visione artificiale
37
Luce strutturata
Visione Artificiale 11/12
La visione artificiale
38
Dal Segnale Analogico alla Matrice
Tensione
Trasduzione
nto
e
am
n
o
pi
m
Ca
Tempo
PIXEL
1 14 17 1
Quantizzazione
Tempo
Visione Artificiale 11/12
Immagine Digitale
La visione artificiale
39
Il processo di digitalizzazione
•
•
•
•
Visione Artificiale 11/12
Il segnale acquisito da una telecamera è tipicamente un
segnale continuo che descrive l’intensità del segnale
luminoso secondo una scansione per linee
La digitalizzazione trasforma un segnale continuo
discretizzandolo sia nella dimensione spaziale, che in quella
dei livelli di grigio (convertitore A/D analogico/digitale)
Il segnale convertito viene memorizzato in una memoria
immagine che funge da interfaccia tra l’elaboratore, il
monitor e l’elemento di acquisizione
Tra la memoria immagine ed il monitor vi è un convertitore
D/A (digitale/analogico)
La visione artificiale
40
Scansione Regolare
•
Visione Artificiale 11/12
Scansione semplice
Scansione interallacciata
La visione artificiale
41
Risoluzione spaziale
•
•
•
Visione Artificiale 11/12
La risoluzione spaziale è la più piccola dimensione
dell’oggetto osservato che può essere discriminata
La cella di risoluzione è la più piccola area elementare
associata ad un valore in una immagine digitale
Generalmente la cella elementare è un quadrato ma si
possono anche avere celle rettangolari o esagonali
La visione artificiale
42
Tassellazione quadrata
Pixel a distanza 1
Pixel a distanza 3
Pixel a distanza 2
Pixel a distanza 4
Visione Artificiale 11/12
La visione artificiale
43
Tassellazione esagonale
Visione Artificiale 11/12
La visione artificiale
44
Tassellazione triangolare
Visione Artificiale 11/12
La visione artificiale
45
Risoluzione spaziale
Visione Artificiale 11/12
La visione artificiale
46
Risoluzione spaziale
•
•
•
Pixel (contrazione di picture element) è descritto dalla
posizione spaziale di una cella elementare (riga, colonna) e
dal valore ad essa associato
Alcune dimensioni frequenti per immagini digitali sono
256x256, 512x512, 1024x1024
Risoluzioni dei monitor:
– 640x480, 1024x768 (4/3)
– 1280x1024 (5/4), 1280x800 (16/10)
– HDTV 1125 righe (16/9)
Visione Artificiale 11/12
La visione artificiale
47
Risoluzione nella scala di grigi
•
Una immagine binaria è una immagine in cui ogni pixel può
assumere solo due valori: (0,1), (vero, falso), (oggetto,
sfondo)
– una immagine binaria utilizza solo un bit per pixel
•
Una immagine a toni di grigio è una immagine in cui ogni
pixel assume valori in un intervallo più ampio
– valori tipici sono [0, 63], [0, 255], [0, 1023], rispettivamente 6, 8,
10 bit per pixel
•
Visione Artificiale 11/12
Un osservatore umano percepisce una scala continua di
grigi osservando immagini memorizzate con 8 bit
La visione artificiale
48
Risoluzione nella scala dei grigi
Visione Artificiale 11/12
La visione artificiale
49
Aliasing
Visione Artificiale 11/12
La visione artificiale
50
Aliasing
Visione Artificiale 11/12
La visione artificiale
51
Antialiasing
Visione Artificiale 11/12
La visione artificiale
52