La Visione Artificiale La vis ione delle macchine La vis ione umana Acquis izione di immag ine Copyright • Alcune slide sono tratte dal testo: – Digital Image Processing – Materiale didattico relativo si trova al sito • www.imageprocessingbook.com Visione Artificiale 11/12 La visione artificiale 2 Attività della Visione Artificiale • • • • • Visione Artificiale 11/12 Signal processing Computer Graphic Pattern Recognition Computer Vision Multimedia ‘50 ‘60 ‘70 ‘80 ‘90 La visione artificiale 3 Visione Artificiale • • È l’insieme dei processi che mirano a costruire una descrizione del mondo a partire da immagini Ha lo scopo di emulare la visione umana attraverso: – L’acquisizione – L’eleborazione al calcolatore – La comprensione delle immagini Visione Artificiale 11/12 La visione artificiale 4 Visione Artificiale • Sono coinvolti molti aspetti, ma il più importante è la Elaborazione delle Immagini – Il settore dell’informatica che definisce tecniche ed algoritmi per trattare immagini digitali • Obiettivi: – Produrre sistemi artificiali (completamente automatici e basati sul calcolatore) che manifestano un comportamento visivo con prestazioni paragonabili a quelle di un sistema biologico Visione Artificiale 11/12 La visione artificiale 5 Interdisciplinarità • La Visione Artificiale è un campo altamente multidisciplinare che include competenze di – Image processing – Informatica – Intelligenza artificiale – Neurofisiologia – Psicologia – Fisica – … Visione Artificiale 11/12 La visione artificiale 6 La visione umana Visione Artificiale 11/12 La visione artificiale 7 La visione umana • L’occhio umano è paragonabile ad una macchina fotografica in cui: – La cornea e il cristallino costituiscono l’obiettivo – L’iride e la pupilla corrispondono al diaframma – La retina è l’elemento sensibile Visione Artificiale ༡༡/༡༢ La visione artificiale ༨ La visione umana • • Sulla retina si forma l’immagine degli oggetti osservati Esistono due tipi di recettori: – Coni – Bastoncelli Visione Artificiale 11/12 La visione artificiale 9 La visione umana - Coni • • • • • • Visione Artificiale 11/12 Circa 6 o 7 milioni per occhio Siti nella parte centrale della retina, detta fovea Altamente sensibili al colore e ad alti livelli di illuminazione Forniscono anche piccoli dettagli Responsabili della visione diurna Connessione 1 a 1 con le terminazioni nervose La visione artificiale 10 La visione umana - Bastoncelli • • • • • • • Visione Artificiale 11/12 Circa 100 milioni per occhio Consentono una visione globale della scena Distribuiti in modo più uniforme sull’intera superficie della retina Praticamente insensibili al colore Sensibili a bassi livelli di illuminazione Responsabili della visione notturna Connessione n a 1 con le terminazioni nervose La visione artificiale 11 Sensibilità di coni e bastoncelli Visione Artificiale 11/12 La visione artificiale 12 Distribuzione di coni e bastoncelli Visione Artificiale 11/12 La visione artificiale 13 Distribuzione di coni e bastoncelli • • • • Visione Artificiale 11/12 Fino a 150000 coni per mm2 La tecnologia attuale del silicio è in grado di ottenere una simile densità di sensori I problemi della visione artificiale non sono quindi nei sensori, ma nel processo di elaborazione Occorre quindi integrare l’intelligenza e l’esperienza umana La visione artificiale 14 La percezione umana Visione Artificiale 11/12 La visione artificiale 15 La percezione umana Visione Artificiale 11/12 La visione artificiale 16 Illusioni Ottiche Visione Artificiale 11/12 La visione artificiale 17 Lo spettro elettromagnetico Visione Artificiale 11/12 La visione artificiale 18 Raggi Gamma e X Visione Artificiale 11/12 La visione artificiale 19 Ultravioletto Visione Artificiale 11/12 La visione artificiale 20 Lo spettro visibile Visione Artificiale 11/12 La visione artificiale 21 Radiazione infrarossa Visione Artificiale 11/12 La visione artificiale 22 Lo spettro elettromagnetico Visione Artificiale 11/12 La visione artificiale 23 Immagini a ultrasuoni Visione Artificiale 11/12 La visione artificiale 24 L’Immagine • Una immagine è una rappresentazione spaziale bidimensionale di un oggetto 2D o 3D o di una scena. • Nel campo dell’elaborazione di immagini per immagine si intende generalmente la rappresentazione dopo il processo di digitalizzazione. • Dal punto di vista del programmatore un’immagine è una matrice bidimensionale di valori omogenei. Visione Artificiale 11/12 La visione artificiale 25 Sistema di acquisizione Componenti di un sistema di acquisizione ♦ La telecamera (in generale un sensore elettronico) ♦ Memoria immagine (frame grabber) ♦ Monitor ♦ Calcolatore ♦ Database ♦ Attuatore Visione Artificiale 11/12 La visione artificiale 26 Sistema di acquisizione Monitor comandi di controllo A/D Memoria D/A Immagine A/D: convertitore analogico/digitale D/A: convertitore digitale/analogico Database Immagini risultati numerici comandi di controllo Visione Artificiale 11/12 La visione artificiale 27 Sensore elettronico Visione Artificiale 11/12 La visione artificiale 28 Esempi di sensori Visione Artificiale 11/12 La visione artificiale 29 Esempi di sensori Visione Artificiale 11/12 La visione artificiale 30 L’acquisizione Visione Artificiale 11/12 La visione artificiale 31 L’acquisizione Visione Artificiale 11/12 La visione artificiale 32 L’acquisizione Visione Artificiale 11/12 La visione artificiale 33 Illuminazione • L’illuminazione non sempre è un parametro controllabile: – In applicazioni indoor è in genere possibile realizzare un impianto di illuminazione adatto al problema da risolvere – In applicazioni outdoor normalmente l’illuminazione non è sotto controllo Visione Artificiale 11/12 La visione artificiale 34 Back lighting Diffusore Visione Artificiale 11/12 La visione artificiale 35 Luce strutturata • Visione Artificiale 11/12 Usata per l’acquisizione e la ricostruzione 3D La visione artificiale 36 Luce strutturata Visione Artificiale 11/12 La visione artificiale 37 Luce strutturata Visione Artificiale 11/12 La visione artificiale 38 Dal Segnale Analogico alla Matrice Tensione Trasduzione nto e am n o pi m Ca Tempo PIXEL 1 14 17 1 Quantizzazione Tempo Visione Artificiale 11/12 Immagine Digitale La visione artificiale 39 Il processo di digitalizzazione • • • • Visione Artificiale 11/12 Il segnale acquisito da una telecamera è tipicamente un segnale continuo che descrive l’intensità del segnale luminoso secondo una scansione per linee La digitalizzazione trasforma un segnale continuo discretizzandolo sia nella dimensione spaziale, che in quella dei livelli di grigio (convertitore A/D analogico/digitale) Il segnale convertito viene memorizzato in una memoria immagine che funge da interfaccia tra l’elaboratore, il monitor e l’elemento di acquisizione Tra la memoria immagine ed il monitor vi è un convertitore D/A (digitale/analogico) La visione artificiale 40 Scansione Regolare • Visione Artificiale 11/12 Scansione semplice Scansione interallacciata La visione artificiale 41 Risoluzione spaziale • • • Visione Artificiale 11/12 La risoluzione spaziale è la più piccola dimensione dell’oggetto osservato che può essere discriminata La cella di risoluzione è la più piccola area elementare associata ad un valore in una immagine digitale Generalmente la cella elementare è un quadrato ma si possono anche avere celle rettangolari o esagonali La visione artificiale 42 Tassellazione quadrata Pixel a distanza 1 Pixel a distanza 3 Pixel a distanza 2 Pixel a distanza 4 Visione Artificiale 11/12 La visione artificiale 43 Tassellazione esagonale Visione Artificiale 11/12 La visione artificiale 44 Tassellazione triangolare Visione Artificiale 11/12 La visione artificiale 45 Risoluzione spaziale Visione Artificiale 11/12 La visione artificiale 46 Risoluzione spaziale • • • Pixel (contrazione di picture element) è descritto dalla posizione spaziale di una cella elementare (riga, colonna) e dal valore ad essa associato Alcune dimensioni frequenti per immagini digitali sono 256x256, 512x512, 1024x1024 Risoluzioni dei monitor: – 640x480, 1024x768 (4/3) – 1280x1024 (5/4), 1280x800 (16/10) – HDTV 1125 righe (16/9) Visione Artificiale 11/12 La visione artificiale 47 Risoluzione nella scala di grigi • Una immagine binaria è una immagine in cui ogni pixel può assumere solo due valori: (0,1), (vero, falso), (oggetto, sfondo) – una immagine binaria utilizza solo un bit per pixel • Una immagine a toni di grigio è una immagine in cui ogni pixel assume valori in un intervallo più ampio – valori tipici sono [0, 63], [0, 255], [0, 1023], rispettivamente 6, 8, 10 bit per pixel • Visione Artificiale 11/12 Un osservatore umano percepisce una scala continua di grigi osservando immagini memorizzate con 8 bit La visione artificiale 48 Risoluzione nella scala dei grigi Visione Artificiale 11/12 La visione artificiale 49 Aliasing Visione Artificiale 11/12 La visione artificiale 50 Aliasing Visione Artificiale 11/12 La visione artificiale 51 Antialiasing Visione Artificiale 11/12 La visione artificiale 52