Catalogazione e ricerca
di oggetti tridimensionali
R ICCARDO S CATENI
U NIVERSITÀ DI C AGLIARI
Sommario
y
y
y
y
y
y
y
y
I NTRODUZIONE
T ESTO
I MMAGINI
S UONI
O GGETTI TRIDIMENSIONALI
D ESCRITTORI DI FORMA
A RCHIVIAZIONE E RICERCA
C ONCLUSIONI
Introduzione
y Motivazione di base per avere strumenti di ricerca
y
y
y
y
y
automatici: dimensione dei dati
Esempio: Google
Nel 1998, 26 milioni di documenti
Nel 2000, supera il miliardo
Nel 2008, raggiunge il bilione (mille miliardi)
Oggi? Difficile da dire
Ricerca di testo
y Il tipo di ricerca più comune
y Semplice da descrivere dal punto di vista delle
modalità
y Confrontare il testo della chiave di ricerca con il testo
contenuto nei documenti
y Cosa rende semplice il procedimento?
y L’ordine alfabetico!
Web di immagini
y Evoluzione del web: da solo testo a testo più
y
y
y
y
immagini
Flickr: nasce nel 2004, nel settembre 2010 supera i 5
miliardi di foto
5 milioni di foto al giorno aggiunte
Molto? No, Facebook contiene decine di miliardi di
foto e se ne aggiungono centinaia di milioni al
giorno! Differiscono in qualità delle immagini
Strumento facilitatore: macchina fotografica digitale
Ricerca di immagini
y Come posso impostare la ricerca di un’immagine?
y Semplice, utilizzando lo stesso principio del testo
y Scrivo cosa voglio cercare e spero che chi ha
generato l’immagine l’abbia descritta nello stesso
modo
y È una vera ricerca sul contenuto dell’immagine?
y No
y Si basa sull’interpretazione semantica data da chi
l’ha prodotta o archiviata (la sua descrizione testuale
tramite tag o il contesto in cui si trova)
Esempio
Cosa ci piacerebbe? Sketch-based search!
MindFinder (Microsoft Research)
Perché è difficile?
y Problema 1: è abbastanza complesso descrivere
nello stesso modo lo sketch che l’utente può fare e le
immagini
y Sono due tipi di informazione diversa
Grafica vettoriale: collezione di tratti
Grafica raster: insieme di pixel colorati
Perché è difficile?
y Problema 2: come si costruisce un indice?
y Non esiste il corrispondente dell’ordine alfabetico
y
y
y
y
nei descrittori di immagini
O perlomeno non è facile farlo esistere!
Si risolve costruendo un qualche tipo di descrittore
di immagine che possa essere organizzato
Possibilmente ordinato!
È un problema di ricerca ancora sostanzialmente
aperto
Ricerca di suoni
y Sono molto diffuse delle applicazioni, soprattutto per
y
y
y
y
smartphone, che consentono di identificare una
canzone facendola ascoltare al telefono
Problema più semplice della ricerca di immagini
La traccia sonora è, come il testo, monodimensionale
Si può effettuare la ricerca più o meno con gli stessi
modelli del testo, solo cambiando l’alfabeto
Piccoli spezzoni di suono anziché lettere
Esempio: Shazam
y Semplice app per Iphone
che consente di:
{
{
{
{
Ascoltare una canzone
Utilizzare il sistema di
registrazione del telefono
Cercare la canzone sul
database di iTunes (circa
13-14 milioni di canzoni)
Eventualmente acquistare
la canzone
Oggetti tridimensionali digitali
y Ad oggi, non sono ancora presenti, in rete, con
y
y
y
y
diffusione generale, oggetti tridimensionali digitali
Se ne trovano solo poche migliaia
Ma nel futuro?
Laser scanner 3D sono (quasi) alla
portata di tutti
Con poco più di 2000 euro si può
comprare un oggetto che consente
di creare una copia digitale di
oggetti reali
Lo scanner 3D
y Lo scanner 3D può essere il facilitatore per la
y
y
y
y
diffusione di modelli come lo è stato la digital camera
per le immagini
Però…
È molto più difficile la costruzione del modello
Non è sufficiente premere un tasto per ottenere il
risultato finale
Per arrivare ad una diffusione di massa sarà
necessario rendere molto più semplice il
procedimento
Rappresentare gli oggetti digitali
y Archiviare e ricercare oggetti tridimensionali passa
attraverso la loro descrizione
y La scelta più semplice è quella di utilizzare tag o
contesto come per le immagini
y Altrimenti si deve pensare quale possa essere una
buona modalità automatica di rappresentazione per
costruire indici
y Questa rappresentazione deve occupare molto meno
spazio rispetto al modello originale e contenere, in
maniera compatta, più o meno le stesse informazioni
dell’oggetto di partenza
Descrittori di forme
y Quali sono le caratteristiche di questo
oggetto?
y Cosa lo distingue in maniera peculiare?
y Dovremmo cercare di catturare le informazioni
essenziali e trasformale in un descrittore di forma
y Questo, ovviamente, utilizzando la sua
rappresentazione digitale e usando
dei metodi automatici per calcolarli
Descrittori di forme
y Il descrittore più
comunemente utilizzato,
compatto e facile da
estrarre in maniera
automatica è il
cosiddetto scheletro
topologico
y Ha tutte le informazioni
minime che consentono
di archiviare l’oggetto
Come ordinare le informazioni
y Anche nel caso dei descrittori di forma abbiamo lo
y
y
y
y
y
stesso problema visto per le immagini
Possibilmente ancora più complesso
Il testo e i suoni sono monodimensionali
Le immagini sono bidimensionali
I descrittori di oggetti digitali sono
tridimensionali!
Come trasformarli in un descrittore lineare è un
problema totalmente aperto
Lo scheletro topologico
y Lo scheletro è
importante anche per
suddividere l’oggetto in
porzioni semanticamente
significative (segmenti)
y Il processo di ricerca può
basarsi sul trovare altri
oggetti che sono
composti dalle stesse
porzioni collegate nel
medesimo modo
Ricerca e comparazione
Oggetto con cui si effettua la ricerca
Risultato della ricerca
Come affinare il risultato
y Per evitare di ottenere
degli oggetti che sono
distanti dall’oggetto
utilizzato per la ricerca si
devono utilizzare
informazioni diverse
y Si devono misurare le
dimensioni effettive
dell’oggetto
y Si possono utilizzare le
sfere massime centrate
nei nodi dello scheletro
Conclusioni
y Gli oggetti tridimensionali digitali possono essere
uno dei prossimi contenuti del web
y La produzione degli oggetti può avvenire utilizzando
strumenti di acquisizione o software di modellazione
y L’archiviazione e la ricerca possono utilizzare
strumenti simili a quelli utilizzati per le immagini
y Le attività collegate alla rappresentazione compatta
degli oggetti, alla loro interpretazione semantica,
all’archiviazione ed alla ricerca automatica sono un
campo di ricerca aperto