Catalogazione e ricerca di oggetti tridimensionali R ICCARDO S CATENI U NIVERSITÀ DI C AGLIARI Sommario y y y y y y y y I NTRODUZIONE T ESTO I MMAGINI S UONI O GGETTI TRIDIMENSIONALI D ESCRITTORI DI FORMA A RCHIVIAZIONE E RICERCA C ONCLUSIONI Introduzione y Motivazione di base per avere strumenti di ricerca y y y y y automatici: dimensione dei dati Esempio: Google Nel 1998, 26 milioni di documenti Nel 2000, supera il miliardo Nel 2008, raggiunge il bilione (mille miliardi) Oggi? Difficile da dire Ricerca di testo y Il tipo di ricerca più comune y Semplice da descrivere dal punto di vista delle modalità y Confrontare il testo della chiave di ricerca con il testo contenuto nei documenti y Cosa rende semplice il procedimento? y L’ordine alfabetico! Web di immagini y Evoluzione del web: da solo testo a testo più y y y y immagini Flickr: nasce nel 2004, nel settembre 2010 supera i 5 miliardi di foto 5 milioni di foto al giorno aggiunte Molto? No, Facebook contiene decine di miliardi di foto e se ne aggiungono centinaia di milioni al giorno! Differiscono in qualità delle immagini Strumento facilitatore: macchina fotografica digitale Ricerca di immagini y Come posso impostare la ricerca di un’immagine? y Semplice, utilizzando lo stesso principio del testo y Scrivo cosa voglio cercare e spero che chi ha generato l’immagine l’abbia descritta nello stesso modo y È una vera ricerca sul contenuto dell’immagine? y No y Si basa sull’interpretazione semantica data da chi l’ha prodotta o archiviata (la sua descrizione testuale tramite tag o il contesto in cui si trova) Esempio Cosa ci piacerebbe? Sketch-based search! MindFinder (Microsoft Research) Perché è difficile? y Problema 1: è abbastanza complesso descrivere nello stesso modo lo sketch che l’utente può fare e le immagini y Sono due tipi di informazione diversa Grafica vettoriale: collezione di tratti Grafica raster: insieme di pixel colorati Perché è difficile? y Problema 2: come si costruisce un indice? y Non esiste il corrispondente dell’ordine alfabetico y y y y nei descrittori di immagini O perlomeno non è facile farlo esistere! Si risolve costruendo un qualche tipo di descrittore di immagine che possa essere organizzato Possibilmente ordinato! È un problema di ricerca ancora sostanzialmente aperto Ricerca di suoni y Sono molto diffuse delle applicazioni, soprattutto per y y y y smartphone, che consentono di identificare una canzone facendola ascoltare al telefono Problema più semplice della ricerca di immagini La traccia sonora è, come il testo, monodimensionale Si può effettuare la ricerca più o meno con gli stessi modelli del testo, solo cambiando l’alfabeto Piccoli spezzoni di suono anziché lettere Esempio: Shazam y Semplice app per Iphone che consente di: { { { { Ascoltare una canzone Utilizzare il sistema di registrazione del telefono Cercare la canzone sul database di iTunes (circa 13-14 milioni di canzoni) Eventualmente acquistare la canzone Oggetti tridimensionali digitali y Ad oggi, non sono ancora presenti, in rete, con y y y y diffusione generale, oggetti tridimensionali digitali Se ne trovano solo poche migliaia Ma nel futuro? Laser scanner 3D sono (quasi) alla portata di tutti Con poco più di 2000 euro si può comprare un oggetto che consente di creare una copia digitale di oggetti reali Lo scanner 3D y Lo scanner 3D può essere il facilitatore per la y y y y diffusione di modelli come lo è stato la digital camera per le immagini Però… È molto più difficile la costruzione del modello Non è sufficiente premere un tasto per ottenere il risultato finale Per arrivare ad una diffusione di massa sarà necessario rendere molto più semplice il procedimento Rappresentare gli oggetti digitali y Archiviare e ricercare oggetti tridimensionali passa attraverso la loro descrizione y La scelta più semplice è quella di utilizzare tag o contesto come per le immagini y Altrimenti si deve pensare quale possa essere una buona modalità automatica di rappresentazione per costruire indici y Questa rappresentazione deve occupare molto meno spazio rispetto al modello originale e contenere, in maniera compatta, più o meno le stesse informazioni dell’oggetto di partenza Descrittori di forme y Quali sono le caratteristiche di questo oggetto? y Cosa lo distingue in maniera peculiare? y Dovremmo cercare di catturare le informazioni essenziali e trasformale in un descrittore di forma y Questo, ovviamente, utilizzando la sua rappresentazione digitale e usando dei metodi automatici per calcolarli Descrittori di forme y Il descrittore più comunemente utilizzato, compatto e facile da estrarre in maniera automatica è il cosiddetto scheletro topologico y Ha tutte le informazioni minime che consentono di archiviare l’oggetto Come ordinare le informazioni y Anche nel caso dei descrittori di forma abbiamo lo y y y y y stesso problema visto per le immagini Possibilmente ancora più complesso Il testo e i suoni sono monodimensionali Le immagini sono bidimensionali I descrittori di oggetti digitali sono tridimensionali! Come trasformarli in un descrittore lineare è un problema totalmente aperto Lo scheletro topologico y Lo scheletro è importante anche per suddividere l’oggetto in porzioni semanticamente significative (segmenti) y Il processo di ricerca può basarsi sul trovare altri oggetti che sono composti dalle stesse porzioni collegate nel medesimo modo Ricerca e comparazione Oggetto con cui si effettua la ricerca Risultato della ricerca Come affinare il risultato y Per evitare di ottenere degli oggetti che sono distanti dall’oggetto utilizzato per la ricerca si devono utilizzare informazioni diverse y Si devono misurare le dimensioni effettive dell’oggetto y Si possono utilizzare le sfere massime centrate nei nodi dello scheletro Conclusioni y Gli oggetti tridimensionali digitali possono essere uno dei prossimi contenuti del web y La produzione degli oggetti può avvenire utilizzando strumenti di acquisizione o software di modellazione y L’archiviazione e la ricerca possono utilizzare strumenti simili a quelli utilizzati per le immagini y Le attività collegate alla rappresentazione compatta degli oggetti, alla loro interpretazione semantica, all’archiviazione ed alla ricerca automatica sono un campo di ricerca aperto