TECNICA robotica Robot mobile per la fruizione e la ricostruzione 3D di una caverna paleolitica Tommaso Gramegna, Grazia Cicirelli, Massimo Ianigro, Gianni Attolico, Arcangelo Distante L’obiettivo di questo lavoro è quello di sviluppare un robot mobile autonomo per la fruizione remota di una grotta ricca di pitture e reperti preistorici. Il luogo esplorato è la “Grotta dei Cervi” sita a Porto Badisco in Puglia. Tale grotta conserva pitture murarie che risalgono all’era Neolitica. L’uso di un robot mobile è ideale per questo tipo di task poiché non necessita di grosse modifiche dell’ambiente né dell’installazione di nuove infrastrutture. Il sito archeologico, infatti, non deve né essere danneggiato né subire interventi invasivi. Il robot è in grado di esplorare l’ambiente, di costruire la mappa 2D della grotta, di posizionarsi rispetto alle pitture e di ricostruire un modello 3D delle aree di interesse a partire da un set di tre immagini acquisite da tre punti di vista differenti. Keyword Robot mobile, Navigazione Autonoma, Ricostruzione 3D, Fruizione di Beni Culturali. La terra conserva tesori artistici spesso inaccessibili al pubblico a causa delle difficili condizioni di accesso, delle caratteristiche strutturali ostili e della necessità di preservare tali tesori da deterioramento ed eventuali danni. Nel sud dell’Italia, lungo la costa Adriatica, una grotta custodisce uno dei tesori più sorprendenti e straordinari per la sua valenza artistica e culturale. Questa è la “Grotta dei Cervi” la quale ha conservato per secoli, sui suoi muri, una grossa quantità di pitture di scene di caccia, cervi, gruppi di uomini e piccoli animali. Tali pitture risalgono all’era Neolitica. I lunghi corridoi della grotta sono decorati con affascinanti pitture rosse e nere realizzate con ocra rossa e guano di pipistrello. Alcuni di questi disegni sono mostrati nella figura 1. La grotta è costituita da una serie di corridoi stretti e tortuosi, e il suo accesso è consentito solo ad un numero ristretto di persone autorizzate le quali, durante l’esplorazione della grotta, devono sia avere cura della propria incolumità, sia avere la massima cura nel preservare l’ambiente non danneggiandolo e non introducendo elementi che potrebbero inquinarlo. T. Gramegna, G. Cicirelli, M. Ianigro, G. Attolico, A. Distante Istituto di Studi sui Sistemi Intelligenti per l’Automazione CNR - ISSIA, Bari 90 - Automazione e Strumentazione - Luglio-Agosto 2006 Figura 1 - Alcune delle pitture preistoriche presenti sui muri del sito archeologico della “Grotta dei Cervi” La soluzione tecnologica presentata in questo lavoro, per la fruizione remota del sito, sembra essere la più adatta poiché da un lato soddisfa le condizioni di conservazione della grotta, con i suoi tesori artistici e storici, e dall’altro assicura la sicurezza degli utenti L’uso, infatti, di un robot mobile, propriamente equipaggiato, non necessita di grossi cambiamenti dell’ambiente riducendo così al minimo il rischio di danneggiare la grotta e, inoltre, navigando autonomamente, può gestire gli strumenti necessari per la visione, la misurazione e la caratterizzazione del sito. È stata eseguita una sessione sperimentale in uno dei corridoi all’interno della Grotta dei Cervi. Nella figura 2 viene presentata l’unica mappa disponibile della struttura della grotta, ricavata attraverso misurazioni manuali. Tale mappa dà un’i- TECNICA robotica dea della tortuosità e della lunghezza dei corridoi caratterizzanti la grotta. Sempre nella figura 2 viene evidenziata la zona che è stata ispezionata dal robot durante la sessione sperimentale. Il robot usato nella sessione sperimentale è costituito da una piattaforma robotica mobile equipaggiata con un sensore laser, sensori a ultrasuoni, inclinometri, una telecamera, un compasso ed un’antenna per la comunicazione wireless fra il robot ed un computer remoto. il veicolo di ruote cingolate, ma in questo modo si rischierebbe di danneggiare pesantemente il suolo preistorico. Utilizzando i diversi dispositivi sensoriali, di cui è dotato il robot, è stato possibile, durante l’ispezione della grotta, ottenere una ricostruzione planare della superficie ispezionata e una ricostruzione tridimensionale di alcune zone di particolare interesse. Figura 3 - Il robot mobile nella sua configurazione finale durante la navigazione nella “Grotta dei Cervi” Figura 2 - La mappa ricostruita manualmente della “Grotta dei Cervi”. La zona evidenziata è il corridoio ispezionato dal veicolo mobile I sistemi sensoriali elencati sono stati opportunamente assemblati perché il robot soddisfacesse i requisiti del particolare task da svolgere. Una immagine del robot assemblato è mostrata nella figura 3. La piattaforma robotica è costituita da quattro ruote da fuoristrada che possono affrontare pendenze del 45% e soglie di 9 cm. Ci sono, inoltre, sedici sensori sonar posizionati davanti e dietro il robot, capaci di individuare ostacoli fino a 7 m di distanza. La piattaforma robotica contiene quattro motori, un processore locale e le batterie. Sulla piattaforma è stato installato un sensore laser capace di individuare oggetti fino ad una distanza di 80 m con una risoluzione di mezzo grado. La piattaforma inoltre dispone di un compasso, di inclinometri e di odometri con correzione inerziale. Sulla piattaforma è stato posizionato un supporto di altezza appropriata per ospitare sulla sua sommità il sistema di illuminazione e la telecamera. Tale supporto è in alluminio e ha un’altezza di 1 m per poter acquisire le immagini delle pitture che, infatti, si trovano sui muri ad un’altezza compresa fra 1 e 2. A causa della completa oscurità della grotta è stato necessario fornire il robot di una lampada per poter illuminare le zone d’interesse e permetterne la fruizione. La lampada è stata posizionata opportunamente sul supporto in alluminio per poter ottenere il miglior risultato. Durante la sessione sperimentale sono emerse alcune limitazioni strutturali del veicolo. In particolare, esso ha difficoltà a superare grosse irregolarità del terreno come dossi ripidi e buche profonde. Una soluzione a questo problema potrebbe essere quella di dotare La planimetria del sito è stata ottenuta usando il sensore laser. Questa fornisce informazione nuova e utile, sebbene approssimata, sulla struttura della grotta. Tale informazione non era disponibile prima della ispezione con il nostro veicolo mobile. È importante notare che la struttura della grotta, fornita dalla mappa del sito, è di particolare interesse per la conoscenza e la fruizione del sito archeologico, poiché essa descrive la morfologia dell’ambiente. In questo modo ogni pittura può essere caratterizzata al meglio studiando così il loro ruolo e il loro significato a partire dal contesto e posizione in cui si trovano. Inoltre la planimetria del sito è importante per la navigazione del robot all’interno della grotta. Ricordiamo che uno dei problemi fondamentali della navigazione di un veicolo mobile è quello di determinare la sua posizione e orientazione nell’ambiente. Inoltre in questo particolare contesto il robot deve essere in grado di raggiungere autonomamente una posizione designata (target) partendo da una qualunque posizione dell’ambiente. Questo può essere fatto utilizzando l’informazione fornita dalla mappa costruita con il sensore laser. A causa, però, della instabilità del veicolo per le irregolarità del terreno, la posizione finale del robot nei pressi del target può essere imprecisa. Il robot deve, quindi, una volta raggiunto il target, raffinare la propria posizione e orientazione rispetto ad esso. Per la navigazione sono, inoltre, necessari elementi di riferimento per permettere al robot di referenziarsi durante la navigazione. Questi elementi possono essere artificiali, ossia oggetti esterni opportunamente inseriti nell’ambiente o naturali poiché sono elementi già presenti nell’ambiente senza alcun intervento esterno. Nel nostro contesto, a causa della impossibilità di modificare in alcun modo il sito, sono stati considerati punti di riferimento naturali, ossia le stesse pitture sono sia punti target per il veicolo sia punti di riferimento per la sua navigazione. Nella zona ispezionata quattro posi- Luglio-Agosto 2006 - Automazione e Strumentazione - 91 TECNICA robotica zioni target sono state definite per il robot, che corrispondono a quattro zone particolarmente interessanti per la ricca presenza di pitture preistoriche. Un’altra applicazione eseguita nel sito ispezionato è la ricostruzione del modello tridimensionale VRML del muro circostante le pitture, usando tre immagini della stessa scena acquisite da tre punti di vista differenti. Le immagini sono state acquisite dalla telecamera del robot con lunghezza focale fissa. La metodologia utilizzata usa come vincoli geometrici, le corrispondenze fra gli spigoli nelle differenti immagini. Di seguito sono descritti, nel prossimo paragrafo, la costruzione della mappa planare del sito e il metodo usato per la ricostruzione 3D di una zona della grotta. Infine sono presentate alcune conclusioni. Ispezione della grotta preistorica La soluzione tecnologica proposta in questo lavoro, per la fruizione di una grotta preistorica è caratterizzata dall’uso di un robot mobile che, navigando nel sito, acquisisce le immagini delle zone di particolare interesse per la presenza delle pitture murarie preistoriche, inviandole ad una stazione remota. Per quanto riguarda la navigazione del robot, uno dei problemi fondamentali è la determinazione della posizione del robot nell’ambiente. La mappa planare del sito, ricostruita usando il sensore laser, è utile per calcolare la posizione approssimativa del robot nell’ambiente e quindi per la navigazione da una posizione all’altra. Una volta che il veicolo raggiunge la posizione target, è necessario un posizionamento più preciso per poter acquisire le immagini delle pitture da un punto di vista ottimale. In questo contesto, il problema da risolvere è quello del posizionamento automatico della telecamera montata sul veicolo. Diversi metodi per la stima della posizione della telecamera possono essere trovati in letteratura [1, 2, 3]. Molti di questi usano modelli visivi o punti di riferimento che spesso sono rappresentati da oggetti tridimensionali che devono essere confrontati con le rispettive proiezioni bidimensionali sul piano immagine [4]. Spesso vengono utilizzati elementi di riferimento artificiali per poter semplificare il problema della loro rilevazione sul piano immagine [5], ma questo richiede di strutturare appositamente l’ambiente di navigazione. Tale soluzione non può essere presa in considerazione nel caso della grotta. Nel contesto del visual servoing i metodi di localizzazione sono classificati in base alla conoscenza o meno del modello del target (metodi model-based [7] e metodi model-free [8]) o alla conoscenza dei parametri della telecamera [6]. Il problema comune in questi metodi consiste nello stabilire la corrispondenza fra il modello del target e l’immagine corrente, nel caso dei metodi model-based; e fra l’immagine di riferimento e l’immagine corrente per i metodi model-free. Se la corrispondenza fra le caratteristiche del modello sono note a priori, in letteratura si possono trovare molti metodi modelbased per la stima della posizione [9]. Gli autori seguono questo approccio proponendo una versione nuova dell’algoritmo POSIT [10, 11]. Esso si basa su considerazioni geometriche che combinano la proiezione prospettica e 92 - Automazione e Strumentazione - Luglio-Agosto 2006 la proiezione ortografica scalata di punti caratteristici della scena. L’algoritmo POSIT calcola la posizione di un oggetto usando una approssimazione iniziale del modello prospettico della telecamera e raffinando la stima in un ciclo fino ad ottenere la posizione prospettica finale. Il principale vantaggio di questo metodo sta nel suo basso costo computazionale. Inoltre l’algoritmo POSIT calcola la posizione della telecamera utilizzando una singola immagine e considerando il modello 3D del target nel sistema di riferimento del target stesso. Le condizioni necessarie sono l’estrazione di almeno quattro punti non complanari del modello bidimensionale del target sul piano immagine e la giusta corrispondenza fra i punti caratteristici estratti con quelli del modello 3D. L’applicabilità di questo metodo in un ambiente complesso come una grotta è stata convalidata come descritto in [12]. Costruzione della mappa planare La mappa planare del sito costruita utilizzando il sensore laser del robot permette di determinare la posizione approssimata del robot nell’ambiente. Durante la navigazione del robot il sensore laser colleziona i dati relativi all’ambiente per la successiva costruzione della mappa. A causa delle irregolarità del terreno i dati laser vengono integrati con i dati forniti dagli inclinometri al fine di ottenere l’informazione tridimensionale dell’ambiente. Il sensore laser potrebbe essere utile anche per la ricostruzione della struttura del pavimento della grotta. Infatti, durante la navigazione, orientando il raggio laser verso il terreno si collezionerebbero dati relativi alla struttura dello stesso. Questo risulterebbe molto utile per la navigazione completamente autonoma del veicolo nella grotta. Partendo dalla conoscenza della mappa del sito, uno degli obiettivi è quello di realizzare un percorso permettendo la fruizione di quelle zone particolarmente ricche di pitture preistoriche. Elementi di riferimento artificiali, ma non invasivi, identificati dal sensore laser e distinguibili sulla mappa, sono utili per determinare le posizioni di tali zone. A tal fine, quattro bastoncini verticali sono stati posizionati nelle vicinanze delle zone d’interesse, così il robot può sia localizzarsi in queste zone sia permettere la fruizione visiva delle pitture. Nella figura 4 viene mostrata la mappa costruita usando il sensore laser durante la navigazione del robot nel corridoio ispezionato della Grotta dei Cervi. I quattro punti rossi indicano la posizione dei bastoncini localizzati nei pressi delle zone particolarmente ricche di disegni preistorici. Ricostruzione 3D delle pitture murarie La seconda applicazione testata durante la sessione sperimentale nel sito è stata la ricostruzione del modello VRML completo delle quattro zone d’interesse. La ricostruzione del modello 3D mediante tecniche di computer vision generalmente richiede l’estrazione, sull’immagine, di caratteristiche delle scene, come punti, linee, spigoli, angoli ecc. e di metterli in corrispondenza con quelli tridimensionali [13, 14, 15]. Inoltre è importante determinare la corrispondenza fra punti in immagini differenti poiché la precisione del modello risultante dipende fortemente dalla accuratezza di tali corrispondenze. TECNICA robotica angoli per ogni coppia di immagini, viene individuato l’insieme di angoli appartenenti a tutte e tre le immagini. Questi angoli sono detti inliers. Una volta note le corrispondenze, è possibile definire la Matrice Fondamentale della telecamera, ossia la matrice contenente informazioni sui parametri intrinseci della telecamera (calibrazione) [18]. A questo punto tutti i dati utili per la costruzione del modello 3D della scena sono a disposizione e tale modello è ricavato applicando la tecnica del reticolo poligonale. Il modello 3D è stato costruito utilizzando il linguaggio VRML: prima viene ricavato il reticolo triangolare della superficie 3D e poi la tessitura della scena, ottenuta dalle immagini, viene mappata su di esso. Qui presentiamo un esempio del metodo di ricostruzione 3D descritto, applicato a tre immagini della zona numero 4 indicata nella figura 4. Nella figura 5(a) sono mostrate le tre immagini della scena selezionata e nella figura 5(b) sono evidenziati gli inliers estratti durante la procedura di matching. La figura 6, infine, mostra il modello tridimensionale della stessa scena. Figura 4 - Mappa planare del corridoio ispezionato nella grotta. I punti in rosso individuano le zone particolarmente interessanti per la presenza delle pitture preistoriche Il metodo usato in questo lavoro usa come vincoli geometrici le corrispondenze degli angoli in immagini differenti. Una scena 3D complessa è ricostruita usando un insieme di tre immagini della stessa scena acquisite da tre punti di vista differenti. L’unico requisito è che siano acquisite dalla stessa telecamera con la stessa lunghezza focale. 1. L’applicazione richiede che vengano eseguiti i seguenti passi: acquisizione delle immagini; estrazione degli angoli; costruzione delle corrispondenze sparse; determinazione degli inliers; calibrazione della telecamera; ricostruzione 3D; visualizzazione del modello 3D. Una volta acquisite le tre immagini di una scena con la telecamera del robot, i punti, caratterizzati da un’alta curvatura che chiameremo angoli, vengono estratti da ogni immagine utilizzando l’algoritmo di Harris [16]. Un numero massimo prefissato di punti viene estratto da ogni immagine. Per ogni coppia di immagini i punti estratti sono messi in corrispondenza utilizzando una procedura di matching. Inizialmente viene applicata una tecnica di correlazione per stabilire i punti, tra due immagini, candidati ad essere in corrispondenza. Per ogni coppia di punti viene calcolata una probabilità di concordanza e, se questa probabilità supera una soglia prefissata, viene stabilito il match. Inoltre per eliminare ogni ambiguità tra le corrispondenze candidate viene calcolato il numero di corrispondenze candidate simili trovate in un intorno del match stabilito. La somma di questi valori per tutti i match candidati definisce una funzione energia. La minimizzazione di questa funzione energia attraverso una tecnica di rilassamento risolve il problema dell’ambiguità [17]. Una volta determinata la corrispondenza degli Figura 5 - (a) Tre immagini di una stessa zona acquisite da tre punti di vista diversi. (b) I punti bianchi indicano gli inliers estratti nella procedura di matching, durante la fase di ricostruzione tridimensionale della scena Conclusioni In questo lavoro è stata proposta una soluzione tecnologica per la fruizione di un sito archeologico non aperto al pubblico per la sua struttura molto complessa e potenzialmente pericolosa. La soluzione proposta non solo garantisce l’incolumità degli utenti, ma anche la sicurezza del sito dal rischio di danneggiamenti ed inquinamento. Figura 6 - Modello 3D della scena della figura 5 Luglio-Agosto 2006 - Automazione e Strumentazione - 93 TECNICA robotica L’utilizzo di un robot mobile, che naviga nella grotta acquisendo e inviando ad una stazione remota le immagini delle zone di interesse ricche di disegni preistorici, sembra una soluzione appropriata per la fruizione di tale sito archeologico nel rispetto dell’ambiente. La costruzione di un tale sistema richiede lo sviluppo di diversi moduli. Due di questi sono stati descritti in questo lavoro: il modulo per la costruzione di una mappa bidimensionale della grotta e il modulo per la ricostruzione del modello tridimensionale di zone particolarmente interessanti. Il primo costruisce la mappa utile per la navigazione del veicolo all’interno della grotta e per il suo posizionamento nei pressi delle zone di interesse. Inoltre fornisce la struttura bidimensionale dei corridoi e degli ambienti che compongono questo complesso sito. Il secondo modulo costruisce il modello tridimensionale delle zone dove sono presenti le pitture. Tali modelli VRML possono essere utilizzati off-line dagli utenti ed inoltre sono utili per lo studio dei disegni, da parte degli esperti, all’interno del loro contesto. Le potenzialità di tali moduli sono state provate durante una sessione sperimentale all’interno della “Grotta dei Cervi”. Un sommario della sessione sperimentale è disponibile su un video che mostra la costruzione della mappa planare attraverso l’uso del sensore laser, la locazione di alcune zone d’interesse ricche di pitture preistoriche e, infine, la ricostruzione tridimensionale di una di queste zone [19]. Sebbene ci siano ancora alcuni limiti strutturali da risolvere, la soluzione proposta sembra essere adatta all’obiettivo della fruizione di un sito archeologico senza alcun intervento invasivo sullo stesso. Essa permette di migliorare la conoscenza di questi siti collezionando grandi quantità di informazione prima non disponibili agli esperti, rispettando gli inestimabili tesori archeologici che questi siti conservano. Bibliografia [1] E. Malis, “Survey of vision-based robot control,” ENSIETA European Naval Ship Design Short Course, France 2002. [2] R. Talluri, J.K. Aggarwal, “Position Estimation Techniques for an Autonomous Mobile Robot - A Review,” The Handbook of Pattern Recognition and Computer Vision, World Scientific Publishing Co., pp. 769-801, Singapore 1993. [3] K. Sugihara, “Some location problems for robot navigation using a single camera,” Computer Vision Graphics and Image Processing, vol. 42, pp. 112-129, 1988. [4] M. Betken, L. Gurvits, “Mobile Robot Localization Using Landmarks,” IEEE Transactions On Robotics And Automation, vol. 13, no. 2, pp. 251-263, 1997. [5] T. D’Orazio, F.P. Lovergine, M. Ianigro, E. Stella, A. Distante, “Mobile Robot Position Determination Using Visual Landmarks.,” IEEE Transactions on Industrial Electronics, vol. 41, no 6, pp. 654-662, 1994. [6] K. Hashimoto, “Visual Servoing,” World Scientific, ISBN 981-02-1364-6, 1993. 94 - Automazione e Strumentazione - Luglio-Agosto 2006 [7] D.F. DeMenthon, L.S. Davis, “Model-based object pose in 25 lines of code,” International Journal of Computer Vision, vol. 15, n. 2, pp. 123-141, 1995. [8] R. Basri, E. Rivlin, I. Shimshoni, “Visual homing: surfing on the epipole,” International Journal of Computer Vision, vol. 33, n. 2, pp. 117-137, 1999. [9] I. Lopez, A. Frangi, B. van der Wijst, H. Broers, “Pose Estimation from 2D to 3D for Computer Vision in an Assembly Node,” Technical Report CTB500-02-0000, Philips CFT, Netherlands 2000. [10] T. Gramegna, L. Venturino, G. Cicirelli, G. Attolico, A. Distante, “Optimization of the Posit algorithm for indoor autonomous navigation,” Robotics and Autonomous Systems, vol. 48, n. 2-3, pp. 145-162, September 2004. [11] T. Gramegna, L. Venturino, G. Cicirelli, G. Attolico, A. Distante, “Autonomous robot navigation using uncalibrated images,” 8th Conference on Intelligent Autonomous Systems, pp. 881-888, Netherlands 2004. [12] L. Venturino, T. Gramegna, G. Cicirelli, G. Attolico, A. Distante “Self positioning to observe prehistoric paints in a cave,” Workshop Interazione e Comunicazione Visuale nei Beni Culturali, Italy 2004, in stampa. [13] J.K. Aggarwal, B.C. Vemuri, “3-D model construction from multiple views and intensity data,” IEEE Conf. Computer Vision and Pattern Recognition, pp. 435-437, Florida 1986. [14] V. Sequeira, K. Ng, E. Wolfart, J.G.M. Gonçalves, D.C. Hogg, “Automated Reconstruction of 3D Models from Real Environments,” ISPRS Journal of Photogrammetry and Remote Sensing, vol. 54, pp. 1-22, February 1999. [15] L. Venturino, T. Gramegna, G. Cicirelli, G. Attolico, A. Distante, “Improving 3D scene reconstruction through the application of geometric constraints”, 11th International Workshop on Systems, Signals and Image Processing, Poland 2004, in stampa. [16] C. Harris, M. Stephens, “A combined corner and edge detector,” 4th Alvey Conference, pp. 147-151, 1988. [17] Z. Zhang, R. Deriche, O. Faugeras, Q. Luong, “A robust technique for matching two uncalibrated images trough the recovery of the unknown epipolar geometry,” Technical report N° 2273, Institut national de recherche en informatique et en automatique, 1994. [18] R.I. Hartley, “Kruppa’s equations derived from the fundamental matrix,” IEEE Transactions on pattern analysis and machine intelligence, vol. 19, n. 2, pp. 133-135, February 1997. [19] T. Gramegna, L. Venturino, M. Ianigro, G. Attolico, A. Distante, “Archaeological cave fruition and 3D reconstruction using a mobile robot,” 2005 International Conference on ■ Robotics and Automation, Spain 2005. Ringraziamenti. Gli autori ringraziano Arturo Argentieri per il suo prezioso supporto tecnico. Un doveroso ringraziamento va anche all’Istituto Italiano di Speleologia nonché al suo presidente Ninì Ciccarese per il supporto fornito durante l’esplorazione della grotta. Infine gli autori ringraziano la D.ssa Maria Antonietta Gorgoglione della Sovrintendenza dei Beni Culturali.