confronto di algoritmi sfm in archeologia - il caso delle

CONFRONTO DI ALGORITMI
SFM IN ARCHEOLOGIA - IL
CASO DELLE TERME DI
TRAIANO IN ROMA
Simone Gianolio (Univ. “La Sapienza”)
[email protected]
LOW-COST 3D: Sensori, algoritmi e applicazioni
8-9 marzo Trento 2012
Algoritmi SfM in archeologia


Il progredire delle tecniche e delle tecnologie rendono
sempre più evidente l’assenza di un solido background
informatico nelle discipline umanistiche, in particolare quella
archeologica che massimo giovamento trarrebbe
dall’utilizzo del 3D per la registrazione di dati ad elevata
complessità interpretativa. Questo si scontra con il
progressivo regredire dei finanziamenti a disposizione per
la ricerca archeologica, senza chiudere gli occhi di fronte
alla loro mala amministrazione.
Negli ultimi anni pertanto è cresciuto l’utilizzo di algoritmi di
Structure from Motion come soluzioni dall’impatto economico
nullo e dal risultato garantito in termini temporali più che
accettabili, cosa che può consentire la registrazione
tridimensionale di un gran numero di informazioni.
Algoritmi SfM in archeologia


Tuttavia come risaputo gli algoritmi di SfM sono ben
lungi dal restituire quella precisione e quella
accuratezza propri di sistemi di rilevamento strumentale
indiretto (fotogrammetria, laser scanner, stazione totale,
etc.) o manuale diretto.
Viene così chiaramente a scontrarsi l’esigenza da parte
dell’archeologo di lavorare sempre su dati dalla
massima precisione possibile con l’inevitabile
approssimazione di soluzioni computer vision, per
quanto in grado di offrire una sempre più veloce analisi
del dato sottomesso con lo sviluppo di soluzioni “cloud”
o “gpu-computing” in caso di assenza di rete.
Algoritmi SfM e documentazione
archeologica
Gli algoritmi SfM rischiano
pertanto di essere visti come
soluzioni push-button in grado
di restituire a costi irrisori e
senza la necessità di un
corretto background
scientifico il rilievo
tridimensionale di un
manufatto. Questo può
essere vero nell’occasionalità,
nei progetti che non
richiedono affidabilità del
dato, ma non può essere vero
nell’ambito della
documentazione archeologica
intesa come processo
scientifico di acquisizione di
dati grezzi da elaborare per
giungere ad una ricostruzione
verosimile della storia antica.
Ancora oggi siamo insomma
fermi a quello slogan ideato
da George Eastman per
lanciare la prima fotocamera
Kodak nel novembre del
1889 “You press the button, - - - we do the rest.”
Le Terme di Traiano in Roma



Il principale ambito di analisi di questa comparativa sono state le
Terme di Traiano in Roma, edificio costruito dall’omonimo imperatore
ispanico su progetto di Apollodoro di Damasco occludendo la Domus
Aurea tra il 104 ed il 109 d.C.
L’area, per oltre 1500 anni destinata prevalentemente ad orti,
boschetti e casalini di nobili e confraternite romane, è stata nel
1935/1936 sistemata a parco pubblico su progetto di A. Muñoz,
con la creazione di un giardino, di un viale panoramico e
procedendo alla rimozione di alcune strutture che insistevano
sull’area.
I resti delle Terme di Traiano, già menomati nella loro omogeneità
dal progetto del parco, si trovano inglobati all’interno di cancellate,
circondate ed in alcuni casi sovrastate dalla vegetazione; alcuni
punti di vista sono attualmente chiusi per le ben note vicende
relative alla Domus Aurea.
Le Terme di Traiano in Roma
I resti oggetto
del test
costituiscono un
corpo di grosse
dimensioni
disposto su una
vasta area
nell’angolo nordoccidentale del
complesso che,
oltre alle
strutture visibili
nella foto
accanto,
comprendono la
c.d. “Aula
biabsidata” ed
una grossa
esedra
riconosciuta come
ninfeo.
Struttura di Test 01


Nessun algoritmo è riuscito a mettere insieme
l’intero set di fotografie, a causa della presenza di
impedimenti naturali e dell’impossibilità di costruire
una adeguata rete di punti comuni nel passaggio
sotto l’arco.
La dimensione delle strutture e lo spazio presente
tra le stesse e la rete protettiva sono risultate
sufficienti a consentire un match completo del set
riguardante il lato meridionale dell’intero corpo
architettonico.
Le Terme di Traiano in Roma
La c.d. “Esedra L”
è uno dei corpi
meglio conservati
delle Terme:
come in
precedenza, una
cancellata a
maglie strette
ostruisce la
ripresa
fotografica,
possibile soltanto
attraverso delle
aperture nella
rete che tuttavia
rendono molto
difficile includere
l’intero corpo
anche all’interno
della focale da
17mm utilizzata.
Struttura di Test 02


Sebbene l’angolatura di presa non sia stata
completa a causa della chiusura di un settore del
parco, tutti gli algoritmi hanno restituito una buona
elaborazione del set di fotografie.
I risultati finali sono stati comunque altalenanti, nella
generazione della texture e nella definizione del
modello, in particolare nella parte inferiore del
terreno dove sono conservate anche dei resti di
volta crollati di potenziale interesse.
L’Arco di Costantino in Roma
L’Arco di
Costantino è
risultato un
caso di grande
interesse per
via
dell’elevato
dettaglio (in
bassorilievo o
a tutto tondo)
presente sul
monumento, a
cui si aggiunge
una cancellata
che penalizza
fortemente le
riprese
fotografiche
per gli SfM.
L’Arco di Costantino in Roma


L’Arco di Costantino, dedicato all’imperatore dal
Senato, è il frutto di una serie di riutilizzi di
elementi provenienti da altri monumenti:
bassorilievi, statue a tutto tondo, colonne, particolari
decorativi architettonici molto fini.
La vicinanza delle strutture metalliche ha reso
impossibile completare l’intera struttura: pur
utilizzando un 17mm solo VisualSfM è riuscito a
computare i match creando modelli differenti, ma
non 1 unico modello.
Criteri di analisi

L’operazione svolta sugli algoritmi SfM presi in esame è
volta alla creazione di una tabella di usabilità che tenga
conto delle seguenti caratteristiche, partendo dal
background tecnologico a disposizione di un archeologo:






Interfaccia user-friendly dell’applicazione e semplicità
d’installazione-configurazione
Licenza d’uso del software/servizio web
Tipologia di output del rilievo (mesh, point cloud, formato del file
generato)
Capacità di risoluzione dei dataset a disposizione
Qualità del risultato finale generato
Coerenza della geometria generata con i resti in situ
Point cloud & mesh

Dal punto di vista della documentazione
archeologica, prescindendo dall’aspetto di
scientificità che con algoritmi SfM non può essere
ancora ottenuto, è comunque necessario rispondere
a determinati parametri che qualificano
positivamente o negativamente un progetto:
 Open
data, open format dei dati grezzi
 Documenti disponibili in multipiattaforma
 Corrispondenza con il dato archeologico
I software analizzati

Sono stati presi in esame una serie di software che
fanno riferimento a tecnologie di SfM differenti:
Autodesk 123DCatch beta (già Project Photofly)
 Microsoft Photosynth
 Hypr3D
 Arc3D
 Visual Structure from Motion 0.5.13
 Structure from Motion Toolkit
 V3D Structure from Motion
 Bundler SfM 0.4
 OSM Bundler
 Etc.

Piattaforma di test






Windows 7 SP1 64bit
Intel i7 920 @ 3,4Ghz + nVidia Quadro 2000 +
12GB di RAM + 1GB GDDR5
Canon 5D Mark II (sensore FF 21MP) + Canon EF 1740mm f/4L + Canon EF 24-70mm f/2.8L: scatto in
RAW e sviluppo con Digital Photo Professional
Samsung Galaxy W i8150 (sensore 5MP):
elaborazione immagini con Adobe Photoshop
Autodesk 3DS Max; Meshlab
Immagini totali prese: >500 in 3 distinti dataset
Caratteristiche software
Software
Piattaforma
Licenza
Interfaccia
Facilità
d’uso
Feature
aggiuntive
123DCatch
Web-based: client
for Windows
Autodesk has a
perpetual royaltyfree license on
model if you use a
web-service
User-friendly
5
Strumenti della
famiglia 123D
per modellazione libera e
prototipazione
Photosynth
Web-based: client
for Windows
Free use, share &
embed; CC, public
domain, © for photo
up to 20GB
Simple & minimal
5
Microsoft Image
Composite
Editor
Hypr3D
Web-based
Free use, share &
embed up 1GB.
Hypr3D has a
perpetual royaltyfree license on
model
Simple & Minimal
5
Mesh from
video file
Caratteristiche software
Software
Piattaforma
Licenza
Interfaccia
Facilità Feature
d’uso
aggiuntive
VisualSfM
Windows-MacLinux
Personal, non-profit
or research use with
references
User-friendly GUI but
advanced
4
Arc3D
Web-based:
client for
Windows-MacLinux & others
Non-commercial
only; public use with
references
Simple & minimal
5
GPU-computing
for matching;
dense reconstruction;
automatching
point clouds
Formati di esportazione
123DCatch
Hypr3D
VisualSfM
PhotoSynth*
Arc3D
DWG
DAE+jpg
PLY
PLY
V3D
FBX
PLY
sparse+dense
OBJ
OBJ
RZI
STL
VRML
OBJ
HiRe+LowRe
X3D
IPM
LAS
Low+Mid+HiRe
*= via SynthExport 1.1.0
ST1: 123DCatch vs Hypr3D



Per il corpo del settore nord-orientale delle terme, delle dimensioni di
ca. 40x15 metri, sono stati effettuati diversi momenti di presa per un
totale superiore alle 200 immagini. Quelle realmente utilizzate
ammontano a ca. 80 per la presenza di impedimenti naturali che hanno
ostacolato il match dell’intero set.
Il comportamento generale dei due algoritmi può definirsi
soddisfacente: i punti deboli rilevati sono stati il ponteggio di sostegno
alla volta non riconosciuto da 123DCatch al contrario di Hypr3D, il
quale ha però mostrato un comportamento non idoneo nel trattamento
del terreno erboso risultato troppo frastagliato.
In termini di definizione, Hypr3D  80.000 vertici maggiormente
concentrali sulla geometria architettonica, 123DCatch  113.000
vertici maggiormente concentrali sulla geometria “accessoria”.
ST1: 123DCatch vs Hypr3D
Il diverso
comportamento
nella definizione
del terreno ha
portato i due
algoritmi ad una
diversa
definizione
dell’area
occidentale del
modello 3D:
risulta in ogni
caso da
preferirsi
l’approssimazione
operata da
123DCatch
rispetto a quella
di Hypr3D.
ST1: PhotoSynth vs ARC3D
Microsoft
PhotoSynth ha
costruito una
nuvola di punti
troppo sparsa
per essere
utilizzata ai fini
della definizione
di una mesh
coerente con le
strutture rilevate.
ARC3D ha
gentilmente
restituito un
messaggio di
errore nel quale
segnalava
l’impossibilità di
processare il set
di immagini.
ST1: VisualSfM
VSfM ha
restituito una
buona nuvola
di punti, ben
processando il
ponteggio di
sostegno della
volta, meno
altri particolari
pure ben
visibili nelle
foto ed
andando in
crisi con i punti
più scuri
dell’immagine
come la
vernice nera
del portoncino.
ST2: 123DCatch vs Hypr3D



Nel caso dell’esedra L il comportamento dei 2 software può definirsi sovrapponibile
al 95% ca.: Hypr3D ha generato un modello ad alto dettaglio di oltre 100.000
vertici dai quali sono state ricavate ca. 200.000 facce, al contrario Autodesk si è
limitato a computare poco più di 33.000 vertici per un totale di 66.000 facce ca.
La più alta risoluzione ha consentito al primo di definire meglio i particolari posti
nella parte inferiore del modello, come frammenti di volta crollati e aperture dei
praefurnia.
Il trattamento cromatico della texture è risultato più fedele nel software Autodesk
piuttosto che nell’algoritmo di Viztu che ha introdotto una eccessiva dominante blu
nell’immagine.
Nella creazione del file .jpg Autodesk rispetta maggiormente gli standard della
mappatura UVW costruendo un file compatibile con il modificatore Unwrap UVW
di 3DS Max che lo riconosce, apre e gestisce correttamente; questo facilita
eventuali operazioni di postproduzione sulla texture che dovessero essere necessari.
Al contrario, Hypr3D tende a mosaicizzare in maniera eccessiva la texture che pur
essendo correttamente riconosciuta dall’Unwrap UVW di Max non è assolutamente
gestibile in fase di postproduzione, poiché i riquadri contenenti informazioni sul
colore delle facce ne assumono anche le dimensioni, risultando non più grandi di
poche decine di pixel.
ST2: 123DCatch vs Hypr3D
Hypr3D High Detail mesh
Sovrapposizione mesh
Autodesk mesh
ST2: 123DCatch vs Hypr3D
Hypr3D texture
Autodesk texture
ST2: PhotoSynth vs ARC3D
Sia l’algoritmo
di Microsoft
che quello di
ARC3D si sono
rivelati
insufficienti a
definire il
modello:
PhotoSynth a
causa di una
nuvola di punti
troppo sparsa,
il secondo per
manifesta
incapacità di
processare il
modello.
ST2: VisualSfM
AoC: 123DCatch vs Hypr3D
Il servizio della
Autodesk e quello
di Viztu forniscono
la mesh più
interessante del
dataset sottoposto:
la differenza può
arrivare al >30%
(dato non statistico)
di differenza sul
modello, che può
tuttavia definirsi
accettabile in
entrambi i casi.
Hypr3D restituisce
una elaborazione in
alta risoluzione che
conta tuttavia 2/3
in meno dei
poligoni rispetto al
modello Autodesk.
AoC: 123DCatch vs Hypr3D
Nel test dell’Arco
di Costantino la
palma della
migliore mesh va
al programma
Autodesk (viola),
più preciso nei
dettagli e nelle
sfumature. Solo il
programma
Autodesk è
riuscito per altro
ma in parte a
non “decapitare”
gli 8 guerrieri
Daci presenti
nella parte
superiore
dell’Arco.
AoC: VSfM vs 123DCatch
VisualSfM al
contrario degli
altri algoritmi è
in grado di
generare una
dense point cloud
attraverso l’uso
di CMVS/PMVS,
possibilità in
assoluto da
preferirsi per la
documentazione
archeologica.
Rispetto al
programma
Autodesk è stato
in grado di
computare fino a
>11 volte il
numero di vertici
utilizzati.
AoC: Photosynth vs Arc3D
Nella generazione di
modelli 3D nessuno dei
due servizi si è
dimostrato adeguato
alle esigenze
archeologiche. Arc3D
ha fallito nella
computazione del
match mentre
Photosynth si limita a
riconoscere una blanda
quantità di punti utile
soltanto a generare
ambienti 3D da prese
fotografiche; al fine di
ottenere risultati
soddisfacenti sotto il
piano visuale
l’algoritmo Microsoft
necessita di una
puntuale pianificazione
del programma di
prese fotografiche per
non spezzettare troppo
la navigazione
interattiva all’interno
dell’ambiente virtuale.
È disponibile la
funzione “panorama”
per utenti iOS 4.2 e ss.
Conclusioni

Dal punto di vista della formazione archeologica “standard” e dei risultati ottenibili
dall’utilizzo di algoritmi SfM per la registrazione tridimensionale veloce di
manufatti antichi, è possibile concludere che:





VisualSfM ed Autodesk 123DCatch sono attualmente i software migliori per generare
point cloud e mesh controllate; VSfM è tuttavia da preferirsi qualora si disponesse di
ottimali risorse hardware per il calcolo, poiché più completo
Microsoft Photosynth genera modelli con una risoluzione eccessivamente bassa nella nuvola
di punti, cosa che costringe l’elaboratore ad una approssimazione non controllata della
mesh risultante
Arc3D non è stato capace di processare i set inviati
Bundler, V3D, OSM non hanno chiuso la task segnalata, andando in crash; alcuni bugs sono
ampiamente segnalati agli sviluppatori ma non risolti; Bundler in particolare per essere
utilizzato in ambiente Win necessita la compilazione di CYGWin: sarebbe preferibile
quindi utilizzarlo in ambiente Linux, con il corollario di dover chiedere all’archeologo di
imparare un nuovo sistema operativo e/o la programmazione da shell. Inevitabile
scegliere dunque VSfM
Hypr3D è un algoritmo molto promettente, ma allo stato attuale i progetti possono soltanto
essere pubblici e questa non è una condizione idonea nella fase iniziale di un progetto di
studio archeologico. È comunque prevista una futura implementazione dell’opzione “make
private”. La possibilità inoltre di generare modelli da video costituisce un valore aggiunto
Algoritmi SfM per l’archeologia



VisualSfM per la sua capacità di generare point cloud dense (=dato grezzo) offline
e con risorse temporali e computazionali adeguate, unitamente ad una serie di
strumenti in grado di automatizzare realmente l’intero flusso di lavoro, risulta il
toolkit più efficace per la generazione di documentazione speditiva 3D. Riguardo
gli standard della documentazione archeologica, come detto inizialmente non è
possibile valutarne l’affidabilità, inoltre va in difficoltà quando deve analizzare
aree troppo scure o il terreno, nei set sempre non computato a differenza degli
altri algoritmi.
123DCatch ha dimostrato una perfetta integrazione con la suite di modellazione
sia gratuita (famiglia 123D) che commerciale (Entertainment Creation) di Autodesk,
divenendo un buon tool per la generazione di modelli 3D destinati alla creazione di
ambienti tridimensionali virtuali. Presenta 3 livelli di definizione della mesh,
sebbene l’appossimazione della risoluzione non andrebbe lasciata al software. Per
contro, non con tutti i set di test ha avuto un comportamento soddisfacente.
Hypr3D ha avuto un comportamento altalenante: non buona gestione della texture
ai fini di un modello importabile in ambienti virtuali, maggiore definizione della
mesh geometrica con qualche errore di troppo che nel caso della ST01 ha inficiato
gravemente la qualità finale a fini archeologici pur presentando una migliore
elaborazione generale del set fotografico.
Algoritmi SfM per l’archeologia



VisualSfM si è inoltre ben comportato nelle successive analisi di diverse
prese ottenute in tempi diversi di uno stesso set; al contrario, 123DCatch,
pur contemplando la possibilità di analisi successive dello stesso modello ed
un tool per la definizione manuale di punti comuni, ha mostrato una carenza
strutturale dovuta all’incapacità di mantenere inalterata la mesh già
computata, che veniva progressivamente deteriorata.
Gli algoritmi SfM danno in definitiva il meglio di sé in situazioni “ideali” su
dimensioni relativamente contenute del manufatto e con una decente
presenza di dettagli per l’individuazione di punti comuni. Hanno tutti invece
dimostrato una discreta indipendenza dal fattore hardware legato al
sensore fotografico che fa sentire il suo peso soltanto nella qualità delle
texture generate.
In definitiva, se ne consiglia l’utilizzo in archeologia sotto due precise
indicazioni: non trarre dai loro risultati elementi di documentazione
archeologica nel senso classico dell’espressione, limitarsi ad utilizzare per
un intero progetto lo stesso algoritmo, accettandone i limiti ma
minimizzando e per questo standardizzando l’errore su tutti i dati.
Thank you for your attention!
For further information:
[email protected]