P. Minsenti, Primo come soluzione per la ricerca esplorativa e per

annuncio pubblicitario
Primo come soluzione per
la ricerca esplorativa e per
federare gli Atenei.
L’installazione consortile
di Primo a Venezia:
Ca’ Foscari e Iuav
Pierfranco Minsenti
Itale Primavera 2015
Seminario "Risorse bibliografiche al centro della rete e mediazione
bibliotecaria: le nuove sfide del servizio di reference"
14 maggio 2015
Università degli Studi di Torino, Aula Magna della Cavallerizza Reale
[email protected]
2
Installazione consortile di Venezia: 1 Primo site ma 2 Institutions
Installazione consortile
Primo site di Venezia
1 unico site ma 2 view autonome:
view di Primo Ca’ Foscari
view di Primo Iuav
http://uve-iua-primo.hosted.exlibrisgroup.com/
primo_library/libweb/action/search.do?
view=unive
http://primo.iuav.it/primo_library/libweb/action/
search.do?vid=iuav
Le due Istituzioni condividono l’installazione e le risorse bibliografiche, ma hanno
autonomia nelle scelte (per es. grafiche), nelle politiche sugli accessi, ecc.
3
Installazione consortile di Venezia: 1 Primo site ma 2 Institutions
Installazione consortile
Iuav
Condivisione delle risorse bibliografiche: lo scope di
default interroga simultaneamente Iuav e Ca’ Foscari
4
Installazione consortile
Installazione consortile di Venezia: 1 Primo site ma 2 Institutions
condivisione dei cataloghi Iuav e Ca’ Foscari
5
Primo Iuav
Iuav e Primo
Primo è stato adottato nel 2011 da Iuav (Istituto universitario di
architettura Venezia) come interfaccia della propria biblioteca digitale
per questi motivi:
1. per studio e ricerca gli architetti usano una varietà di materiali
tra cui materiali iconografici, letteratura primaria e secondaria,
materiali di interesse storico
2. da anni lo Iuav ha diversificato la catalogazione delle proprie
risorse documentarie adottando database distinti in base alla
tipologia del documento.
La configurazione è stata eseguita nel corso del 2012
6
La biblioteca digitale distribuita dello Iuav
Materiali speciali catalogati in 5 database distinti:
Primo Iuav
1. Tesi di laurea
2. Documenti d’archivio (Archivio progetti)
3. Cartografia
4. Spogli di periodici di architettura, urbanistica ecc.
5. Diateca
Ogni database adotta un formato di metadati specifico.
Ogni database ha numerosi records con associati oggetti
digitali ma non c’è un rapporto 1:1.
7
Perché usare diversi applicativi
Primo Iuav
1. materiali speciali richiedono l’uso di schemi di schemi di
metadati distinti e quindi di database diversi
2. una piattaforma software pensata specificamente per gli oggetti
digitali non è adatta a una situazione mista: cioè quando la
digitalizzazione è in corso e difficilmente potrà essere estesa
all’intero patrimonio (per es. per una questione di diritti). In
questo caso avremo database/cataloghi con record che
potranno avere associati oggetti digitali e record che ne saranno
privi.
☞ in questo caso avremo quindi bisogno di un sistema
esterno che consente di unificare la ricerca nelle
collezioni, digitali o no, in una interfaccia unica
8
Primo Iuav
La produzione di oggetti digitali presso Iuav (situazione al 2014)
Database
Tipologia
N° oggetti
digitali
Tesi
tesi di laurea digitalizzate
11.500
Archivio progetti
fotografie; disegni
20.000 ca.
N° records
Diritti di accesso
11.500
postazioni dedicate
72.500
libero per immagini
a bassa risoluzione
Cartografia
carte geografiche
36.000
30.000 ca.
libero per immagini
a bassa risoluzione
Spoglio periodici
fascicoli di: Urbanistica : bollettino della
sezione regionale piemontese dell'Istituto
nazionale di urbanistica (1949-1995)
270
119.000
solo utenti Iuav
Diateca
foto
15.000 ca.
88.000
solo utenti Iuav
Totale
82.770
9
Iuav e la scelta di Primo come interfaccia di Discovery e Delivery
☞ era necessario trovare una soluzione per unificare
Primo Iuav
la ricerca nei diversi cataloghi e archivi.
10
L’architettura di Primo di Iuav: i sistemi sorgenti locali e quelli esterni
Catalogo
Sebina
Primo Iuav
modulo OAI-PMH
Database
EasyCat:
- Tesi
- Cartografia
- Spogli di periodici
- Archivio progetti
modulo OAI-PMH
Diateca
(Codex)
interfaccia utente
knowledge
base locale di
SFX
e-journals
e-books
Vai
utente
Ricerca nativa
Metaricerca
Search engine
FTP
Metaricerca
Normalizzazione
metadati
Harvester di Primo
Indice
unico
dei sistemi
locali
Primo
Central:
JSTOR
DOAJ
...
Banche
dati
Ebsco
modulo OAI-PMH
Eprints
(d-Library)
modulo OAI-PMH
Link resolver
per accesso
ai full text
Editori
Harvester di Ex Libris
Banche
dati
ProQuest
11
Vantaggi di Primo come interfaccia per una biblioteca digitale distribuita
1. è un aggregatore di dati da diverse sistemi source grazie all’harvestizzazione
Primo Iuav
2. ha un formato di metadati descrittivi (PNX) flessibile che può essere
personalizzato
3. può essere multiformato: per normalizzare i metadati si possono usare pipes
distinte specifiche per ogni source. Ogni pipe può quindi associare a record da
un determinato sorgente un certo insieme di metadati specifico per quel tipo di
risorse
4. consente di presentare gli oggetti digitali tramite una anteprima (immagini
thumbnails) con misure che possono essere personalizzate e in grado di
accogliere sia il formato portrait che landscape (queste modifiche sono possibili
solo con Primo perché anche nella situazione hosting l’istituzione ha accesso al
CSS mentre nel caso degli altri discovery tools non viene dato accesso al CSS
per introdurre modifiche di stile).
5. consente di arricchire il record con links agli oggetti digitali e ai record
oringiali nei sistemi sorgente
6. consente raggruppamenti logici (scopes) e per affinità (faccette)
7. può gestire diritti di accesso diversificati
12
Fasi del lavoro
Primo Iuav
1. dotare i cataloghi/database di un’uscita OAI-PMH per consentire
l’harvestizzazione dei records da un sistema esterno (Primo)
2. definire lo schema di metadati (con codifica XML) da usare per
l’esposizione via OAI-PMH dei records di ogni specifico archivio
3. definire la personalizzazione del formato PNX di Primo per
adattarlo a ogni specifico tipo di materiale
4. definire le modalità per arricchire i records in Primo con immagini
thumbnails e links
5. definire scopes (raggruppamenti logici),faccette (raggruppamenti
per affinità) e filtri
13
Metadati e links
Per usare Primo come interfaccia unica per una biblioteca digitale
distribuita occorre lavorare su:
Primo Iuav
1. metadati
•
•
al livello dell’uscita OAI-PMH nel sistema sorgente
al livello di Primo
2. links agli oggetti digitali
3. definzione di scopes e faccette
4. l’interfaccia grafica di Primo
☞ il grosso del lavoro riguarda i metadati
14
Analisi dei metadati
Primo Iuav
L’implementazione di un Discovery tool richiede un’analisi preliminare dei
records soprattutto al livello della struttura dati:
1. devo analizzare la struttura dati (1) del formato
originale dei records
2. predisporre la struttura dati (2) dei records
trasferiti dal protocollo OAI-PMH
3. decidere le corrispondenze tra la struttura dati (2)
e la struttura dati usata dal Discovery tool (3)
15
Primo Iuav
Sfatare un equivoco sul protocollo OAI-PMH
☞ Bisogna sfatare un equivoco basato sulla presunta
equivalenza tra OAI-PMH e Dublin Core.
In realtà il protocollo OAI-PMH è multiformato = fatto
per esporre i records simultaneamente in una varietà di
formati (=di diverse strutture dati) tra cui almeno il Dublin
Core.
16
Primo Iuav
Sfatare un equivoco sulla “normalizzazione” eseguita da Primo
Conversione nel formato di Primo
= “normalizzazione” dei metadati
Si tratta di ridurre tutti i metadati harvestizzati a un
unico schema.
Vantaggi: dati espressi con codifiche diverse in
schemi diversi ma che condividono la stessa
semantica possono essere indicizzati in maniera
uniforme.
Ma: si possono anche adottare differenti
trattamenti per set di metadati diversi
17
Formato di metadati di Primo
Il PNX è una sorta di Dublin Core application profile che ha
questi vantaggi:
Primo Iuav
1. personalizzabile, estensibile
2. le etichette visualizzate all’utente possono
essere personalizzate
3. svolge funzioni diverse: non solo descrittive ma
anche di filtro (es.: faccette)
La scelta di un formato composto, basato sulla estensione del Dublin
Core semplice è diffusa tra i portali di aggregatori di biblioteche digitali
(es.: Cultura Italia; Europeana)
Scelte da fare sui metadati
Scelta tra 2 approcci opposti:
1. importazione “essenziale” = non tutti i metadati del sistema
sorgente
Primo Iuav
Esempio:
Brigham Young University (USA): http://lib.byu.edu/
2. importazione di tutti i metadati dei sistemi sorgente
Esempi:
Solo (Primo Oxford): http://solo.bodleian.ox.ac.uk/
Humboldt (Berlino): http://primus.ub.hu-berlin.de/
18
Scelte da fare: estendere il formato PNX
Primo Iuav
Estensione del formato di metadati di Pirmo (PNX)
per adeguarsi a tipiologie di materiali speciali in
Primo: per es. i materiali archivistici.
Esempio della British Library:
Search Archives: http://searcharchives.bl.uk
19
20
Il lavoro fatto in Iuav per i database dei materiali speciali
Primo Iuav
Per consentire l’harvestizzazione da parte di Primo, i record dei sistemi
sorgente vengono esposti tramite OAI-PMH e l’uso di un application
profile basato sul Dublin Core completo di 55 elementi: http://
dublincore.org/documents/dcmi-terms/
21
Il lavoro fatto in Iuav per i database dei materiali speciali
Primo Iuav
Ai 55 elementi del Dublin Core sono stati aggiunti 41 elementi creati
appositamente e che compongono il file .xsd dell’application profile:
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
abstract
accrualMethod
adminBioHistoryNote
alternative
archDescLevel
associatedCollection
classification
contributorCorporate
contributorPersonal
created
creatorCorporate
creatorPersonal
date_coded
dateSurveyed
degreeGrantor
degreeLevel
department
edition
fileIdentifier
genre
isPartOfDetails
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
isPartOfFonds
isPartOfSeries
isReferencedBy
itemMedium
itemTechnique
location
mapData
note
provenance
recordContentSource
recordIdentifier
relationContinuedBy
relationContinues
relationHasSupplement
relationIsSupplementOf
scale
serialsNumbering
spatial
statResponsibility
thesaurus
visualizzazione con foglio di stile di un record esposto via
OAI-PMH da un database Iuav
Primo Iuav
metadati specifici per
fondi archivistici
Primo Iuav
metadati specifici per
record cartografici
Primo Iuav e i links agli archivi esterni di oggetti digitali
Primo Iuav
4. Il lavoro per Primo Iuav
altri archivi di oggetti
digitali
Archivio di oggetti
digitali Codex (Cineca)
per visualizzare gli oggetti digitali Primo usa:
1. anteprime (immagini thumbnails)
2. links esterni (URL predefinite oppure “calcolate” in base a
un certo parametro)
Primo Iuav
oggetti digitali su Codex
(Cineca)
Primo Iuav
la cella delle immagini
thumbnails è stata
modificata per ospitare
tutti i tipi di formati senza
deformarli
lo scope di default (Tutti i cataloghi Iuav e Ca’ Foscari)
raggruppa tutti i materiali: in questo modo le diverse collezioni
acquistano maggiore visibilità perché l’utente avrà una visione
panoramica di tutte le collezioni
usando lo scope di default e una ricerca con la parola chiave: “ghetto”, la
schermata dei risultati è composta di diverse tipologie di materiali
usando lo scope di default e una ricerca con la parola chiave:
“rinascimento” la faccetta Tipo risorsa dà un’idea di tutte diverse tipologie
di materiali disponibili
usando lo scope di default e una ricerca con la parola chiave: “loos”,
l’utente scopre per caso che c’è anche un documento di archivio che
riguarda l’architetto viennese Adolf Loos.
usando lo scope di default e una ricerca con le parole chiave: “loos muller”,
l’utente scopre ci sono che ci sono anche tavole di progetto per la casa
Muller dell’architetto viennese Adolf Loos.
33
Criticità
Limiti di Primo:
Il formato di metadati PNX è stato concepito per descrivere:
Limiti di Primo
1. metadati descrittivi relativi a unità documentarie
semplici, non multiparte
2. solo records descrittivi e non records di autorità
Per poter ricostruire legami reticolari tra unità documentarie
multiparte in Primo si possono usare queste soluzioni:
•
fornire l’informazione all’interno del record (campo di testo, non
cliccabile. Es.: Fa parte di:)
•
aggiungere campi hyperlink al record per consentire la
navigazione del reticolo
34
Criticità
Mettere assieme metadati diversi in un unico indice:
1. fa emergere l’eterogeneità dei metadati provenienti dai
Criticità
sistemi sorgente, soprattutto per quanto riguarda i
records di autorità
2. questa eterogeneità rende l’uso delle faccette
meno efficace
☞ per poter risolvere questi problemi e sfruttare in maniera
efficace Primo è necessario lavorare nei sistemi sorgenti
facendo un lavoro di uniformazione dei metadati
soprattutto al livello dei records di autorità
Il catalogo “esplorativo”
Il catalogo
☞ «Il catalogo di biblioteca deve essere in
grado di dirti più cose di quelle che tu gli
hai chiesto».
(The catalogue has to tell you more than what you ask for).
Seymour Lubetzky, intervento tenuto nel 1977 alla conferenza di
Los Angeles “The Catalog in the Age of Technological Change”.
35
Primo come soluzione per la
ricerca esplorativa e per
federare gli Atenei.
L’installazione consortile
di Primo a Venezia:
Ca’ Foscari e Iuav
Domande?
Itale Primavera 2015
Seminario "Risorse bibliografiche al centro della rete e mediazione
bibliotecaria: le nuove sfide del servizio di reference"
14 maggio 2015
Università degli Studi di Torino, Aula Magna della Cavallerizza Reale
[email protected]
Scarica