La digitalizzazione delle riviste in Europa

La digitalizzazione delle riviste in Europa
(bozza a cura di Stefan Cramme (DigiZeit) e Werner Schwartz (DIEPER), 20 giugno 2000
traduzione di Anna Mioni [email protected] )
Basandosi sulle “conclusioni e raccomandazioni” di Ann Matheson alla conferenza di Copenhagen
nel marzo 20001 e su altra documentazione diffusa in quell’occasione, questa breve relazione
intende riassumere i risultati della conferenza, gli sviluppi a partire da quella data e i punti nodali
principali per ulteriori cooperazioni nella digitalizzazione di periodici in Europa. Uno degli scopi
principali è definire le aree in cui si devono concordare gli standard per ottenere e mantenere una
interoperabilità.
1. Contenuti
La selezione dei periodici pregressi da digitalizzare deve seguire obiettivi nazionali e la
missione delle biblioteche. Nella maggior parte dei casi, lo scopo principale sarà migliorare
l’accesso a una parte centrale della letteratura accademica; gli aspetti di conservazione giocano
un ruolo secondario, ma non trascurabile. Il coinvolgimento degli utenti nella scelta dei
periodici è cruciale per garantire che la digitalizzazione vada incontro a delle necessità effettive.
I criteri di selezione devono essere espressi nel modo più chiaro possibile e devono essere
condivisi e raffrontati tra i vari progetti europei. Per evitare duplicazioni nella digitalizzazione,
tutti i periodici selezionati devono essere controllati presso un registro centrale (è già
disponibile un prototipo del DIEPER), che comprenda sia i periodici già digitalizzati che quelli
per cui è in programma la digitalizzazione.
L’idea, proposta dal DIEPER, di usare un registro internazionale di periodici digitalizzati come
strumento di coordinazione, ha ottenuto grande sostegno alla conferenza. Molti hanno espresso
la loro convinzione che i periodici digitalizzati debbano far parte del database EROMM2. Al suo
incontro annuale in maggio, il Comitato normativo di EROMM ha accettato in linea di principio
questa proposta. Si stanno ora indagando le metodiche tecniche e organizzative per metterla in
pratica. Gallica, la biblioteca elettronica della Biblioteca Nazionale Francese (548 periodici), e
JSTOR (124 periodici) hanno accettato di fornire le loro notizie bibliografiche.
2. Standard di scannerizzazione
C’è stato vasto consenso sugli standard tecnici per la scannerizzazione dei periodici accademici:
- una risoluzione d’immagine di 600 dpi per il materiale bicolore;
- TIFF con una compressione lossless (senza perdita di dati) come formato di
archiviazione;
- Un formato diverso di immagine per l’accesso degli utenti, di solito GIF o JPEG, o
anche PDF.
11
Digitising Journals : Conference on future strategies for European libraries, København 13/14 marzo 2000. la
conferenza era organizzata da LIBER e dalla Denmark's Electronic Research Library (DEF) in collaborazione con il
progetto europeo DIEPER, quello nordamericano JSTOR e NORDINFO, il Nordic Council for Scientific Information.
Per ulteriori informazioni visitare i siti http://www.sub.uni-goettingen.de/gdz/dieper/confer.htm o
http://www.deflink.dk/english/Aktivitet.ihtml?count=0 per gli atti della conferenza.
2
EROMM sta registrando tutto il materiale stampato che è stato riformattato per essere conservato ad infinitum, in
qualsiasi forma (microfilm o digitale). Cfr. il sito http://www.gbv.de/eromm
Per i “master digitali” si raccomanda vivamente l’uso di intestazioni TIFF per i metadati.
3. Metadati
Per consentire l’accesso ai periodici devono essere preparati due tipi di metadati, dati
bibliografici (o descrittivi) sul livello del periodico e dell’articolo (titolo, autore, classificazione,
ecc., usando la semantica Dublin Core dove possibile) e dati sulla struttura del documento
(pagine, capitoli, note, ecc. dell’originale; relazioni tra i componenti, p. es. tra testo e immagini).
Per entrambi la migliore strada per un accesso corretto è il mark-up in XML/RDF. I metadati
strutturali devono poter consentire ricerche complete e libere da parte dell’utente, e devono
essere consultabili con un browser.
I dati devono essere conservati in un sistema di gestione dei documenti basato su un database, e
non su una semplice struttura di file.
4. Full text
E’ importante fornire la possibilità di una ricerca full-text per incrementare il valore dei
periodici digitalizzati. Di solito il testo viene creato con un OCR. Anche se in molti casi non
sarà possibile correggere gli errori presenti nel testo, esso dovrebbe subire un processo di markup secondo le norme TEI (lite) o EAD per permettere l’accesso alle singole parti. Come nel caso
dei dati strutturali, la ricerca sul full text dovrebbe essere gratuita, anche se la visualizzazione
del singolo articolo, come testo o come immagine, è limitata agli abbonati.
5. Motori di ricerca
Gli UID o unique identifiers (URN, o anche DOI), sono necessari per consentire la ricerca
all’interno di un database distribuito di periodici digitalizzati. Per fornire un accesso fino al livello
dei singoli articoli, gli identifier devono avere la giusta granularity (per esempio avvalendosi di
SICI, http://sunsite.berkeley.edu/SICI/).
All’interno del progetto DIEPER si sta attualmente lavorando per installare un motore di ricerca in
grado di ricercare molti archivi digitali contemporaneamente. Sarà basato su RDF/XML (per la
struttura e il metadati), su TEI/XML (per il full text) e sugli unique identifiers (URN). Il motore di
ricerca fa parte del punto di accesso centrale, insieme al registro.
6. Accessibilità
Fino ad ora la maggior parte dei progetti europei si sono contraddistinti per aver fornito accesso
gratuito ai loro periodici digitalizzati. Considerando gli sviluppi futuri, un obiettivo deve essere
mantenere il più possibile quest’apertura, quando si tratta di conciliare tali obiettivi con i fattori
di spesa, che possono essere determinati in parte dalla cooperazione con gli editori e con gli altri
detentori dei diritti. Questi aspetti legali (specialmente il diritto d’autore) sono un settore al
quale bisogna dedicare un’attenzione particolare, dato che una limitazione dell’accesso a
materiali non soggetti a diritti d’autore lascerebbe insoddisfatte molte delle esigenze degli
utenti.
L’accesso ai metadati fino al livello dell’articolo dovrebbe essere gratuito per chiunque. Persino
nel caso dei periodici ai quali solo gli utenti paganti possono accedere in toto, ci deve essere un
punto di accesso centrale che permette la ricerca da parte degli utenti. Una volta che l’utente ha
ottenuto il diritto di utilizzo completo per tutta una serie di archivi digitali, o per una parte di
La digitalizzazione delle riviste in Europa
2
traduzione di Anna Mioni
essi, potrà accedere a tutti i periodici a cui è abbonato. Per agevolare l’accesso e per costruire
(dal punto di vista dell’utente) la biblioteca europea virtuale dei periodici digitalizzati, un
miglioramento significativo per unire tutti i progetti separati sarebbe un server comune di
certificazione e di autorizzazione.
7. Obiettivi
Il principale obiettivo a breve termine, comunque, sarà quello di dare una struttura formale e forse
istituzionale alla cooperazione europea in questo campo. Come primo passo, il presidente di LIBER
ha invitato un piccolo gruppo di esperti a formare una task force, che esplorerà tutti gli aspetti della
cooperazione paneuropea: Trix Bakker, Delta; Stefan Cramme, DigiZeit; Juha Hakala, HUL;
Catherine Lupovici, Gallica; Werner Schwartz, DIEPER; Simon Tanner, HEDS; Jens Thorhauge,
DEF.
Un primo incontro della task force si terrà contemporaneamente alla conferenza annuale di
LIBER quest’anno a Copenhagen.
La digitalizzazione delle riviste in Europa
3
traduzione di Anna Mioni