La digitalizzazione delle riviste in Europa (bozza a cura di Stefan Cramme (DigiZeit) e Werner Schwartz (DIEPER), 20 giugno 2000 traduzione di Anna Mioni [email protected] ) Basandosi sulle “conclusioni e raccomandazioni” di Ann Matheson alla conferenza di Copenhagen nel marzo 20001 e su altra documentazione diffusa in quell’occasione, questa breve relazione intende riassumere i risultati della conferenza, gli sviluppi a partire da quella data e i punti nodali principali per ulteriori cooperazioni nella digitalizzazione di periodici in Europa. Uno degli scopi principali è definire le aree in cui si devono concordare gli standard per ottenere e mantenere una interoperabilità. 1. Contenuti La selezione dei periodici pregressi da digitalizzare deve seguire obiettivi nazionali e la missione delle biblioteche. Nella maggior parte dei casi, lo scopo principale sarà migliorare l’accesso a una parte centrale della letteratura accademica; gli aspetti di conservazione giocano un ruolo secondario, ma non trascurabile. Il coinvolgimento degli utenti nella scelta dei periodici è cruciale per garantire che la digitalizzazione vada incontro a delle necessità effettive. I criteri di selezione devono essere espressi nel modo più chiaro possibile e devono essere condivisi e raffrontati tra i vari progetti europei. Per evitare duplicazioni nella digitalizzazione, tutti i periodici selezionati devono essere controllati presso un registro centrale (è già disponibile un prototipo del DIEPER), che comprenda sia i periodici già digitalizzati che quelli per cui è in programma la digitalizzazione. L’idea, proposta dal DIEPER, di usare un registro internazionale di periodici digitalizzati come strumento di coordinazione, ha ottenuto grande sostegno alla conferenza. Molti hanno espresso la loro convinzione che i periodici digitalizzati debbano far parte del database EROMM2. Al suo incontro annuale in maggio, il Comitato normativo di EROMM ha accettato in linea di principio questa proposta. Si stanno ora indagando le metodiche tecniche e organizzative per metterla in pratica. Gallica, la biblioteca elettronica della Biblioteca Nazionale Francese (548 periodici), e JSTOR (124 periodici) hanno accettato di fornire le loro notizie bibliografiche. 2. Standard di scannerizzazione C’è stato vasto consenso sugli standard tecnici per la scannerizzazione dei periodici accademici: - una risoluzione d’immagine di 600 dpi per il materiale bicolore; - TIFF con una compressione lossless (senza perdita di dati) come formato di archiviazione; - Un formato diverso di immagine per l’accesso degli utenti, di solito GIF o JPEG, o anche PDF. 11 Digitising Journals : Conference on future strategies for European libraries, København 13/14 marzo 2000. la conferenza era organizzata da LIBER e dalla Denmark's Electronic Research Library (DEF) in collaborazione con il progetto europeo DIEPER, quello nordamericano JSTOR e NORDINFO, il Nordic Council for Scientific Information. Per ulteriori informazioni visitare i siti http://www.sub.uni-goettingen.de/gdz/dieper/confer.htm o http://www.deflink.dk/english/Aktivitet.ihtml?count=0 per gli atti della conferenza. 2 EROMM sta registrando tutto il materiale stampato che è stato riformattato per essere conservato ad infinitum, in qualsiasi forma (microfilm o digitale). Cfr. il sito http://www.gbv.de/eromm Per i “master digitali” si raccomanda vivamente l’uso di intestazioni TIFF per i metadati. 3. Metadati Per consentire l’accesso ai periodici devono essere preparati due tipi di metadati, dati bibliografici (o descrittivi) sul livello del periodico e dell’articolo (titolo, autore, classificazione, ecc., usando la semantica Dublin Core dove possibile) e dati sulla struttura del documento (pagine, capitoli, note, ecc. dell’originale; relazioni tra i componenti, p. es. tra testo e immagini). Per entrambi la migliore strada per un accesso corretto è il mark-up in XML/RDF. I metadati strutturali devono poter consentire ricerche complete e libere da parte dell’utente, e devono essere consultabili con un browser. I dati devono essere conservati in un sistema di gestione dei documenti basato su un database, e non su una semplice struttura di file. 4. Full text E’ importante fornire la possibilità di una ricerca full-text per incrementare il valore dei periodici digitalizzati. Di solito il testo viene creato con un OCR. Anche se in molti casi non sarà possibile correggere gli errori presenti nel testo, esso dovrebbe subire un processo di markup secondo le norme TEI (lite) o EAD per permettere l’accesso alle singole parti. Come nel caso dei dati strutturali, la ricerca sul full text dovrebbe essere gratuita, anche se la visualizzazione del singolo articolo, come testo o come immagine, è limitata agli abbonati. 5. Motori di ricerca Gli UID o unique identifiers (URN, o anche DOI), sono necessari per consentire la ricerca all’interno di un database distribuito di periodici digitalizzati. Per fornire un accesso fino al livello dei singoli articoli, gli identifier devono avere la giusta granularity (per esempio avvalendosi di SICI, http://sunsite.berkeley.edu/SICI/). All’interno del progetto DIEPER si sta attualmente lavorando per installare un motore di ricerca in grado di ricercare molti archivi digitali contemporaneamente. Sarà basato su RDF/XML (per la struttura e il metadati), su TEI/XML (per il full text) e sugli unique identifiers (URN). Il motore di ricerca fa parte del punto di accesso centrale, insieme al registro. 6. Accessibilità Fino ad ora la maggior parte dei progetti europei si sono contraddistinti per aver fornito accesso gratuito ai loro periodici digitalizzati. Considerando gli sviluppi futuri, un obiettivo deve essere mantenere il più possibile quest’apertura, quando si tratta di conciliare tali obiettivi con i fattori di spesa, che possono essere determinati in parte dalla cooperazione con gli editori e con gli altri detentori dei diritti. Questi aspetti legali (specialmente il diritto d’autore) sono un settore al quale bisogna dedicare un’attenzione particolare, dato che una limitazione dell’accesso a materiali non soggetti a diritti d’autore lascerebbe insoddisfatte molte delle esigenze degli utenti. L’accesso ai metadati fino al livello dell’articolo dovrebbe essere gratuito per chiunque. Persino nel caso dei periodici ai quali solo gli utenti paganti possono accedere in toto, ci deve essere un punto di accesso centrale che permette la ricerca da parte degli utenti. Una volta che l’utente ha ottenuto il diritto di utilizzo completo per tutta una serie di archivi digitali, o per una parte di La digitalizzazione delle riviste in Europa 2 traduzione di Anna Mioni essi, potrà accedere a tutti i periodici a cui è abbonato. Per agevolare l’accesso e per costruire (dal punto di vista dell’utente) la biblioteca europea virtuale dei periodici digitalizzati, un miglioramento significativo per unire tutti i progetti separati sarebbe un server comune di certificazione e di autorizzazione. 7. Obiettivi Il principale obiettivo a breve termine, comunque, sarà quello di dare una struttura formale e forse istituzionale alla cooperazione europea in questo campo. Come primo passo, il presidente di LIBER ha invitato un piccolo gruppo di esperti a formare una task force, che esplorerà tutti gli aspetti della cooperazione paneuropea: Trix Bakker, Delta; Stefan Cramme, DigiZeit; Juha Hakala, HUL; Catherine Lupovici, Gallica; Werner Schwartz, DIEPER; Simon Tanner, HEDS; Jens Thorhauge, DEF. Un primo incontro della task force si terrà contemporaneamente alla conferenza annuale di LIBER quest’anno a Copenhagen. La digitalizzazione delle riviste in Europa 3 traduzione di Anna Mioni