Edizione digitale di testi epigrafici classici e medievali Daniele Fusi http://www.fusisoft.it/ Edizione digitale Obiettivi Molteplici media e pubblici cd-rom o dvd sito web unica banca dati libri elettronici libri chiosco museale Vari livelli di specializzazione epigrafia archeologia unica banca dati livelli di fruizione paleografia filologia e linguistica Longevità uso di tecnologie standard indipendenza da qualsiasi particolare forma e medium di pubblicazione dei dati elevata capacità di trasformazione dei dati, intrinseca al progetto editoriale Esempi di uso specialistico: sistemi esperti linguistico: software di flessione morfologica diacronica e sincronica; lemmatizzazione automatica metrico: software di analisi e scansione metrica di versi greci e latini; corpus metrico paleografico: algoritmi di riconoscimento neurale, corpora paleografici interattivi Realizzazione ed espansione Principi generali Semantizzazione dei contenuti lemma morfologia etimo traducente fraseologia opera etc ... Semantizzazione: usi lemma elenco alfabetico dei lemmi, diretto o inverso morfologia elenco dei lemmi per categoria grammaticale etimo dizionario etimologico (elenco lemmi per radicale) traducente vocabolario bilingue (italiano <> greco) fraseologia ricerca per fraseologia opera elenco dei luoghi citati, elenco dei lemmi per occorrenza etc ... ricerche combinate lemma morfologia etimo opera etc ... Peculiarità del documento epigrafico supporto: monumento e funzione contesto storico e materiale materiale, tecnica, forme testo: lingua o dialetto ortografia ed ‘errori’ Ortografia e prassi editoriali Διονύσις 1. Ἀντώνιος 2. Ἀντώνις η = ι (= υ, ει, οι, υι, ηι) 3. Ἀντώνης (m. -ης) Livelli di semantizzazione del testo minimo: puro testo A • FABIO • A • F • FABIANO • EQVITI ROMANO • DECVD RIONI • OST M QVI • VIXIT • ANNIS • XXII • M • XI • D • XX • A • FABIVS • TROPHIMVS PATER • FECIT Livelli di semantizzazione del testo medio: testo continuo marcato (es. XML) abbreviazione = Aulo A • FABIO • A • F • FABIANO • EQVITI ROMANO • DECVD RIONI • OST M QVI • VIXIT • ANNIS • XXII • M • XI • D • XX • A • FABIVS • TROPHIMVS PATER • FECIT nomen titolo numerale <x>A</x> • <y>FABIO</y> • A • F • FABIANO • <z>EQVITI</z> ROMANO • DECVD RIONI • OST M QVI • VIXIT • ANNIS • XXII • M • XI • D • <n>XX</n> • A • FABIVS • TROPHIMVS PATER • FECIT Testo continuo marcato: vantaggi semantizzazione standardizzazione (es. XML, Unicode) testo continuo interpretabile e fungibile a diversi livelli piattaforma di scambio, trasformabilità Testo continuo marcato: svantaggi <ln><x>A</x> • <y>FABIO<y> • A • F • FABI-</ln> <ln>ANO • <z>EQVITI</z></ln> patronimico nomen cognomen abbreviazione = Aulo abbreviazione = Auli praenomen nidificazione e complicazione della struttura limite alla sovrapposizione di tag costrizione del dato metatestuale abbreviazione = filio titolo nome completo = Aulo Fabio Auli filio Fabiano etc. ... Banca dati non semplice testo marcato ma banca dati altamente strutturata luogo data etc. etc. apparato: [...] dati di scavo testo: [...] bibliogr.: [...] testo bibliografia dati scavo: [...] data: [......] luogo: [......] apparato Dal testo continuo alla banca dati dati identificativi classificazione luogo intestazione data corpus bibliografia gruppi di testi iscrizioni dati di scavo descr. fisica abcdefg hijkl mno pqrstuv wxy z ... descr. paleografica media associati commento testo apparato etc. ... Banca dati XML testo ‘amorfo’ e decomposto, massima separazione forme / contenuto struttura slegata dal testo e dettata da soli criteri semantici dato metatestuale libero di espandersi e strutturarsi secondo le sue specificità struttura aperta: espansione in pubblicazione (media e pubblici) e redazione (aggiunta di materiale e specializzazione) Edizione elettronica diversi output per vari media e pubblici unica banca dati (repertorio) XML trasformazione incluso testo XML continuo (es. TEI) media associati indicizzazione automatica in database relazionali Banca dati (repertorio) XML conservazione dei vantaggi di XML: standardizzazione (XML, Unicode, etc.) formato di scambio flessibilità e apertura a espansione eliminazione degli svantaggi di XML: semplificazione delle strutture (nidificazione) no limitazioni intrinseche (sovrapposizione) velocità di accesso nella pubblicazione tramite indicizzazioni automatiche in database relazionali Trasformazione testuale (1) repertorio strutturato (2) preprocessing Trasformazione testuale (1) repertorio strutturato (2) preprocessing (3) conversione e pubblicazione: • medium e formati (HTML, PDF, DOC, SQL, TEI, etc.) • risorse tipografiche (es. font) • impaginazione tipografica Esempi di realizzazione Stratigrafia testuale e ramificazione Stratificazione del testo ... altri strati ... “in pace” la pace qui va intesa... EN EIPHNH edd. EIPHNH HPHNH strato di traduzione strato di commento strato di apparato strato ortografico: istruzione H > EI testo di base come sulla pietra Strato ortografico: indici e ricerca doppio testo: ortografia storica (KATAKITE) e normativa (KATAKEITAI) ricerche intelligenti: effettuabili su ogni strato: KATAKITE = KATAKEITAI, EPYHSEN = EPOIHSEN parametri avanzati (es. tutte le parole con I per EI, tutte le forme di KEITAI con E per AI, tutti gli errori nelle forme di KEITAI [KITE: I=EI, E=AI], ...) creazione automatica di indici: linguistici di errori paleografici Esempi di espansione unica struttura di banca dati, unico software distribuito (web) di data entry e trasformazione nuovi strati: nessi e legature prosopografia citazioni letterarie nuovi rami (specializzazione): paleografia descrizione fisica