Edizione digitale di testi epigrafici classici e medievali

annuncio pubblicitario
Edizione digitale di testi
epigrafici classici e medievali
Daniele Fusi
http://www.fusisoft.it/
Edizione digitale
Obiettivi
Molteplici media e pubblici
cd-rom o dvd
sito web
unica banca dati
libri elettronici
libri
chiosco museale
Vari livelli di specializzazione
epigrafia
archeologia
unica banca dati
livelli di
fruizione
paleografia
filologia e
linguistica
Longevità



uso di tecnologie standard
indipendenza da qualsiasi particolare forma
e medium di pubblicazione dei dati
elevata capacità di trasformazione dei dati,
intrinseca al progetto editoriale
Esempi di uso specialistico: sistemi
esperti



linguistico: software di flessione morfologica
diacronica e sincronica; lemmatizzazione
automatica
metrico: software di analisi e scansione
metrica di versi greci e latini; corpus metrico
paleografico: algoritmi di riconoscimento
neurale, corpora paleografici interattivi
Realizzazione ed espansione
Principi generali
Semantizzazione dei contenuti
lemma
morfologia
etimo
traducente
fraseologia
opera
etc ...
Semantizzazione: usi
lemma
elenco alfabetico dei lemmi, diretto o inverso
morfologia
elenco dei lemmi per categoria grammaticale
etimo
dizionario etimologico (elenco lemmi per radicale)
traducente
vocabolario bilingue (italiano <> greco)
fraseologia
ricerca per fraseologia
opera
elenco dei luoghi citati, elenco dei lemmi per occorrenza
etc ...
ricerche combinate
lemma
morfologia
etimo
opera
etc ...
Peculiarità del documento epigrafico

supporto:




monumento e funzione
contesto storico e materiale
materiale, tecnica, forme
testo:


lingua o dialetto
ortografia ed ‘errori’
Ortografia e prassi editoriali
Διονύσις
1. Ἀντώνιος
2. Ἀντώνις
η = ι (= υ, ει, οι, υι, ηι)
3. Ἀντώνης (m. -ης)
Livelli di semantizzazione del testo

minimo: puro testo
A • FABIO • A • F • FABIANO • EQVITI
ROMANO • DECVD RIONI • OST M
QVI • VIXIT • ANNIS •
XXII • M • XI • D • XX •
A • FABIVS • TROPHIMVS
PATER • FECIT
Livelli di semantizzazione del testo

medio: testo continuo marcato (es. XML)
abbreviazione =
Aulo
A • FABIO • A • F • FABIANO • EQVITI
ROMANO • DECVD RIONI • OST M
QVI • VIXIT • ANNIS •
XXII • M • XI • D • XX •
A • FABIVS • TROPHIMVS
PATER • FECIT
nomen
titolo
numerale
<x>A</x> • <y>FABIO</y> • A • F • FABIANO • <z>EQVITI</z>
ROMANO • DECVD RIONI • OST M
QVI • VIXIT • ANNIS •
XXII • M • XI • D • <n>XX</n> •
A • FABIVS • TROPHIMVS
PATER • FECIT
Testo continuo marcato: vantaggi




semantizzazione
standardizzazione (es. XML, Unicode)
testo continuo interpretabile e fungibile a
diversi livelli
piattaforma di scambio, trasformabilità
Testo continuo marcato: svantaggi
<ln><x>A</x> • <y>FABIO<y> • A • F • FABI-</ln>
<ln>ANO • <z>EQVITI</z></ln>
patronimico
nomen
cognomen



abbreviazione
= Aulo
abbreviazione
= Auli
praenomen
nidificazione e
complicazione della
struttura
limite alla sovrapposizione
di tag
costrizione del dato
metatestuale
abbreviazione
= filio
titolo
nome
completo =
Aulo Fabio Auli
filio Fabiano
etc. ...
Banca dati
non semplice testo marcato ma
banca dati altamente strutturata
luogo
data
etc. etc.
apparato: [...]
dati di scavo
testo: [...]
bibliogr.: [...]
testo
bibliografia
dati scavo: [...]
data: [......]
luogo: [......]
apparato
Dal testo continuo alla banca dati
dati identificativi
classificazione
luogo
intestazione
data
corpus
bibliografia
gruppi
di testi
iscrizioni
dati di scavo
descr. fisica
abcdefg hijkl
mno pqrstuv
wxy z
...
descr. paleografica
media associati
commento
testo
apparato
etc. ...
Banca dati XML




testo ‘amorfo’ e decomposto, massima
separazione forme / contenuto
struttura slegata dal testo e dettata da soli criteri
semantici
dato metatestuale libero di espandersi e
strutturarsi secondo le sue specificità
struttura aperta: espansione in pubblicazione
(media e pubblici) e redazione (aggiunta di
materiale e specializzazione)
Edizione elettronica
diversi output per vari
media e pubblici
unica banca dati (repertorio) XML
trasformazione
incluso testo XML
continuo (es. TEI)
media associati
indicizzazione automatica
in database relazionali
Banca dati (repertorio) XML

conservazione dei vantaggi di XML:




standardizzazione (XML, Unicode, etc.)
formato di scambio
flessibilità e apertura a espansione
eliminazione degli svantaggi di XML:



semplificazione delle strutture (nidificazione)
no limitazioni intrinseche (sovrapposizione)
velocità di accesso nella pubblicazione tramite
indicizzazioni automatiche in database relazionali
Trasformazione testuale
(1) repertorio
strutturato
(2) preprocessing
Trasformazione testuale
(1) repertorio
strutturato
(2) preprocessing
(3) conversione e pubblicazione:
• medium e formati (HTML, PDF,
DOC, SQL, TEI, etc.)
• risorse tipografiche (es. font)
• impaginazione tipografica
Esempi di realizzazione
Stratigrafia testuale e ramificazione
Stratificazione del testo
... altri strati ...
“in pace”
la pace qui va intesa...
EN EIPHNH edd.
EIPHNH
HPHNH
strato di traduzione
strato di commento
strato di apparato
strato ortografico:
istruzione H > EI
testo di base come sulla pietra
Strato ortografico: indici e ricerca


doppio testo: ortografia storica (KATAKITE)
e normativa (KATAKEITAI)
ricerche intelligenti:



effettuabili su ogni strato: KATAKITE =
KATAKEITAI, EPYHSEN = EPOIHSEN
parametri avanzati (es. tutte le parole con I per EI,
tutte le forme di KEITAI con E per AI, tutti gli errori
nelle forme di KEITAI [KITE: I=EI, E=AI], ...)
creazione automatica di indici:


linguistici
di errori paleografici
Esempi di espansione


unica struttura di banca dati, unico software
distribuito (web) di data entry e
trasformazione
nuovi strati:




nessi e legature
prosopografia
citazioni letterarie
nuovi rami (specializzazione):


paleografia
descrizione fisica
Scarica