Slide - L.Int.Ar.

annuncio pubblicitario
Aspetti Epistemologici dell’Informatica
Prof.ssa Stefania Bandini
Dott. Gianluca Colombo
Dott. Luca Mizar Federici
Dipartimento di Informatica, Sistemistica e Comunicazione
Università di Milano-Bicocca
[email protected]. 02 6448 7835
[email protected] tel. 02 6448 7879
[email protected] tel. 02 6448 7857
Modello Classificatorio e Modello Predicativo
(Albero di Porfirio, XML e Semantic Web)
Le immagini e le considerazioni esposte in queste slides sono liberamente tratte
dall’articolo di Massimo Parodi e Alfio Ferrara Xml semantic web e
rappresentazione della conoscenza pubblicato sulla rivista online Mondo
Digitale del 3 Settembre 2002
Albero di Porfirio
Genere supremo
Differenza
Sostanza
corporea
Corpo
Genere subordinato
Differenza
Genere subordinato
Differenza
animato
Genere subordinato
inanimato
Corpo Animato
sensibile
insensibile
Animale
Genere subordinato
Differenza
incorporea
razionale
irrazionale
Animale Razionale
mortale
immortale
Uomo
Un’altra struttura ad albero della conoscenza:
XML
<!DOCTYPE NEWSPAPER [
<!ELEMENT NEWSPAPER (ARTICLE+)>
<!ELEMENT ARTICLE (HEADLINE, BYLINE, LEAD, BODY, NOTES)>
<!ELEMENT HEADLINE (#PCDATA)>
<!ELEMENT BYLINE (#PCDATA)>
<!ELEMENT LEAD (#PCDATA)>
<!ELEMENT BODY (#PCDATA)>
<!ELEMENT NOTES (#PCDATA)>
<!ATTLIST ARTICLE AUTHOR CDATA #REQUIRED>
<!ATTLIST ARTICLE EDITOR CDATA #IMPLIED>
<!ATTLIST ARTICLE DATE CDATA #IMPLIED>
<!ATTLIST ARTICLE EDITION CDATA #IMPLIED>
<!ENTITY NEWSPAPER "Vervet Logic Times">
<!ENTITY PUBLISHER "Vervet Logic Press">
<!ENTITY COPYRIGHT "Copyright 1998 Vervet Logic Press">
]>
DTD (DATA TYPE DECLARATION)
La definizione di tipo di documento descrive accuratamente
i marcatori che individuano le porzioni di testo, ma
prescinde del tutto da cosa essi possano significare.
Come nell’albero di Porfirio l’aspetto strutturale da
origine a una gerarchia di marcatori generici più ampi,
al di sotto dei quali si collocano altri marcatori, per così
dire speciali che possono fungere da generi per ulteriori
specificazioni
Inoltre il sistema non deve ammettere alcuna
sovrapposizione dei marcatori (non si può aprire entro
una porzione di testo si apra un marcatore destinato a
chiudersi oltre la chiusura del primo.
XML, Semantic Web e rappresentazione della
conoscenza
La ricerca sugli sviluppi di XML mostra come il problema della
descrizione dei dati abbia origini antiche.
In particolare si segnalano due modelli:
- il modello classificatorio
- il modello predicativo
Queste due forme che la discussione ha assunto fino dalla sua
origine sembrano oggi riproporsi nel dibattito sul semantic web.
XML (eXtensive markup Language)
XML permette di definire la struttura che descrive un
contesto informativo all’interno del contesto stesso,
precisando l’articolazione di un documento attraverso
l’uso di marcatori in esso inseriti e questo ha prodotto due
fenomeni interessanti:
1) XML viene usato spesso nella rappresentazione di
documenti testuali, anche di carattere letterario o
umanistico.
2) La versatilità dello strumento di generare definizioni di
diverse tipologie di documento, produce la convinzione
diffusa che tale linguaggio possa costituire uno strumento
“neutro”con il quale rappresentare la conoscenza
contenuta nelle diverse fonti informative.
XML e albero di Porfirio sono neutri?
Il ricorso a formalismi dell’informatica per l’archiviazione , la
trasmissione e la rappresentazione dei dati che costituiscono la
conoscenza può apparire neutro solo finché si consideri
l’integrità del singolo dato la sua identità sostanziale, anziché
la non corruttibilità delle relazioni fra i dati stessi.
Il significato dei dati raccolti risulta quindi solo
apparentemente conservato, dal momento che viene rispettata
la sostanza e l’integrità di ogni singolo dato singolarmente
inteso.
Esempio di struttura ad albero
Esseri viventi
animali
carnivori
piante
erbivori
foglie
rami
Limiti della rappresentazione ad albero
Con una rappresentazione della conoscenza ad albero ci sono
notevoli limiti, riferendoci all’esempio precedente:
- se il ramo è una parte di una pianta mentre i carnivori sono un
sottoinsieme degli animali non abbiamo elementi per capire che
un carnivoro è un animale mentre un ramo è una parte di una
pianta. Non è possibile definire regole che ci dicano come
interpretare le relazioni che intercorrono tra nodi e sottonodi.
- L’albero non ci permette di definire la distinzione tra carnivori e
erbivori, né ci permette di dire che gli erbivori mangiano le
piante, mentre i carnivori mangiano altri animali
-Una pianta carnivora come potrebbe essere classificata nella
struttura precedentemente vista?
La semantica presupposta nell’albero
Ma è proprio vero che la struttura ad albero (e XML)
costituisca uno strumento neutro?
In qualche modo la struttura ci fornisce informazioni
semantiche. Non sarebbe infatti possibile sostenere che
un erbivoro è una pianta.
Quindi XML non rappresenta in modo neutro le
informazioni fornite ma al tempo stesso non definisce
nemmeno regole di interpretazioni univoche per le relazioni
descritte.
Soluzione 1
Esseri viventi
animali
carnivori
piante
erbivori
Definiamo una relazione tra il nodo carnivori e il
nodo animali e tra il nodo erbivori e il nodo piante.
Tale soluzione dissolve la struttura ad albero:
animali è sia radice che nodo di carnivori, mentre
l’elemento erbivori ha due radici
foglie
rami
Soluzione 2
Esseri viventi
animali
piante
carnivori
erbivori
animali
piante
Definire come sottonodo di carnivori un nuovo elemento
animali, e come sottonodo di erbivori un nuovo sottonodo
piante. Questa soluzione non è ammessa dall’albero di
Porfirio, ma è ammessa da xml. Tuttavia essa non esprime
correttamente le definizioni proposte di carnivori ed erbivori.
Dall’albero non è evincibile univocamente che se gli erbivori
mangiano piante essi mangiano oggetti non animali.
foglie
rami
Soluzione 3
Esseri viventi
animali
carnivori
mangiano animali
piante
erbivori
foglie
Mangiano piante
La terza soluzione consiste nel non considerare le caratteristiche
di carnivori ed erbivori come loro proprietà, cioè come relazioni
fra essi ed altri elementi, ma considerarle come attributi. Piante e
animali diventano una caratteristica propria degli elementi
carnivori ed erbivori. Viene salvaguardata la struttura ad albero
ma quella che nell’albero Porfiriano sarebbe stata una differenza
specifica smette di essere una relazione (fra mangiante e
mangiato) per divenire parte dell’oggetto definito.
rami
Modelli di descrizione e archiviazione non adeguati ai
dati da rappresentare
Se si assume che il significato di un insieme informazioni e
conoscenze risiede soprattutto nelle relazioni che intercorrono
tra esse, allora si deve concludere che gli strumenti
informativi agiscono sul significato in quanto impongono di
definire le relazioni in modo congruente a quanto consentito
dallo strumento stesso.
Ma tali difficoltà sono sempre di natura tecnica o sono il
retaggio di teorie e tradizioni da cui non si riesce a
discostarsi?
Modello predicativo
Roberto Grossatesta nel XIII secolo descrisse un duplice
procedimento che chiamò la teoria della resolutio – compositio
(traduzione greca delle parole latine analisi e sintesi).
Resolutio: classificare per somiglianze e differenze gli elementi
costituenti il fenomeno partendo dalla raccolta di esempi del
fenomeno fino a giungere alla “formula comune” che enuncia la
relazione empirica osservata.
Compositio: risistemazione delle proposizioni in ordine causale in
modo che le più particolari risultino derivate deduttivamente da
quelle più generali per dimostrare che il rapporto tra generale e
particolare è di causa ed effetto
Analisi e sintesi
Dagli Elementi di Euclide: «L’analisi è l’assunzione di ciò che è cercato come se
fosse ammesso ed il passaggio attraverso le sue conseguenze fino a qualcosa di
ammesso come vero; la sintesi invece è l’assunzione di ciò che è ammesso ed il
passaggio attraverso le sue conseguenze fino all’attingimento di ciò che è cercato».
Un problema, connesso con quello dell’origine delle due definzioni, è quello della
«direzione», o del «senso», dell’analisi.
Platone nei libri VI e VII della Repubblica parla di quello che sale dalle «ipotesi»
al «principio anipotetico», chiamato «via all'in su», e quello che scende dal
principio anipotetico, cioè dall’idea del bene, alle altre idee, chiamato «via all’in
giù» .
A ciò si è opposto R. Robinson, il quale ha osservato che l’analisi, in tutte le
definizioni che ne possediamo, è descritta come un procedimento che passa
attraverso «conseguenze» (in greco akòloutha ), cioè come una «via all’in giù». La
differenza tra analisi e sintesi, secondo Robinson, non starebbe nella direzione,
che sarebbe sempre la stessa, cioè «all’in giù», ma nel fatto che l’analisi parte da
una proposizione cercata, assunta come ipotesi, e ne deduce come conseguenza
una proposizione nota, mentre la sintesi parte da proposizioni note e ne deduce
come conseguenza una proposizione cercata.
Istanza deduttiva nel semantic web
Questa istanza deduttiva che in Grossatesta è solo accennata
diverrà centrale secoli dopo con le logiche predicative.
Questo spostamento è anche ciò che avviene con il semantic
web che prima nel trattare i metadati, con l’RDF e poi
nell’ultimo livello, quello ontologico, si avvale di formalismi di
natura logico predicativa.
Semantic web e modello predicativo
I tre livelli del semantic web
1) Livello di descrizione della semantica
OIL
DAML + OIL
2) Livello di descrizione dello schema
RDF Schema
3)Livello di descrizione del modello dei dati e dei metadati
RDF
Semantic web e modello predicativo
RDF ( Resource Description Framework):
Linguaggio relazionale del tipo “soggetto-predicato-oggetto” per
descrivere metadati e modelli dei dati.
RDF Schema:
Estensione dell’RDF pensata per la rappresentazione di strutture
più generali di carattere classificatorio (classi e sottoclassi)
OIL (ontology Interchange Language) e DAML (Darpa Agent
Mark-up Language):
Descrizione della realtà di riferimento, degli oggetti del mondo in
base ai quali articolare la descrizione semantica di una realtà di
interesse. Tale descrizione viene chiamata Ontologia
Albero di Porfirio in OIL
OIL consiste in:
- Definizioni di classi (class-def) definizioni di concetti
realtà
- Definizioni di Slot (slot-def) rappresentazione di relazioni
binarie tra classi
- Definizioni di vincoli (slot-contraint)
Nel modello ad albero non vi è alcun metodo per
rappresentare le relazioni in se stesse.
Albero di Porfirio in OIL
Pur non rinunciando a
definire relazioni gerarchiche
come
nel
caso
delle
sottoclassi, le relazioni sono
rappresentate e sono varie
fra loro.
Si possono descrivere l’essere
sottoinsieme e l’essere parte
di una classe, ci sono vincoli
sulle
relazioni
che
ne
determinano anche le regole
di applicabilità
Albero di Porfirio in OIL
ANIMALI
PIANTE
ERBIVORI
CARNIVORI
mangia
sottoclasse di
Parte di
RAMI
FOGLIE
Scarica