Aspetti Epistemologici dell’Informatica Prof.ssa Stefania Bandini Dott. Gianluca Colombo Dott. Luca Mizar Federici Dipartimento di Informatica, Sistemistica e Comunicazione Università di Milano-Bicocca [email protected]. 02 6448 7835 [email protected] tel. 02 6448 7879 [email protected] tel. 02 6448 7857 Modello Classificatorio e Modello Predicativo (Albero di Porfirio, XML e Semantic Web) Le immagini e le considerazioni esposte in queste slides sono liberamente tratte dall’articolo di Massimo Parodi e Alfio Ferrara Xml semantic web e rappresentazione della conoscenza pubblicato sulla rivista online Mondo Digitale del 3 Settembre 2002 Albero di Porfirio Genere supremo Differenza Sostanza corporea Corpo Genere subordinato Differenza Genere subordinato Differenza animato Genere subordinato inanimato Corpo Animato sensibile insensibile Animale Genere subordinato Differenza incorporea razionale irrazionale Animale Razionale mortale immortale Uomo Un’altra struttura ad albero della conoscenza: XML <!DOCTYPE NEWSPAPER [ <!ELEMENT NEWSPAPER (ARTICLE+)> <!ELEMENT ARTICLE (HEADLINE, BYLINE, LEAD, BODY, NOTES)> <!ELEMENT HEADLINE (#PCDATA)> <!ELEMENT BYLINE (#PCDATA)> <!ELEMENT LEAD (#PCDATA)> <!ELEMENT BODY (#PCDATA)> <!ELEMENT NOTES (#PCDATA)> <!ATTLIST ARTICLE AUTHOR CDATA #REQUIRED> <!ATTLIST ARTICLE EDITOR CDATA #IMPLIED> <!ATTLIST ARTICLE DATE CDATA #IMPLIED> <!ATTLIST ARTICLE EDITION CDATA #IMPLIED> <!ENTITY NEWSPAPER "Vervet Logic Times"> <!ENTITY PUBLISHER "Vervet Logic Press"> <!ENTITY COPYRIGHT "Copyright 1998 Vervet Logic Press"> ]> DTD (DATA TYPE DECLARATION) La definizione di tipo di documento descrive accuratamente i marcatori che individuano le porzioni di testo, ma prescinde del tutto da cosa essi possano significare. Come nell’albero di Porfirio l’aspetto strutturale da origine a una gerarchia di marcatori generici più ampi, al di sotto dei quali si collocano altri marcatori, per così dire speciali che possono fungere da generi per ulteriori specificazioni Inoltre il sistema non deve ammettere alcuna sovrapposizione dei marcatori (non si può aprire entro una porzione di testo si apra un marcatore destinato a chiudersi oltre la chiusura del primo. XML, Semantic Web e rappresentazione della conoscenza La ricerca sugli sviluppi di XML mostra come il problema della descrizione dei dati abbia origini antiche. In particolare si segnalano due modelli: - il modello classificatorio - il modello predicativo Queste due forme che la discussione ha assunto fino dalla sua origine sembrano oggi riproporsi nel dibattito sul semantic web. XML (eXtensive markup Language) XML permette di definire la struttura che descrive un contesto informativo all’interno del contesto stesso, precisando l’articolazione di un documento attraverso l’uso di marcatori in esso inseriti e questo ha prodotto due fenomeni interessanti: 1) XML viene usato spesso nella rappresentazione di documenti testuali, anche di carattere letterario o umanistico. 2) La versatilità dello strumento di generare definizioni di diverse tipologie di documento, produce la convinzione diffusa che tale linguaggio possa costituire uno strumento “neutro”con il quale rappresentare la conoscenza contenuta nelle diverse fonti informative. XML e albero di Porfirio sono neutri? Il ricorso a formalismi dell’informatica per l’archiviazione , la trasmissione e la rappresentazione dei dati che costituiscono la conoscenza può apparire neutro solo finché si consideri l’integrità del singolo dato la sua identità sostanziale, anziché la non corruttibilità delle relazioni fra i dati stessi. Il significato dei dati raccolti risulta quindi solo apparentemente conservato, dal momento che viene rispettata la sostanza e l’integrità di ogni singolo dato singolarmente inteso. Esempio di struttura ad albero Esseri viventi animali carnivori piante erbivori foglie rami Limiti della rappresentazione ad albero Con una rappresentazione della conoscenza ad albero ci sono notevoli limiti, riferendoci all’esempio precedente: - se il ramo è una parte di una pianta mentre i carnivori sono un sottoinsieme degli animali non abbiamo elementi per capire che un carnivoro è un animale mentre un ramo è una parte di una pianta. Non è possibile definire regole che ci dicano come interpretare le relazioni che intercorrono tra nodi e sottonodi. - L’albero non ci permette di definire la distinzione tra carnivori e erbivori, né ci permette di dire che gli erbivori mangiano le piante, mentre i carnivori mangiano altri animali -Una pianta carnivora come potrebbe essere classificata nella struttura precedentemente vista? La semantica presupposta nell’albero Ma è proprio vero che la struttura ad albero (e XML) costituisca uno strumento neutro? In qualche modo la struttura ci fornisce informazioni semantiche. Non sarebbe infatti possibile sostenere che un erbivoro è una pianta. Quindi XML non rappresenta in modo neutro le informazioni fornite ma al tempo stesso non definisce nemmeno regole di interpretazioni univoche per le relazioni descritte. Soluzione 1 Esseri viventi animali carnivori piante erbivori Definiamo una relazione tra il nodo carnivori e il nodo animali e tra il nodo erbivori e il nodo piante. Tale soluzione dissolve la struttura ad albero: animali è sia radice che nodo di carnivori, mentre l’elemento erbivori ha due radici foglie rami Soluzione 2 Esseri viventi animali piante carnivori erbivori animali piante Definire come sottonodo di carnivori un nuovo elemento animali, e come sottonodo di erbivori un nuovo sottonodo piante. Questa soluzione non è ammessa dall’albero di Porfirio, ma è ammessa da xml. Tuttavia essa non esprime correttamente le definizioni proposte di carnivori ed erbivori. Dall’albero non è evincibile univocamente che se gli erbivori mangiano piante essi mangiano oggetti non animali. foglie rami Soluzione 3 Esseri viventi animali carnivori mangiano animali piante erbivori foglie Mangiano piante La terza soluzione consiste nel non considerare le caratteristiche di carnivori ed erbivori come loro proprietà, cioè come relazioni fra essi ed altri elementi, ma considerarle come attributi. Piante e animali diventano una caratteristica propria degli elementi carnivori ed erbivori. Viene salvaguardata la struttura ad albero ma quella che nell’albero Porfiriano sarebbe stata una differenza specifica smette di essere una relazione (fra mangiante e mangiato) per divenire parte dell’oggetto definito. rami Modelli di descrizione e archiviazione non adeguati ai dati da rappresentare Se si assume che il significato di un insieme informazioni e conoscenze risiede soprattutto nelle relazioni che intercorrono tra esse, allora si deve concludere che gli strumenti informativi agiscono sul significato in quanto impongono di definire le relazioni in modo congruente a quanto consentito dallo strumento stesso. Ma tali difficoltà sono sempre di natura tecnica o sono il retaggio di teorie e tradizioni da cui non si riesce a discostarsi? Modello predicativo Roberto Grossatesta nel XIII secolo descrisse un duplice procedimento che chiamò la teoria della resolutio – compositio (traduzione greca delle parole latine analisi e sintesi). Resolutio: classificare per somiglianze e differenze gli elementi costituenti il fenomeno partendo dalla raccolta di esempi del fenomeno fino a giungere alla “formula comune” che enuncia la relazione empirica osservata. Compositio: risistemazione delle proposizioni in ordine causale in modo che le più particolari risultino derivate deduttivamente da quelle più generali per dimostrare che il rapporto tra generale e particolare è di causa ed effetto Analisi e sintesi Dagli Elementi di Euclide: «L’analisi è l’assunzione di ciò che è cercato come se fosse ammesso ed il passaggio attraverso le sue conseguenze fino a qualcosa di ammesso come vero; la sintesi invece è l’assunzione di ciò che è ammesso ed il passaggio attraverso le sue conseguenze fino all’attingimento di ciò che è cercato». Un problema, connesso con quello dell’origine delle due definzioni, è quello della «direzione», o del «senso», dell’analisi. Platone nei libri VI e VII della Repubblica parla di quello che sale dalle «ipotesi» al «principio anipotetico», chiamato «via all'in su», e quello che scende dal principio anipotetico, cioè dall’idea del bene, alle altre idee, chiamato «via all’in giù» . A ciò si è opposto R. Robinson, il quale ha osservato che l’analisi, in tutte le definizioni che ne possediamo, è descritta come un procedimento che passa attraverso «conseguenze» (in greco akòloutha ), cioè come una «via all’in giù». La differenza tra analisi e sintesi, secondo Robinson, non starebbe nella direzione, che sarebbe sempre la stessa, cioè «all’in giù», ma nel fatto che l’analisi parte da una proposizione cercata, assunta come ipotesi, e ne deduce come conseguenza una proposizione nota, mentre la sintesi parte da proposizioni note e ne deduce come conseguenza una proposizione cercata. Istanza deduttiva nel semantic web Questa istanza deduttiva che in Grossatesta è solo accennata diverrà centrale secoli dopo con le logiche predicative. Questo spostamento è anche ciò che avviene con il semantic web che prima nel trattare i metadati, con l’RDF e poi nell’ultimo livello, quello ontologico, si avvale di formalismi di natura logico predicativa. Semantic web e modello predicativo I tre livelli del semantic web 1) Livello di descrizione della semantica OIL DAML + OIL 2) Livello di descrizione dello schema RDF Schema 3)Livello di descrizione del modello dei dati e dei metadati RDF Semantic web e modello predicativo RDF ( Resource Description Framework): Linguaggio relazionale del tipo “soggetto-predicato-oggetto” per descrivere metadati e modelli dei dati. RDF Schema: Estensione dell’RDF pensata per la rappresentazione di strutture più generali di carattere classificatorio (classi e sottoclassi) OIL (ontology Interchange Language) e DAML (Darpa Agent Mark-up Language): Descrizione della realtà di riferimento, degli oggetti del mondo in base ai quali articolare la descrizione semantica di una realtà di interesse. Tale descrizione viene chiamata Ontologia Albero di Porfirio in OIL OIL consiste in: - Definizioni di classi (class-def) definizioni di concetti realtà - Definizioni di Slot (slot-def) rappresentazione di relazioni binarie tra classi - Definizioni di vincoli (slot-contraint) Nel modello ad albero non vi è alcun metodo per rappresentare le relazioni in se stesse. Albero di Porfirio in OIL Pur non rinunciando a definire relazioni gerarchiche come nel caso delle sottoclassi, le relazioni sono rappresentate e sono varie fra loro. Si possono descrivere l’essere sottoinsieme e l’essere parte di una classe, ci sono vincoli sulle relazioni che ne determinano anche le regole di applicabilità Albero di Porfirio in OIL ANIMALI PIANTE ERBIVORI CARNIVORI mangia sottoclasse di Parte di RAMI FOGLIE