Introduzione a Python

Rappresentazione della
conoscenza
LORENZO DI SILVESTRO
www.dmi.unict.it/~disilvestro
[email protected]
Cos’è?
 La rappresentazione della conoscenza (KR) è una
branca dell’intelligenza artificiale
 Scopo:

definire simboli e linguaggi per rendere la conoscenza
comprensibili alle macchine
 Perché?

per poter effettuare ragionamenti automatici
Rappresentazione della conoscenza
[email protected]
Inferenza
 Processo con il quale da una proposizione considerata
vera, si passa ad una seconda proposizione la cui verità è
dedotta dal contenuto della prima
 Inferenza = trarre una conlcusione
 Inferenza != Conclusione
 Le leggi di una valida inferenza sono studiate in Logica
Rappresentazione della conoscenza
[email protected]
Inferenza vs. Conclusione
 Se la premessa è vera, lo sarà
anche l’inferenza
 La veridicità della premessa
non garantisce
dell’implicazione
Rappresentazione della conoscenza
la
verità
[email protected]
Sillogismo
 I filosofi greci hanno definito una serie di sillogismi
in tre parti che possono essere usati come “mattoni”
per ragionamenti più complessi
 Sillogismo: argomento (o argomentazione) in cui una
proposizione (la conclusione) è ricavabile da due o
più proposizioni (premesse)
 Vari modelli, il più famoso è il sillogismo aristotelico
Rappresentazione della conoscenza
[email protected]
Sillogismo aristotelico
 Il più famoso:
1. Tutti gli uomini sono mortali
2. Socrate è un uomo
3. Quindi, Socrate è mortale
 Le premesse sono VERE, l’inferenza è VALIDA, quindi la
conclusione è VERA
Rappresentazione della conoscenza
[email protected]
Inferenza non valida
 Inferenza non valida:
1. Tutti gli X sono Y
2. Z è Y
3. Quindi, Z è X
 Esempio:
1. Tutte le mele sono frutti
2. Le pere sono frutti
3. Quindi, le pere sono mele
 Le premesse sono VERE, l’inferenza è NON VALIDA,
quindi la conclusione è FALSA
Rappresentazione della conoscenza
[email protected]
Conclusione FALSA da inferenza VALIDA
 Inferenza valida:
1. Tutti gli italiani sono anfibi
2. Sean Connery è italiano
3. Quindi, Sean Connery è anfibio
 Le premesse sono FALSE, l’inferenza è VALIDA, quindi la
conclusione è FALSA
Rappresentazione della conoscenza
[email protected]
Conclusione VERA da premesse FALSE
 Inferenza valida:
1. Tutti i computer sono attori
2. Sean Connery è un computer
3. Quindi, Sean Connery è attore
 Le premesse sono FALSE, l’inferenza è VALIDA, in questo
caso due false premesse implicano una conclusione VERA
 Il ragionamento è ERRATO
Rappresentazione della conoscenza
[email protected]
Ragionamento automatico
FATTI
CODIFICA
RAPPRESENTAZIONI
RAGIONAMENTO
RIFERIMENTO
Una rappresentazione è un simbolo o un segno che “codifica”
un oggetto o un evento creando una corrispondenza fra
strutture interne ed esterne all’agente cognitivo
Rappresentazione della conoscenza
[email protected]
Buona rappresentazione
 Evidenziare oggetti e relazioni importanti.
 Fornire visioni complessive efficaci.
 Sopprimere dettagli irrilevanti.
 Consentire generalizzazioni.

Non soltanto entità isolate (tokens) ma tipi (types) di entità simili
 Essere comprensibile, completa, concisa.
Rappresentazione della conoscenza
[email protected]
Buona rappresentazione (2)
 Consentire una facile ed efficace manipolabilità
della conoscenza.
 Essere utilizzabile anche se la conoscenza è
incompleta.
 Essere computabile.
 Avere potenza espressiva.
 Essere flessibile ed estensibile.
Rappresentazione della conoscenza
[email protected]
Compromessi
 Ovviamente è molto difficile, se non impossibile,
tener conto di tutti questi principi.
 Ad esempio, esiste un trade-off fra l’espressività del
formalismo di rappresentazione e la complessità del
meccanismo inferenziale.
 Il linguaggio naturale è un esempio di formalismo
massimamente espressivo ma che proprio per questo
motivo permette di generare espressioni vaghe ed
imprecise e persino di omettere informazione.
Rappresentazione della conoscenza
[email protected]
Problemi classici dell’IA
 Il frame problem (tradotto come problema del
contorno o del contesto)
 Il problema della ramificazione
 Il problema della qualificazione
Rappresentazione della conoscenza
[email protected]
Frame problem
 Nonostante sia possibile specificare tutti i fatti che
cambiano in una situazione come conseguenza di
una azione (ad esempio di un robot), è invece
impossibile specificare tutti quelli che non
cambiano, che sono peraltro verosimilmente molto
più numerosi.
 Non è spesso possibile enumerare tutte le proprietà
che non cambiano
Rappresentazione della conoscenza
[email protected]
Problema della ramificazione
 Consiste nello stabilire quali siano gli effetti indiretti
di una certa azione.
 Ad esempio, se si acquista del pane una conseguenza
diretta consiste nel fatto che successivamente si
possiede del pane.
 Esistono tuttavia molte conseguenze indirette, come
ad esempio il fatto che si possiede meno denaro;
inferire tali conseguenze indirette può essere molto
rilevante, specialmente dato il fatto che non tutte
possono essere desiderate o desiderabili.
Rappresentazione della conoscenza
[email protected]
Problema della quantificazione
 Consiste nello stabilire a quali condizioni un’azione
abbia successo.
 Ad esempio, il successo dell’azione di acquistare il
pane dipende da un grande numero di fattori, come
ad esempio trovare il negozio aperto e possedere
denaro, ma alcuni di essi possono essere
difficilmente prevedibili o esplicitabili, come nel caso
di ostacoli improvvisi come un terremoto.
Rappresentazione della conoscenza
[email protected]
Problemi della KR
 Problema della località o della rilevanza
 Problema della generalità
 Problema della vaghezza
 Problema dell’incertezza
 Problema dell’ancoramento dei simboli (symbol
grounding problem)
Rappresentazione della conoscenza
[email protected]
Località / Rilevanza
 Fortemente correlato al frame problem
 Consiste nella difficoltà di descrivere tutta e sola la
conoscenza rilevante nel risolvere un problema.
 Teoricamente infatti per risolvere qualsiasi problema
ciascuna conoscenza potrebbe essere utile, mentre
ovviamente il formalismo deve consentire di
processare tutta e sola la conoscenza rilevante,
focalizzandosi dunque su di un sottoinsieme
dell’informazione potenzialmente disponibile.
Rappresentazione della conoscenza
[email protected]
Generalità
 Qualunque definizione o assiomatizzazione si
scelga per un concetto o per un principio, essa non
coprirà tutti i casi possibili.
 Le conoscenze umane sono altamente contestuali e
cercare di catturare tutti gli aspetti di un concetto
con una singola definizione è una impresa vana
Rappresentazione della conoscenza
[email protected]
Vaghezza
 Si riferisce alla difficoltà di stabilire dei confini
netti per i concetti; Russell chiama questo aspetto
“penombra”.
 Zadeh nel 1975 ha sviluppato un “logica della
vaghezza”, la logica fuzzy, proprio per rispondere a
questo tipo di problemi.
 Ambiguità:
molti significati, appartenenti a
differenti campi di riferimento, possono essere
associati alla stessa forma fonetica (es. “pesca”)
Rappresentazione della conoscenza
[email protected]
Incertezza
La conoscenza è incerta in molti sensi:
 Il suo valore di verità può essere graduato (e non
discreto) o probabile (e non certo)
oppure
 può essere approssimata o incompleta, ad esempio
perché alcune conoscenze possono non essere
disponibili al momento
Rappresentazione della conoscenza
[email protected]
Ancoramento dei simboli
 Se i concetti rimandano solo ad altri concetti, o i
simboli ad altri simboli c’è il rischio di generare
una circolarità.
 Per
evitare la circolarità essi devono essere
ancorati ad entità che non siano esse stesse dei
simboli, ovvero direttamente al mondo.
Rappresentazione della conoscenza
[email protected]
Valutazione
 l’adeguatezza epistemologica, ovvero la capacità di
rappresentare tutti gli aspetti del problema in
esame;
 l’adeguatezza euristica, ovvero l’efficienza nei
tempi di processamento. Va notato che è presente
un trade-off fra adeguatezza inferenziale (quello
che è possibile inferire dato il formalismo) ed
efficienza inferenziale (rapidità di inferenza).
Rappresentazione della conoscenza
[email protected]
Valutazione (2)
 l’adeguatezza inferenziale, ovvero la capacità di
ottenere nuove strutture a partire dalla
manipolazione di quelle preesistenti;
 l’efficienza inferenziale, ovvero la capacità di
adattare le strategie di ricerca a seconda della
nuova informazione che viene acquisita;
 l’efficienza di acquisizione, ovvero la possibilità di
inserire nuova informazione, sia per mezzo di
operatori umani, sia per mezzo di tecniche di
apprendimento automatico.
Rappresentazione della conoscenza
[email protected]
Forme di ragionamento

Ragionamento formale consiste nel manipolare
strutture dati per dedurne di nuove, a fronte di
specifiche regole di inferenza.

Ragionamento procedurale usa la simulazione
per rispondere a domande e risolvere problemi.

Ragionamento per analogia consiste
nell’applicare la sua conoscenza in casi simili al
caso in esame.
Rappresentazione della conoscenza
[email protected]
Forme di ragionamento (2)

Generalizzazione ed astrazione consiste nel
generalizzare a regola un fatto/evento che si
ripete sempre con le stesse modalità anche se in
diverse contestualizzazioni.

Ragionamento di meta-livello consiste
nell’usare la conoscenza sia di ciò che il sistema
sa, che dell’importanza di certi fatti.
Rappresentazione della conoscenza
[email protected]
Linguaggi di rappresentazione
 In linea generale, i linguaggi di rappresentazione
della conoscenza forniscono sia una serie di costrutti
per definire la sintassi del dominio di interesse (le
regole sulle quali costruire delle asserzioni
accettabili), sia una serie di operatori (quantificatori,
operatori modali, etc.) che permettano di dare un
significato, un valore di verità alle asserzioni rispetto
al modello di riferimento.
Rappresentazione della conoscenza
[email protected]
Base di conoscenza
 Attraverso il linguaggio scelto si andranno ad
effettuare una serie di asserzioni sul mondo, che
andranno insieme a costituire una Base di
Conoscenza (KB Knowledge Base). È inoltre
importante che il linguaggio scelto per fare le
asserzioni sia anche in grado di operare sulla KB per
estrarre nuova conoscenza e per aggiungerne di
nuova.
Rappresentazione della conoscenza
[email protected]
Approccio dell’IA
 Approcci di tipo logico

Calcolo proposizionale


Contiene(bicchiere, acqua) AND sopra(bicchiere, tavolo)
Calcolo dei predicati (o logica del primo ordine)

∀x(città(x) AND vicina_al(mare, x) ⇒ calda(x))
 Programmazione logica

PROLOG

∀(x) (mortale(x) & razionale(x) ⇒ uomo(x))
uomo(Socrate)
in una rappresentazione equivalente in PROLOG:
uomo(X):- mortale(X),
razionale(X).
uomo(Socrate).
Rappresentazione della conoscenza
[email protected]
Approccio nel Semantic Web
 I linguaggi a cui siamo interessati in ingegneria
ontologica sono quelli che permettono la definizione
di ontologie e basi di conoscenza, il ragionamento su
di esse e la loro interrogazione.
 Lo sviluppo dei linguaggi formali attualmente
utlizzati in ingegneria ontologica è avvenuto
attraverso due linee evolutive che si sono incontrate
alcuni anni fa:

il semantic web e la knowledge representation.
Rappresentazione della conoscenza
[email protected]
Approccio nel Semantic Web (2)
 Inizialmente: XML per la sintassi generale; RDF per
la codifica della conoscenza
 XML permette la definizione di un qualsiasi
linguaggio di annotazione mediante la creazione di
elementi appropriati.
 Schemi XML e i DTD (Document Type Definition)
possono rappresentare ontologie, ma hanno due
difetti: ampio margine di arbitrarietà al modellatore
e nessuna distinzione tra diverse “primitive” (classi,
relazioni, istanze, etc.).
Rappresentazione della conoscenza
[email protected]
Semantic Web
Rappresentazione della conoscenza
[email protected]
Semantic Web Cake
Rappresentazione della conoscenza
[email protected]
Unicode, URI e XML
 Unicode: standard internazionale per la
definizione di una rappresentazione univoca
dei caratteri
 URI: stringa che identifica univocamente
una risorsa
 XML: standard de facto per la condivisione
di documenti sul web
Rappresentazione della conoscenza
[email protected]
XML
 Meno oneroso il lavoro di un parser per
l’individuazione di relazioni tra entità
 Facilita
la pubblicazione sul
l’esportazione in diversi formati
web
e
 Interoperabilità tra banche dati
Rappresentazione della conoscenza
[email protected]
Namespace, XML Schema, XML Query
 Namespaces: serve a qualificare e disambiguare tag e
attributi in un documento XML mediante degli URI,
rendendoli quindi univoci sul web.
 XML Schema: serve a definire la struttura di un
documento XML. Oggi il W3C consiglia di adottarlo al
posto della DTD stessa, essendo una tecnica più recente
ed avanzata.
 XML Query: è un linguaggio di query concepito per
essere applicabile a qualsiasi sorta di documento XML e si
basa sull'utilizzo di XPath per la specificazione di percorsi
all'interno di documenti. XQuery ha funzionalità che
consentono di poter attingere da fonti di dati multiple per
la ricerca, per filtrare i documenti o riunire i contenuti di
interesse.
Rappresentazione della conoscenza
[email protected]
RDF
 Il Resource Description Framework (RDF) è
lo strumento base proposto da W3C per la codifica,
lo scambio e il riutilizzo di metadati strutturati e
consente l'interoperabilità tra applicazioni che si
scambiano informazioni sul Web.
 È costituito da due componenti:
 RDF Model and Syntax: espone la struttura del
modello RDF, e descrive una possibile sintassi.
 RDF Schema: espone la sintassi per definire schemi e
vocabolari per i metadati.
Rappresentazione della conoscenza
[email protected]
RDF (2)
 L'unità base per rappresentare un'informazione in
RDF è lo statement.
Uno statement è una tripla del tipo
Soggetto – Predicato – Oggetto
 il soggetto è una risorsa
 il predicato è una proprietà
 l'oggetto è un valore (e quindi anche un URI che
punta ad un'altra risorsa)
Rappresentazione della conoscenza
[email protected]
Rappresentazione RDF
 Un
modello
RDF
è
rappresentabile
da
un grafo orientato sui cui nodi ci sono risorse o tipi
primitivi e i cui archi rappresentano le proprietà.
 Un grafo RDF è rappresentato fisicamente mediante
una serializzazione:



RDF/XML: documento RDF è serializzato in un file XML.
N-Triples: serializzazione del grafo come un insieme di
triple soggetto - predicato - oggetto.
Notation3: serializzazione del grafo descrivendo, una per
volta, una risorsa e tutte le sue proprietà.
Rappresentazione della conoscenza
[email protected]
Esempio RDF
Lezione
PR/28.10.2011
Lorenzo Di Silvestro
Rappresentazione della conoscenza
[email protected]
Esempio RDF
Lezione
PR/26.10.2011
DSLLNZ28F12C594J
Lorenzo Di Silvestro
[email protected]
Rappresentazione della conoscenza
Catania
[email protected]
RDF/XML
 RDF/XML
è una delle serializzazioni riconosciute
ufficialmente e dotata di una specifica Recommendation
della W3C, oltre ad essere una delle più utilizzate.
 Ogni documento RDF/XML inizia con l’intestazione che
specifica la versione XML del documento e la codifica
utilizzata.
 L’intestazione è poi seguita dalle dichiarazioni dei
prefissi da utilizzare nel documento e quindi i
namespace collegati.
 Gli elementi di RDF sono descritti nel documento
http://www.w3.org/1999/02/22-rdf-syntax-ns# che è
un vocabolario fornito da W3C per descrivere risorse.
Rappresentazione della conoscenza
[email protected]
RDF/XML (2)
 Ogni risorsa è identificata da una URI sia essa una
URN, ed in questo caso la risorsa descritta non è
deferenziabile o una URL (deferenziabile).
 Ogni risorsa è descritta dal tag “<rdf:Description>
</rdf:Description>”

dove rdf rappresenta il prefisso per il dizionario RDF
 Le URI delle risorse vengono indicate specificando
l‟attributo “about” del nodo.
Rappresentazione della conoscenza
[email protected]
Esempio
<rdf:Description
rdf:about="http://www.rdfvoc.it/director/#WesAnderson ">
<rdf:type
rdf:resource="http://www.rdfvoc.it/art/director”/>
</rdf:Description>
<rdf:Seq rdf:ID=“movies"> (oppure Bag o Alt)
<rdf:li
rdf:resource="http://www.rdfvoc.it/movie#darjeeling_li
mited"/>
<rdf:li
rdf:resource="http://www.rdfvoc.it/movie#fantastic_m
r_fox"/>
</rdf:Seq>
Rappresentazione della conoscenza
[email protected]
Entity
<?xml version="1.0"?>
<!DOCTYPE rdf:RDF [ <!ENTITY movie
"http://www.rdfvoc.it/movie#"> ]>
<rdf:Seq rdf:ID=“movies"> (oppure Bag o Alt)
<rdf:li rdf:resource=“&movie;darjeeling_li
mited"/>
<rdf:li rdf:resource=“&movie;fantastic_m
r_fox"/>
</rdf:Seq>
Rappresentazione della conoscenza
[email protected]
Proprietà RDF
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdfsyntax-ns#"
xmlns:dir="http://description.org/schema/">
<rdf:Description
about="http://www.imdb.com/Hotel_Cevalier/">
<dir:director>Wes_Anderson</dir:director>
</rdf:Description>
</rdf:RDF>
Rappresentazione della conoscenza
[email protected]
Proprietà
 Il data model RDF permette di definire un modello
semplice per descrivere le relazioni tra le risorse, in
termini di proprietà identificate da un nome e
relativi valori.
 Tuttavia, RDF data model non fornisce nessun
meccanismo per dichiarare queste proprietà, né per
definire le relazioni tra queste proprietà ed altre
risorse.
Rappresentazione della conoscenza
[email protected]
RDF Schema
 RDF Schema permette di definire dei vocabolari,
quindi l’ insieme delle proprietà semantiche
individuato da una particolare comunità.
 RDFSchema
permette di definire significato,
caratteristiche e relazioni di un insieme di proprietà,
compresi eventuali vincoli sul dominio e sui valori
delle singole proprietà.
 Inoltre, implementando il concetto (transitivo) di
classe e sottoclasse,consente di definire gerarchie di
classi.
Rappresentazione della conoscenza
[email protected]
Classi
RDF Classi:
Ogni risorsa descritta in RDF è istanza della classe
rdfs:Resource.
Le sottoclassi di rdfs:Resource sono:
rdfs:Literal - Rappresenta un letterale, una stringa
di testo.
rdfs:Property - Rappresenta le proprietà.
rdf:Class - Una classe dei linguaggi object-oriented.
Rappresentazione della conoscenza
[email protected]
Proprietà
RDF Proprietà:
rdf:type - Indica che una risorsa è del tipo della classe che
viene specificata.
rdfs:subClassOf - Indica la relazione classe/sottoclasse fra
due classi.
L'ereditarietà può essere multipla.
rdfs:subPropertyOf - Indica che una proprietà è
specializzazione di un'altra.
rdfs:seeAlso - Specifica che la risorsa è anche descritta in
altre parti.
rdfs:isDefinedBy - Indica la risorsa "soggetto
dell'asserzione" ovvero chi ha fatto l'asserzione.
Rappresentazione della conoscenza
[email protected]
Vincoli
RDF Vincoli:
rdfs:range (codominio) - È utilizzato come proprietà
di una risorsa; indica le classi che faranno parte di una
asserzione con la proprietà.
rdfs:domain(dominio) - Indica la classe a cui può
essere applicata la proprietà.
Rappresentazione della conoscenza
[email protected]
Proprietà - esempio
<rdf:Description rdf:ID="Animale">
<rdf:type
rdf:resource="http://www.w3.org/2000/01
/rdf-schema#Class"/>
</rdf:Description>
<rdf:Description rdf:ID="gatto">
<rdf:type
rdf:resource="http://www.w3.org/2000/01
/rdf-schema#Class"/>
<rdfs:subClassOf rdf:resource="#Animale"/>
</rdf:Description>
Rappresentazione della conoscenza
[email protected]
Oltre RDFS
 Nonostante RDFS sia in grado di raggiungere un
elevato livello di espressività, il linguaggio è carente
di alcuni strumenti necessari per rappresentare
schemi e vocabolari più complessi.
 In conseguenza di ciò, il W3C ha promosso la
standardizzazione di Ontology Web Language che
presenta una maggiore espressività rispetto a RDFS.
Rappresentazione della conoscenza
[email protected]
Organizzazione della conoscenza
KOS
Knolowdge Organization System
Ontologie
Thesauri
Tassonomie
Rappresentazione della conoscenza
Schemi di
classificazione
[email protected]
Relazioni in un thesaurus
 BT sta per Broader Term ed indica un termine
generale, ovvero posto gerarchicamente più in alto
 NT sta per Narrower Term ed indica un più
specifico, ovvero posto gerarchicamente più in basso
 RT sta per Releated Term ed indica un termine
collegato
Rappresentazione della conoscenza
[email protected]
SKOS
 Simple
 Knowledge
 Organization
 System
Labels:
 preferred label: usate come descrittore
 alternative labels: sinonimi, abbreviazioni, acronimi
 hidden labels: usate internamente dal sistema
Rappresentazione della conoscenza
[email protected]
Etichette e URI
 Sia i concetti che gli schemi concettuali sono identificati
utilizzando URI.
 Il concetto può essere etichettato in una qualsiasi lingua
e può essere correlato a più etichette, ma per ogni lingua
solo una etichetta può essere segnata come etichetta
preferita (prefLabel).
 Le restanti etichette sono note come etichette alternative
(altLabel).
 Inoltre possono essere definite anche delle etichette
nascoste (hiddenLabel) in modo da poter assegnare ad
un concetto delle etichette non visibili dagli utenti ma
che vengono utilizzate nella ricerca e nei processi di
indicizzazione.
Rappresentazione della conoscenza
[email protected]
Relazioni semantiche
Broader e Narrower
 Sono relazioni inverse
 Non sono transitive!
 Ma lo sono
broaderTransitive
 narrowerTransitive

Related
 Proprietà simmetrica
 Non transitiva
Rappresentazione della conoscenza
[email protected]
Skos
Rappresentazione della conoscenza
[email protected]
Skos
Rappresentazione della conoscenza
[email protected]
OWL
 Ontology Web Language (OWL) è un linguaggio
di markup per rappresentare esplicitamente
significato e semantica di termini con vocabolari e
relazioni tra gli stessi.
 Lo scopo di OWL è descrivere delle basi di
conoscenza, effettuare delle deduzioni su di esse e
integrarle con i contenuti delle pagine web.
 La rappresentazione dei termini e delle relative
relazioni è chiamata ontologia.
Rappresentazione della conoscenza
[email protected]
Ontologia
 Rappresentazione formale, condivisa ed esplicita di
una concettualizzazione di un dominio di interesse.
 Teoria assiomatica del primo ordine esprimibile in
una logica descrittiva.
 Applicate nel campo dell'intelligenza artificiale,
nella rappresentazione e condivisione della
conoscenza.
 Ragionamento deduttivo, classificazione, tecniche
di problem solving
Rappresentazione della conoscenza
[email protected]
Esempio OWL-DL
Class(MangiatoreNotturnoDiNutella complete
Persona
restriction(partecipaA
someValuesFrom(intersectionOf
Spuntino
restriction(haPartecipante
someValuesFrom(Nutella))
restriction(haData cardinality=1(xsd:Date))
restriction(haPeriodo oneOf(notte))))
Rappresentazione della conoscenza
[email protected]
Esempio OWL-DL (2)
Letteralmente, la definizione dei mangiatori notturni
di nutella si interpreta come segue:
 un mangiatore notturno di nutella equivale
(“complete”) a una persona che (“restriction”)
 partecipa ad almeno uno (“someValuesFrom”)
spuntino
 a cui (“intersectionOf ”) partecipa almeno una
(“someValuesFrom”) quantità di nutella
 a una certa data specifica (“cardinality=1”),
esclusivamente (“oneOf ”) di notte.
Rappresentazione della conoscenza
[email protected]
Esempio OWL-DL (3)
Adesso possiamo costruire la nostra base di conoscenza:
Individual(4_12_2004
type(xsd:Date))
Individual(spuntino_notte_4-12-2004
type(Spuntino)
value(haPartecipante nutella_150g_codiceBarattolo_xxx)
value(haPartecipante Giovanni)
value(haData 4_12_2004)
value(haPeriodo notte))
Individual(Giovanni
type(MangiatoreNotturnoDiNutella)
value(partecipaA spuntino_notte_4-12-2004))
Rappresentazione della conoscenza
[email protected]
Linked Data
 L'obiettivo del progetto Linking Open Data del W3C è di
estendere il Web pubblicando diversi
open dataset come RDF sul Web e impostando link RDF
tra i dati da differenti risorse.
 Nell'Ottobre del 2007, i dataset contenevano più di due
miliardi di triple RDF, collegate da più di due milioni di
link RDF.
 Da Maggio 2009 sono cresciuti a 4,2 miliardi di triple
RDF, collegate da circa 142 milioni di link RDF.
 Esiste anche una visualizzazione interattiva dei dati
attraverso cui è possibile navigare.
Rappresentazione della conoscenza
[email protected]
Rappresentazione della conoscenza
[email protected]
Tassonomie
 L’induzione di tassonomie da testi è oggetto di
notevole interesse, tale processo prevede lo
sviluppo di sistemi finalizzati all’inferenza di
regole e assiomi da testo.
 L’apprendimento
automatico
procede
attraverso l’utilizzo di metodologie per
l’acquisizione di conoscenza alle quali
corrispondono
algoritmi
di
complessità
crescente, il cui stato dell’arte è lontano
dall’avere trovato una soluzione definitiva.
Rappresentazione della conoscenza
[email protected]
Fasi dell’induzione automatica
 Estrazione automatica di terminologia
 Riconoscimento dei sinonimi, in genere effettuato
utilizzando
la
misura
distribuzionale (Dagan, 2000)
della
similitudine
 Popolazione della base di conoscenza per cui è
possibile utilizzare tecnologie basate su bootstrap da
esempi (Fleischman e Hovy, 2002) o metodolgie
basate sul riconoscimento della similitudine
distribuzionale (Cimiano e Völker, 2005)
 Sviluppo di sistemi finalizzati all’inferenza di regole e
assiomi da testo
Rappresentazione della conoscenza
[email protected]
Problematiche
 Questo
campo è stato ancora scarsamente
esplorato, ma sta divenendo oggetto di crescente
interesse in letteratura, in quanto l’acquisizione
di regole di inferenza è certamente un aspetto
fondamentale
legato
al
riconoscimento
dell’implicazione nel testo (Dagan et al., 2005)
 L’identificazione di tali proprietà è di importanza
cruciale per attivare processi di ragionamento
automatico
Rappresentazione della conoscenza
[email protected]