LOGICA, KR e INTELLIGENZA ARTIFICIALE Matteo Palmonari, Alessandro Mosca Matteo.palmonari;[email protected] DISCo - Università di Milano-Bicocca Intelligenza e computazione ► ► Diversi modelli di intelligenza... filosofia, psicologia... Una tradizione... Intelligenza come calcolo. Mente vs. Comportamento vs. Fisiologia: funzionalismo cognitivista vs comportamentismo e fisiologia ►Approccio Che cos’è un calcolo? Alan Turing: una nozione formale di algoritmo: la Macchina di Turing formale allo studio della mente come manipolazione di simboli. Se l’intelligenza è manipolare simboli, una macchina può pensare? ►Un Agente Intelligente secondo questo approccio ha una descrizione simbolica del mondo e delle regole per “manipolare” questi simboli. Intelligenza Artificiale ... da questo punto di vista ► Uno studio empirico delle attività cognitive umane (modelli psicologici computrazionali). ► Una ricerca sugli strumenti di rappresentazione. Linguaggi, tecniche e modelli computazionali KR (Rappresentazione della conoscenza). ► Una disciplina ingegneristica; svolgimento di compiti complesso sulla base di tali modelli. Conoscenza, Rappresentazione e Ragionamento ► La conoscenza è connessa alla nozione di verità E.g. John sa(crede?) che oggi non piova ► Rappresentazione... “representation is a relationship between two domains, where the first is meant to “stand for”, or take place of the second. (...) Usually the first domain, the representor, is more conrete, immediate, or accessible in some way of the second” Cioò che “sta per” sono i SIMBOLI ► Ragionamento: manipolazione formale di simboli che rappresentano un insieme di proposizioni ritenute vere (rappresentazioni), affinchè vengano prodotte nuove rappresentazioni Una teoria della mente rappresentazionale ► Le rappresentazioni sono di tipo simbolico. The Phisical Symbolic System Hypothesis A phisical symbolic system has necessary and sufficient instruments to perform general intelligent actions. [Newell, Simon] 1. Simboli primitivi (atomi); 2. Strutture complesse; 3. Regole di Trasformazione dei simboli e delle strutture complesse; 4. Denotazione dei simboli. ... La disciplina della Rappresentazione della Conoscenza. Ogni sistema “intelligente” deve incorporare un insieme di strutture tali che: 1) 2) Queste strutture, viste da un osservatore esterno al sistema, possano essere interpretate come rappresentazione della conoscenza di cui il sistema dispone; Indipendentemente da tale attribuzione semantica, tali strutture devono poter essere manipolabili formalmente, in modo da poter giocare un ruolo causale nel determinare il comportamento del sistema. [The Knowledge Representation Hypothesis - Brian Smith, Prologue to “Reflection and Semantics in a Procedural Language”, 1982] Il fine di un sistema di rappresentazione della conoscenza è individuare strutture simboliche e meccanismi di inferenza appropriati sia per rispondere a domande che per acquisire nuove informazioni, in accordo con la teoria della verità del linguaggio di rappresentazione sottostante. [R. Brachman e H. Levesque, Readings in Knowledge Representation, 1985] IA, linguaggio e rappresentazione Intelligenza: Significato Concetti/mondo: la rappresentazione Concetti/concetti: inferenza Lingua […] Esperienza, percezione Rappresentare la conoscenza Conoscenza “Artificiale”? Macchine e meccanismi… la nozione di procedura meccanica Automatizzare le procedure con cui da conoscenza si ottiene conosceza (INFERENZA)Mondo IA, linguaggio e rappresentazione Significato Lingua Esperienza, percezione Conoscenza Mondo Il fine di un sistema di rappresentazione della conoscenza è individuare strutture simboliche e meccanismi di inferenza appropriati sia per rispondere a domande che per acquisire nuove informazioni, in accordo con la teoria della verità del linguaggio di rappresentazione sottostante. [R. Brachman e H. Levesque, Readings in Knowledge Representation, 1985] Alcune inferenze 1. Mario è un architetto oppure è un geometra. Se Mario fosse architetto, allora Mario sarebbe laureato. Mario non è laureato. Quindi: Mario è un geometra . 2. Diego Armando Maradona è siciliano. Tutti i siciliani sono giardinieri. Quindi: Diego Armando Maradona è giardiniere. 3. Tutti i cigni osservati sinora in Europa sono bianchi. Tutti i cigni osservati sinora in Nord America sono bianchi. Tutti i cigni osservati sinora in Sud America sono bianchi […] Non sono mai stati osservati cigni che non fossero bianchi. Quindi: Tutti i cigni sono bianchi. 4. L’assassino ha sporcato di fango il tappeto. Chiunque fosse entrato dal giradino avrebbe sporcato di fango il tappeto. Quindi: L’assassino è entrato dal giardino. 5. Gli uccelli, salvo eccezioni, sono in grado di volare. Titti è un uccello. Quindi: Titti è in grado di volare. Perchè la Logica come sistema simbolico... 1) La Logica è Formal (e quanto più generale possibile). 2) La Logica è Mathematical. 3) La Logica è Symbolic (sintassi, semantica). 4) La Logica ha un Calculus (corretto e completo). ... La Logica è Rappresentazione della Conoscenza. La Logica ► Sintassi formule corrette ► Semantica Interpretazione dei simboli, concetto di verità ► Inferenze Tautologie e conseguenze logiche (semantica) Derivabilità (sintassi) ► Espressività: Logica Proposizionale Logica Predicativa First Order Logic (FOL) Costituenti “logici” del linguaggio, Costituenti “extra-logici” del linguaggio, Alcune espressioni Termini Formule Atomiche Formule ben formate Logica e modelli: cos’è un modello? Scegliere un linguaggio: • una sintassi • una semantica Problemi: Espressività (cosa posso rappresentare?) Reasoning (cosa ci faccio?) Logica come strumento di modellazione! Intensione/Estensione Linguaggi formali per rappresentare la conoscenza: Cosa rappresentare? Linguaggio (L) Concetti Predicati unari P(x) Relazioni Predicati binari, ternari ... R(x,y), R(x,y,z) inferenza Semantica (M) Semantica standard su base insiemistica: Concetti Insiemi Relazioni Insiemi di n-uple Rappresentazione ESTENSIONALE! Statica... Conoscenza sulla realtà Intensione/Estensione Linguaggi formali per rappresentare la conoscenza: Cosa rappresentare? Linguaggio (L) Concetti Predicati unari P(x) Relazioni Predicati binari, terziari ... R(x,y), R(x,y,z) Semantica (M) Semantica standard su base insiemistica: Concetti Insiemi Relazioni Insiemi di n-uple Rappresentazione ESTENSIONALE! Statica... Conoscenza Intensione/Estensione Quello che interessa dal punto di vista della possibilità di fare inferenza è una caratterizzazione della rappresentazione che tratti concetti e relazioni indipendentemente dagli oggetti che nella circostanza specifica entrano a darne la definizione estensionale. INTENSIONE di concetti e relazioni: Linguaggio (L) Proprietà formali di alto livello Necessità di un linguaggio per definirle E.g. IN è transitiva E.g. Inferire IN(x,z) Da: IN(x,y) + IN(y,z) inferenza Semantica (M) Conoscenza Intensione e inferenza Proprietà di alto livello (aspetti intensionali di una base di conoscenza) 1. Coinvolgono una sola relazione: e.g. simmetria: R( x, y) → R( y, x) 2. Coinvolgono più concetti/relazioni: a - Interdipendenze e interdefinizioni tra relazioni N ( x, y)∧E ( x, y) ↔ NE( x, y) N ( x, y)∧IN ( z, y) → N ( x, z ) e.g. Nord Est = Nord ∩ Est e.g. ? b - Relazioni tra concetti e.g. FiguraGeometrica e Triangolo... Triangolo( x) → FigGeometrica( x) 1- Inferenza: proprietà delle relazioni 1 – Proprietà delle relazioni e.g. IN: Transitività... IN(a,b); IN(b,d); IN(d,e); IN(e,c) a a b c 1 f 1 f IN ( x, y) ∧ IN ( y, z ) → IN ( x, z ) Assioma di L 1 c e e 1 b d d 1- Inferenza: proprietà delle relazioni IN: Transitività... IN(a,b); IN(b,d); IN(d,e); IN(e,c) a b c d e a 1 1 1 1 b 1 1 1 c d e f f Altre proprietà? e.g. antisimmetria? Più proprietà? (coerenza?) e.g. antisim + rifl + trans? 1 1 1 antisim + irrifl + trans ⇝⊥ Relazioni tra concetti Figura geometrica e.g. FiguraGeometrica e Triangolo... Triangolo Sfera Triangolo IS-A FigGeometrica Triangolo( x) → FigGeometrica( x) Triangolo è sussunto da FigGeometrica ? Triangolo eredita le proprietà di FigGeometrica ? haPerimetro(x) ∃(y ).FigGeometrica( y) ∧Perimetro( y) ∧PartOf ( y, x) ... Da 1.a: N ( x, y)∧E ( x, y) ← NE( x, y) NordEst IS-A Nord ??? ... Qualche problema... Problemi con FOL e la programmazione logica ► FOL è indecidibile Sottoinsiemi decidibili : Clausole di Horn - Prolog Limiti di espressività ► Esplosione combinatoria La complessità di una dimostrazione cresce esponenzialmente rispetto alla lunghezza della formula Euristiche, raffinamento degli algoritmi di ricerca Logicisti vs. Anti-logicisti nell’IA simbolica ► Una lunga disputa: ’60 ’80 ► Approccio logico: McCarthy, McDermott, R.C. Moore, Reiter, Kowalsky ► Approcci anti-logici : Minsky, Simon, Newell Anti-logicisti: considerazioni generali ► Minsky Il ragionamento logico non è abbastanza flessibile. La Conoscenza non consiste in un insieme di proposizioni atomiche più un insieme di regole di inferenza: è molto più strutturata. Un approccio puramente dichiarativo è discutibile: rilevanza delle descrizioni procedurali. ► Shank e Rieger “Dimostrazione” logica (concetto formale) Vs Inferenza come processo psicologico (magari scorretto, guidato da associazioni) Anti-logicisti: tre punti ► Concetti definiti (logica condizioni necessarie e/o sufficienti) vs prototipi (oggetti normali con valori di defaut). inferenze umane sono sistematicamente incorrette da un punto di vista logico. Il ragionamento del senso comune non segue regole logiche. ► Le ► La memoria è strutturata in maniera più complessa che in teorie logiche (assiomi): vicinanza semantica (e.g. Cometa/Natale). Logicisti: tre punti ►I formalismi per la rappresentazione della conoscenza (KR) necessitano di una semantica adeguata per garantire la preservazione della correttezza (specialmente per programmi lunghi e complessi). dell’espressione vs livello dell’implementazione [P. Hayes]. ► Livello Logica al livello dell’espressione: giustificazione delle inferenze. ► Logiche per modellare il ragionamento del senso comune. Estendere e modificare la logica matematica. Riassumendo ► La Logica è estremamente generale e non necessita di assunzioni ontologiche [Moore]. ► Rappresentazione in termini di individui, relazioni e funzioni praticamente ogni dominio. Differenti risposte Flessibilità Approcci basati sull’ analisi numerica Approcci più vicini alla logica classica Incertezza Incompletezza delle informazioni Logiche Fuzzy e della probabilità, reti neurali e algoritmi genetici Approcci differenti: Elemento comune non monotonia LOGICHE NON MONOTONE Ragionamento del senso comune ► Inferenze sulla base di informazioni incomplete Non abbiamo bisogno di conoscere tutti i dettagli di una situazione per trarre ragionevolmente molte inferenze ► Incertezza Queste inferenze posso non essere così certe come le inferenze in matematica ► Flessibilità La base di conoscenza cambia. Nuovi fatti sono aggiunti La logica è classicamente monotona Il ragionamento del senso comune è NONMONOTONO! Bibliografia [1] Stuart Russell, Peter Norvig, Artificial Intelligence. A modern Approach, Prentice Hall, New Jersey, 1995. [2] Michael R. Genesereth, Nils J. Nilsson, Logical Foundations of Artificial Intelligence, Morgan Kaufmann Publishers Inc., California, 1987. [3] Corrado Mangione e Silvio Bozzi, Storia della Logica. Da Boole ai giorni nostri, Garzanti, Milano, 1993. [4] Maurizio Negri, Elementi di Logica, LED - Edizioni Universitarie di Lettere, Economia, Diritto, Milano, 1994. [5] John McCarthy e Patrick J. Hayes, Some Philosophical Problems from the Standpoint of Artificial Intelligence, Computer Science Department, Stanford University, Stanford, 1969. [6] John McCarthy, Epistemological Problems of Artificial Intelligence, Computer Science Department, Stanford University, Stanford, 1977. [7] Randall Davis, Howard Shrobe e Peter Szolovits, What is a Knowledge Representation?, Artificial Intelligence Laboratory and Laboratory for Computer Science at MIT, published by AI Magazine, 14(1):17-33, 1993. [8] Robert Kowalski, The limitations of Logic, Department of Computing, Imperial College, London. An earlier version of this paper was presented at the Workshop on Knowledge Base Management System, Creta, Giugno 1985 [published by Springler Verlag]. [9] Frixione, M. (1994), Logica, Significato e Intelligenza Artificiale. - Milano: Francoangeli. [10] J. Cheng, Logical Tool of Knowledge Engineering: Using Entailment Logic rather than Mathematical Logic, Depertment of Computer Science and Communication Engineering, Kyushu University, Fukuoka, Japan, 1991. Bibliografia (logiche non monotone) NONMONOTONIC REASONING [11] BREWKA, G. (1991), Nonmonotonic Reasoning: Logical Foundations of Commonsense. Cambridge: Cambridge University Press. [12] BREWKA, G., DIX, J. AND KONOLIGE, K. (1997), Non Monotonic Reasoning: An Overview. - Stanford: Center For The Study Of Language And Information. [13] FISHER SERVI, G. (2001), Quando l'eccezione è la regola: le logiche non monotone. Milano: McGraw-Hill. [14] GABBAY, D.M., HOGGER, C.J. e ROBINSON, J.A. (a cura di) (1993 e 1994), Handbook of Logic in Artificial Intelligence and Logic Programming, Vol. III: Non Monotonic and Uncertain Reasoning. - Oxford. La possibilità di costruire sistemi logici diversi mostra che la logica non è ristretta alla riproduzione dei fatti, ma è un libero prodotto dell’uomo come un’opera d’arte. Jan Łukasiewicz