Complementi di Logica Modale Umberto Grandi 17 Maggio 2008 1 Completezza 1.1 Livelli di interpretazione semantica Per fissare la notazione e prendere confidenza con le strutture di Kripke (i modelli in logica modale) può essere utile indagare più a fondo l’interpretazione delle formule. Fissato un insieme di variabili proposizionali V ar, una formula ben formata è ottenuta da esse tramite connettivi booleani e operatore 2. L’operatore 3ψ è definito come ¬2¬ψ. Ricordiamo inoltre che un modello è composto da una struttura relazionale (che chiameremo frame) F =< W, R > e da una funzione V che ad ogni ”mondo” associa una valutazione delle variabili proposizionali in questione: V : W × V ar → {0, 1}. Seguendo le regole di interpretazione la valutazione si estende a una valutazione V̂ su tutte le formule ben formate. Dato un modello M =< W, R, V >, la ”verità” di una formula ϕ può essere considerata a diversi livelli: • ϕ è vera nello stato w, e scriviamo M, w |= ϕ, se V̂ (w)(ϕ) = 1; • ϕ è globalmente vera in M, e scriviamo M |= ϕ, se M, w |= ϕ per ogni w ∈ W ; • ϕ è valida sul frame F, e scriviamo F |= ϕ, se ϕ è globalmente vera su ogni modello basato sul frame F, dunque vera in ogni stato di ogni modello su F. Soltanto quest’ultimo concetto permetterà di ottenere dei teoremi di completezza per logiche modali. Il collegamento tra sintattica e semantica avviene dunque al livello dei frame, non dei modelli. 1.2 Correttezza Data una logica Λ, richiedere che sia corretta rispetto ai suoi modelli significa richiedere che tutte le sue conseguenze continuino a valere su questa classe, che dunque le regole di deduzione dei teoremi preservino la ”verità”. Per le 1 logiche modali, come anticipato, nel ruolo dei modelli ci sono i frame e la verità viene impersonata dalla validità: Λ è corretta rispetto alla classe di frame F sse ⊢Λ ϕ ⇒ F |= ϕ per ogni F ∈ F. C’è un motivo per cui K è la più piccola logica modale: Lemma 1.1. K è valido su tutti i frame. Questo fatto e il seguente lemma permettono di dimostrare la correttezza delle principali logiche modali. Il lemma afferma: ”dato K il ragionamento modale è corretto”. Lemma 1.2. Sia Γ un insieme di formule ben formate ed F un frame su cui sono valide tutte le formule di Γ. Ogni teorema di K ∪ Γ è valido su F. Dimostrazione. Per induzione sulle dimostrazioni: se α ∈ K ∪ Γ allora è valido in F per ipotesi. Se è ottenuta per modus ponens da β e β → γ (valide per ipotesi in tutto il modello) allora β è valida per le regole di V̂ . Se è ottenuta per sostituzione α = β[p1 /β1 , . . . pn βn ], per ipotesi β era vera per ogni assegnamento, dunque α rimane valida. Infine il caso di α = 2β ottenuta per necessitazione. ¬α implica l’esistenza di un mondo dove β sia falsa, ma per ipotesi induttivaβ è verificata in tutto il frame, e dunque lo è anche α. Per ottenere la correttezza di Λ sarà dunque sufficiente controllare la validità dei suoi assiomi su una certa classe di frame; per il lemma appena dimostrato tutte i teoremi di Λ saranno automaticamente validi. Mostriamo per esempio che: Proposizione 1.1. S5 è corretta rispetto ai frame riflessivi, simmetrici e transitivi (frame dove R è una relazione di equivalenza). Dimostrazione. Basta dimostrare che gli assiomi di S5 sono validi su questi frame. L’assioma T: 2p → p è valido poichè essendo il frame riflessivo, Rww vale per ogni w ∈ W e dunque se M, w |= 2p allora M, w |= p. Per S5: 3p → 23p vediamo che se M, w |= 3p allora esiste w′ tale che M, w′ |= p. Ora per transitività e simmetria ogni mondo con cui il primo w è in relazione può vedere w′ , dunque vale che M, w′′ |= 3p per ogni w′′ in relazione con w e cosı̀ M, w |= 23p. Allo stesso modo si dimostra che T è corretto rispetto ai frame riflessivi, S4 è corretto rispetto ai frame riflessivi e simmetrici, D rispetto a quelli senza ”vicoli ciechi”. Ovviamente K è corretta rispetto alla classe di tutti i frame. 2 1.3 Completezza Data una classe di modelli si può generalmente definire la nozione di conseguenza logica, scrivendo che ϕ segue logicamente da ψ se in ogni modello in cui vale ψ vale anche ϕ. Nel nostro caso, data una classe F di frame, scriveremo ψ |=F ϕ per indicare che per ogni F ∈ F F |= ψ ⇒ F |= ϕ. Quello che si richiede con la completezza1 di una logica Λ rispetto a una classe F di frames è che: ψ |=F ϕ ⇒⊢Λ ψ → ϕ ossia che conseguenza logica e conseguenza sintattica coincidano (la freccia inversa è data dalla correttezza). In realtà dimostreremo un enunciato analogo2 : ”se ϕ è vera in ogni frame di F allora ϕ è dimostrabile da Λ. Il metodo utilizzato non funziona per tutte le logiche modali, ma risulta essere portentoso in molti casi. Fortunatamente per quelle fin qui menzionate il questo metodo detto del modello canonico funziona perfettamente. Tutto sta nel costruire un modello3 che chiameremo McΛ (modello, non frame) in cui le formule globalmente vere sono tutte e sole quelle dimostrabili. Una volta dimostrato poi che il modello canonico appartiene alla classe ”giusta” di frame, quella su cui Λ è corretta, si ottiene la completezza: se ϕ è valida su tutti i frame di F, in particolare sarà valida sul frame del modello canonico, dunque globalmente vera sullo stesso McΛ , e cosı̀ dimostrabile. Le formule stesse saranno i mattoni per costruire questo modello (è un idea ricorrente), o meglio sottoinsiemi di formule ben formate. Definiamo che un insieme di formule Γ è Λ-inconsistente se esistono γ1 . . . γn ∈ Γ tali che ⊢Λ ¬(γ1 ∧ · · · ∧ γn ), Λ-consistente altrimenti. Γ è Λ-consistente massimale se è massimale rispetto all’inclusione. Le proprietà fondamentali di questi insiemi sono elencate nel seguente lemma (di facile dimostrazione): Lemma 1.3. Se Γ è Λ-consistente massimale allora: (i) per ogni formula ben formata β, o β ∈ Γ o ¬β ∈ Γ; (ii) α ∨ β ∈ Γ ⇒ α ∈ Γ oppure β ∈ Γ; (iii) α ∧ β ∈ Γ ⇒ α ∈ Γ e β ∈ Γ; (iv) Γ è chiuso per modus ponens. Dimostrazione. Basta usare la definizione, e qualche tautologia. 1 debole; verrà in realtà dimostrata anche la completezza forte o compattezza, che sostituisce a ψ un qualsiasi insieme di formule ben formate. Inserire la distinzione avrebbe reso troppo pesante la trattazione. Per maggiori dettagli vedere [2]. 2 che corrisponde al precedente con al posto di ψ una tautologia 3 Sarà data soltanto un idea delle dimostrazioni, una trattazione in dettaglio si può trovare su [5] o su [2]. 3 Non abbiamo ancora dimostrato l’esistenza di un insieme Λ-massimale consistente, dimostriamo allora un lemma molto più forte: Lemma 1.4 (Lindenbaum). Ogni insieme Λ-consistente può essere esteso a un insieme Λ-consistente massimale. Dimostrazione. Sia Γ un insieme Λ-consistente, è sufficiente considerare la famiglia di Σ sottoinsiemi di fbf {Σ/Γ ⊆ Σ, Σ Λ-consistente}, ed applicare il lemma di Zorn. Abbiamo ora tutti gli strumenti necessari per costruire il modello canonico. Sia McΛ =< W c , Rc , V c > dove • W c sia formato da tutti gli insiemi Λ-consistenti massimali di formule; • se indichiamo con 2(w) = {ϕ t.c. 2ϕ ∈ w}, definiamo Rc ww′ per w e w′ in W c sse 2(w) ⊆ w′ . Dunque w è in relazione con w′ se per ogni formula necessitata 2ϕ ∈ w, la sottoformula necessitata sta in w′ , ϕ ∈ w′ . Cerchiamo ora un suggerimento per la valutazione V c , dimostrando il seguente lemma: Lemma 1.5. 3ψ ∈ w ⇒ esiste w′ Λ-consistente massimale tale che ψ ∈ w′ . Dimostrazione. Mostriamo che 2(w) ∪ ψ è Λ-consistente. Se cosı̀ non fosse infatti esisterebbero γ1 . . . γn tali che 2γ1 . . . 2γn ∈ w tali che ⊢Λ ¬(γ1 ∧ . . . γn ∧ ψ) ossia ⊢Λ (γ1 ∧ . . . γn ) → ¬ψ per Nec: ⊢Λ 2((γ1 ∧ . . . γn ) → ¬ψ) per K: ⊢Λ 2(γ1 ∧ . . . γn ) → 2¬ψ per distributività: ⊢Λ (2γ1 ∧ . . . 2γn ) → ¬3ψ) ossia: ⊢Λ ¬(2γ1 ∧ . . . 2γn ) ∨ ¬3ψ) dunque: ⊢Λ ¬(2γ1 ∧ . . . 2γn ∧ 3ψ) ma 3ψ ∈ w e dunque w sarebbe Λ-inconsistente, contro le ipotesi. Sfruttando appieno il suggerimento definiamo V c (w)(p) = 1 sse p ∈ w, per ogni w ∈ W c e per ogni variabile proposizionale p. Si può dimostrare con argomenti simili a quelli appena utilizzati il seguente teorema fondamentale: Teorema 1.1. Per ogni α formula ben formata, V̂ c (w)(α) = 1 ⇔ α ∈ w. Torniamo ora alla proprietà richiesta per la completezza rispetto al modello canonico: ψ valida su McΛ implica che ⊢Λ ψ. Supponiamo che 6⊢Λ ψ, {¬ψ} è Λ-consistente, dunque estendibile per il Lemma di Lindenbaum ad un sottoinsieme Λ-consistente massimale w. Per la 4 definizione di W c , w è un punto del modello canonico, e dato che ¬ψ ∈ w otteniamo McΛ , w |= ¬ψ per il teorema 1.1, contro l’ipotesi di validità di ψ. Resta soltanto da dimostrare che MΛc ∈ F per ottenere la completezza di Λ rispetto a F . Come anticipato ciò non è sempre vero4 , ma risulta dimostrabile per tutti i sistemi modali visti sinora. Mostriamo che McS5 appartiene alla classe di correttezza di S5: c è riflessiva, simmetrica e transitiva. Proposizione 1.2. RS5 Dimostrazione. Dimostriamo soltanto la simmetria. Supponiamo che Rww′ , ossia che 2(w) ⊆ w′ . Se per assurdo 2(w′ ) 6⊆ w, e dunque R non fosse simmetrica, esisterebbe una formula ψ tale che 2ψ ∈ w′ ma ψ 6∈ w. Per la massimalità di w si avrebbe che ¬ψ ∈ w. Ora p → 23p è un teorema di S5 e w è chiuso per MP, dunque 23¬ψ ∈ w. Concludendo, 3¬ψ = ¬2ψ ∈ w′ , mentre avevamo supposto il contrario. Corollario 1.1. S5 è completa rispetto alla classe dei frame < W, R > dove R è una relazione di equivalenza. 4 per esempio se W è 2(2ψ → ψ) → 2ψ, KW non è corretta rispetto al suo modello canonico, cfr. [5] pag.139. 5 2 Decidibilità Una proprietà fondamentale da dimostrare è la decidibilità delle logiche sinora menzionate. Ciò significa determinare se esiste una procedura ”meccanica”, un (non) ben definito algoritmo che decida se una determinata formula è dimostrabile o meno. Sottolineerei o meno, infatti ciò che si sa è che se gli assiomi di una logica sono ”buoni”5 , l’insieme dei suoi teoremi è semidecidibile. La procedura, costosa ma efficace, che permette di verificare se una data formula è un teorema, consiste nell’elencare in ordine di lunghezza tutte le possibili dimostrazioni. Prima o poi quella giusta comparirà nell’elenco. Ciò che invece non è noto a priori è se esiste una procedura terminante per riconoscere i non-teoremi. Uno dei tanti punti di forza della logica modale è che questo algoritmo esiste in generale per K, ma anche per i particolari sistemi finora elencati. La dimostrazione di questo fatto si basa sulla seguente proprietà: si può dimostrare che data una formula ψ tale che 6⊢Λ ψ esiste un modello finito ed uno stato w in cui ψ è falsa (proprietà dei modelli finiti). L’algoritmo cercato è dunque il seguente: si elencano tutte le strutture finite fino a che non se ne trova una invalidante ψ. La procedura ha termine poichè i modelli finiti (se le variabili sono finite6 ) sono numerabili per taglia, dunque la struttura invalidante comparirà nell’elenco dopo un tempo finito. Al pari del modello canonico, anche questa procedura è particolare e dipende dal sistema logico che stiamo considerando. Si può comunque dimostrare che K, T, S4 ed S5 godono della proprietà dei modelli finiti e sono dunque decidibili. 3 La conoscenza secondo S5 Spesso S5 viene chiamata col nome più espressivo di logica epistemica, stante ad indicare la sua interpretazione come buon candidato alla modellizzazione della conoscenza. Non discuteremo qui le motivazioni a supporto di quest’interpretazione, ampiamente discusse nella letteratura a partire dall’iniziale lavoro di Hintikka [4]. Piuttosto, esamineremo in dettaglio un esempio di come S5 possa caratterizzare la conoscenza7 . 5 leggere primitivi ricorsivi. Se le variabili sono infinite possiamo restringerci alle variabili di ψ, visto che siamo interessati soltanto ad invalidare quella formula. 7 Le idee di questa sezione sono prese da [3] 6 6 Una struttura molto utilizzata in teoria della scelta o in teoria dei giochi come modello per l’informazione e la conoscenza di un agente è la seguente. Siano dati un insieme Ω e una partizione P su Ω. Ad ogni elemento w in Ω possiamo associare l’unico elemento della partizione a cui appartiene, che denoteremo con P(w). Se si considera l’insieme Ω come costituito dall’insieme dei mondi, la partizione P associa ad ogni mondo un sottoinsieme di mondi, diciamo quelli considerati ”possibili”. Si supponga di essere di essere nel mondo w, P(w) indica che è a conoscenza di essere in uno dei mondi in P(w) ma non si sa qual’è. P è detta infatti funzione di informazione, dato che associa ad ogni mondo l’informazione (la disinformazione in realtà) sulla propria posizione. Come si può dedurre è un modello molto generale e adatto a una gran varietà di situazioni. Viene detto evento ogni sottoinsieme di Ω (identificando un evento con l’insieme dei mondi in cui accade). Possiamo definire sullo spazio degli eventi una funzione conoscenza K, che associ ad un evento E l’evento K(E) = {w ∈ Ω/P(w) ⊆ E}. L’evento immagine tramite K è l’insieme dei mondi in cui siamo a conoscenza dell’evento E, in cui ”sappiamo” E: in qualsiasi stato pensiamo di essere (qualsiasi in P(w) dunque) E accade (P (w) ⊆ E). Possiamo pensare ad una situazione pratica in cui si sia in una stanza all’interno di un grosso albergo, e grazie ad un gioco di specchi si possa vedere un numero imprecisato di altre stanze, senza però capire in quale si è per davvero. Si potranno dare delle descrizioni: ”c’è un tavolino”, ”c’è la moquette”, ”l’abat-jour è accesa”; ed applicarle come delle etichette alle stanze che si vedono. L’unico modo per esser certi che nella stanza in cui sono veramente l’abat-jour è accesa o meno, è che questa sia accesa in tutte le stanze a cui ho accesso. Soltanto in queste stanze sarà vero che ”so” che ”l’abat-jour è accesa”. Diamo ora una assiomatizzazione particolarmente espressiva di S5. Per renderla ancora più espressiva scriveremo K al posto di 2 e leggeremo ”l’agente sa ψ” invece che ”ψ è necessario”: • K: K(ψ → ϕ) → (Kψ → Kϕ). Se lo si legge sembra affermare che che l’agente è intelligente. • T: Kψ → ψ. L’agente sa soltanto cose vere. • S4: Kψ → KKψ. Se l’agente sa ψ allora sa di saperlo. • S5: ¬Kψ → K¬Kψ. Sa di non sapere. Questa, oltre che essere un assiomatizzazione perfettamente equivalente di S5 (è stato soltanto cambiato qualche nome), è anche una lista di proprietà piuttosto ragionevoli per caratterizzare il comportamento di un agente razionale rispetto alla propria conoscenza. 7 Torniamo alle strutture di Aumann (si possono chiamare cosı̀) esposte all’inizio di questa sezione. Abbiamo un insieme Ω di mondi, una partizione P, e una serie di ”etichette” applicate agli elementi di Ω. È immediato associare ad essa una struttura di Kripke, considerando Ω come l’insieme dei mondi, e definendo R come la relazione di equivalenza determinata dalla partizione P. Se poi consideriamo le etichette, le proprietà dei mondi, come variabili, possiamo costruire una valutazione V . V assegnerà valore 1 alla variabie p se in quel mondo vale la proprietà p, se quel mondo ha l’etichetta p, e zero altrimenti. Abbiamo visto che la valutazione si può estendere a tutte le formule ben formate, comprese quelle contenenti il 2 che nel nostro caso è proprio la conoscenza K. È facile mostrare che l’estensione è coerente anche rispetto a K, la funzione conoscenza (che non a caso era definita in termini di P). Si associ infatti ad ogni formula ψ l’insieme ψ Ω dei mondi in cui la formula è vera: ψ Ω = {w ∈ Ω t.cV (w)(ψ) = 1}. Sorprendentemente si ottiene K(ψ Ω ) = (Kψ)Ω ): l’insieme dove l’agente ”sa” ψ è esattamente l’insieme dei mondi dove vale K(ψ). Non è tutto, la completezza di S5 dimostrata nelle precedenti sezioni ci fornisce un risultato potentissimo: tutto quello che possiamo dire (con formule modali) sulla conoscenza (di un agente razionale con le proprietà sopraelencate) è dimostrato da S5. Un ulteriore argomento portato in [1] a favore di questa interpretazione riguarda il modello canonico. Il modello canonico di S5 rappresenta infatti esattamente l’insieme dei mondi possibili per un agente con un determinato vocabolario (le etichette). Gli insiemi di formule consistenti massimali sono esattamente tutti i possibili mondi che si può immaginare con il linguaggio a sua disposizione. Riferimenti bibliografici [1] R.J. Aumann. Interactive epistemology i: Knowledge. International Journal of Game Theory, (28):263–300, 1999. [2] P. Blackburn, M. de Rijke, and Y. Venema. Modal Logic. Cambridge University Press, 2001. [3] R. Fagin, J.Y. Halpern, Y.Moses, and M.Y. Vardi. Reasoning About Knowledge. MIT Press, 1995. [4] J. Hintikka. Knowledge and Belief. Cornell University Press, 1962. [5] G.E. Huges and M.J. Cresswell. A New Introduction to Modal Logic. Routledge, 1996. 8