METODO ASSIOMATICO E TEORIA DEGLI INSIEMI a.a. 2013/14 TEORIE ASSIOMATICHE Versione provvisoria e incompleta∗ Alberto Zanardo Dipartimento di Matematica - Università di Padova Maggio 2014 Indice 1 Prime nozioni sulle Teorie Assiomatiche 1.1 Deduzione Logica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 4 2 Linguaggi del primo ordine - Interpretazioni e Modelli 5 3 Prime proprietà delle Teorie Assiomatiche 9 3.1 Coerenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 3.2 Indipendenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.3 Decidibilità degli assiomi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 4 Alcuni risultati di logica matematica 13 5 Categoricità e α-categoricità 16 5.1 Ordini lineari, densi, senza estremi . . . . . . . . . . . . . . . . . . . . . . 19 6 Completezza Semantica e Completezza Sintattica 20 7 Assiomi di Peano - I numeri naturali 7.1 Definizione per induzione. Categoricità degli assiomi di Peano 7.2 Somma di naturali . . . . . . . . . . . . . . . . . . . . . . . . 7.3 Prodotto di naturali . . . . . . . . . . . . . . . . . . . . . . . 7.4 Ordinamento dei naturali . . . . . . . . . . . . . . . . . . . . . 7.5 Altre formulazioni degli Assiomi di Peano . . . . . . . . . . . . 22 25 27 30 31 34 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Aritmetica al primo ordine. Modelli non-standard 34 8.1 Linguaggi ridotti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 ∗ Ringrazio fin d’ora chi vorrà segnalarmi errori o inesattezze. 1 2 9 Teorema di Loś e Teorema di Compattezza 46 9.1 Ultrafiltri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 9.2 Prodotti diretti e ultraprodotti . . . . . . . . . . . . . . . . . . . . . . . . 48 10 Teorema di Ramsey 54 10.1 Prodotti di ultrafiltri e dimostrazione del Teorema di Ramsey infinito . . . 57 A Tautologie 59 B Insiemi 59 1 Prime nozioni sulle Teorie Assiomatiche Diciamo che una teoria (matematica, o in generale scientifica) viene sviluppata in modo assiomatico quando è costituita da tutte e solo le proposizioni che seguono logicamente (o sono conseguenza logica1 ) di alcune proposizioni fissate detti assiomi. Le conseguenze logiche degli assiomi di una teoria vengono chiamate teoremi. Gli Elementi di Euclide costituiscono l’esempio più antico e più noto di teoria assiomatica. Attualmente possiamo dire che tutta la matematica viene studiata in modo assiomatico, anche se non viene sempre (anzi, quasi mai) precisato cosa si debba intendere con ‘conseguenza logica’ né quali siano gli assiomi logici (o anche della teoria degli insiemi) che vengono usati assieme agli assiomi che caratterizzano la teoria stessa. Consideriamo per esempio la Teoria dei Gruppi. Un gruppo è una terna G = hG, ∗, ui dove G è un insieme non vuoto, ∗ è un’operazione binaria su G, u è un elemento di G, ed inoltre sono verificate le seguenti proprietà: G1. Associatività di ∗: ∀x, y, z [x ∗ (y ∗ z) = (x ∗ y) ∗ z] G2. Proprietà dell’elemento neutro u: ∀x [x ∗ u = u ∗ x = x] G3. Esistenza dell’inverso: ∀x∃y [x ∗ y = y ∗ x = u] Questi sono gli assiomi per la Teoria dei Gruppi, e quindi i teoremi di questa teoria sono le proposizioni che seguono logicamente da questi assiomi. Dire per esempio che in ogni gruppo l’elemento neutro è unico, significa dimostrare che, supposto che u e u0 abbiano le proprietà espresse da G3, dagli assiomi G1-3 segue logicamente u = u0 . Esercizio. Nei corsi di Analisi ed in tanti altri usiamo i Numeri Reali. Anche in questo caso ci troviamo di fronte ad una presentazione di tipo assiomatico. Il punto di partenza è la Teoria dei Campi Ordinati. Ricordiamo che un campo è una struttura K = hK, +, ·, 0, 1i dove K è un insieme, + e · sono operazioni binarie su K, 0 e 1 sono elementi distinti di K, e in cui valgono le seguenti proprietà: C1. Associatività di + e · : ∀x, y, z [ (x + (y + z) = (x + y) + z) e (x · (y · z) = (x · y) · z) ]; 1 Qui ‘conseguenza logica’ va inteso in senso intuitivo, non in senso tecnico come per esempio in [Berarducci, 2006]. 3 C2. Commutatività di + e · : ∀x, y [ (x + y = y + x) e (x · y = y · x); C3. Distributività di · rispetto a + : ∀x, y, z [x · (y + z) = x · y + x · z]; C4. Proprietà degli elementi neutri : (i) ∀x(x + 0 = x), (ii) ∀x(x · 1 = x); C5. Esistenza dell’opposto e del reciproco: (i) ∀x∃y(x+y = 0), (ii) ∀x 6= 0, ∃y(x·y = 1). I campi ordinati sono strutture K = hK, +, ·, 0, 1, ≤i che verificano gli assiomi C1-5, e su cui è inoltre definita una relazione d’ordine totale ≤ avente quindi le seguenti proprietà: C6. Riflessività: ∀x(x ≤ x); C7. Antisimmetria: ∀x, y (x ≤ y ∧ y ≤ x → x = y); C8. Transitività: ∀x, y, z (x ≤ y ∧ y ≤ z → x ≤ z); C9. Totalità, o Linearità: ∀x, y (x ≤ y ∨ y ≤ x). Per la relazione d’ordine in un campo ordinato si richiede infine la compatibilità con le operazioni di somma e prodotto: C10. Compatibilità dell’ordine con l’addizione: ∀x, y, z (x ≤ y → x + z ≤ y + z); C11. Compatibilità dell’ordine con il prodotto: ∀x, y, ∀z ≥ 0 (x ≤ y → x · z ≤ y · z). Sono esempi di campi ordinati i numeri razionali ed i numeri reali. In quest’ultima struttura è però anche verificato un ulteriore assioma: l’Assioma di Completezza. Un campo ordinato K = hK, +, ·, 0, 1, ≤i è completo se C12. Completezza: ∀X, Y ⊆ K [∀x ∈ X, ∀y ∈ Y (x ≤ y) → ∃z (∀x ∈ X, ∀y ∈ Y (x ≤ z ≤ y))] Un risultato cruciale sui Campi Ordinati Completi è che sono tutti isomorfi. Una volta dimostrato quindi che esiste un Campo Ordinato Completo,2 possiamo definire l’insieme R dei numeri reali come un’arbitraria struttura hK, +, ·, 0, 1, ≤i in cui siano verificati C112. In ciò è particolarmente evidente la natura assiomatica della teoria dei numeri reali: non interessano le entità che li costituiscono, ma solo il fatto che siano verificati quegli assiomi. Il passo successivo alla definizione di una struttura algebrica astratta è quello di mostrare strutture matematiche che rientrano in quella definizione. Tornando ai gruppi, si fa notare per esempio che gli interi, con la somma e lo 0, costituiscono un gruppo, che i razionali 2 In genere tale struttura viene definita tramite le classi di equivalenza di successioni di Cauchy, o tramite i tagli di Dedekind, su Q, v, [Fiori and Invernizzi, 2009], [Cohen and Ehrlich, 1963] o [Zanardo, 2014]. 4 non nulli, con il prodotto e l’1, costituiscono un gruppo, e cosı̀ via. Possiamo dire che in queste strutture i simboli ∗ e u che compaiono nella definizione di gruppo, cosı̀ come l’insieme G, vengono interpretati in modo diverso. Questa distinzione tra simbolo e sua interpretazione, che spesso non è rilevante nella pratica matematica, gioca invece un ruolo fondamentale nello studio generale delle teorie assiomatiche. Il primo passo in questa direzione è la definizione di linguaggio formale alla quale seguirà la definizione di interpretazione. Osserviamo fin d’ora che, in relazione al linguaggio in cui una teoria assiomatica viene espressa, c’è una profonda differenza tra la definizione di gruppo, o di campo ordinato, e quella di campo ordinato completo. I quantificatori che compaiono in G1-3 o in C1-11 possono essere tutti letti come “per ogni elemento di G” o “per ogni elemento di K”, mentre C12 inizia con “per ogni sottoinsieme X e ogni sottoinsieme Y di K”. Nel primo caso abbiamo una quantificazione su elementi, nel secondo una quantificazione su insiemi. I due tipi di quantificazione vengono detti rispettivamente del primo ordine e del secondo ordine.3 Inizialmente considereremo solo teorie basate su linguaggi del primo ordine. 1.1 Deduzione Logica Non è essenziale in queste note dare una definizione rigorosa di deduzione logica, per la quale rimandiamo ai primi capitoli di un qualsiasi manuale di logica matematica. Per gli scopi di questo corso basta sapere che i principi che usiamo abitualmente nelle dimostrazioni possono essere formalizzati in una definizione rigorosa di dimostrazione. Ricordiamo comunque alcuni aspetti fondamentali delle deduzioni logiche. DL1 Una deduzione logica (o dimostrazione) in una teoria assiomatica è una successione finita ϕ0 , . . . , ϕn di formule in cui ogni ϕi è un assioma della teoria, o segue logicamente dalle formule precedenti. DL2 Se le formule ϕ0 , . . . , ϕn sono vere in una struttura matematica (in cui quelle formule sono interpretate) e ϕ segue logicamente da ϕ0 , . . . , ϕn , allora anche ϕ è vera in quella struttura matematica. DL3 Tutte le tautologie (v. Appendice A) sono dimostrabili in ogni teoria assiomatica. Le formule che seguono logicamente dagli assiomi di una teoria vengono chiamati teoremi (di quella teoria). Poiché in DL1 non escludiamo che n possa essere 0, gli assiomi risultano essere particolari teoremi. Da DL1 segue anche in particolare che, anche se una teoria ha infiniti assiomi, ogni dimostrazione ne coinvolge solo un numero finito. Da DL2 segue che, se una struttura matematica verifica gli assiomi di una teoria, anche tutti i teoremi risultano verificati in quella struttura. 3 Per rendersi conto della differenza tra quantificazione del primo e del secondo ordine basta pensare alla proprietà della densità che in qualche modo ‘assomiglia’ alla completezza, con la differenza che anziché insiemi abbiamo elementi. Sappiamo che tale proprietà deriva dagli assiomi per i campi ordinati, e che in particolare Q è denso. Ciò non vale ovviamente per la completezza. 5 Scriveremo T ` ϕ (risp. T 6` ϕ) intendendo che ϕ è, (risp. non è) teorema della teoria T . Converrà spesso inoltre identificare una teoria con l’insieme dei suoi assiomi. Scriveremo quindi {ϕ0 , . . . , ϕn } ` ϕ intendendo che ϕ è teorema della teoria assiomatica avente ϕ0 , . . . , ϕn come assiomi. 2 Linguaggi del primo ordine - Interpretazioni e Modelli Definizione 2.1 Un linguaggio L del primo ordine è una quaterna hC, F, R, Vi in cui C, F e R sono insiemi arbitrari, e V è un insieme numerabile (v. Appendice B). Gli elementi di C, F e R sono chiamati rispettivamente (simboli per) costanti, funzioni e relazioni. Gli elementi di V sono chiamati variabili individuali, o brevemente variabili. La terna hC, F, Ri viene chiamata segnatura del linguaggio L. Le variabili di un linguaggio del primo ordine vengono generalmente indicate con x0 , x1 , . . . , o con le lettere x, y, z, t, . . . . Gli elementi degli insiemi F e R sono generalmente indicati con un apice che indica la loro arietà, cioè il numero di argomenti a cui si applicano. Nel seguito cercheremo di evitare il più possibile questo tipo di notazione, facendo in modo che il contesto determini il numero di argomenti a cui le funzioni e le relazioni si applicano. In un linguaggio per la Teoria dei Gruppi avremo quindi C = {u} , F = {∗} (= {f 2 }) R = ∅ mentre, per la Teoria dei Campi Ordinati, C = {1, 0} (= {c1 , c2 }) , F = {+ , ·} (= {f12 , f22 }) R = {≤} (= {R12 }) Per non appesantire la notazione e rendere più comprensibili le formule, useremo spesso i simboli relativi alla struttura matematica che interpreta il linguaggio al posto dei simboli del linguaggio stesso. Per questo motivo nell’esempio precedente abbiamo scritto C = {1, 0}, F = {+ , ·} e R = {≤}. Per dare una definizione rigorosa di formula (di un linguaggio del primo ordine) dobbiamo preliminarmente definire i termini. Essi sono le entità che, in una data struttura matematica, vengono interpretati negli elementi di struttura. Abbiamo quindi, per ogni linguaggio L = hC, F, R, Vi, l’insieme TL dei suoi termini è il più piccolo insieme tale che C ∪ V ⊆ TL e t1 , . . . , tn ∈ TL e f n ∈ F ⇒ f n (t1 , . . . , tn ) ∈ TL (2.1) Esercizio 2.2 Sia N = hN, 0, σi la struttura dei numeri naturali, dove σ è la funzione successore. Descrivere l’insieme TL , dove L è un linguaggio adeguato per la struttura N . L’insieme delle formule di L viene definito in modo analogo: • se t e t0 sono termini, allora t = t0 è una formula; 6 • se t1 , . . . , tn sono termini e Rn ∈ R, allora Rn (t1 , . . . , tn ) è una formula; • se ϕ e ψ sono formule e x è una variabile, allora ¬ϕ, ϕ ∨ ψ, ϕ ∧ ψ, ϕ → ψ, ϕ ↔ ψ, ∀xϕ, e ∃xϕ, sono formule. Se ϕ è una formula e ∀xψ o ∃xψ è una sua sottoformula, allora diremo che ogni occorrenza della variabile x in ψ è vincolata in ϕ. Le occorrenze di una variabile che non sono vincolate in una data formula sono dette libere. Osserviamo che in una formula la stessa variabile può avere sia occorrenze libere sia occorrenze vincolate. Per esempio, nella formula x ≤ 0 ∧ ∀x(y ≤ x) la prima occorrenza della x è libera e la seconda vincolata (mentre l’unica occorrenza della y, supposta diversa da x, è libera). Un enunciato è una formula che non ha variabili libere. Scriveremo spesso ϕ(x1 , . . . , xn ) per mettere in evidenza che nella formula ϕ le variabili x1 , . . . , xn sono libere o, più in generale, che le variabili libere di ϕ appartengono all’insieme {x1 , . . . , xn }. Anche se non abbiamo ancora dato una definizione rigorosa di verità di una formula, non è difficile rendersi conto che in generale una formula con variabili libere può essere vera o falsa a seconda del valore assegnato alle variabili che compaiono libere nella formula stessa: x > 0, interpretata nell’insieme dei numeri reali, è vera per alcuni valori di x e falsa per altri4 . Ciò non succede se una variabile è invece vincolata: ∃x(x > 0) è vera nell’insieme dei numeri reali, indipendentemente dal valore di x, e infatti è equivalente a Rb ∃y(y > 0). Ciò è perfettamente analogo al fatto che a f (x) dx dipende solo da a e b (e Rb Rz coincide con a f (t) dt), mentre a f (x) dx dipende dal valore di z. Prima di dare la definizione di interpretazione, ricordiamo che, dati gli insiemi A e B, con B indichiamo l’insieme delle funzioni da A in B, e che una relazione n-aria su A è un insieme di n-uple ad elementi in A, cioè un sottoinsieme del prodotto cartesiano An . A Definizione 2.3 Una interpretazione del linguaggio L = hC, F, R, Vi è una coppia I = hD, Ii, dove D è un insieme non vuoto, e I è una funzione definita su C ∪ F ∪ R tale che: c ∈ C ⇒ I(c) ∈ D f n ∈ F ⇒ I(f n ) ∈ (Dn ) D Rn ∈ R ⇒ I(Rn ) ⊆ Dn (2.2) Indicheremo talvolta I(c), I(f n ) e I(Rn ) rispettivamente con cI , fIn e RIn . Un’interpretazione di L individua dunque un insieme D, il dominio 5 dell’interpretazione, e: 1) ad ogni elemento di C associa un elemento di D, 2) ad ogni simbolo per funzione n-aria in F associa una funzione da Dn in D, e 3) ad ogni simbolo per relazione n-aria in R associa una relazione ad n argomenti in D. Osserviamo infine che la nozione di interpretazione non coinvolge l’insieme V delle variabili in L, ma solo la segnatura. 4 Abbiamo detto che questo discorso vale ‘in generale’ perché, per esempio, la verità della formula x = x non dipende dal valore della variabile libera x. 5 In matematica si confonde spesso il dominio di un’interpretazione con l’interpretazione stessa. Si parla per esempio dell’insieme dei naturali intendendo la struttura che oltre all’insieme include le usuali operazioni e relazioni sui naturali. Non c’è niente di male in questo modo di fare che, anzi, rende il discorso più snello. Se tuttavia vogliamo fare una teoria delle interpretazioni (Teoria dei Modelli) risulta spesso opportuno distinguere il dominio dall’interpretazione. 7 La cardinalità di un’interpretazione I = hD, Ii viene definita come la cardinalità dell’insieme D. Diremo per esempio che I è numerabile se card(D) = card(N). Nella sezione precedente abbiamo visto alcuni esempi di interpretazioni della segnatura per la teoria dei gruppi: h{u}, {∗}, ∅i. Con la notazione appena introdotta possiamo dire per esempio che un’interpretazione di questa segnatura è la coppia Z = hZ, Ii, dove uZ = I(u) e ∗Z = I(∗) sono rispettivamente lo 0 e l’usuale somma negli interi. Esercizio 2.4 Definire un linguaggio per gli anelli ordinati e l’interpretazione di quel linguaggio nella struttura degli interi. Osservazione 2.5 Consideriamo ancora la segnatura h{u} , {∗} , ∅i per i gruppi e la coppia I = hM, Ii, dove M è l’insieme delle matrici 2×2, uI è la matrice identica in M , e ∗I è il prodotto righe per colonne in M . L’insieme delle matrici 2×2 con l’usuale prodotto non è un gruppo, tuttavia la coppia hM, Ii è una interpretazione del linguaggio per la teoria dei gruppi. Una struttura matematica è una interpretazione di un linguaggio quando le formule del linguaggio risultano vere o false in quella struttura. Non viene richiesto che i teoremi della teoria descritta da quel linguaggio risultino verificati. Per tale situazione introduciamo la nozione di modello, che richiede la nozione di ‘verità’ di una formula in una interpretazione. Abbiamo già osservato che la verità di una formula con variabili libere dipende in generale dal valore assegnato a tali variabili. Per una definizione rigorosa di verità abbiamo dunque bisogno di un’ulteriore nozione. Definizione 2.6 Data l’interpretazione I = hD, Ii del linguaggio L = hC, F, R, Vi, una valutazione (delle variabili di L in I) è una funzione V da V in D. Data una valutazione V, una variabile v, ed un elemento a di D, indicheremo con V(v/a) la valutazione V 0 che coincide con V su tutte le variabili diverse da v e tale che V 0 (v) = a. Ogni valutazione V puo essere estesa induttivamente all’insieme di tutti i termini ponendo, per ogni costante c, termini t1 , . . . , tn , e simbolo per funzione f n , V(c) = cI e V(f n (t1 , . . . , tn )) = fIn (V(t1 ), . . . , V(tn )) (2.3) Scriveremo spesso tV invece di V(t). Useremo l’espressione I, V |= ϕ intendendo che la formula ϕ è vera nell’interpretazione I = hD, Ii con una data valutazione V. La relazione |= è definita dalle seguenti regole di verità, per induzione sulla costruzione di ϕ. 8 Regole di verità (per formule del primo ordine) I, V |= t1 = t2 sse tV1 = tV2 R0 R1 I, V |= Rn (t1 , . . . , tn ) sse htV1 , . . . , tVn i ∈ RIn I, V |= ¬ψ sse I, V 6|= ψ R2 R3 I, V |= ψ ∧ χ sse I, V |= ψ e I, V |= χ R4 I, V |= ψ ∨ χ sse I, V |= ψ o I, V |= χ R5 I, V |= ψ → χ sse I, V |= ¬ψ o I, V |= χ R6 I, V |= ψ ↔ χ sse I, V |= ψ → χ e I, V |= χ → ψ R7 I, V |= ∀v ψ sse per ogni a ∈ D, I, V(v/a) |= ψ R8 I, V |= ∃v ψ sse esiste a ∈ D : I, V(v/a) |= ψ Da queste regole segue che, per ogni I e V, I, V |= ϕ ∨ ψ se e solo se I, V |= ¬(¬ϕ ∧ ¬ψ) def e dunque l’operatore ∨ può essere definito per mezzo di ∧ e ¬ : ϕ ∨ ψ ≡ ¬(¬ϕ ∧ ¬ψ). In modo analogo abbiamo def ϕ → ψ ≡ ¬ϕ ∨ ψ def ϕ ↔ ψ ≡ (ϕ → ψ) ∧ (ψ → ϕ) def ∃v ϕ ≡ ¬∀v¬ϕ Quindi possiamo considerare un linguaggio con i soli operatori ¬, ∧, ∀ e considerare gli altri come operatori definiti6 . Questa riduzione del linguaggio torna in genere utile nelle dimostrazioni per induzione sulla complessità di una formula. Se vogliamo dimostrare che tutte le formule di un dato linguaggio hanno una data proprietà P , possiamo dimostrare come passo iniziale che P vale per formule del tipo t1 = t2 o R(t1 , . . . , tn ) (formule atomiche), e poi (passo induttivo) dimostrare che, se ϕ e ψ hanno P allora lo stesso vale per ¬ϕ1 , ϕ ∧ ψ, e ∃vϕ. Usiamo questa tecnica di dimostrazione per formalizzare il discorso fatto sopra sulla dipendenza della verità di una formula dall’interpretazione delle variabili. Proposizione 2.7 Se la variabile x non compare libera in ϕ allora la verità di ϕ nell’interpretazione I con valutazione V non dipende da V(x). Dimostrazione. Dimostriamo la proposizione per induzione della formula ϕ. Se ha la forma t1 = t2 o Rn (t1 , . . . , tn ), dire che x non compare libera equivale a dire che x non compare, e dunque il risultato è banalmente vero. Supponiamo ora che l’enunciato sia vero per ogni sottoformula (propria) di ϕ. Se ϕ è della forma ¬ψ o ψ ∧ χ, abbiamo la proposizione applicando l’ipotesi induttiva. Se ϕ è ∀vψ dobbiamo distinguere i casi in cui v è x oppure no. Nel primo caso la verità di ϕ viene determinata dalle valutazioni della forma V(x/a) (a ∈ D) e quindi non dipende dal valore V(x). Nel secondo caso abbiamo che x non è libera in ψ, e quindi si arriva alla conclusione usando l’ipotesi induttiva. 6 Sono possibili altre scelte degli operatori non definiti, per esempio ¬, ∨, ∃, o ¬, →, ∃, ecc. 9 Diciamo che la formula ϕ è vera (risp. falsa) in una interpretazione I se, se per ogni valutazione V, I, V |= ϕ (risp. I, V |= ¬ϕ), e in tal caso scriviamo I |= ϕ (risp. I |= ¬ϕ). Si osservi che una formula ϕ che non è vera in una interpretazione I, non è necessariamente falsa in quella interpretazione: può succedere che per qualche valutazione V, I, V |= ϕ e che per qualche altra valutazione V 0 , I, V 0 |= ¬ϕ. Se però ϕ è un enunciato, allora la sua verità in I non dipende dalla scelta della valutazione V (Proposizione 2.7), e quindi ϕ risulta vera oppure falsa in I. Se esiste una valutazione V tale che I, V |= ϕ, diciamo che ϕ è soddisfacibile in I. Diciamo che ϕ è soddisfacibile se lo è in qualche interpretazione. Esercizio 2.8 Sia ϕ(x1 , . . . , xn ) una formula con le variabili libere nell’insieme {x1 , . . . , xn }. Dimostrare che ϕ(x1 , . . . , xn ) è vera in I se e solo se ∀x1 , . . . , xn ϕ(x1 , . . . , xn ) è vera in I. Definizione 2.9 Diciamo che una interpretazione M è un modello della teoria assiomatica T se ogni assioma di T è vero in M. Per la proprietà DL2 delle deduzioni logiche abbiamo quindi che tutti i teoremi di T sono veri in ogni modello di T . Esempio 2.10 L’interpretazione di h{u} , {∗} , ∅i considerata nell’ Osservazione 2.5 non è un modello della Teoria dei Gruppi. Essa diventa però un modello se ∗I è la somma tra matrici 2 × 2. Osservazione 2.11 Abbiamo osservato che un enunciato risulta vero oppure falso in una data interpretazione. Se invece la formula ϕ(x) contiene la variabile x libera, in generale la verità di questa formula dipende dalla particolare valutazione V(x) di x nel dominio dell’interpretazione. Per esempio, se consideriamo l’interpretazione I dell’Osservazione 2.5, la formula ∀x∃y(x ∗ y = u), che è un enunciato, è falsa, mentre la formula ∃y(x ∗ y = u) risulta vera se V(x) è una matrice invertibile, falsa negli altri casi. Una formula ϕ(x) con x unica libera, identifica quindi un sottoinsieme Xϕ(x) del dominio D dell’interpretazione: Xϕ(x) = {a ∈ D : I, V(x/a) |= ϕ(x)} (si osservi che essendo x l’unica variabile libera in ϕ, l’insieme Xϕ(x) non dipende da V). In questo caso si dice che Xϕ(x) è l’insieme definito dalla formula ϕ(x) (v. anche §8). In modo analogo, le formule del tipo ϕ(x1 , . . . , xn ) definiscono sottoinsiemi di Dn . 3 3.1 Prime proprietà delle Teorie Assiomatiche Coerenza Un requisito minimo che una teoria assiomatica T deve soddisfare perché abbia senso studiarla, è quello della coerenza o non contraddittorietà. Vogliamo cioè che la teoria non permetta di dedurre una proposizione e al tempo stesso la sua negazione. 10 Definizione 3.1 La teoria T è coerente, o consistente, se non esiste nessuna formula ϕ tale che T ` ϕ e T ` ¬ϕ. Poiché una teoria dimostra due formule ϕ e ψ se e solo se ne dimostra la congiunzione ϕ ∧ ψ, e le formule del tipo ϕ ∧ ¬ϕ vengono chiamate contraddizioni, possiamo dire che T è coerente se e solo se non dimostra contraddizioni. Verranno chiamate contraddittorie le teorie non coerenti. Il motivo per cui si richiede che una teoria sia coerente è ovvio: se T dimostra una contraddizione, allora T non ha modello. Dalle Regole di Verità segue infatti che, per ogni interpretazione I e ogni valutazione V, I, V 6|= ϕ ∧ ¬ϕ. Non esiste nessuna struttura matematica della quale T descriva le proprietà. Oltre a questo, abbiamo che una teoria non coerente dimostra ogni proposizione. Infatti, l’implicazione (ϕ ∧ ¬ϕ) → ψ è una tautologia per ogni scelta delle formule ϕ e ψ, e quindi, se T ` ϕ ∧ ¬ϕ, allora, per Modus Ponens, T ` ψ. Non c’è alcun interesse nello studiare teorie in cui tutto è dimostrabile. Avendo deciso di identificare una teoria con l’insieme dei suoi assiomi, possiamo anche parlare di coerenza di un insieme {ϕ0 , . . . , ϕn } di formule. Tale insieme sarà dunque coerente se è tale la teoria assiomatica che ha quelle formule come assiomi, ossia se esiste una formula ϕ tale che {ϕ0 , . . . , ϕn } 6` ϕ. La seguente proposizione permette di estendere insiemi coerenti di formule e verrà usata in seguito. Esercizio 3.2 Siano Φ e Ψ insiemi coerenti di formule. Cosa possiamo dire riguardo alla coerenza di Φ ∩ Ψ e Φ ∪ Ψ? Proposizione 3.3 Dato un insieme Φ di formule e la formula ϕ, l’insieme Φ ∪ {¬ϕ} è coerente se e solo se Φ 6` ϕ. Dimostrazione. Supponiamo Φ ` ϕ. Allora dalla proprietà DL1 (§1.1) segue Φ∪{¬ϕ} ` ϕ e Φ ∪ {¬ϕ} ` ¬ϕ. Quindi Φ ∪ {¬ϕ} non è coerente. Supponiamo inversamente che Φ ∪ {¬ϕ} non sia coerente e consideriamo una formula ψ tale che Φ ∪ {¬ϕ} ` ψ ∧ ¬ψ. Per un risultato di logica (Teorema di Deduzione) abbiamo che Φ ` ¬ϕ → (ψ ∧ ¬ψ), ma (¬ϕ → (ψ ∧ ¬ψ)) → ϕ è una tautologia e quindi Φ ` ϕ. Teorema 3.4 (T. di Compattezza Sintattica). Un insieme di formule è coerente se e solo se ogni suo sottoinsieme finito è coerente. Dimostrazione. Per DL1 ogni dimostrazione in una teoria assiomatica coinvolge un numero finito di assiomi e quindi, se possiamo dedurre ϕ∧¬ϕ da un dato insieme di formule, possiamo dedurre la stessa contraddizione anche da un suo sottoinsieme finito. L’affermazione che una data teoria T è coerente coinvolge implicitamente tutte le (infinite) possibili deduzioni logiche basate sugli assiomi di T , nel senso che si afferma che nessuna di queste deduzioni si conclude con una contraddizione. Considerare tutte le possibili deduzioni in una data teoria è nella maggioranza dei casi molto difficile, ma per dimostrare che una teoria assiomatica è coerente possiamo usare anche altre tecniche. La più usata 11 è mostrare che la teoria in esame ha un modello. Abbiamo già osservato infatti (DL2, §1.1) che se gli assiomi di una teoria T sono verificati in una interpretazione, allora in tale interpretazione sono verificati anche tutti i teoremi di T . Basta dunque ricordare che per le Regole di Verità in una interpretazione non possono essere contemporaneamente vere una formula e la sua negazione. Da questo segue che se gli assiomi di una teoria sono verificati in una struttura, allora tale teoria non può dimostrare una contraddizione, cioè è coerente. Osservazione 3.5 Per il Teorema 3.4, per dimostrare che una teoria assiomatica T con infiniti assiomi è coerente è sufficiente dimostrare che ogni insieme finito dei suoi assiomi è coerente. Può succedere in particolare che vengano esibiti vari modelli per i vari insiemi finiti di assiomi, ma che ciascuno di questi modelli non sia modello di tutta la teoria. Nel §8 vedremo un esempio di questa situazione. Osservazione 3.6 Abbiamo visto che per dimostrare la coerenza di una teoria possiamo dimostrare che tale teoria ha un modello. La dimostrazione rigorosa dell’esistenza di tale modello deve avvenire internamente alla Teoria Assiomatica degli Insiemi e quindi sorge inevitabilmente il problema della coerenza di questa teoria. Questo è un problema molto delicato e per esporre quanto è attualmente noto al riguardo sarebbero necessarie nozioni e risultati molto sofisticati di logica matematica e teoria degli insiemi. Ci limitiamo a ricordare il risultato principale, cioè che non è possibile dare una dimostrazione della coerenza di questa teoria internamente alla teoria stessa. Per il Teorema di Incompletezza di Gödel, infatti, se la teoria degli insiemi fosse in grado di dimostrare la propria coerenza (per esempio dimostrando l’esistenza di un suo modello), allora sarebbe contraddittoria! Se poi teniamo presente che la teoria degli insiemi viene posta alla base della matematica, il Teorema di Incompletezza di Gödel implica che la coerenza della teoria degli insiemi non è dimostrabile. Nella pratica matematica, la non contradditorietà della teoria degli insiemi viene presupposta, basandosi essenzialmente sull’evidenza intuitiva dei suoi assiomi, anche se non possiamo escludere che prima o dopo venga trovata una contraddizione. 3.2 Indipendenza Definizione 3.7 Sia Φ un insieme di formule. Diciamo che ϕ ∈ Φ è dipendente (risp. indipendente) in Φ se è (risp. non è) deducibile da Φ \ {ϕ}. Diciamo che Φ è dipendente (risp. indipendente) se esiste (risp. non esiste) una sua formula dipendente. Gli assiomi di una teoria assiomatica sono indipendenti se nessuno di essi può essere dedotto dagli altri. Anche in questo caso, come per la coerenza, stiamo considerando una proprietà che coinvolge tutte le possibili deduzioni in una data teoria: l’assioma ϕ della teoria T è indipendente se, detta T 0 la teoria ottenuta togliendo l’assioma ϕ da T , nessuna deduzione in T 0 si conclude con ϕ. Analogamente a quanto si è visto per la coerenza, la proprietà DL2 delle deduzioni logiche fornisce una tecnica più semplice per dimostrare che ϕ è indipendente. Se ϕ fosse teorema 12 di T 0 (cioè dipendente) allora ϕ dovrebbe essere vero in ogni modello di T 0 . Per dimostrare l’indipendenza di ϕ basta quindi trovare un’interpretazione in cui siano verificati tutti gli assiomi di T ad eccezione di ϕ. L’indipendenza del quinto postulato di Euclide è stata dimostrata in questo modo. Per dimostrare che l’Assioma di Completezza C12 per i reali non è conseguenza degli altri, basta osservare che i razionali verificano gli assiomi dei campi ordinati, ma non l’Assioma di Completezza. Supponiamo che gli assiomi di una teoria T siano ϕ0 , . . . , ϕn e che ϕ0 sia dipendente. Ciò significa che ϕ0 è dimostrabile nella teoria T 0 avente ϕ1 , . . . , ϕn come assiomi. Non è difficile rendersi conto che, se trascuriamo l’indipendenza, le teorie T e T 0 hanno le stesse proprietà, hanno cioè gli stessi teoremi e gli stessi modelli. In effetti, le proprietà di una teoria dipendono da ciò che è dimostrabile, cioè dai teoremi, più che dalla scelta degli assiomi. In base a questa osservazione sembra quindi che questioni legate all’indipendenza degli assiomi siano sostanzialmente questioni di eleganza formale. Come insegnano le Geometrie non Euclidee, però, c’è qualcosa di più. Supponiamo che gli assiomi ϕ0 , . . . , ϕn della teoria T siano indipendenti; da ciò segue in particolare che {ϕ1 , . . . , ϕn } 6` ϕ0 . Per la Proposizione 3.3 la teoria T ∗ avente per assiomi ϕ1 , . . . , ϕn e ¬ϕ0 è coerente, per cui diventa interessante vedere quali siano i teoremi di T ∗ e soprattutto vedere come sono fatti, se ce ne sono, i suoi modelli. Lo studio delle geometrie non Euclidee è appunto lo studio delle strutture in cui è verificata la negazione del quinto postulato. 3.3 Decidibilità degli assiomi Un altro requisito elementare che le teorie assiomatiche devono soddisfare è che l’insieme degli assiomi sia decidibile. Intuitivamente ciò significa che deve esistere una procedura effettiva, un algoritmo, un programma di un computer7 , che ci permetta di decidere se una data formula sia un assioma della teoria oppure no. Il senso di questo requisito è che una teoria assiomatica non deve lasciare alcun dubbio sul fatto che una data successione di passaggi sia una dimostrazione e, affinché questo succeda, deve essere ben determinato l’insieme degli assiomi che possono essere usati nelle dimostrazioni. Le teorie assiomatiche che incontriamo in matematica sono generalmente presentate elencandone gli assiomi, se questi sono in numero finito, oppure elencando degli ‘schemi d’assiomi’, cioè dicendo che tutte le formule aventi una data struttura sono assiomi della teoria. In questi casi la procedura effettiva per determinare se una data formula sia un assioma consiste semplicemente nel controllare se tale formula compaia in un dato elenco o abbia una data forma. Ci sono molti modi tuttavia per definire un insieme (di formule, nel nostro caso) e non tutti gli insiemi possono essere descritti elencandone in qualche modo gli elementi. Diventa quindi sensato chiederci se un qualsiasi insieme coerente di formule, comunque definito, possa essere visto come l’insieme degli assiomi di una teoria assiomatica. Un esempio 7 Possiamo trovare una definizione rigorosa di ‘procedura effettiva’ in Teoria della Ricorsività nella nozione di funzione ricorsiva. 13 semplice di insieme di formule che non può essere considerato l’insieme degli assiomi di una teoria assiomatica, è l’insieme di tutte le formule scritte con i simboli 0, 1, +, ×, = (oltre ai simboli logici) vere nella struttura dei numeri naturali 8 Il teorema di Incompletezza di Gödel ci dice che non esiste una procedura effettiva per decidere se una data formula in quell’insieme sia vera oppure falsa nella struttura dei numeri naturali. 4 Alcuni risultati di logica matematica In questa sezione enunceremo, senza darne sempre una dimostrazione dettagliata, alcuni risultati fondamentali di logica matematica relativi alle teorie del primo ordine. Le dimostrazioni si trovano in qualsiasi manuale di logica matematica, per esempio: [Bell and Machover, 1977] o [Mendelson, 1981]. Gli assiomi e le regole della logica del primo ordine, comuni a tutte le teorie del primo ordine, possono essere visti in ogni manuale di Logica Matematica. Essi includono gli assiomi e le regole del Calcolo Proposizionale visto in Appendice A, e quindi anche nel caso delle teorie del primo ordine possiamo parlare di tautologie e contraddizioni. Teorema 4.1 Ogni insieme coerente Φ di formule del primo ordine ha un modello. Dimostrazione. (Cenni sulle linee essenziali) La costruzione di un modello hD, Ii di Φ si sviluppa secondo le linee seguenti. Conviene tenere presente che abbiamo a disposizione solo un insieme di formule, e quindi sia D sia I verranno costruiti partendo da quell’insieme. 1. Bisogna innanzitutto estendere Φ ad un insieme coerente Φ∗ con le seguenti proprietà: 1) se ∃xϕ(x) ∈ Φ∗ , allora esiste una costante c tale che ϕ(c) ∈ Φ∗ , e 2) per ogni formula ϕ, ϕ ∈ Φ∗ oppure ¬ϕ ∈ Φ∗ . Teoremi di logica garantiscono che Φ∗ esiste (Lemma di Lindenbaum). In generale il linguaggio L∗ di Φ∗ risulta esssere un’estensione (generalmente propria) di quello di Φ, ottenuta aggiungendo nuove costanti. 2. Le entità del linguaggio che rappresentano gli elementi di D sono le costanti e quindi, per costruire D, si partirà proprio dall’insieme delle costanti di L∗ . Questo spiega la richiesta 1) al punto precedente: se abbiamo una formula esistenziale, dobbiamo avere anche una costante che rappresenta l’elemento di cui viene asserita l’esistenza. Sull’insieme delle costantti definiamo una relazione di equivalenza: c ≡ c0 se e solo se c = c0 ∈ Φ∗ . Il dominio D viene definito come l’insieme delle classi di equivalenza [c]≡ , con c costante di L∗ . 3. Osserviamo che la cardinalità di D è minore o uguale alla cardinalità dell’insieme delle costanti di L∗ . 8 Si osservi che queste formule, essendo verificate in una data struttura matematica, costituiscono un insieme coerente. 14 4. Per ogni costante c di L∗ poniamo I(c) = [c]≡ . 5. Per ogni simbolo per funzione n-aria f di L∗ (che è anche in L) definiamo I(f ) tramite I(f )([c1 ]≡ . . . [cn ]≡ ) = [c]≡ , dove f (c1 , . . . , cn ) = c ∈ Φ∗ . Dalle proprietà di Φ∗ segue che un tale c esiste sempre, e dagli assiomi per l’uguaglianza segue che I(f ) è ben definita. 6. Per ogni simbolo per relazione n-aria R in Φ∗ poniamo I(R) = {h[c1 ]≡ . . . [cn ]≡ )i ∈ Dn : R(c1 , . . . , cn ) ∈ Φ∗ }. Anche in questo caso gli assiomi per l’uguaglianza garantiscono che I(R) è ben definita. In questo modo si conclude la definizione dell’interpretazione. Il passo successivo è quello di dimostrare che, ogni enunciato ϕ di L∗ è vero in hD, Ii se e solo se ϕ ∈ Φ∗ . La dimostrazione è ovviamente per induzione sulla complessità di ϕ. Nel caso ϕ sia c = c0 o R(c1 , . . . , cn ) il risultato segue dalla definizione di I. Il discorso è semplice anche quando ϕ è ¬ϕ1 o ϕ1 ∧ ϕ2 . In questi casi si usa il fatto che Φ∗ è massimale e coerente. Più insidioso è il caso in cui ϕ è ∃xϕ1 o ∀xϕ1 (a seconda di quale operatore riteniamo primitivo e quale definito). Il problema è che in generale ϕ1 non è un enunciato. Bisogna quindi riprendere la dimostrazione dall’inizio, considerando anche le valutazioni delle variabili, e partendo da formule del tipo t = t0 o R(t1 , . . . , tn ) in cui i termini t, t0 , t1 , . . . , tn possono contenere variabili. Teorema 4.2 (T. di Compattezza Semantica) Un insieme di formule del primo ordine ha modello se e solo se ogni suo sottoinsieme finito ha modello. Dimostrazione. Segue immediatamente dai Teoremi 3.4 e 4.1. Nel Teorema 9.22 verrà data una dimostrazione puramente semantica di questo teorema, senza usare cioè il Teorema 4.1. Corollario 4.3 Se un insieme Φ di enunciati del primo ordine ha modelli finiti di cardinalità9 arbitrariamente grande, allora ha anche un modello infinito. Dimostrazione. Poniamo ! En = ∃x1 , . . . , xn ^ xi 6= xj e Φ∗ = Φ ∪ {En : n ∈ N e n ≥ 2} (4.4) 1≤i<j≤n V dove il simbolo indica la congiunzione (∧) delle formule che lo seguono al variare degli indici i e j. L’espressione xi 6= xj è un’abbreviazione di ¬(xi = xj ). La formula En è vera in una interpretazione hD, Ii se e solo D ha almeno n elementi. Dato un qualsiasi sottoinsieme finito Φ0 di Φ∗ , sia n0 il massimo indice tale che En0 ∈ Φ0 . Dalle ipotesi sui modelli di Φ abbiamo che esiste un suo modello M0 con almeno n0 9 La cardinalità verrà definita nella seconda parte del corso. In questo caso, cioè per insiemi finiti, possiamo identificare la cardinalità di un insieme con il numero dei suoi elementi. 15 elementi e tale interpretazione è anche modello di Φ0 . Ogni enunciato di Φ0 che appartiene a Φ è banalmente vero in M0 , cosı̀ come tutte le formule della forma En , per la supposta massimalità di n0 . Poiché Φ0 è un arbitrario sottoinsieme finito di Φ∗ , per il Teorema di Compattezza Semantica possiamo concludere che Φ∗ ha modello M, che è anche modello di Φ perché Φ ⊆ Φ∗ . Ma dalla definizione di Φ∗ , segue che M deve essere infinito. Corollario 4.4 Non esiste nessun insieme di enunciati del primo ordine che risultano veri in tutte e solo le interpretazioni finite. Dimostrazione. Se tutte le interpretazioni finite sono modelli di un insieme Φ di enunciati del primo ordine, allora Φ ha modelli finiti di cardinalità arbitrariamente grande, e quindi, per il corollario precedente, ha anche un modello infinito. Esercizio 4.5 Sia L un linguaggio del primo ordine senza (simboli per) costanti e funzioni con un’unica relazione binaria <. Si dimostri che non esistono enunciati ϕ di L che risultano veri in un’interpretazione I se e solo se l’interpretazione <I di < è un buon ordine (v. Definizione 7.25) Suggerimento. Consideriamo una estensione L∗ di L ottenuta aggiungendo infinite costanti c0 , c1 , . . . indicizzate sull’insieme dei naturali. Sia Φ = {ϕ} ∪ {cn < cm : m < n}. Dimostriamo che ogni sottoinsieme finito di Φ ha modello, e quindi Φ ha modello. Per enunciare il seguente teorema dobbiamo precisare che la cardinalità di un linguaggio L = hC, F, R, Vi intendiamo la cardinalità dell’insieme C ∪ F ∪ R ∪ V. Scrivendo card(L) intenderemo quindi card(C ∪ F ∪ R ∪ V). Si osservi che in ogni linguaggio l’insieme V delle variabili è numerabile, in generale avremo quindi card(L) ≥ card(N). Se in particolare, come succede spesso in matematica, gli insiemi C, F, e R sono finiti o numerabili, allora anche il linguaggio è numerabile. Teorema 4.6 (T. di Löwenheim-Skolem). Se un insieme Φ di enunciati del primo ordine ha un modello infinito, allora tale insieme ha modelli di qualsiasi cardinalità infinita α maggiore o uguale alla cardinalità del linguaggio di Φ.10 Dimostrazione. Una possibile dimostrazione è un uso tipico del teorema di Compattezza Semantica11 . Dimostreremo il teorema nella forma della Nota 10, in modo di non coinvolgere la nozione assoluta di cardinalità. Sia X un insieme tale che card(L) ≤ card(X) e consideriamo il linguaggio L∗ ottenuto aggiungendo a L un insieme di nuove costanti indicizzate su X: {cx : x ∈ X}. Poiché card(L) ≤ card(X) per la Proposizione B.4, abbiamo card(L∗ ) = card(X). Sia Φ∗ = Φ∪C 10 In assenza di una nozione assoluta di cardinalità (Card), possiamo riformulare l’enunciato di questo teorema nel modo seguente: Se un insieme Φ di enunciati del primo ordine ha un modello infinito, allora, per ogni insieme infinito X tale che card(L) ≤ card(X), Φ ha un modello M tale che card(M) = card(X). 11 Ci sono altre dimostrazioni che usano solo tecniche di Teoria dei Modelli, v. [Berarducci, 2006]. 16 dove C = {cx 6= cy : x, y ∈ X e x 6= y}. Se M = hD, Ii è un modello infinito di Φ, allora, M può anche essere visto come modello di Φ ∪ C0 per ogni sottoinsieme finito C0 di C: basta interpretare le costanti che compaiono in C0 su elementi diversi di D. Ciò è sempre possibile perché D è infinito e le costanti che compaiono in C0 sono in numero finito. Abbiamo dunque che ogni sottoinsieme finito di Φ∗ ha modello e quindi, per il Teorema 4.2, anche Φ∗ ha un modello M∗ che sarà anche modello di Φ. Poiché in M∗ sono verificate anche tutte le disuguaglianze in C, vale la disuguaglianza card(X) ≤ card(M∗ ). Ma, per il punto 3 della dimostrazione del Teorema 4.1, abbiamo che possiamo scegliere il modello di M∗ in modo che card(M∗ ) ≤ card(X). Esercizio 4.7 Sia L il linguaggio per la teoria degli anelli. Si dimostri che non esiste nessuna teoria assiomatica T del primo ordine nel linguaggio L avente tutti i modelli isomorfi a Z. 5 Categoricità e α-categoricità Definizione 5.1 Date due interpretazioni I = hD, Ii e I 0 = hD0 , I 0 i della segnatura hC, F, Ri, diciamo che la funzione η : D → D0 è un isomorfismo tra I e I 0 se a. η è una corrispondenza biunivoca tra D e D0 ; b. per ogni c ∈ C, η(cI ) = cI 0 ; c. per ogni f n ∈ F e ogni hd1 , . . . , dn i ∈ Dn , η(fIn (d1 , . . . , dn ) = fIn0 (η(d1 ), . . . , η(dn )); d. per ogni Rn ∈ R e ogni hd1 , . . . , dn i ∈ Dn , hd1 , . . . , dn i ∈ RIn ⇔ hη(d1 ), . . . , η(dn )i ∈ RIn0 . Le interpretazioni I e I 0 sono dette isomorfe (in simboli I ∼ = I 0 ) se esiste un isomorfismo tra I e I 0 . Questa è l’usuale definizione di isomorfismo tra strutture matematiche: una funzione biunivoca che conserva le costanti, le operazioni e le relazioni. Il motivo per cui vengono coinvolte le segnature è che una data funzione può essere o non essere un isomorfismo a seconda dalle relazioni e funzioni che vengono considerate, cioè, nella terminologia di queste dispense, a seconda della segnatura. Per esempio, i naturali e i naturali pari sono isomorfi se vengono considerate strutture dotate con le usuali somma e relazione d’ordine; non lo sono se consideriamo anche la moltiplicazione (Esercizio). Proposizione 5.2 Siano I = hD, Ii e I 0 = hD0 , I 0 i sono due interpretazioni isomorfe con isomorfismo η. Data una qualsiasi valutazione V su I indichiamo con V 0 la valutazione definita da V 0 (v) = η(V(v)) per ogni variabile v. Allora, per ogni formula ϕ della segnatura per I e I 0 , (∗) I, V |= ϕ ⇔ I 0 , V 0 |= ϕ. 17 Dimostrazione. La dimostrazione è ovviamente per induzione sulla complessità di ϕ, osservando preliminarmente che, per ogni termine t, dalla clausola c. nella Definizione 5.1 segue che η(V(t)) = V 0 (t). Da ciò segue l’equivalenza (∗) quando ϕ è t1 = t2 . Se ϕ è R(t1 , . . . , tn ) allora usiamo la clausola d. nella definizione di isomorfismo. Supponiamo induttivamente che (∗) valga per ψ e χ, e per ogni valutazione V. I casi in cui ϕ è ¬ψ o ψ ∧ χ seguono immediatamente dall’ipotesi induttiva e dalle regole di verità per ¬ e ∧. Se ϕ è ∀v ψ, abbiamo: I, V |= ϕ ⇔ per ogni d ∈ D, I, V(v/d) |= ψ ⇔ per l’ipotesi induttiva, per ogni d ∈ D, I 0 , V 0 (v/η(d)) |= ψ. Ma η è una corrispondenza biunivoca tra D e D0 e quindi abbiamo che, per ogni d0 ∈ D0 , I 0 , V 0 (v/d0 ) |= ψ che equivale a I 0 , V 0 |= ∀v ψ. Definizione 5.3 Una teoria assiomatica è categorica se tutti i suoi modelli sono isomorfi (cioè se ha un solo modello, a meno di isomorfismi). La categoricità è molto importante quando, come nel caso dei numeri reali, una teoria assiomatica ha lo scopo di precisare formalmente proprietà di una particolare struttura, come la retta reale, della quale abbiamo un’intuizione abbastanza precisa. In questo caso possiamo dire che gli assiomi catturano tutte le proprietà essenziali di quella struttura, nel senso che non esistono strutture diverse (non isomorfe) in cui tali assiomi sono verificati. Come abbiamo già osservato, la teoria assiomatica dei numeri reali è categorica. Mostreremo più avanti che anche la teoria dei numeri naturali basata sugli Assiomi di Peano è categorica. Inversamente, non è difficile rendersi conto che la teoria dei gruppi non è categorica, cosı̀ come molte altre teorie che studiamo in algebra. Si potrebbe pensare che questa differenza tra teoria dei gruppi e teoria dei reali sia dovuta semplicemente al fatto che la prima ha meno assiomi della seconda. È effettivamente vero che aumentando gli assiomi in generale diminuiscono i modelli di una teoria perché tali modelli devono verificare più enunciati. Tuttavia, la differenza tra teoria dei gruppi e teoria dei campi ordinati completi è molto più sostanziale: come abbiamo già osservato, la prima è una teoria del primo ordine mentre la seconda è una teoria del secondo ordine. Proposizione 5.4 Ogni teoria del primo ordine con modelli infiniti non è categorica. Dimostrazione. Per il Teorema di Löwenheim-Skolem (T. 4.6), se T ha modelli infiniti, allora ha modelli infiniti di cardinalità arbitrariamente grande, ma due modelli di cardinalità diversa non possono essere isomorfi. La Proposizione 5.4 (che risolve l’Esercizio 4.7) chiude definitivamente la questione della categoricità per le teorie del primo ordine con modelli infiniti. Possiamo però chiederci se, fissato un cardinale, tutti i modelli equipotenti a quel cardinale siano isomorfi. 18 Definizione 5.5 Sia α un insieme cardinale. Una teoria assiomatica è α-categorica se tutti i suoi modelli di cardinalità α sono isomorfi.12 Ogni numero naturale è un insieme cardinale. Una teoria n-categorica è dunque una teoria i cui modelli con n elementi sono tutti isomorfi. Dal corso di algebra sappiamo che ogni gruppo con un numero primo di elementi è ciclico e che gruppi ciclici con lo stesso ordine sono isomorfi ([Piacentini Cattaneo, 1996, Cap.5]). Possiamo quindi concludere che, per ogni numero primo p, tutti i gruppi di ordine p sono isomorfi. Abbiamo quindi il seguente risultato. Proposizione 5.6 Per ogni numero primo p, la teoria dei gruppi è p-categorica. Consideriamo ora la formula En definita in (4.4) e la formula An = ∃x1 , . . . , xn ∀x(x = x1 ∨ · · · ∨ x = xn ) (5.5) Abbiamo già osservato che l’enunciato En in (4.4) risulta vero in una interpretazione hD, Ii se D ha almeno n elementi. La formula An invece è vera quando il dominio ha al più n elementi. Abbiamo quindi che la congiunzione En ∧ An è vera quando D ha esattamente n elementi. Indichiamo con TGn la teoria assiomatica avente come assiomi gli assiomi della teoria dei gruppi e l’enunciato En ∧ An . Per la Proposizione 5.6, abbiamo il seguente risultato. Proposizione 5.7 Per ogni numero primo p, la teoria TGp dei gruppi di ordine p è categorica. Esercizio 5.8 Dimostrare che la teoria dei gruppi non è ℵ0 -categorica. Suggerimento. Si considerino i gruppi numerabili hZ, +, 0i e hQ+ , ·, 1i. Si supponga per assurdo che f sia un isomorfismo tra le due strutture e si dimostri che, per ogni k ∈ Z, f (k) = (f (1))k . Si concluda che f non può essere suriettiva. Esercizio 5.9 Sia L un linguaggio senza simboli per costanti o per funzioni, e con un solo simbolo R per relazione n-aria. Dimostrare che se due interpretazioni I e I 0 di L verificano gli stessi enunciati e una delle due è finita, allora esse sono isomorfe. Svolgimento. Osserviamo innanzitutto che, se l’interpretazione I ha k elementi: D = {a1 . . . ak }. Allora anche I 0 ha k elementi perché l’esistenza di esattamente k oggetti è esprimibile da una formula del primo ordine. 12 Anche in questo caso possiamo riformulare la definizione senza ricorrere alla nozione di insieme cardinale: sia X un insieme. Una teoria assiomatica è X-categorica se tutti i suoi modelli M tali che card(M) = card(X) sono isomorfi. In particolare, anticipando una notazione della seconda parte del corso, diciamo che una teoria è ℵ0 -categorica se tutti i suoi modelli numerabili sono isomorfi. 19 Fissiamo un insieme {x1 . . . xk } di variabili distinte (tante quante gli elementi di D). Per ogni n-upla (xi1 , . . . , xin ) di elementi (non necessariamente distinti) in {x1 . . . xk }, consideriamo la formula ( R(xi1 , . . . , xin ) se (ai1 , . . . , ain ) ∈ RI A(xi1 , . . . , xin ) = ¬R(xi1 , . . . , xin ) se (ai1 , . . . , ain ) 6∈ RI Sia ϕ(x1 , . . . , xk ) la congiunzione di tutte le (k n ) formule A(xi1 , . . . , xin ). La formula ϕ(x1 , . . . , xk ) risulta vera in I quando le variabili x1 , . . . , xk vengono interpretate rispettivamente in a1 , . . . , ak . Risulta quindi vera in I anche la formula " ! # ^ ψ = ∃x1 , . . . , xk xi 6= xj ∧ ϕ(x1 , . . . , xk ) 1≤i<j≤k Per le ipotesi ψ è vera anche in I 0 . Esistono quindi k elementi b1 , . . . , bk di D0 , tutti distinti (da cui segue {b1 , . . . , bk } = D0 ) e tali che ϕ(x1 , . . . , xk ) risulta vera in I 0 quando x1 , . . . , xk vengono interpretati rispettivamente in b1 , . . . , bk . Per come è stata definita ϕ(x1 , . . . , xk ), poiché R è l’unico simbolo per relazioni in L, abbiamo che da funzione f : D → D0 definita da f (ai ) = bi è un isomorfismo. 5.1 Ordini lineari, densi, senza estremi Consideriamo la teoria assiomatica TOLDS espressa in un linguaggio senza costanti e funzioni, e con un solo simbolo, ≤, per relazione binaria. Gli assiomi di tale teoria sono: O1 − 4 O5 O6 O7 Assiomi per gli ordini lineari ∀x, y[x < y → ∃z(x < z < y)] (densità) ∀x∃y(x < y) (assenza di massimo) ∀x∃y(y < x) (assenza di minimo) I modelli di TOLDS sono gli ordini lineari, densi, senza estremi. Tale teoria non è categorica. Possiamo infatti osservare che i reali e i razionali con l’usuale relazione d’ordine sono suoi modelli, ma non possono essere isomorfi perché hanno cardinalità diversa. Vedremo che TOLDS è ℵ0 -categorica. Ricordiamo preliminarmente che in Teoria degli Insiemi una funzione f : X → Y viene vista come un insieme di coppie ha, bi ∈ X × Y tale che: 1) per ogni a ∈ D, esiste b ∈ Y tale che ha, bi ∈ f , e 2) se ha, bi ∈ f e ha, b0 i ∈ f , allora b = b0 . Nella notazione usuale ha, bi ∈ f viene espresso da f (a) = b. Quindi, in teoria degli insiemi, le funzioni vengono identificate con l’insieme che spesso viene chiamato grafico della data funzione. Definizione 5.10 Siano X = hX, ≤i e Y = hY, ≤0 i ordini lineari. Un isomorfismo (finito) parziale da X in Y è una funzione f = {hxi , yi i ∈ X × Y : i ≤ n, x0 < · · · < xn e y0 <0 · · · <0 yn }. Gli insiemi {x0 , . . . , xn } e {y0 , . . . , yn } sono rispettivamente il dominio e l’ immagine di f . 20 Lemma 5.11 Siano X = hX, ≤i e Y = hY, ≤0 i ordini lineari densi senza estremi, e sia f = {hxi , yi i ∈ X × Y : i ≤ n} un isomorfismo parziale da X in Y. Allora, per ogni x ∈ X (risp. y ∈ Y ) esiste un isomorfismo parziale f 0 ⊇ f da X in Y avente come dominio (risp. immagine) l’insieme {x0 , . . . , xn , x} (risp. {y0 , . . . , yn , y}). Dimostrazione. Esercizio. Si osservi che, se x ∈ {x0 , . . . , xn } (risp. y ∈ {y0 , . . . , yn }), allora f 0 = f . Teorema 5.12 Se le interpretazioni X = hX, ≤i e Y = hY, ≤0 i sono modelli numerabili di TOLDS , allora X è isomorfo a Y. Dimostrazione. La dimostrazione di questo teorema è un esempio della tecnica del backand-forth, nel senso che definiamo un isomorfismo f da hX, ≤i su tutto hY, ≤0 i andando avanti e indietro tra le due strutture. Dalla numerabilità di X e Y segue che possiamo scrivere questi insiemi come: X = {x0 , x1 , . . . , xn , . . . } Y = {y0 , y1 , . . . , yn , . . . } Per ogni naturale n definiamo induttivamente un isomorfismo parziale fn da X in Y con la proprietà che, per n < m, fn ⊆ fm . Poniamo f0 = {hx0 , y0 i}. Per ogni n > 0 definiamo fn usando il Lemma 5.11. Se n = 2k − 1 è dispari allora fn si ottiene aggiungendo yk all’immagine di fn−1 . Se n = 2k è pari, allora otteniamo fn aggiungendo xk al dominio di fn−1 . Poniamo f = ∪n∈N fn e mostriamo che f è un isomorfismo sa X su Y. Se ha, bi e ha, b0 i sono elementi di f , possiamo considerare il minimo n tale che ha, bi ∈ fn e ha, b0 i ∈ fn , da cui segue b = b0 perché ogni fn è una funzione. In modo analogo si dimostra che f conserva l’ordine. Poiché infine nella costruzione vengono considerati tutti gli elementi xk ∈ X e tutti i yk ∈ Y , abbiamo che f (che contiene ogni fn ) è una funzione da X su tutto Y . Corollario 5.13 Tutti gli ordini lineari densi, senza estremi, e numerabili sono isomorfi, come insiemi ordinati, ai numeri razionali. Anche in questo caso si vede come la nozione di isomorfismo dipenda dalle funzioni e relazioni che consideriamo. Per esempio, il campo ordinato dei reali algebrici 13 è numerabile, ed è quindi isomorfo a Q come insieme ordinato, Ma non è isomorfo a Q come campo. 6 Completezza Semantica e Completezza Sintattica Definizione 6.1 La teoria T è semanticamente completa se per ogni enunciato del linguaggio di T vero in ogni modello di T è anche dimostrabile in T . 13 Sono algebrici i reali che sono radici di polinomi a coefficienti in Z. I reali non algebrici vengono chiamati trascendenti. 21 Teorema 6.2 (T. di Adeguatezze e di Completezza Semantica per Teorie del Primo Ordine) Ogni enunciato del linguaggio della teoria del primo ordine T è vero in ogni modello di T se e solo se è dimostrabile in T . Dimostrazione. Sia T una teoria del primo ordine e sia ϕ un enunciato del linguaggio di T . Se ϕ è teorema di T allora, per DL2, ϕ è vera in ogni modello di T .14 Supponiamo inversamente che ϕ non sia teorema di T . Per la Proposizione 3.3 la teoria T ∪ {¬ϕ} è coerente e, per il Teorema 4.1, ha modello M. Quindi M è un modello di T in cui ϕ non è vero. Definizione 6.3 La teoria T è sintatticamente completa se per ogni enunciato ϕ del linguaggio di T , T ` ϕ oppure T ` ¬ϕ.15 Osservazione 6.4 Nelle definizioni di completezza semantica e sintattica parliamo di dimostrabilità di un enunciato. Bisogna però distinguere la dimostrabilità di un enunciato, dal fatto che siamo in grado (anche solo teoricamente) di trovarne una dimostrazione. Ci sono esempi di teorie semanticamente o sintatticamente complete, per le quali non esiste un algoritmo in grado di determinare la dimostrazione di ogni formula dimostrabile. È chiaro che la completezza sintattica è una proprietà è molto forte: si richiede che la teoria sia in grado di dimostrare o confutare ogni enunciato. All’inizio del ’900, tuttavia, essa era considerata più forte di quanto effettivamente sia. Si pensava infatti che i modelli di una teoria sintatticamente completa dovessero essere isomorfi perchè verificano esattamente le stesse formule. In altri termini, si pensava che la completezza sintattica implicasse la categoricità. Il teorema di Löwenheim-Skolem ed altri risultati ci dicono che ciò non è vero: possono esserci strutture non isomorfe che rendono vere le stesse formule. Per quanto riguarda le teorie del primo ordine è vero invece il seguente risultato opposto. Proposizione 6.5 Ogni teoria categorica del primo ordine è sintatticamente completa. Dimostrazione. Sia T sia una teoria categorica del primo ordine e supponiamo per assurdo che T non sia sintatticamente completa. Esiste quindi un enunciato ϕ tale che T 6` ϕ e T 6` ¬ϕ. Per la Proposizione 3.3 abbiamo che entrambe le teorie T 0 e T 00 ottenute aggiungendo rispettivamente ¬ϕ e ϕ agli assiomi di T sono coerenti e quindi, per il Teorema 4.1, queste teorie hanno modello. Siano M0 e M00 i rispettivi modelli delle due teorie. Questi modelli devono essere isomorfi in quanto modelli anche di T (che è categorica), ma per la Proposizione 5.2 ciò è assurdo perché il primo modello verifica ¬ϕ mentre il secondo verifica ϕ. Un’applicazione di questo risultato viene dalla Proposizione 5.7: la teoria TGp è sintatticamente completa. 14 Questa parte del teorema va sotto il nome di Teorema di Adeguatezza, o di Validità. Si osservi che questa definizione è significativa solo se parliamo di enunciati, e non di formule con variabili libere. Non ha senso infatti richiedere, per esempio, che la formula x ≤ 0 o la sua negazione siano dimostrabili. I teoremi di una teoria sono veri in tutti i modelli della teoria stessa, e non possiamo quindi richiedere che siano dimostrabili formule la cui verità dipende da come vengono valutate le variabili. 15 22 Aggiungendo un’ulteriore ipotesi la Proposizione 6.5 può essere estesa al caso di teorie α-categoriche per qualche α infinito. Proposizione 6.6 Se la teoria del primo ordine T non ha modelli finiti ed è α-categorica per qualche α infinito e maggiore o uguale alla cardinalità del linguaggio di T , allora T è sintatticamente completa. Dimostrazione. La dimostrazione è simile a quella precedente. Supponendo che la teoria T non sia sintatticamente completa concludiamo che esistono due modelli M0 e M00 di T che non verificano le stesse formule. Dalle ipotesi su T segue che questi due modelli sono infiniti e quindi, per il Teorema di Löwenheim-Skolem, possiamo supporre che M0 e M00 abbiano cardinalità α. A questo punto si arriva ad un assurdo come nella dimostrazione precedente usando il fatto che T è α-categorica. Come conseguenza di questa proposizione abbiamo che la teoria degli ordini densi senza estremi considerata nel §5.1 (che non ha modelli finiti) è sintatticamente completa. Il seguente risultato mette in relazione la completezza semantica con la completezza sintattica. Non dovrebbe sorprendere il fatto che il legame tra le due nozioni sia la categoricità. Proposizione 6.7 Ogni teoria T semanticamente completa e categorica è sintatticamente completa. Dimostrazione. Sia M l’unico modello di T . Dalla completezza semantica di T segue che ogni formula vera in M è dimostrabile in T . A questo punto possiamo osservare che, dato un qualsiasi enunciato ϕ, tale enunciato oppure la sua negazione sono veri in M e quindi dimostrabili in T . Esercizio 6.8 Se la teoria T è sintatticamente completa e ha un modello, allora T è semanticamente completa. Suggerimento. Usare il fatto che T 6` ϕ implica che ¬ϕ è vera in tutti i modelli di T . 7 Assiomi di Peano - I numeri naturali La presentazione assiomatica dei numeri naturali è basata sugli Assiomi di Peano (o di Peano-Dedekind). In base a questa presentazione, i numeri naturali sono una struttura hN, 0, σi dove N è un insieme, 0 è un elemento di N e σ è una funzione da N in N , tali che: (N1) ∀n (σn 6= 0) (N2) ∀n, m (σn = σm → n = m) 23 (PI) ∀X ⊆ N [(0 ∈ X ∧ ∀k (k ∈ X → σk ∈ X)) → X = N ] 16 Indicheremo con TN la teoria basata sui tre assiomi di Peano. Si osservi che in PI, il Principio di Induzione, ∀X è un quantificatore del secondo ordine perché quantifica su ℘(N ), l’insieme di tutti i sottoinsiemi di N .17 La teoria TN è dunque una teoria del secondo ordine. Una variante, più informale, ma molto usata, del Principio di Induzione è la seguente: (PIP ) Se il numero naturale 0 ha una certa proprietà P , e dal fatto che k ha la proprietà P segue che σk ha tale proprietà, allora ogni numero naturale n ha la proprietà P . Gli enunciati PI e PIP risultano equivalenti in base alla seguente corrispondenza tra insiemi e proprietà. Ad ogni proprietà P possiamo associare l’insieme KP dei naturali aventi tale proprietà e ad ogni insieme K di naturali possiamo associare la proprietà PK di appartenere a K. Si verifica facilmente che P = PKP e K = KPK da cui segue che la corrispondenza tra proprietà dei naturali e sottoinsiemi di N è biunivoca. Internamente alla teoria degli insiemi si dimostra che la teoria dei naturali è coerente. L’ordinale ω infatti è costituito dagli insiemi ∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}, ... dove il successore di ogni elemento α è α ∪ {α}. Posto σn = n ∪ {n}, la terna hω, ∅, σi risulta essere un modello di N1, N2, PI.18 Questo è un ulteriore esempio di situazione in cui è evidente la natura assiomatica dell’aritmetica di Peano. La struttura hω, ∅, σi è un modello di N1, N2 e PI, ma è anche dotato di una struttura insiemistica e in particolare la relazione ∈ su ω è una relazione d’ordine stretto. Per potere parlare di relazione d’ordine sui naturali, tuttavia, abbiamo bisogno di una costruzione più complessa che vedremo in seguito, e che deve essere basata solo sugli assiomi di Peano. Dimostriamo ora che gli Assiomi di Peano sono indipendenti costruendo tre opportuni modelli della forma hN, 0, σi, dove tuttavia N, 0, e σ sono scelti in modo da rendere veri due degli assiomi e falsificare il rimanente. (1) Sia N = {0}, dove 0 è un arbitrario oggetto, e poniamo σ0 = 0. Si verifica facilmente che gli assiomi N2 e PI sono veri in questa struttura (esercizio), mentre N1 è banalmente falso. 16 Spesso questi assiomi sono preceduti da “0 è un numero naturale” e “il successore di un numero naturale è un numero naturale”. Ma queste due assunzioni sono implicite nel considerare strutture hN, 0, σi, con 0 costante e σ funzione. 17 A rigore, N non è un simbolo del linguaggio per l’Aritmetica di Peano. Una formulazione più corretta del Principio di Induzione sarebbe stata questa: ∀X [(0 ∈ X ∧ ∀k (k ∈ X → σk ∈ X)) → ∀n(n ∈ X)], con ∀X quantificazione del II ordine. Una volta chiarito questo, conviene continuare con la solita notazione. 18 In particolare, nella struttura ω abbiamo che ogni naturale risulta l’insieme dei naturali che lo precedono. 24 (2) Sia N = {0, a, b}, dove 0, a e b sono oggetti distinti, e poniamo σ0 = a, σa = b e σb = a. In questa struttura N1 e PI sono verificati (esercizio), ma σ non è iniettiva perché σ0 = σb, e quindi N2 non è verificato. (3) Siano 0 e a due oggetti distinti e sia N l’insieme di tutte le successioni finite 0, , 00, 000, . . . e a, aa, aaa, . . . . Data una successione s ∈ N , σs è la più piccola successione in N che contiene propriamente s. Questa struttura verifica N1 e N2 (esercizio). Sia X in sottoinsieme di N costituito da tutte le successioni in cui compare solo 0. Abbiamo che l’antecedente del Principio di Induzione è verificato da X, ma ovviamente X 6= N . D’ora in avanti, in questo paragrafo, parlando dei numeri naturali intenderemo sempre un arbitrario modello hN, 0, σi degli assiomi N1, N2 e PI. Come abbiamo visto sopra, esiste almeno una struttura con queste proprietà. In ognuna di queste strutture, diremo che σn è il successore del numero naturale n. Osservazione 7.1 Abbiamo usati gli stessi simboli (0, σ, ∀n, ecc.) sia per esprimere gli assiomi di Peano, sia in riferimento al modello hN, 0, σi di tali assiomi. A rigore, gli assiomi sono formule di un linguaggio formale (v. anche Nota 17) e si sarebbero dovute esprimere in un linguaggio con una costante, c, ed un simbolo per funzione 1-aria f 1 . Abbiamo volutamente evitato questa distinzione per non appesantire la notazione. La dimostrazione dell’indipendenza del Principio di Induzione mette in luce il significato di questo principio, cioè che ogni numero naturale può essere raggiunto dallo 0 mediante successive applicazioni della funzione σ, cioè che l’insieme dei naturali può essere descritto come {0, σ0, σσ0, . . . }. Più formalmente, se un insieme X contiene 0 ed è chiuso per l’operazione σ allora X esaurisce tutto N . Vale inoltre la seguente proposizione, la cui dimostrazione è un primo esempio di dimostrazione per induzione. Proposizione 7.2 Se hN, 0, σi è un modello di N1, N2 e PI, allora, per ogni n 6= 0 in N , esiste un unico m ∈ N tale che n = σm. Dimostrazione. Sia X l’insieme {n ∈ N : n = 0 oppure ∃m : n = σm}. L’insieme X contiene ovviamente 0. Se k ∈ X, allora σk appartiene a X perchè X contiene tutti gli elementi di N del tipo σn. Per l’assioma PI, possiamo concludere che X = N . Per quanto riguarda l’unicità, per N2 abbiamo che da σm = σm0 segue m = m0 . Da questa proposizione segue che l’immagine della funzione σ è N \ {0} e quindi, per ogni n 6= 0, possiamo parlare del predecessore di n come dell’unico m tale che σm = n; il predecessore di n verrà indicato con σ −1 n. Esercizio 7.3 Dimostrare che, per ogni n ∈ N , n 6= σn. 25 7.1 Definizione per induzione. Peano Categoricità degli assiomi di Abbiamo visto nel paragrafo precedente che ogni naturale può essere raggiunto dallo 0 tramite successive applicazioni della funzione σ. Questa proprietà sta alla base della costruzione di molte funzioni definite sui naturali, incluse le usuali operazioni di somma e prodotto. Intuitivamente, possiamo definire una funzione f fornendo il valore f (0) e fornendo una regola che permetta di calcolare f (σn) una volta calcolato f (n). Per esempio, supponendo di aver già definito la moltiplicazione, il fattoriale può essere definito da 0! = 1 e (σn)! = σn·n!. Per accettare questo tipo di definizioni, dobbiamo però dimostrare che questa procedura definisce effettivamente una funzione. La seguente dimostrazione e altre in questa sezione sono tratte da [Feferman, 1964] Teorema 7.4 [Definizione per Induzione 1] Sia X un insieme, sia a un elemento di X, e sia F una funzione da X in X. Allora, per ogni modello hN, 0, σi degli Assiomi di Peano, esiste un’unica funzione f da N in X con le seguenti proprietà: (1) f (0) = a, (2) per ogni n ∈ N , f (σn) = F (f (n)). Dimostrazione. Dimostriamo prima l’esistenza di f e poi l’unicità. Insiemisticamente, una funzione da N in X è un insieme di coppie hn, xi ∈ N × X. Consideriamo l’insieme F costituito da tutti i sottoinsiemi W di N × X tali che (10 ) h0, ai ∈ W (20 ) hn, xi ∈ W ⇒ hσn, F (x)i ∈ W L’insieme F non è vuoto perché l’intero insieme N × X ha le proprietà (10 ) e (20 ) e quindi appartiene a F. Si osservi che queste proprietà corrispondono proprio alle proprietà (1) e (2) dell’enunciato del teorema. L’insieme F è chiuso per intersezioni arbitrarie. Se Wi ∈ F T per ogni i ∈ I e W = i∈I Wi , allora h0, ai ∈ W perché questa coppia appartiene a ogni Wi . Se hn, xi ∈ W allora, per ogni i, hn, xi ∈ Wi e, per la proprietà (2’) hσn, F (x)i ∈ Wi . Ma da ciò segue hσn, F (x)i ∈ W che quindi appartiene a F. Appartiene dunque a F anche l’insieme f definito da \ f= W (7.6) W ∈F Dimostriamo ora che l’insieme f è effettivamente una funzione da N in X, cioè che (3) ∀n ∈ N, ∃x ∈ X : hn, xi ∈ f (4) ∀n ∈ N, ∀x1 , x2 ∈ X, hn, x1 i ∈ f e hn, x2 i ∈ f ⇒ x1 = x2 È facile dimostrare (3) per induzione. Sia K l’insieme {n ∈ N : ∃x ∈ X : hn, xi ∈ f }. Per (10 ), abbiamo 0 ∈ K e, per (20 ), se k ∈ K, allora σk ∈ K. Abbiamo quindi K = N , cioè (3). 26 Anche (4) si dimostra per induzione. Poniamo K = {n ∈ N : ∀x1 , x2 ∈ X, hn, x1 i ∈ f e hn, x2 i ∈ f ⇒ x1 = x2 } (7.7) K è dunque l’insieme dei naturali sui quali f ‘si comporta’ come una funzione. Dimostreremo per induzione che K = N . Supponiamo per assurdo 0 6∈ K, cioè h0, x0 i ∈ f per qualche x0 6= a. Consideriamo il sottoinsieme V di N × X definito da V = f \ {h0, x0 i}. L’insieme V verifica la proprietà (10 ) perché f ha tale proprietà e x0 6= a. Se hn, xi ∈ V , allora hn, xi ∈ f e, per (20 ), hσn, F (x)i ∈ f ; ma ciò implica hσn, F (x)i ∈ V perché, per N1, 0 6= σn per ogni n. Abbiamo quindi che V ha le proprietà (10 ) e (20 ) e quindi V ∈ F, ma ciò contraddice (7.6) perché V è contenuto propriamente in f . Dimostriamo ora preliminarmente che, per ogni naturale n, hσn, yi ∈ f ⇒ ∃x : hn, xi ∈ f e y = F (x) (7.8) Ciò significa che ogni coppia del tipo hσn, yi può essere vista come risultato della proprietà (20 ). Supponiamo per assurdo che l’implicazione (7.8) non valga, cioè che esista una coppia hσn0 , yi in f tale che, per ogni x ∈ X, se hn0 , xi ∈ f , allora y 6= F (x). Consideriamo l’insieme V = f \ {hσn0 , yi}; vogliamo dimostrare che V ∈ F, cioè che verifica (10 ) e (20 ), in modo da contraddire (7.6) come nel caso precedente. La coppia h0, ai appartiene a f e quindi anche a V perché 0 6= σn0 . Supponiamo hk, zi ∈ V , cosicché hk, zi e hσk, F (z)i appartengono a f , ma per le ipotesi su n0 abbiamo che hσk, F (z)i 6= hσn0 , yi, e quindi hσk, F (z)i ∈ V . Abbiamo dunque V ∈ F che contraddice (7.6). Possiamo tornare all’insieme K definito in (7.7) e dimostrare che k ∈ K implica σk ∈ K. Supponiamo hσk, y1 i ∈ f e hσk, y2 i ∈ f . Da (7.8) segue che esistono x1 e x2 tali che hk, x1 i ∈ f , hk, x2 i ∈ f , y1 = F (x1 ) e y2 = F (x2 ). Ma dall’ipotesi k ∈ K segue x1 = x2 e quindi y1 = y2 , cioè σk ∈ K. Ciò conclude la dimostrazione che K = N e quindi che f è una funzione. Supponiamo ora che due funzioni f1 ed f2 da N in X verifichino le condizioni (1) e (2) dell’enunciato di questo teorema. Vogliamo dimostrare che f1 = f2 , cosicché la funzione f definita sopra risulterà unica. Sia K l’insieme {n ∈ N : f1 (n) = f2 (n)}; dimostriamo per induzione che K = N . Dalla condizione (1) segue banalmente che 0 ∈ K. Supponiamo k ∈ K, cioè f1 (k) = f2 (k). Dalla condizione (2) abbiamo f1 (σk) = F (f1 (k)) = F (f2 (k)) = f2 (σk), e quindi σk ∈ K. Questo risultato ci permette di dimostrare il teorema dell’unicità del modello degli assiomi di Peano. Teorema 7.5 Siano hN, 0, σi e hN 0 , 00 , σ 0 i strutture in cui sono verificati gli assiomi di Peano N1, N2 e PI. Allora le due strutture sono isomorfe. Dimostrazione. Per il Teorema 7.4, ponendo X = N 0 , a = 00 e F = σ 0 , esiste un’unica funzione f da N in N 0 tale che f (0) = 00 e, per ogni n ∈ N , f (σn) = σ 0 f (n). Abbiamo 27 quindi che f verifica le clausole b. e c. della Definizione 5.1 (si noti che la condizione d. è banalmente verificata). Per concludere che f è un isomorfismo, dobbiamo dimostrare che è suriettiva e iniettiva. Consideriamo l’insieme Im(f ) = {n0 ∈ N 0 : ∃n ∈ N : f (n) = n0 }. Im(f ) contiene 00 perché f (0) = 00 . Se k 0 ∈ Im(f ) e f (k) = k 0 , allora f (σk) = σ 0 f (k) = σ 0 k 0 e quindi anche σ 0 k 0 ∈ Im(f ). Poiché hN 0 , 00 , σ 0 i verifica PI, abbiamo Im(f ) = N 0 e quindi f è suriettiva. Consideriamo ora l’insieme K = {n ∈ N : ∀m ∈ N, f (n) = f (m) ⇒ n = m} Anche in questo caso dimostriamo per induzione che K = N , da cui segue che f è iniettiva. Poiché f (0) = 00 , dobbiamo dimostrare che, per ogni m, f (m) = 00 ⇒ m = 0. Se, per assurdo, f (m) = 00 e m 6= 0, allora, per il Teorema 7.2, esiste k tale che m = σk e quindi 00 = f (m) = σ 0 f (k), ma queste uguaglianze contraddicono N1 per σ 0 . Sia ora k ∈ K e supponiamo f (σk) = f (m). Poichè f (σk) = σ 0 f (k) 6= 00 , abbiamo che m non può essere 0. Esiste quindi un n tale che m = σn e quindi f (m) = σ 0 f (n), e, per l’assioma N2 applicato a σ 0 abbiamo che σ 0 f (n) = σ 0 f (k) implica f (n) = f (k). Poiché k ∈ K, abbiamo infine n = k e m = σk. Questo conclude la dimostrazione che f è iniettiva Quest’ultimo teorema può essere enunciato in modo equivalente dicento che la teoria costituita dagli assiomi di Peano è categorica. Il Teorema 7.4 ha spesso la seguente forma un po’ più complessa. Teorema 7.6 [Definizione per Induzione 2] Sia hN, 0, σi un modello di N1, N2 e PI, X un insieme, a un elemento di X, e ϕ una funzione da N × X in X. Allora esiste un’unica funzione f da N in X con le seguenti proprietà: (1) f (0) = a, (2) per ogni n ∈ N , f (σn) = ϕ(n, f (n)). Omettiamo la dimostrazione che può essere svolta in modo analogo a quella del Teorema 7.4: la funzione f viene definita come l’intersezione di tutti gli insiemi W che contengono h0, ai e chiusi per l’operazione hn, xi ∈ W ⇒ hσn, ϕ(n, x)i ∈ W . 7.2 Somma di naturali Una volta dimostrato che gli assiomi N1, N2 e PI determinano un’unica struttura matematica (Teorema 7.5) resta il problema di definire le usuali operazioni sui naturali. Ci aspettiamo ovviamente di dover usare una definizione per induzione e quindi il Teorema 7.4. In base a questo teorema, per esempio, possiamo definire una funzione +m che applicata ad ogni naturale gli somma m: (i) +m (0) = m, (ii) +m (σn) = σ(+m (n)). In questo caso, l’insieme X, l’elemento a, e la funzione ϕ del Teorema 7.4 sono rispettivamente N , m, e la funzione σ. La funzione somma può dunque essere definita consideriamo l’insieme di tutte le +n . Questo passaggio viene formalizzato dal seguente teorema. 28 Teorema 7.7 Date due funzioni g : N × N → N e h : N → N , esiste un’unica funzione f da N × N in N con le seguenti proprietà (1) f (n, 0) = h(n) (2) f (n, σm) = g(n, f (n, m)) Dimostrazione. Per ogni naturale k, indichiamo con ak il valore di h(k) e con ϕk : N → N la funzione definita da ϕk (n) = g(k, n). Per il Teorema 7.4, esiste un’unica funzione fk : N → N tale che fk (0) = ak e fk (σn) = ϕk (fk (n)). Possiamo ora definire f : N 2 → N tramite: def f (n, m) = fn (m) Per tale funzione valgono le uguaglianze f (n, 0) = fn (0) = an = h(n) e f (n, σm) = fn (σm) = ϕn (fn (m)) = g(n, fn (m)) = g(n, f (n, m)). Le condizioni (1) e (2) sono dunque verificate dalla funzione f . Se f 0 : N × N → N è un’altra funzione che verifica (1) e (2), per ogni naturale n possiamo considerare la funzione fn0 definita da fn0 (m) = f 0 (n, m). Per l’unicità delle funzioni fn deve essere fn0 = fn per ogni naturale n, da cui segue f 0 = f . Siamo ora in grado di definire l’operazione di somma ponendo, nel Teorema 7.7, g(n, m) = σ(m) e h(n) = n. In questo modo, la funzione f , che indicheremo con f+ , risulta definita da: (1) f+ (n, 0) = n (7.9) (2) f+ (n, σ(m)) = σf+ (n, m) Dobbiamo ora dimostrare che f+ gode effettivamente delle proprietà della funzione somma. Si osservi per esempio che la definizione di f+ (n, m) non è simmetrica nelle variabili m e n, per cui non è immediato concludere la commutatività di f+ . Proposizione 7.8 [Associatività di +] Per ogni n, m, k, f+ (n, f+ (m, k)) = f+ (f+ (n, m), k). Dimostrazione. Procediamo per induzione su k, facendo svolgere a n e m il ruolo di parametri. Poniamo K = {k ∈ N : f+ (n, f+ (m, k)) = f+ (f+ (n, m), k)} Per (1) in (7.9), f+ (n, f+ (m, 0)) = f+ (n, m) = f+ (f+ (n, m), 0). Dunque 0 ∈ K. Supposto k ∈ K, usando (2) in (7.9) e l’ipotesi induttiva, abbiamo f+ (n, f+ (m, σk)) = i.i. f+ (n, σf+ (m, k)) = σf+ (n, f+ (m, k)) = σf+ (f+ (n, m), k) = f+ (f+ (n, m), σk); per cui anche σk ∈ K. Lemma 7.9 Per ogni naturale n, f+ (n, 0) = f+ (0, n). Dimostrazione. Per induzione su n. Poniamo K = {k ∈ N : f+ (k, 0) = f+ (0, k)}. Bai.i. nalmente 0 ∈ K. Supponiamo k ∈ K. Allora f+ (σk, 0) = σk = σf+ (k, 0) = σf+ (0, k) = f+ (0, σk). 29 Lemma 7.10 Per ogni coppia m, n di naturali, f+ (σn, m) = f+ (n, σn). Dimostrazione. Per induzione su m. Poniamo K = {k ∈ N : f+ (σn, k) = f+ (n, σk)}. Dalle uguaglianze f+ (σn, 0) = σn = σf+ (n, 0) = f+ (n, σ0) segue 0 ∈ K. Supposto k ∈ K, i.i. abbiamo f+ (σn, σk) = σf+ (σn, k) = σf+ (n, σk) = f+ (n, σσk). Proposizione 7.11 [Commutatività di +] Per ogni n, m, f+ (n, m) = f+ (m, n). Dimostrazione. Per induzione su m. Fissato n ∈ N , poniamo K = {k ∈ N : f+ (n, k) = i.i. f+ (k, n)}. Per il Lemma 7.9, 0 ∈ K. Posto k ∈ K, abbiamo f+ (n, σk) = σf+ (n, k) = σf+ (k, n) = f+ (k, σn) = f+ (σk, n) per il Lemma 7.10. Proposizione 7.12 [Cancellazione per +] Per ogni n, m, k, se f+ (n, k) = f+ (m, k), allora n = m. Dimostrazione. Poniamo K = {k ∈ N : f+ (n, k) = f+ (m, k) ⇒ n = m}. Banalmente, 0 ∈ K. Posto k ∈ K, supponiamo f+ (n, σk) = f+ (m, σk) che equivale a σf+ (n, k) = σf+ (m, k) da cui segue f+ (n, k) = f+ (m, k) per l’iniettività di σ. Ma per l’ipotesi induttiva dall’ultima uguaglianza segue n = m e quindi anche σk ∈ K. Esercizio 7.13 (i) Dimostrare che n = f+ (n, m) se e solo se m = 0. (ii) Dimostrare che f+ (n, m) = 0 se e solo se n = m = 0. Proposizione 7.14 [Tricotomia per +] Dati i numeri naturali n e m, vale una ed una solo delle seguenti alternative: (i) n = m; (ii) esiste un unico x 6= 0 tale che n = f+ (m, x); (iii) esiste un unico x 6= 0 tale che m = f+ (n, x). Dimostrazione. Dimostriamo prima le asserzioni di unicità. Se (i) e (ii) fossero contemporaneamente verificate, allora verrebbe contraddetto l’enunciato dell’Esercizio 7.13. Analogamente per (i) e (iii). Se (ii) e (iii) valessero contemporaneamente, allora avremmo n = f+ (m, x) = f+ (f+ (n, x0 ), x) = f+ (n, f+ (x0 , x)) che ancora contraddice l’Esercizio 7.13. L’unicità di x in (ii) e in (iii) segue dalla Legge di Cancellazione. Fissato ora n ∈ N , dimostriamo l’enunciato principale per induzione su m. Consideriamo l’insieme K = {k ∈ N : (i), o (ii), o (iii) vale per m = k} 0 ∈ K perché, se n 6= 0 (e quindi (i) non vale), allora è verificata la (ii) con x = n. Supposto k ∈ K, possiamo distinguere tre casi. 1) n = k. Allora σk = σn = σf+ (n, 0) = f+ (n, σ0) e (iii) vale per σk. 30 2) ∃x 6= 0 : n = f+ (k, x). Poiché x 6= 0, possiamo considerare σ −1 x. Abbiamo quindi n = f+ (k, σσ −1 x) = f+ (σk, σ −1 x) (Proposizione 7.10). Se σ −1 x = 0, allora n = σk e (i) è verificata da σk. Altrimenti è verificata (ii). 3) ∃x 6= 0 : k = f+ (n, x). In questo caso abbiamo σk = f+ (n, σx) e quindi (iii) è verificata anche da σk. D’ora in avanti scriveremo n + m anziché f+ (n, m). 7.3 Prodotto di naturali Anche per il prodotto si userà il Teorema 7.7, tenendo presente che possiamo usare la funzione somma che abbiamo già definito. Con riferimento alla notazione di quel teorema, poniamo h(n) = 0 per ogni n, e g(n, m) = n+m. Ottenendo in questo modo la definizione di f× : (1) f× (n, 0) = 0 (7.10) (2) f× (n, σ(m)) = n + f× (n, m) Proposizione 7.15 [Distributività di ×] La funzione f× è distributiva rispetto a +. Dimostrazione. Dimostriamo prima la distributività a sinistra: per ogni n, m, k, f× (n, m+ k) = f× (n, m) + f× (n, k). Per k = 0 abbiamo f× (n, m + 0) = f× (n, m) = f× (n, m) + f× (n, 0). Supposta la precedente uguaglianza vera per k, abbiamo f× (n, m + σk) = i.i f× (n, σ(m + k)) = f× (n, m + k) + n = f× (n, m) + f× (n, k) + n = f× (n, m) + f× (n, σk). Per la distributività a destra dobbiamo dimostrare f× (n+m, k) = f× (n, k)+f× (m, k). Per k = 0 abbiamo: f× (n+m, 0) = 0 = f× (n, 0)+f× (m, 0). Per σk abbiamo: f× (n+m, σk) = i.i f× (n + m, k) + n + m = f× (n, k) + f× (m, k) + n + m = f× (n, σk) + f× (m, σk). Lemma 7.16 Per ogni n ∈ N , f× (n, 0) = f× (0, n) = 0 e f× (n, σ0) = f× (σ0, n) = n. Dimostrazione. Dalla definizione di f× abbiamo f× (n, 0) = 0. L’uguaglianza f× (0, n) vale i.i banalmente per n = 0, supposta vera per n, abbiamo: f× (0, σn) = f× (0, n) + 0 = 0. Dalla definizione di f× abbiamo f× (n, σ0) = f× (n, 0)+n = n. L’uguaglianza f× (σ0, n) = n i.i vale banalmente per n = 0. Supposta vera per n, abbiamo: f× (σ0, σn) = f× (σ0, n)+σ0 = n + σ0 = σn. Proposizione 7.17 [Commutatività di ×] Per ogni n, m, f× (n, m) = f× (m, n). Dimostrazione. Per induzione su m. Il caso m = 0 è stato dimostrato nel lemma precedeni.i te. Supposta la commutatività verificata per m, abbiamo: f× (n, σm) = f× (n, m) + n = f× (m, n) + n = (per il lemma precedente) f× (m, n) + f× (σ0, n) = (per associatività) f× (m + σ0, n) = f× (σm, n). Esercizio 7.18 [Associatività di ×] Per ogni n, m, k, f× (n, f× (m, k)) = f× (f× (n, m), k). 31 Esercizio 7.19 Dimostrare che f× (n, m) = 0 se e solo se n = 0 oppure m = 0. Proposizione 7.20 [Cancellazione per ×] Se k 6= 0 e f× (n, k) = f× (m, k) allora n = m. Dimostrazione. Supponiamo n 6= m. Per la Proposizione 7.14, esiste x 6= 0 tale che n = m + x oppure m = n + x. Nel primo caso (l’altro è identico) abbiamo: f× (n, k) = f× (m + x, k) = f× (m, k) + f× (x, k) 6= f× (m, k) essendo x 6= 0 e k 6= 0. D’ora in avanti scriveremo n · m o nm al posto di f× (n, m). 7.4 Ordinamento dei naturali Una volta definita la somma di naturali e dimostrate le sue proprietà, la relazione d’ordine su N può essere semplicemente definita da def n ≤ m ≡ ∃k : n + k = m (7.11) Come al solito si scriverà n < m per n ≤ m e n 6= m. Esercizio 7.21 Dimostrare che n < m se e solo se ∃k 6= 0 : n + k = m. Proposizione 7.22 La relazione ≤ è riflessiva, totale, antisimmetrica e transitiva. Inoltre, per ogni coppia di naturali n e m di naturali, vale una ed una sola delle seguenti relazioni: n < m, m < n, n = m (tricotomia di <). Dimostrazione. Le prime proprietà seguono immediatamente dalla definizione di ≤, dalla Proposizione 7.14 e dall’associatività della somma. La tricotomia segue dalla Proposizione 7.14 assieme all’Esercizio 7.21. Proposizione 7.23 Per ogni coppia di naturali n, m, (i) (ii) (iii) (iv) (v) 0 ≤ n e n 6< 0 n < σm se e solo se n ≤ m σn ≤ m se e solo se n < m n < σn e σn 6≤ n non esiste nessun k tale che n < k < σn (7.12) Dimostrazione. (i) segue dalla definizione di ≤ e dalla tricotomia di <. (ii). Se n + k = σm e k 6= 0, allora σ −1 k esiste e abbiamo: n + σσ −1 k = σm ⇒ σ(n + σ −1 k) = σm ⇒ n + σ −1 k = m ⇒ n ≤ m. Inversamente, n + k = m ⇒ n + σk = σm ⇒ n < σm perché σk 6= 0. (iii). Da σn + k = m segue n + σk = m e n < m. Inversamente, se n + k = m e k 6= 0, allora n + σσ −1 k = m e σn + σ −1 k = m, cioè σn ≤ m. (iv). La prima disuguaglianza segue da: n + σ0 = σn + 0 = σn. La seconda segue dalla prima per tricotomia. (v). Se k < σn, per (ii) abbiamo k ≤ n e quindi non può essere n < k. 32 Esercizio 7.24 Dimostrare che la relazione d’ordine sui naturali è compatibile con somma e prodotto. Definizione 7.25 Sia ≺ una relazione binaria sull’insieme S. Diciamo che hS, ≺i è un buon ordinamento (o che ≺ bene ordina S) se ≺ è un ordine stretto e ogni sottoinsieme non vuoto di S ha minimo. Osserviamo che un buon ordinamento è anche un ordine lineare. Dati infatti due elementi distinti x1 e x2 di X, l’insieme {x1 , x2 } ha minimo, e quindi x1 ≺ x2 , oppure x2 ≺ x1 . Esercizio 7.26 Dimostrare che se hS, ≺i è un buon ordinamento e S 0 ⊆ S allora anche hS 0 , ≺i è un buon ordinamento. Esercizio 7.27 Dimostrare che l’ordine totale stretto hS, ≺i è un buon ordinamento se e solo se non esistono catene discendenti infinite, cioè successioni s0 s1 · · · sn . . . . Esercizio 7.28 Siano hS1 , ≺1 i e hS2 , ≺2 i buoni ordinamenti e sia S1 ∩S2 = ∅. Sia hS, ≺i la struttura in cui S = S1 ∪ S2 e s ≺ s0 se e solo se oppure oppure s, s0 ∈ S1 e s ≺1 s0 s, s0 ∈ S2 e s ≺2 s0 s ∈ S1 e s0 ∈ S2 Dimostrare che hS, ≺i è un buon ordinamento. Teorema 7.29 La coppia hN, <i è un buon ordinamento. Dimostrazione. Supponiamo per assurdo che il sottoinsieme non vuoto A di N non abbia minimo. Poniamo K = {n ∈ N : n < m per ogni m ∈ A} 0 ∈ K. Infatti 0 ≤ m per ogni naturale m e 0 6∈ A, altrimenti 0 sarebbe il minimo di A. Supponiamo ora n ∈ K, cioè n < m per ogni m in A. Per il punto (iii) della Proposizione 7.23, abbiamo σn ≤ m per ogni m in A, da cui segue σn < m per ogni m in A perché altrimenti σn sarebbe il minimo di A. Dunque σn ∈ K e K = N . Per concludere basta ora osservare che K ∩ A = ∅ (altrimenti avremmo m < m per qualche m in A) e quindi A = ∅. Il fatto che N sia bene ordinato da < è di fatto equivalente al Principio di Induzione (v. Teorema 7.32). Un’ulteriore formulazione dello stesso principio viene fornita dal seguente teorema. Teorema 7.30 Nella struttura dei numeri naturali vale PI0 ∀X ⊆ N [∀n (∀m < n (m ∈ X) → n ∈ X) → X = N ] 33 Dimostrazione. Sia X un sottoinsieme di N tale che n ∈ X ogniqualvolta m ∈ X per ogni m < n. Se X 6= N , allora N \ X è non vuoto e quindi possiamo considerarne il minimo n0 . A questo punto possiamo arrivare ad una contraddizione osservando che ogni m < n0 appartiene ad X e che quindi per le ipotesi su X anche n0 vi appartiene. In PI0 sembra mancare il passo iniziale 0 ∈ X che compare invece in PI. Tale mancanza è tuttavia solo apparente. Per n = 0 infatti la formula ∀m < 0(m ∈ X) è banalmente verificata (perché non esistono m < 0) e quindi 0 ∈ X. Dato un ordine stretto ≺ sull’insieme S e due elementi s e s0 di S, diciamo che s0 è un immediato successore di s, o che s è un immediato predecessore di s0 se s ≺ s0 e non esiste s00 , tale che s ≺ s00 ≺ s0 . Lemma 7.31 Sia hS, ≺i un buon ordinamento e sia s ∈ S. (1) Se esiste x tale che s ≺ x, allora s ha un unico immediato successore; (2) s ha al più un immediato predecessore. Dimostrazione. (1) Consideriamo l’insieme {x ∈ S : s ≺ x}. Per le ipotesi su s questo insieme non è vuoto e quindi ha minimo s0 . Dalla linearità di ≺ segue che s0 è l’unico immediato successore di s. (2) Siano s1 e s2 immediati predecessori di s. Dall’ipotesi s1 6= s2 possiamo arrivare ad un assurdo usando ancora la linearità di ≺. In base a questo lemma, in ogni buon ordinamento hS, ≺i possiamo definire la funzione σ≺ che ad ogni s ∈ S associa il suo immediato successore, se questo esiste. Il seguente teorema mostra che la funzione σ≺ si comporta come la funzione σ nei modelli degli assiomi di Peano. Teorema 7.32 Sia hS, ≺i un buon ordinamento e sia s0 il minimo di S. Supponiamo inoltre che ogni elemento di S abbia immediato successore e che s0 sia l’unico elemento di S che non ha immediato predecessore. Allora hS, s0 , σ≺ i è un modello degli Assiomi di Peano. Dimostrazione. Dalla minimalità di s0 segue che l’assioma N1 è verificato. L’assioma N2 segue dall’unicità dell’immediato predecessore (Lemma 7.31). Sia ora K un sottoinsieme di S tale che s0 ∈ K e σ≺ s ∈ K ogniqualvolta s ∈ K. Supponiamo per assurdo K 6= S, da cui segue che X = S \ K non è vuoto, e quindi possiamo considerarne il minimo s∗ . s∗ è diverso da s0 perché s0 ∈ K e quindi s∗ ha un immediato predecessore s0 che appartiene a K per la minimalità di s0 . Ma dalle proprietà di K segue s∗ = σ≺ s0 ∈ K che contraddice s∗ ∈ X. Quindi anche PI è verificato. Questo teorema mostra come i numeri naturali possano anche essere descritti come un insieme bene ordinato hS, ≺i in cui ogni elemento ha immediato successore e il minimo di S è l’unico elemento senza immediato predecessore. Il seguente teorema mostra di conseguenza come si possa caratterizzare i naturali partendo da un ordine lineare stretto in cui valga la versione PI0 del Principio di Induzione. Teorema 7.33 Sia hS, ≺i un ordine lineare stretto che verifica PI0 . Allora hS, ≺i è un buon ordinamento. 34 Dimostrazione. Supponiamo per assurdo che il sottoinsieme non vuoto A di S non abbia minimo. Sia X = S \ A. Mostriamo che X verifica l’antecedente di PI0 . Dato s ∈ S, supponiamo s0 ∈ X per ogni s0 ≺ s. Dalla linearità di ≺ segue s s00 per ogni s00 ∈ A. Poiché A non ha minimo, abbiamo s 6∈ A, e quindi s ∈ X. Per PI0 possiamo concludere X = S che contraddice le ipotesi A 6= ∅. 7.5 Altre formulazioni degli Assiomi di Peano Gli Assiomi di Peano che abbiamo visto precedentemente soddisfano ad un principio di ‘economia’ di nozioni primitive nel senso che sono formulati in un linguaggio minimo che usa esclusivamente le nozioni di numero 0 e di successore. Una volta dimostrato che con quelle nozioni, e i tre assiomi, possiamo definire le usuali operazioni e relazione d’ordine, possiamo considerare nuove assiomatizzazioni. Possiamo cioè considerare strutture hN, 0, σ, +, ·, ≤i in cui valgano i seguenti assiomi. (N1) ∀n (σn 6= 0) (N2) ∀n, m (σn = σm → n = m) (N3) ∀n (n + 0 = n) (N4) ∀n, m ((n + σm) = σ(n + m)) (N5) ∀n (n · 0 = 0) (N6) ∀n, m (n · σm = n + n · m) (N7) ∀n, m (n ≤ m ↔ ∃k(n + k = m)) (PI) ∀X ⊆ N [(0 ∈ X ∧ ∀k (k ∈ X → σk ∈ X)) → X = N ] Ovviamente questa assiomatizzazione è ridondante, nel senso che abbiamo visto precedentemente come somma, prodotto e relazione d’ordine possano essere definite usando esclusivamente la funzione successore. Nella pratica matematica conviene comunque spesso trascurare questioni di economia di principi in favore di una maggiore chiarezza espositiva. È anche importante osservare che N3-N7 sono le stesse formule che abbiamo usato come definizioni della somma, del prodotto, e della relazione d’ordine. È naturale che sia cosı̀: avendo nuove nozioni primitive (+, ·, ≤) abbiamo bisogno di nuovi assiomi che stabiliscano come queste nozioni siano collegate alle precedenti (0, σ), ed il collegamento è proprio quello precedentemente espresso dalle definizioni. Infine, i risultati del §7.4 mostrano come avremmo potuto usare anche altre formulazioni del Principio di Induzione. 8 Aritmetica al primo ordine. Modelli non-standard Il Principio di Induzione è una formula del secondo ordine perché in essa si quantifica su insiemi. In questa sezione considereremo la possibilità di sostituire questo principio con 35 formule del primo ordine. In questo modo si ottiene una teoria del primo ordine perché tutti gli altri assiomi, diversi da Principio di Induzione, sono formule le primo ordine. Conviene chiarire immediatamente che la teoria ottenuta in questo modo non può avere le stesse proprietà dalla precedente. La differenza più evidente è che la prima è categorica (Teorema 7.5), mentre, in base al Teorema di Löwenheim-Skolem, ogni teoria del primo ordine con un modello infinito non può essere categorica. La nozione di α-categoricità, tuttavia, porta a chiedersi se non possano essere isomorfi i modelli di una fissata cardinalità di una teoria del primo ordine dei numeri naturali. In particolare risulteranno interessanti i modelli numerabili, per cui il problema riguarda l’eventuale ℵ0 -categoricità di quella teoria. Anche in questo caso la risposta è negativa, e la dimostrazione (che non può basarsi sul Teorema di Löwenheim-Skolem) usa una costruzione ad hoc ed il Teorema di Compattezza Semantica. Abbiamo già osservato (Osservazione 2.11) che, in una data interpretazione, una formula in cui tutte le variabili sono vincolate (enunciato) può essere vera oppure falsa, mentre la verità di formule con qualche variabile libera in generale dipende dal valore assegnato a tale variabile. Data quindi un’interpretazione hD, Ii per un dato linguaggio L ed una formula ϕ(x) di L in cui x sia l’unica variabile libera, possiamo considerare l’insieme Xϕ(x) costituito da tutti gli elementi d di D che rendono vera ϕ(x) quando ad x venga assegnato il valore d. Come casi limite abbiamo Xx=x = D e Xx6=x = ∅. Applicando le precedenti considerazioni alla struttura hN, 0, σ, +, ·, ≤i, abbiamo per esempio che, se ϕ(x) è ∃n(n + n = x) allora Xϕ(x) è l’insieme dei numeri pari, mentre, per ϕ(x) = ∃n(x = n · σσσ0), Xϕ(x) è l’insieme dei multipli di 3. D’ora in avanti ci riferiremo esclusivamente a strutture hN, 0, σ, +, ·, ≤i, e quindi le formule ϕ saranno formule del linguaggio, che indicheremo con L1N , per queste strutture. La singola istanza del Principio di Induzione relativa all’insieme Xϕ(x) può essere espressa dalla formula PIϕ(x) (ϕ(0) ∧ ∀k(ϕ(k) → ϕ(σk))) → ∀n ϕ(n) che può essere letta come: se la formula ϕ(x) è verificata da x = 019 ed è verificata per x = σk ogniqualvolta è verificata per x = k, allora ϕ(x) è verificata da ogni numero naturale. Un’assiomatizzazione al primo ordine dell’aritmetica può dunque consistere degli assiomi (del primo ordine) N1-7 del §7.5 e di tutte le formule del tipo PIϕ(x) , dove ϕ(x) è una formula del primo ordine del linguaggio per hN, 0, σ, +, ·, ≤i in cui x è l’unica variabile libera. Si osservi che con queste ipotesi ogni istanza di PIϕ(x) è un enunciato.20 In questo caso quindi la teoria assiomatica include uno schema d’assiomi, cioè un insieme infinito di enunciati aventi tutti la stessa forma. Possiamo dunque dire che gli assiomi dell’aritmetica al primo ordine sono N1-7 e SI (Schema d’Induzione) 19 { PIϕ(x) : ϕ(x) è una formula di L1N } Questo è un modo semplice per dire che ϕ(x) è verificata quando a x viene assegnato il valore 0. Talvolta incontriamo anche formulazioni di PIϕ(x) in cui ϕ contiene altre variabili libere oltre ad x, in cui cioè scriviamo questa formula come ϕ(x, y1 , . . . , yn ). In tal caso PIϕ(x) diventa ∀y1 , . . . , yn [(ϕ(0, y1 , . . . , yn ) ∧ ∀k(ϕ(k, y1 , . . . , yn ) → ϕ(σk, y1 , . . . , yn ))) → ∀n ϕ(n, y1 , . . . , yn )]. 20 36 Indicheremo con TN1 la teoria avente come assiomi N1-7 e tutte le istanze di SI. Gli insiemi del tipo Xϕ(x) vengono chiamati insiemi definibili. Lo schema SI esprime quindi tutte le istanze dl Principio di Induzione relative ad insiemi definibili. È abbastanza facile convincersi, in base alla seguente proposizione, che il Principio di Induzione al secondo ordine è più espressivo di questo schema di assiomi. Proposizione 8.1 Per ogni modello hN, 0, σ, +, ·, ≤i di TN1 , l’insieme {X : X ⊆ N } è più che numerabile, mentre l’insieme {X : X = Xϕ(x) per qualche formula ϕ(x) di L1N } è numerabile. Dimostrazione. Per dimostrare la prima parte dell’enunciato, mostriamo che N ha un sottoinsieme infinito e che quindi N stesso è infinito. Sia N0 l’insieme {0, σ0, σσ0 . . . }, cioè l’intersezione di tutti i sottoinsiemi di N che contengono 0 e sono chiusi per la funzione σ. L’immagine σ[N0 ] di N0 tramite σ è ovviamente contenuta in N0 e, per N2, σ è una biiezione tra N0 e σ[N0 ]. Per N1, σ[N0 ] è un sottoinsieme proprio di N0 perché 0 6∈ σ[N0 ]. Abbiamo quindi che N0 è equipotente ad un suo sottoinsieme proprio e quindi è infinito.21 Da ciò segue che card(N ) ≥ card(N) e quindi card({X : X ⊆ N }) ≥ card(℘N). Per la seconda parte dell’enunciato basta osservare che l’insieme delle formule ϕ(x) è numerabile. Infatti, ogni formula di questo tipo è una successione finita di elementi del linguaggio L1N che è numerabile, e l’insieme di tutte le successioni finite ad elementi in un insieme numerabile è pure numerabile (v. App. B). Risulta quindi numerabile anche l’insieme di tutti i sottoinsiemi definibili di N .22 Il fatto che SI sia piu debole di PI ha effettivamente conseguenze sull’insieme delle funzioni che risultano definibili nei modelli di TN1 . A differenza di quanto abbiamo fatto nelle sezioni precedenti, avendo solo SI non possiamo usare il Principio di Induzione con insiemi arbitrai di naturali, ma solo con quelli definibili da formule del primo ordine. Per approfondire questo argomento si può vedere per esempio [Boolos and Jeffrey, 1980]. Nel seguito considereremo il problema da un altro punto di vista, concentrandoci prevalentemente sulla relazione d’ordine, e considerando i possibili modelli di TN1 . D’ora in avanti, N0 = hN0 , 0, σ, +, ·, ≤i indicherà un (o meglio, il) modello di TN . Chiameremo questa struttura il modello standard degli Assiomi di Peano. Poiché ogni assioma di TN1 può essere dedotto dagli assiomi di TN , N0 sarà anche modello dell’aritmetica al primo ordine. Sia Φ0 l’insieme definito da Φ0 = {ϕ : ϕ è un enunciato di L1N vero in N0 } (8.13) Notazione. Fino a questo punto abbiamo usato gli stessi simboli (0, σ, n, m . . . ) per indicare sia i simboli del linguaggio sia gli elementi dell’interpretazione (v. Osservazione 7.1). Ora invece conviene sottolineare anche formalmente la differenza tra i due aspetti. 21 È importante osservare che abbiamo dimostrato solo che N0 è contenuto in N . Come vedremo più avanti la dimostrazione dell’uguaglianza N0 = N richiede il principio di induzione nella forma forte PI. Esistono infatti modelli di TN1 in cui N0 è contenuto propriamente in N . 22 Questo insieme è ovviamente infinito. Ogni insieme costituito dal singolo numero naturale k, per esempio, viene definito da x = σ . . . σ0, dove σ viene applicato k volte. 37 Manterremo quindi gli stessi simboli per l’interpretazione, ma per il linguaggio useremo simboli diversi (più vicini al formalismo logico). Il linguaggio L1N avrà quindi il simbolo per costante c0 (che verrà interpretato in 0), il simbolo per funzione unaria hσ (che verrà interpretato in σ). Avranno pure le ovvie interpretazioni i simboli per funzioni binarie h+ e h× , e il simbolo per relazioni binaria R≤ . Per non confondere gli elementi delle interpretazioni di L1N con le variabili di questo linguaggio, indicheremo queste ultime con v, w, v1 , . . . , anziché con n, m . . . come abbiamo fatto finora. Consideriamo ora il linguaggio L∗N ottenuto aggiungendo una nuova costante, c, ad L1N ; nelle formule di L∗N abbiamo quindi che, oltre a c0 ed alle varibili, può comparire anche c come termine elementare. Per ogni naturale n ∈ N0 , scriveremo n per indicare il termine hσ . . . hσ c0 dove hσ è ripetuto n volte. L’espressione n, che viene chiamata numerale, è dunque un termine del linguaggio, la cui interpretazione in N0 è σ . . . σ0, cioè il numero n. Sia Φ∗0 l’insieme di formule di L∗N definito da Φ∗0 = Φ0 ∪ { m 6= c : m ∈ N0 } (8.14) Ogni sottoinsieme finito Φ di Φ∗0 è costituito da formule di Φ0 , che sono vere in N0 , e da un insieme finito di formule del tipo m 6= c : {m1 6= c, . . . , mk 6= c}. Il modello standard N0 diventa quindi anche modello di Φ: basta interpretare c in un numero naturale che non compare in {m1 , . . . , mk }. Per il Teorema di Compattezza, possiamo concludere che anche Φ∗0 ha modello. Tenendo presente che il linguaggio L∗N è numerabile, per il Teorema di Löwenheim-Skolem possiamo anche concludere che Φ∗0 ha modello numerabile. Sia N ∗ = hN ∗ , c∗ , 0∗ , σ ∗ , +∗ , ·∗ , ≤∗ i un tale modello che rimarrà fissato fino alla fine di questa sezione. Si osservi che in tale modello deve anche comparire l’interpretazione c∗ della costante c. Osservazione 8.2 N ∗ è un modello di TN1 perché Φ0 contiene tutti i teoremi di questa teoria. Ci possiamo chiedere se in N ∗ siano vere anche tutte le istanze di PIϕ(v,c) , dove ϕ(v, c) è una formula, con v variabile libera, che contiene la costante c, e dunque non appartiene a Φ0 . La risposta è positiva. Sia w una variabile che non compare in ϕ(v, c), e consideriamo la formula ϕ(v, w) ottenuta sostituendo c con w in ϕ(v, c). La formula ψ = ∀w[ (ϕ(c0 , w) ∧ ∀v(ϕ(v, w) → ϕ(hσ v, w))) → ∀vϕ(v, w) ] è vera in N0 . Infatti ψ asserisce che, per ogni naturale n0 , vale il Principio di Induzione per l’insieme dei k ∈ N0 tali che ϕ(v, w) è verificata assegnando rispettivamente k e n0 a v e w. Quindi ψ appartiene a Φ0 ed è vera anche in N ∗ . Per una elementare legge logica risulta vera in N ∗ anche la formula (ϕ(c0 , c) ∧ ∀v(ϕ(v, c) → ϕ(hσ v, c))) → ∀vϕ(v, c) che è proprio PIϕ(v,c) . 38 Sia ora f : N0 → N ∗ la funzione definita da: f (0) = 0∗ , f (σn) = σ ∗ f (n) (8.15) Lemma 8.3 La funzione f definita in (8.15) è iniettiva. Dimostrazione. Consideriamo la seconda parte della dimostrazione del Teorema 7.5. In quella parte viene usato PI in N e la validità dell’Assioma N2 in N 0 . Basta quindi osservare che le strutture N0 e N ∗ verificano rispettivamente PI e N2. L’immagine Im(f ) di f è costituita dagli elementi di N ∗ della forma σ ∗ . . . σ ∗ 0∗ che sono le interpretazioni dei termini della forma m. L’elemento c∗ di N ∗ non può appartenere a Im(f ) perché in N ∗ sono verificate tutte le disuguaglianze del tipo m 6= c, e dunque l’immersione f è propria. Corollario 8.4 Il sottoinsieme Im(f ) di N ∗ non è definibile. Dimostrazione. Se Im(f ) fosse definibile dalla formula ϕ(v), allora, per PIϕ(v) , avremmo Im(f ) = N ∗ . Basta ora tenere presente che ogni eventuale isomorfismo tra N0 e N ∗ deve avere le proprietà di f per concludere che questi due modelli di TN1 non sono isomorfi. I modelli di TN1 che, come N ∗ , non sono isomorfi a N0 sono chiamati modelli non-standard dell’aritmetica. Poiché N ∗ è numerabile abbiamo che esistono modelli non standard numerabili e quindi vale il seguente teorema. Teorema 8.5 La teoria TN1 non è ℵ0 -categorica. Possiamo ora studiare alcune proprietà del modello non standard N ∗ . La tecnica usata sarà sostanzialmente sempre la stessa: poiché N ∗ è modello anche di Φ0 , per (8.13) ogni formula del primo ordine vera nel modello standard dovrà essere vera anche in N ∗ . Questo permetterà di ricavare altre proprietà di questa struttura. Conviene chiamare naturali standard gli elementi di Im(f ) e naturali non standard gli elementi di N ∗ \ Im(f ). Useremo le lettere m, n, k, . . . per indicare i naturali standard, le lettere a, b, c, . . . per i naturali non standard, e le lettere x, y, z, . . . per arbitrari elementi di N ∗ . L’elemento c∗ di N ∗ è un naturale non standard. Proposizione 8.6 Siano n, m, a ∈ N ∗ , dove n e m sono standard, e a è non standard. Allora (a) n +∗ m è un naturale standard; (b) esiste un naturale standard k tale che n +∗ k = m oppure m +∗ k = n; (c) se x ≤∗ n, allora x è un naturale standard; (d) n <∗ a; 39 (e) a +∗ x è non standard per ogni x ∈ N ∗ ; (f) se x +∗ n = a, allora x è non standard; (g) per ogni x ∈ N ∗ e ogni naturale k, (σ ∗ )k (x) 6= x. Dimostrazione. (a) Se n e m sono naturali standard, allora essi sono l’interpretazione in N ∗ dei numerali n e m. La formula h+ (n, m) = n + m appartiene a Φ0 , quindi è vera in N ∗ , ma l’interpretazione di h+ (n, m) in N ∗ è proprio n +∗ m che quindi coincide con l’interpretazione di n + m che è un naturale standard. (b) Supponiamo n ≤∗ m. Quindi, nel modello standard, n ≤ m ed esiste un naturale k tale che n + k = m. La formula h+ (n, k) = m appartiene dunque a Φ0 ed è vera in N ∗ . Possiamo ora ragionare come nel caso precedente. (c) Consideriamo la formula del primo ordine ∀v(R≤ (v, n) → (v = 0 ∨ v = 1 ∨ · · · ∨ v = n)) che è vera in N0 e quindi anche in N ∗ . Poiché stiamo supponendo che in N ∗ sia vero x ≤∗ n, cioè la formula R≤ (v, n) quando v viene interpretata in x, abbiamo che in N ∗ deve essere vera anche una delle formule v = k (con k ≤ n) quando v viene interpretata in x. Ma ciò significa che x è standard. (d) segue da (c) tenendo presente per la tricotomia della relazione <∗ (che viene espressa da una formula del primo ordine che appartiene a Φ0 ). (e) Osserviamo che, se a +∗ x fosse standard allora a sarebbe minore o uguale a qualche naturale standard, contro (d). (f) segue da (a). Per (g), basta osservare che la formula ∀v(hσ hσ . . . hσ v 6= v) appartiene a Φ0 per ogni iterazione finita hσ hσ . . . hσ di hσ . In base alle proprietà appena considerate possiamo abbozzare una prima rappresentazione parziale di N ∗ nella Figura 1. Figura 1 0q∗ q q q q . . . . . . Im(f ) q c∗ Il fatto che ogni naturale abbia un unico successore e che ogni elemento di N ∗ diverso da 0∗ abbia un unico predecessore viene espresso da formule del primo ordine (Esercizio). La struttura N ∗ conterrà quindi σ ∗ c∗ e σ ∗−1 c∗ . Ovviamente σ ∗ può essere applicata anche a σ ∗ c∗ per cui possiamo iterare l’applicazione di σ ∗ un arbitrario numero finito di volte. Anche l’applicazione di σ ∗−1 può essere iterata perché, per la proprietà (f) nella Proposizione 8.6, il predecessore di ogni naturale non standard è ancora un naturale non standard e quindi in particolare è diverso da 0∗ . Infine, per (g) nella Proposizione 8.6, non esistono σ ∗ -cicli. Possiamo dunque associare a c∗ un insieme Zc∗ di naturali non standard che, come insieme ordinato, è isomorfo all’insieme Z degli interi. Dalle considerazioni precedenti segue anche Im(f ) ∩ Zc = ∅. La Figura 2 è una rappresentazione di N ∗ più precisa della Figura 1, seppure ancora parziale. 40 Figura 2 0q∗ q q q q . . . . . . Im(f ) ... q q q q q ... Zc∗ Ogni naturale può essere raddoppiato: ciò corrisponde alla formula ∀v ∃w (w = h+ (v, v)). Possiamo quindi considerare il naturale (non standard, perché maggiore di c∗ ) uguale a c∗ +∗ c∗ e che possiamo chiamare 2c∗ . In base a successive applicazioni di σ ∗ e σ ∗−1 a 2c∗ possiamo considerare anche la copia Z2c∗ di Z in N ∗ . Lemma 8.7 Zc∗ ∩ Z2c∗ = ∅. Dimostrazione. Ogni elemento x di Zc∗ può essere scritto nella forma (σ ∗ )k c∗ o nella forma (σ ∗−1 )k c∗ , per un opportuno k, e analogamente per gli elementi di Z2c∗ . Se, per assurdo, x ∈ Zc∗ ∩ Z2c∗ , combinando opportunamente le espressioni di x del tipo visto sopra, ricaviamo che, essendo c∗ <∗ 2c∗ , esiste un naturale standard m tale che c∗ +∗ c∗ = (σ ∗ )m c∗ . Ogni formula della forma ∀v, w(w = (hσ )m (v) → h+ (v, m) = w) è vera in N0 e quindi in N ∗ . Se v e w vengono interpretati rispettivamente in c∗ e (σ ∗ )m c∗ , otteniamo c∗ +∗ c∗ = (σ ∗ )m c∗ = c∗ +∗ (σ ∗ )m 0∗ , da cui segue c∗ = (σ ∗ )m 0∗ (osservando che la Legge di Cancellazione viene espressa da una formula del primo ordine). Ma ciò contraddice il fatto che c∗ sia non standard. È chiaro a questo punto che N ∗ contiene infinite copie di Z a due a due disgiunte. Dalla dimostrazione del lemma precedente abbiamo inoltre il seguente risultato. Corollario 8.8 Dati due naturali non standard a e b in N ∗ , essi appartengono ad una stessa copia di Z se e solo se esiste un naturale standard n tale che a = n +∗ b oppure b = n +∗ a. Detta Za la copia di Z che contiene a, possiamo definire in modo naturale una relazione d’ordine stretto sull’insieme degli Za ponendo Za ≺ Zb se solo se Za 6= Zb e a <∗ b Per quanto visto finora, l’insieme degli Za non ha massimo. Per verificare che non ha neanche minimo basta considerare la formula ∀v ∃w (h+ (w, w) = v ∨ h+ (w, w) = hσ (v)) che asserisce che ogni numero naturale o il suo successore può essere diviso per due. Questa formula è ovviamente vera nel modello standard, e quindi anche in N ∗ . Esiste quindi un ∗ ∗ ∗ ∗ ∗ elemento di N ∗ , che possiamo indicare con c2 , tale che c2 + c2 = c∗ oppure c2 + c2 = σ ∗ c∗ . ∗ Con una dimostrazione simile a quella del Lemma 8.7, possiamo concludere che c2 è un numero naturale non standard e che la corrispondente copia di Z non interseca Zc∗ (v. Figura 3). 41 Figura 3 0q q q q q . . . . . . Im(f ) ... q q q q q ... Z c∗ 2 ... q q q q q ... Zc∗ ... q q q q q ... Z2c∗ Infine, possiamo considerare la formula che esprime l’esistenza della ‘media’ di due numeri interi: ∀v1 , v2 , ∃w(h+ (w, w) = h+ (v1 , v2 ) ∨ h+ (w, w) = hσ (h+ (v1 , v2 ))) dove, come nel caso della divisione per due, abbiamo dovuto tener presente che la somma dei due numeri potrebbe essere dispari. Questa formula è vera in N0 e dunque anche in N ∗ . Dati quindi i naturali non standard a e b, possiamo considerare l’elemento di N ∗ la cui esistenza viene stabilita dalla precedente formula quando v1 e v2 vengono interpretate rispettivamente in a e b. Possiamo indicare tale elemento con a+b e considerare la 2 corrispondente copia di Z. Esercizio 8.9 Dimostrare che, per ogni coppia a e b di naturali non standard, se Za = Zb allora Z a+b = Za , mentre, se Za ≺ Zb allora Za ≺ Z a+b ≺ Zb 2 2 Questo risultato conclude lo studio della struttura di N ∗ come insieme ordinato. Oltre ad una parte iniziale (Im(f )) isomorfa a N0 , N ∗ contiene infinite copie Za di Z sulle quali è possibile definire una relazione d’ordine stretto. Questo ordine è senza massimo, senza minimo e denso e quindi, essendo la struttura numerabile, è isomorfo all’ordine dei razionali. 8.1 Linguaggi ridotti Possiamo ora tornare ad usare gli stessi simboli 0, σ, +, . . . sia nel linguaggio, sia nell’interpretazione. Nella prima parte di questa sezione abbiamo considerato un linguaggio del primo ordine con tutti i simboli dell’aritmetica. Può essere interessante esaminare linguaggi ridotti. In particolare considereremo un linguaggio del primo ordine L1N,σ , con la costante 0 e il solo simbolo di successore.23 Questi simboli erano sufficienti per definire somma, prodotto e relazione d’ordine nella teoria al secondo ordine. Si dimostrerà che ciò non è possibile con la capacità espressiva molto ridotta dei linguaggi del primo ordine. Cominciamo col considerare un sistema di assiomi per un’opportuna teoria basata su L1N,σ . Dopo i primi tre, abbiamo una successione infinita di assiomi, uno schema di assiomi. A1 ∀n(0 6= σn) A2 ∀m, n(σm = σn → m = n) A3 ∀n(n 6= 0 → ∃m(n = σm)) 23 Altre sottoteorie del linguaggio per l’aritmetica, assieme a quella considerata in questa sezione, sono considerate nelle sezioni 3.1 e 3.2 di [Enderton, 1972]. 42 A4.k ∀n(n 6= σ k n) (k ∈ N0+ ) 1 Indichiamo con TN,σ la teoria basata su questi assiomi. Ogni assioma (e quindi ogni teorema) di questa teoria è vero nella struttura N0 che tuttavia non è l’unico suo modello. Come nella parte precedente di questa sezione possiamo considerare modelli in cui esistono elementi a 6∈ N0 . Chiamiamo ancora numeri non-standard questi nuovi elementi. 1 Proposizione 8.10 I modelli della teoria TN,σ sono tutte e solo le strutture N ∗ = hN ∗ , 0, σi S in cui: (1) N ∗ = N ∪ i∈I Zi ; (2) hN, σi è isomorfo alla struttura hN0 , σi dei naturali standard; (3) I è un insieme arbitrario di indici e ogni hZi , σi è isomorfo alla struttura dei numeri interi; (4) se i 6= j, Zi e Zj sono disgiunti. Dimostrazione. Si verifica facilmente che ogni struttura descritta nell’enunciato è modello 1 . In tali strutture infatti: (i) 0 non appartiene all’immagine di σ; (ii) σ è iniettiva; di TN,σ (iii) ogni elemento diverso da 0 appartiene all’immagine di σ; (iv) non esistono σ-cicli. 1 . Sia f la funzione da N0 in Supponiamo inversamente che hN ∗ , 0, σi sia modello di TN,σ ∗ N definita da f (0) = 0 e f (σn) = σf (n). Per il Lemma 8.3, osservando che N2 è anche 1 , la funzione f è iniettiva. La funzione f conserva banalmente la funzione assioma di TN,σ σ e quindi, posto N = Im(f ), hN, σi è una sottostruttura di N ∗ isomorfa a hN0 , σi. Se N = N ∗ , poniamo I = ∅. Altrimenti, sia a un elemento di N ∗ \ N . Per l’iniettività di σ, anche σ −1 è una funzione (iniettiva), e possiamo considerare la chiusura Za di {a} per le operazioni σ e σ −1 . Poiché N = {σ k 0 : k ∈ N} e Za = {σ k (a) : k ∈ Z}, abbiamo che Za ∩ N = ∅. Per lo stesso motivo, se anche b ∈ N ∗ \ N , allora Za = Zb oppure Za ∩ Zb = ∅. 0 Osserviamo infine che, per A4, σ k a 6= σ k a ogniqualvolta k 6= k 0 ; non si sono cioè σ-cicli. Ogni Za dunque è isomorfo a Z (come struttura dotata dell’operazione di successore). 1 e i modelli di In base a questo risultato c’è una stretta analogia tra i modelli di TN,σ 1 TN considerati nella sezione precedente. Osserviamo però che il linguaggio che stiamo considerando non contiene la relazione d’ordine né la somma. Non viene quindi definita nessuna struttura d’ordine nell’insieme delle strutture Za . L’insieme di queste Z-catene è arbitrario. Per quanto riguarda l’indipendenza, gli assiomi A4.k meritano una discussione a parte. Osserviamo per esempio che A4.k è conseguenza di A4.2k. Se infatti per qualche n, n = σ k n, allora vale anche n = σ 2k n. In generale A4.k è conseguenza di A4.h per ogni multiplo h di k. La formulazione dell’indipendenza nella seguente proposizione assume quindi una forma particolare. 1 Proposizione 8.11 Gli assiomi A1-3 di TN,σ sono indipendenti, e per nessun valore di k A4k è deducibile da A1-3, A4.1, . . . ,A4.k−1. Dimostrazione. Per l’indipendenza di A1 basta considerare la struttura Z dei numeri interi ed interpretare σ nell’usuale operazione di successore. In questo modo otteniamo un modello di A2, A3, e ogni A4.k in cui A1 non è verificata. 43 Per l’indipendenza di A2 consideriamo una struttura Z0 isomorfa a Z, unita allo 0. Indichiamo con k 0 gli elementi di Z0 , dove k ∈ Z. La funzione σ è l’usuale funzione successore sugli elementi di Z0 , mentre σ(0) = 10 . In questo modo σ(0) = 10 = σ(00 ), e dunque σ non è iniettiva. Gli assiomi diversi da A2 sono invece verificati. Per A3 possiamo considerare la struttura costituita da N0 e da una sua copia N00 . La funzione σ è l’usuale successore. In questo modo 00 è un elemento diverso da 0 che non ha predecessore. Per seconda parte dell’enunciato infine, dato k > 0, consideriamo una struttura costituita da N0 e da k nuovi elementi a1 , . . . , ak . La funzione σ è l’usuale successore su N0 , per h < k poniamo σah = ah+1 , mentre σak = a1 . Abbiamo cioè aggiunto a N0 un ‘ciclo’ di k elementi. In questa struttura sono verificati gli assiomi A1-3 e ogni A4h con h < k. Vale invece l’uguaglianza ai = σ k ai . 1 non è finitamente assiomatizzabile, non Corollario 8.12 L’insieme dei teoremi di TN,σ 1 . esiste cioè nessun insieme finito di assiomi da cui siano deducibili tutti i teoremi di TN,σ Dimostrazione. Supponiamo per assurdo che esista una teoria T , con un insieme finito 1 {B1 , . . . , Bn } di assiomi (non necessariamente assiomi di TN,σ ), in grado di dimostrare 1 tutti i teoremi di TN,σ . Le due teorie sono cioè equivalenti, e quindi in particolare ogni assioma Bi sarà teorema di 1 TN,σ . Poiché ogni dimostrazione coinvolge un numero finito di formule, possiamo indicare 1 con Ai,1 , . . . , Ai,ki gli assiomi di TN,σ coinvolti nella dimostrazione di Bi in questa teoria. 1∗ Consideriamo la teoria TN,σ avente come assiomi tutti gli Ai,j (1 ≤ i ≤ n, 1 ≤ j ≤ ki ). 1 1∗ Tutti i teoremi di T (e quindi di TN,σ ) sono anche teoremi di TN,σ che ha un numero finito di assiomi. Ma ciò contraddice la Proposizione 8.11. S 1 . Per la Proposizione 8.10 possiamo porre N ∗ = N ∪ i∈I Zi , Sia N ∗ un modello di TN,σ dove ogni Zi è una Z-catena. Si α il cardinale dell’insieme I. Poiché ogni Zi è numerabile, possiamo concludere ( ℵ0 se α ≤ ℵ0 (8.16) |N ∗ | = α altrimenti 1 Proposizione 8.13 Se N1 e N2 sono modelli non numerabili di TN,σ ed hanno la stessa cardinalità, allora N1 e N2 sono isomorfi. Dimostrazione. Sia α > ℵ0 la cardinalità di N1 e N2 . Per (8.16), abbiamo che α è anche la cardinalità degli insiemi C1 e C2 delle Z-catene nei due modelli. Esiste quindi una corrispondenza biunivoca tra C1 e C2 . Componendo tale corrispondenza con l’identità su Z otteniamo quindi una biiezione (che conserva σ) tra le parti non-standard di N1 e N2 . Le parti standard sono ovviamente isomorfe. In base a questa proposizione abbiamo immediatamente: 1 Teorema 8.14 La teoria TN,σ è α-categorica per ogni α non numerabile. 44 1 Corollario 8.15 La teoria TN,σ è sintatticamente completa. 1 Dimostrazione. Per il teorema precedente e la Proposizione 6.6, tenendo presente che TN,σ non ha modelli finiti. Corollario 8.16 Per ogni enunciato ϕ di L1N,σ , ϕ è vero nella struttura standard N0 se 1 e solo se è dimostrabile in TN,σ . 1 1 Dimostrazione. La struttura N0 è modello di TN,σ , e dunque ogni teorema di TN,σ è vero 1 1 1 in N0 . Inversamente, se TN,σ 6` ϕ, allora TN,σ ` ¬ϕ per la completezza sintattica di TN,σ , e quindi ϕ non è vero in N0 . Definizione 8.17 Una teoria assiomatica T ammette eliminazione dei quantificatori se, per ogni formula ϕ, esiste una formula ψ, in cui non compaiono quantificatori, tale che T ` ϕ ↔ ψ. 1 ammette eliminazione dei quantificatori. In base al Corollario 8.16 Dimostreremo che TN,σ sarà sufficiente mostrare che, per ogni formula ϕ, esiste una formula ψ, in cui non compaiono quantificatori, tale che N0 |= ϕ ↔ ψ. D’ora in avanti quindi, parleremo di formule 1 ϕ e ψ equivalenti intendendo sia TN,σ ` ϕ ↔ ψ, sia N0 |= ϕ ↔ ψ.24 Enunciamo preliminarmente un risultato sulle logiche del primo ordine. Chiamiamo letterale ogni formula atomica, o negazione di formula atomica. Nel caso di L1N,σ , dove non abbiamo simboli per relazioni, i letterali saranno quindi le formule del tipo t1 = t2 o t1 6= t2 , dove t1 e t2 sono termini. Essendo poi 0 l’unica costante e σ l’unica funzione, i termini saranno solo del tipo σ n 0 o σ n x, con x variabile e n ≥ 0. Definizione 8.18 La formula ϕ è in forma normale prenessa congiuntiva se ϕ è Q1 x1 , . . . , Qn xn ψ dove (1) ogni Qi è ∀ o ∃, e (2) ψ è una congiunzione ψ1 ∧· · ·∧ψk dove ciascun ϕi è una disgiunzione ψi1 ∨ · · · ∨ ψi mi di letterali. La forma normale prenessa disgiuntiva è definita in modo analogo, scambiando ∧ e ∨. Non daremo una dimostrazione della seguente proposizione. Ci limitiamo ad osservare che la dimostrazione si basa su equivalenze del tipo ¬(ϕ ∧ ψ) ↔ ¬ϕ ∨ ¬ψ, ¬∀xϕ ↔ ∃x¬ϕ ecc., e sulla distributività di ∨ rispetto a ∧ e viceversa. Proposizione 8.19 Ogni formula del primo ordine è equivalente ad una formula in forma normale prenessa congiuntiva e ad una formula in forma normale prenessa disgiuntiva. 24 Spesso problemi relativi all’eliminazione dei quantificatori sono riferiti a ‘teorie’ intese come insiemi di formule chiusi per deducibilità, e quindi non necessariamente teorie ‘assiomatiche’. L’esempio più frequente è “l’insieme degli enunciati veri in una data interpretazione I”, per cui la definizione dell’eliminazibilità dei quantificatori è che, per ogni formula ϕ esiste una formula ψ senza quantificatori tale che I |= ϕ ↔ ψ. 45 Lemma 8.20 Se una teoria del primo ordine T ammette eliminazione dei quantificatori per formule del tipo ∃x(ψ1 ∧ · · · ∧ ψn ) con ψi letterali, allora T ammette eliminazione dei quantificatori. Dimostrazione. Consideriamo una formula ϕ e supponiamo inizialmente che, in forma normale prenessa disgiuntiva, abbia un solo quantificatore. Quindi ϕ è equivalente alla formula Qx(ϕ1 ∨ · · · ∨ ϕn ) dove Q è ∃ o ∀, e ogni ϕi è una congiunzione di letterali. Caso 1: Q è ∃. Dall’equivalenza ∃x(χ1 ∨χ2 ) ↔ (∃x χ1 ∨∃x χ2 ) abbiamo che ϕ è equivalente a ∃xϕ1 ∨· · ·∨∃xϕn . Essendo ogni ϕi una congiunzione di letterali, per le ipotesi del lemma ogni formula ∃xϕi è equivalente ad una formula senza quantificatori, quindi il risultato vale anche per ϕ. Caso 2: Q è ∀. Questo caso si riporta facilmente al precedente osservando che ∀xψ è equivalente a ¬∃x¬ψ. La formula ¬ψ risulta a sua volta equivalente alla disgiunzione di congiunzioni di letterali, e dunque, come abbiamo visto sopra, ∃x¬ψ è equivalente ad una formula senza quantificatori. Nel caso in cui la forma normale prenessa disgiuntiva di ϕ abbia più di un quantificatore, possiamo iterare il processo precedente e determinare una formula equivalente a ϕ e senza quantificatori. 1 ammette eliminazione dei quantificatori. Teorema 8.21 La teoria TN,σ Dimostrazione. Per il lemma precedente possiamo limitarci a dimostrare il teorema per formule del tipo ∃x(ϕ1 ∧ · · · ∧ ϕn ) dove le ϕi sono letterali che, in L1N,σ , sono formule del tipo σ k t1 = σ m t2 o σ k t1 6= σ m t2 , dove t1 e t2 sono la costante 0 o una variabile, e k, m ≥ 0. Mostreremo che ogni formula ϕi può essere sostituita con una formula in cui x non compare. Il teorema seguirà quindi dal fatto che ∃xψ è equivalente a ψ se questa formula non contiene x. Ogni formula ϕi che contiene x ha la forma σ k x = σ m t o σ k x 6= σ m t, dove t è 0 o una variabile. Possiamo anche supporre che t non sia la variabile x perché σ k x = σ m x può essere sostituito da 0 = 0 se k = m, e da 0 6= 0 se k 6= m. Possiamo ora distinguere due casi. Caso 1: ogni ϕi è è del tipo σ k x 6= σ m t, con t 6= x. Dunque ∃x(ϕ1 ∧ . . . ϕn ) esprime l’esistenza di un x che verifica un numero finito di disuguaglianze di quel tipo. Per ogni scelta di valori per le variabili diverse da x che compaiono in ϕ, esiste sempre un valore di x che verifica le disuguaglianze perché queste sono in numero finito. La formula ϕ è dunque equivalente alla formula 0 = 0. Caso 2: esiste almeno una ϕi della forma σ k x = t, dove t non contiene x. Questa equazione ha soluzioni quando il numero naturale corrispondente a t è maggiore o uguale a k. L’esistenza di un x tale che σ k x = t corrisponde alla verità della formula t 6= 0 ∧ t 6= σ0∧· · ·∧t 6= σ k−1 0 in cui x non compare. Possiamo quindi sostituire quest’ultima formula a ϕi . Se σ m x = u è un’altra ϕj nella forma di uguaglianza, possiamo prima sostituire ϕj con σ m+k x = σ k u e quindi con σ m t = σ k u in cui x non compare. Possiamo ora vedere alcune conseguenze dell’eliminabilità dei quantificatori per L1N,σ . La prima è la decidibilità dell’insieme degli enunciati di L1N,σ veri in N0 . Non enunciamo 46 esplicitamente questo risultato perché non abbiamo dato una definizione rigorosa di decidibilità. Alcune osservazioni intuitive possono tuttavia presentare adeguatamente il risultato. Osserviamo preliminarmente che la costruzione della formula senza quantificatori nella dimostrazione del Teorema 8.21 è basata su una procedura effettiva che permette di costruire quella formula con un numero finito di passaggi. Sempre per quella dimostrazione, inoltre, la formula ottenuta non ha più variabili libere della formula ϕ di partenza. Un enunciato risulta quindi equivalente ad un enunciato ψ senza quantificatori, in cui cioè non compaiono variabili. Tenendo presente ora i simboli di L1N,σ , ψ non è altro che la combinazione di formule del tipo σ m 0 = σ k 0 con gli operatori ∧, ∨ e ¬. La verità delle formule costruite in questo modo è determinabile in un numero finito di passaggi (con le tavole di verità). Abbiamo quindi che la verità in N0 per le formule di L1N,σ (che equivale 1 alle dimostrabilità in TN,σ ) risulta decidibile.25 Diciamo che A ⊆ X è cofinito se A, il complementare X \ A di A in X, è finito. Lemma 8.22 I sottoinsiemi di N0 definibili nel linguaggio L1N,σ sono i sottoinsiemi finiti e cofiniti. Dimostrazione. Consideriamo una formula ϕ(x) con l’unica variabile libera x. Per il Teorema 8.21 possiamo supporre che ϕ(x) non contenga quantificatori, e quindi sia combinazione, per mezzo degli operatori ∧, ∨ e ¬, di formule atomiche σ k t1 = σ m t2 in cui compare al più la variabile x. Ogni formula di questo tipo definisce un insieme con al più un elemento, quindi un insieme finito, oppure l’intero N0 . Le operazioni insiemistiche corrispondenti agli operatori ∧, ∨ e ¬ sono intersezione, unione, e complementazione. Basta quindi osservare che applicando queste operazioni a insiemi finiti o cofiniti, otteniamo ancora insiemi finiti o cofiniti. Proposizione 8.23 L’operazione di somma non è definibile in L1N,σ . Dimostrazione. Con l’operazione di somma possiamo definire l’insieme dei numeri pari: ∃y(y + y = x). Ma questo insieme non è finito né cofinito. Quindi il risultato segue dal lemma precedente. 9 9.1 Teorema di Loś e Teorema di Compattezza Ultrafiltri La nozione generale di filtro riguarda i reticoli, o in particolare le Algebre di Boole. Per gli scopi di queste note possiamo limitarci all’Algebra di Boole ℘X, dove X è un arbitrario insieme infinito. 25 In effetti questo risultato poteva essere dedotto anche dal Corollario 8.15. È un risultato classico di Teoria della Ricorsività infatti che l’insieme dei teoremi di una teoria assiomatica sintatticamente completa è decidibile. 47 Definizione 9.1 Un filtro sull’insieme X è un sottoinsieme F di ℘X tale che (1) ∅ 6∈ F, (2) se Y ∈ F e Y ⊆ Z, allora Z ∈ F, e (3) se Y ∈ F e Z ∈ F, allora Y ∩ Z ∈ F. Esercizio 9.2 Sia F un filtro su X e siano A e B sottoinsiemi di X. Dimostrare che A ∩ B ∈ F se e solo se A ∈ F e B ∈ F. Esercizio 9.3 Sia A è un sottoinsieme non vuoto di X. Dimostrare che {B ⊆ X : A ⊆ B} è un filtro (che viene chiamato filtro principale generato da A) Esercizio 9.4 Dimostrare che i sottoinsiemi cofiniti di un insieme infinito X costituiscono un filtro (filtro di Frechet su X). Definizione 9.5 Un sottoinsieme H di ℘X ha la proprietà dell’intersezione finita (PIF) se A0 ∩ · · · ∩ An 6= ∅ per ogni sottoinsieme finito {A0 , . . . , An } di H. Esercizio 9.6 Dimostrare che, se H ∈ ℘X ha la PIF, allora l’insieme F = {A ⊆ X : ∃A0 , . . . , An ∈ H : A0 ∩ · · · ∩ An ⊆ A} è un filtro su X Proposizione 9.7 Sia U un filtro sull’insieme X. Sono equivalenti le seguenti affermazioni: (i) U è massimale per inclusione, cioè, se F è un filtro su X e U ⊆ F, allora U = F; (ii) per ogni A ⊆ X, A ∈ U oppure A ∈ U; (iii) se A0 ∪ · · · ∪ An ∈ U, allora esiste un i ≤ n tale che Ai ∈ U. Dimostrazione. (i) ⇒ (ii). Supponiamo A 6∈ U. Allora, per la proprietà (2) dei filtri, B 6⊆ A e dunque B ∩ A 6= ∅ per ogni B ∈ U. Quindi U ∪ {A} ha la PIF26 ed è contenuto in un filtro F, ma per (i) F = U e A ∈ U. (ii) ⇒ (iii). Supponiamo Ai 6∈ U per ogni i ≤ n. La proprietà (ii) implica Ai ∈ U per ogni i e quindi A0 ∩ · · · ∩ An ∈ U, ma A0 ∩ · · · ∩ An = A0 ∪ · · · ∪ An e quindi A0 ∪ · · · ∪ An 6∈ U. (iii) ⇒ (i). Sia U un filtro che verifica (iii) e supponiamo U ⊆ F. Mostriamo che ogni elemento di F è anche elemento di U. Dato A ∈ F, A ∪ A ∈ U e quindi A ∈ U oppure A ∈ U. Ma la seconda alternativa non può verificarsi perché U ⊆ F. Definizione 9.8 Un ultrafiltro su X è un filtro che verifica le tre condizioni equivalenti della Proposizione 9.7. Dato un insieme X e un suo elemento x0 , l’insieme U = {A ⊆ X : x0 ∈ A} è un ultrafiltro (esercizio). In questo caso diciamo che U è l’ultrafiltro principale generato da x0 . Esistono anche ultrafiltri non principali; in particolare ogni filtro può essere esteso ad un ultrafiltro. Per dimostrare questo risultato è necessario il Lemma di Zorn (Appendice B). Teorema 9.9 Ogni filtro F sull’insieme X è contenuto in un ultrafiltro. 26 Si osservi che possiamo sostituire B con qualsiasi intersezione finita B1 ∩ · · · ∩ Bn di elementi di U. 48 Dimostrazione. Sia F = {G : G è un filtro su X e F ⊆ G}. La relazione ⊆ è una relazione d’ordine S su F. Sia H un sottoinsieme di F totalmente ordinato da ⊆. Mostriamo che H = G∈H G è un filtro. L’insieme vuoto non appartiene a nessun elemento di H e quindi neanche a H. Se A ∈ H e A ⊆ B, basta osservare che A appartiene a qualche G ∈ H e quindi B ∈ G, da cui segue B ∈ H. Supponiamo A, B ∈ H. Esistono quindi G, G 0 ∈ H tali che A ∈ G e B ∈ G 0 . Poiché H è totalmente ordinato da ⊆, abbiamo G ⊆ G 0 oppure G 0 ⊆ G. Supponiamo G ⊆ G 0 . Allora A, B ∈ G 0 e A ∩ B ∈ G 0 ⊆ H. Dunque H è un filtro che contiene tutti i filtri in H; è cioè un maggiorante per H. Sono quindi verificate le ipotesi del Lemma di Zorn e possiamo concludere che F ha elementi massimali per l’inclusione. Tali elementi sono ultrafiltri. Corollario 9.10 Dato l’insieme X, ogni sottoinsieme di ℘X con la PIF è contenuto in un ultrafiltro. L’insieme dei sottoinsieme cofiniti di X per esempio può essere esteso ad un ultrafiltro che non è principale. Esercizio 9.11 Dimostrare che un ultrafiltro non è principale se e solo se contiene tutti gli insiemi cofiniti. 9.2 Prodotti diretti e ultraprodotti In questa sezione (tratta da [Bell and Machover, 1977, Cap. 5]) verrà considerata la costruzione di interpretazioni di un dato linguaggio basata su altre interpretazioni dello stesso linguaggio. Vogliamo determinare delle condizioni affinché nella nuova interpretazione risultino vere le formule che erano vere nelle interpretazioni di partenza. Per non appesantire il discorso considereremo un linguaggio L con un’unico simbolo per relazione binaria R (oltre all’identità) e senza simboli per costanti e per funzioni. Gli unici termini di L sono dunque le variabili. In tutta la sezione, J è un fissato insieme non vuoto di indici e, per ogni j ∈ J, IQ j = hDj , Ij i è una fissata interpretazione di L. Indichiamo con S D il prodotto cartesiano j∈J Dj . Gli elementi di D sono dunque funzioni f da J in j∈J Dj tali che, per ogni j, f (j) ∈ Dj . Q Il prodotto diretto j∈J Ij è una interpretazione I = hD, Ii per L in cui l’interpretazione RI di R viene definita dalla seguente condizione hf, gi ∈ RI ⇔ per ogni j ∈ J, hf (j), g(j)i ∈ RIj (9.17) I prodotti diretti di strutture non funzionano bene per conservare la verità delle formule. Non è difficile infatti costruire esempi di enunciati che risultano veri in ogni Ij , ma falsi nel prodotto diretto I. Supponiamo per esempio che ogni RIj sia una relazione di ordine totale che indichiamo con ≤j . Indicando con ≤ la relazione RI , in base a (9.17) abbiamo che f ≤ g se e solo se, per ogni j ∈ J, f (j) ≤j g(j). Per la totalità degli ordini ≤j , l’enunciato ϕ = 49 ∀x, y (R(x, y) ∨ R(y, x)) è vero in ogni Ij . Supponiamo ora che gli insiemi J e Dj abbiano almeno due elementi. Esistono quindi f, g ∈ D tali che: per qualche j, f (j) 6≤j g(j) e, per altri k, f (k) 6≤k g(k). Da ciò segue f 6≤ g e g 6≤ f , e dunque I 6|= ϕ. Per conservare la verità degli enunciati abbiamo bisogno di costruzioni più complesse del prodotto diretto. Sia ϕ(v1 , . . . , vn ) una formula le cui variabili libere appartengono all’insieme {v1 , . . . , vn } e consideriamo gli elementi f1 , . . . , fn di D. Siamo interessati all’ insieme degli indici j tali che la formula ϕ(v1 , . . . , vn ) risulta vera in Ij quando le variabili v1 , . . . , vn vengono valutate rispettivamente in f1 (j), . . . , fn (j). Estendendo la notazione vista nella Definizione 2.6, scriveremo V(v1 , . . . , vn /a1 , . . . , an ) per indicare la valutazione V 0 tale che V 0 (vi ) = ai per i = 1, . . . , n, e V 0 (v) = V(v) per ogni altra variabile. Conviene infine usare la notazione vettoriale scrivendo v al posto di v1 , . . . , vn , f al posto di f1 , . . . , fn , e f (j) al posto di f1 (j), . . . , fn (j). Poniamo: def ||ϕ(v)[f ] || = {j ∈ J : Ij , Vj (v/f (j)) |= ϕ(v)} (9.18) dove Vj è una arbitraria valutazione su Ij . Poiché tutte le variabili libere di ϕ(v) sono nell’insieme {v1 , . . . , vn }, la definizione precedente non dipende dalla scelta delle Vj . Lemma 9.12 Per ogni f, g, f1 , . . . , fn in D, abbiamo ||v1 = v2 [f, g] || = {j ∈ J : f (j) = g(j)} ||R(v1 , v2 ) [f, g] || = {j ∈ J : hf (j), g(j)i ∈ RIj } ||¬ϕ(v)[f ] || = J \ ||ϕ(v)[f ] || ||(ϕ ∧ ψ)(v)[f ] || = ||ϕ(v)[f ] || ∩ ||ψ(v)[f ] || S ||∃v ϕ(v, v)[f ] || = f ∈D ||ϕ(v, v)[f, f ] || Dimostrazione. Le prime due uguaglianze seguono immediatamente dalla regola di verità R0 e R1. Dalle regole R2 e R3 segue facilmente l’enunciato per formule del tipo ¬ϕ e ϕ ∧ ψ. Per l’ultima uguaglianza dobbiamo usare la regola R8. Supponiamo j ∈ ||∃v ϕ(v, v)[f ] ||, cioè, per (9.18), Ij , Vj (v/f (j)) |= ∃v ϕ(v, v) e quindi esiste a ∈ Dj tale che Ij , Vj (v, v/a, f (j)) |= ϕ(v, v) Se dunque g è un qualsiasi elemento di D tale che g(j) = a, abbiamo [ j ∈ ||ϕ(v, v)[g, f ] || ⊆ ||ϕ(v, v)[f, f ] || f ∈D S Supponiamo inversamente j ∈ f ∈D ||ϕ(v, v)[f, f ] ||. Esiste quindi g ∈ D tale che j ∈ ||ϕ(v, v)[g, f ] ||, cioè Ij , Vj (v, v/g(j), f (j)) |= ϕ(v, v) ma per R8 da ciò segue Ij , Vj (v/f (j)) |= ∃v ϕ(v, v), cioè j ∈ ||∃v ϕ(v, v)[f ] ||. 50 Osservazione 9.13 Nel precedente lemma abbiamo considerato solo formule costruite solo usando ¬, ∧ e ∃. Non è una scelta restrittiva perché (come abbiamo osservato nella nota 6) gli altri operatori possono essere definiti usando questi. In tutto il capitolo quindi considereremo formule costruite in questo modo. Esercizio 9.14 Sia ϕ(v) una formula con l’unica variabile libera v e siano f e g elementi di D. Mostrare che ||v1 = v2 [f, g] || ∩ ||ϕ(v)[f ] || ⊆ ||ϕ(v)[g] || Suggerimento. Per (9.18), il fatto che j appartenga o meno a ||ϕ(v)[f ] || dipende solo dal valore di f in j. Lemma 9.15 Sia ϕ(v, v) una formula con variabili libere in {v, v1 , . . . , vn } e siano f1 , . . . , fn elementi di D. Allora esiste g ∈ D tale che ||∃v, ϕ(v, v)[f ] || = ||ϕ(v, v)[g, f ] || Dimostrazione. Per semplicità di scrittura supponiamo che v sia l’unica variabile libera in ϕ, per cui le n-uple v e f sono vuote. La dimostrazione nel caso generale è identica. Consideriamo un buon ordinamento di D.27 Abbiamo dunque D = {fβ : β < α}, dove α è un opportuno ordinale. Per ogni β < α poniamo [ Xβ = ||ϕ(v)[fβ ] || \ ||ϕ(v)[fη ] || η<β Per il Lemma 9.12 abbiamo quindi [ [ [ Xβ ||ϕ(v)[fβ ] || = ||ϕ(v)[f ] || = ||∃v ϕ(v)|| = f ∈D β<α β<α Gli insiemi Xβ sono per costruzione sottoinsiemi di J a due a due disgiunti. Poiché unioni S di funzioni con domini disgiunti sono ancora funzioni, l’unione β<α fβ |Xβ delle restrizioni S delle fβ a Xβ è una funzione con dominio β<α Xβ . Sia g un qualsiasi elemento di D che estende questa funzione. Per ogni β < α abbiamo quindi g|Xβ = fβ |Xβ . Quindi Xβ ⊆ ||v1 = v2 [g, fβ ] || e, per l’Esercizio 9.14, ||ϕ(v)[g] || ⊇ ||v1 = v2 [g, fβ ] || ∩ ||ϕ(v)[fβ ] || ⊇ Xβ da cui segue ||∃v ϕ(v)|| = [ Xβ ⊆ ||ϕ(v)[g] || β<α L’inclusione inversa segue dal Lemma 9.12. Sia ora U un ultrafiltro sull’insieme J degli indici. Per ogni f, g ∈ D poniamo f ∼U g 27 ⇔ {j : f (j) = g(j)} ∈ U (9.19) In questa dimostrazione viene usata la nozione di ordinale che verrà precisata solo nella seconda parte del corso. 51 Esercizio 9.16 Dimostrare che la relazione ∼U è una relazione di equivalenza. (Si osservi che è sufficiente supporre che U sia un filtro). Possiamo quindi considerare l’insieme delle classi di equivalenza modulo ∼U in D. Indicheremo questo insieme con D/U, e con [f ]U la classe di equivalenza dell’elemento f di D. Vogliamo usare l’insieme D/U come dominio di una nuova interpretazione di L, per cui dobbiamo definire l’interpretazione di R che indicheremo con RU . Poniamo h[f ]U , [g]U i ∈ RU ⇔ {j ∈ J : hf (j), g(j)i ∈ RIj } ∈ U (9.20) Lemma 9.17 La relazione RU in (9.20) è ben definita. Dimostrazione. Poniamo F = {j ∈ J : f (j) = f 0 (j)}, G = {j ∈ J : g(j) = g 0 (j)} e X = {j ∈ J : hf (j), g(j)i ∈ RIj }, e supponiamo F ∈ U, G ∈ U, e X ∈ U. Le prime due relazioni dicono rispettivamente che f ∼U f 0 e g ∼U g 0 . Per verificare che RU è ben definita dobbiamo mostrare che anche l’insieme X 0 = {j ∈ J : hf 0 (j), g 0 (j)i ∈ RIj } appartiene a U. Ma F ∩ G ∩ X ⊆ X 0 e quindi, per le proprietà dei filtri, X 0 ∈ U. L’interpretazione di L,Y basata su D/U e con l’interpretazione RU del simbolo per relazioni R, viene indicata con Ij /U (o I/U) e viene chiamata ultraprodotto delle interpretazioni j∈J Ij (con ultrafiltro U). Se tutte queste interpretazioni coincidono con l’interpretazione K, allora l’interpretazione I/U, indicata con KJ /U, viene chiamata ultrapotenza di K. Si vedrà in seguito gli ultraprodotti sono interessanti solo quando sono basati su ultrafiltri non principali, quindi ultrafiltri che non hanno insiemi finiti come elementi (v. Esercizio 9.11). Per questo motivo si dice spesso che le classi di equivalenza [ · ]U identificano elementi di D che coincidono su un ‘sottoinsieme grande’ di J. Un discorso analogo si può fare per la relazione RU . Teorema 9.18 (Teorema di Loś) Sia ϕ una formula di L con variabili libere nell’insieme {v1 , . . . , vn } (= {v}). Per ogni n-upla f1 , . . . , fn (= f ) di elementi di D, I/U, V(v/[f ]U ) |= ϕ ⇔ ||ϕ(v)[f ] || ∈ U dove [f ]U è l’n-upla [f1 ]U , . . . , [fn ]U . In particolare, se ϕ è un enunciato, I/U |= ϕ ⇔ {j ∈ J : Ij |= ϕ} ∈ U Dimostrazione. La seconda equivalenza è conseguenza immediata della prima che dimostriamo per induzione sulla complessità di ϕ. Se ϕ è della forma v1 = v2 o R(v1 , v2 ), allora il risultato è conseguenza immediata della definizione di ∼U e di RU . Possiamo quindi considerare i casi in cui ϕ è ¬ψ, o ψ ∧ χ, o ∃v ψ, e supporre induttivamente che il teorema valga per ψ e χ. Caso 1: ϕ è ¬ψ. Allora I/U, V(v/[f ]U ) |= ϕ ⇔ I/U, V(v/[f ]U ) 6|= ψ 52 ⇔ ||ψ(v)[f ] || 6∈ U ⇔ ||ϕ(v)[f ] || ∈ U dove nella penultima equivalenza abbiamo usato l’ipotesi induttiva e, nell’ultima, abbiamo usato l’uguaglianza ||ψ(v)[f ] || = J \ ||ϕ(v)[f ] || (Lemma 9.12) e il fatto che U sia un ultrafiltro. Caso 2: ϕ è ψ ∧ χ. Allora I/U, V(v/[f ]U ) |= ϕ ⇔ ⇔ I/U, V(v/[f ]U ) |= ψ e I/U, V(v/[f ]U ) |= χ ||ψ(v)[f ] || ∈ U e ||χ(v)[f ] || ∈ U ⇔ ⇔ ||ψ(v)[f ] || ∩ ||χ(v)[f ] || ∈ U ||(ψ ∧ χ)(v)[f ] || ∈ U dove abbiamo usato il (Lemma 9.12) e l’Esercizio 9.2. Caso 3: ϕ è ∃v ψ. Allora I/U, V(v/[f ]U ) |= ϕ se e solo se esiste f ∈ D tale che I/U, V(v, v/[f ]U , [f ]U ) |= ψ. Per l’ipotesi induttiva ciò equivale a ||ψ(v, v)[f, f ] || ∈ U. Per il Lemma 9.12, ||ψ(v, v)[f, f ] || ⊆ ||∃v ψ(v, v)[f ] || e dunque, per le proprietà dei filtri, ||∃v ψ(v, v)[f ] || ∈ U. Supponiamo inversamente ||∃v ψ(v, v)[f ] || ∈ U. Per il Lemma 9.15 esiste g ∈ D tale che ||ψ(v, v)[g, f ] || ∈ U. Per l’ipotesi induttiva abbiamo I/U, V(v, v/[g]U , [f ]U ) |= ψ che implica I/U, V(v/[f ]U ) |= ∃v ψ. La seguente proposizione dimostra che un ultraprodotto è effettivamente interessante solo quando l’ultrafiltro su cui è basato non è principale. Altrimenti non costruiamo niente di nuovo. Proposizione 9.19 Se l’ultrafiltro U è l’ultrafiltro principale generato da j0 , allora l’ultraprodotto I/U è isomorfo a Ij0 . Dimostrazione. Dobbiamo definire una opportuna funzione biiettiva h da D/U su Dj0 . Poniamo h([f ]U ) = f (j0 ). Tale funzione è ben definita perché [f ]U = [g]U ⇔ {j : f (j) = g(j)} ∈ U ⇔ j0 ∈ {j : f (j) = g(j)} ⇔ f (j0 ) = g(j0 ) ⇔ h([f ]U ) = h([g]U ). Queste equivalenze mostrano anche che h è iniettiva. La funzione h è banalmente suriettiva perché, per ogni a ∈ Dj0 esiste f in D tale che f (j0 ) = a. Resta quindi da dimostrare che h conserva le interpretazioni RU e RIj0 del simbolo per funzioni R. Da (9.20) segue: h[f ]U , [g]U i ∈ RU ⇔ {j : hf (j) = g(j)i ∈ RIj } ∈ U ⇔ hf (j0 ), g(j0 )i ∈ RIj0 . Esercizio 9.20 Si supponga Ij = K per ogni j ∈ J, e che l’insieme J sia finito. Dimostrare che l’ultrapotenza KJ /U è isomorfa a K. Proposizione 9.21 Sia J = N , l’insieme dei naturali e sia K l’interpretazione di L basata sul dominio N , in cui RK è l’usuale ordine sui naturali. Sia infine U in ultrafiltro non principale su N . Allora KJ /U non è un buon ordinamento. 53 Dimostrazione. Indichiamo con ha0 , a1 , . . . i le successioni di naturali. Il dominio D di KJ /U è quindi costituito dalle classi di equivalenza [ha0 , a1 , . . . i]U dove [ha0 , a1 , . . . i]U = [hb0 , b1 , . . . i]U ⇔ {n : an = bn } ∈ U. La relazione RU in KJ /U è definita da h[ha0 , a1 , . . . i]U , [hb0 , b1 , . . . i]U i ∈ RU ⇔ {n : an ≤ bn } ∈ U Siano f0 , f1 , . . . , fn , . . . le successioni di naturali dove f0 = h0, 1, 2, 3 . . . i e, per ogni n, se fn = ha0 , a1 , . . . i allora fn+1 = hb0 , b1 , . . . i è definita da: bk = 0 se ak = 0, e bk = ak − 1 se ak 6= 0. Le successioni f0 , f1 , . . . sono quindi h0, 1, 2, 3 . . . i, h0, 0, 1, 2, 3 . . . i, h0, 0, 0, 1, 2, 3, . . . i, ecc. In particolare, per ogni naturale k, bk ≤ ak che implica h[fn+1 ]U , [fn ]U i ∈ RU per ogni n. La successione [f0 ]U , [f1 ]U , . . . , [fn ]U , . . . è dunque una successione RU -decrescente. Per concludere la dimostrazione dobbiamo mostrare che la successione [f0 ]U , [f1 ]U , . . . , [fn ]U , . . . è infinita. Per ogni n 6= m, fn e fm coincidono solo su un insieme finito di naturali (un segmento iniziale) che quindi non appartiene a U (essendo questo ultrafiltro non principale). Dunque [fn ]U 6= [fm ]U . Questo risultato può essere generalizzato all’ultraprodotto di arbitrari insiemi infiniti bene ordinati. Una conseguenza è un risultato già visto nell’Esercizio 4.5: la proprietà di essere un buon ordinamento non è esprimibile da formule del primo ordine (altrimenti tale proprietà dovrebbe essere conservata dagli ultraprodotti). Siamo ora in grado di dimostrare il Teorema di Compattezza Semantica (Teorema 4.2) con mezzi puramente semantici, cioè senza usare il Teorema 4.1. Teorema 9.22 (Teorema di Compattezza Semantica) Un insieme Φ di enunciati del primo ordine ha modello se e solo se ogni suo sottoinsieme finito ha modello. Dimostrazione. Sia J l’insieme di tutti i sottoinsiemi finiti di Φ e, per ogni ∆ ∈ J, fissiamo un modello I∆ di ∆. Poniamo ˜ = {∆0 ∈ J : ∆ ⊆ ∆0 } ∆ Dati gli elementi ∆1 , . . . , ∆n di J, abbiamo ∆i ⊆ ∆1 ∪· · ·∪∆n per ogni i e quindi ∆1 ∪· · ·∪ ˜1 ∩···∩∆ ˜ n . L’insieme {∆ ˜ : ∆ ∈ J} ha dunque la proprietà dell’intersezione finita ∆n ∈ ∆ eY possiamo considerare un ultrafiltro U che lo contiene. Dimostriamo che l’ultraprodotto I∆ /U è un modello di Φ. ∆∈J Sia ϕ un enunciato in Φ. Allora il singoletto {ϕ} appartiene a J e possiamo considerare g che appartiene a U. Per ogni ∆ ⊇ {ϕ} (cioè ∆ ∈ {ϕ}) g abbiamo I∆ |= ϕ e quindi {ϕ} g ⊆ {∆ ∈ J : I∆ |= ϕ} {ϕ} Y da cui segue {∆ ∈ J : I∆ |= ϕ} ∈ U e I∆ /U |= ϕ per il Teorema 9.18. ∆∈J 54 10 Teorema di Ramsey La prima parte di questa sezione è tratta da [Boolos and Jeffrey, 1980]. Il Teorema di Ramsey riguarda un problema di combinatoria. Consideriamo un insieme finito X e indichiamo con [X]r l’insieme dei sottoinsiemi di X con esattamente r elementi. Sia S r {C1 , . . . , Cs } una arbitraria partizione di [X] ; abbiamo cioè Ci = [X]r e Ci ∩ Cj = ∅ per ogni i 6= j. Dato un numero naturale n, ci poniamo il seguente problema: esiste Y ⊆ X : Y ha n elementi e [Y ]r è contenuto in qualche Ci ? (10.21) Esempio 10.1 Sia r = 2. Allora possiamo pensare gli elementi di X come i vertici di un poligono e [X]2 come l’insieme dei lati e delle diagonali di quel poligono. Sia s = 2. Ciò vuol dire che dividiamo [X]2 in due insiemi disgiunti C1 e C2 . Se n = 3, il problema diventa: esiste sottoinsieme Y di X con 3 elementi tale che i segmenti aventi estremi in Y sono tutti in C1 oppure oppure tutti in C2 ? Mostriamo che se X ha 6 elementi, allora la risposta è positiva. Sia A un elemento di X. Da A partono 5 tra lati e diagonali, e quindi almeno tre di questi sono in C1 o in C2 . Supponiamo che AB, AC, AD, siano in C1 . Se BC ∈ C1 allora Y = {A, B, C}. Se BD ∈ C1 allora Y = {A, B, D}. Se CD ∈ C1 allora Y = {A, C, D}. Se nessuna delle precedenti alternative vale, allora abbiamo BC ∈ C2 , BD ∈ C2 , e CD ∈ C2 , e in questo caso Y = {B, C, D}. Una volta fissati i valori r, s, e n, l’esistenza dell’insieme Y in (10.21) dipende dal numero di elementi di X. Definizione 10.2 Il Numero di Ramsey R(r, s, n) è il minimo numero naturale tale che, per ogni X con R(r, s, n) elementi, e per ogni partizione {C1 , . . . , Cs } di [X]r , esiste un Y ⊆ X che verifica (10.21). Teorema 10.3 Teorema di Ramsey Per ogni r, s, n, R(r, s, n) esiste. Dimostreremo questo teorema usando i Teoremi di Compattezza e di Löwenheim-Skolem, passando attraverso la seguente versione infinitaria dello stesso teorema. Teorema 10.4 Teorema di Ramsey infinito Siano r e s naturali positivi arbitrari. Per ogni partizione {C1 , . . . , Cs } di [N]r , esiste un sottoinsieme infinito Y di N ed un indice i tali che [Y ]r ⊆ Ci . Dimostrazione. V. §10.1. Nel seguito converrà identificare una partizione {C1 , . . . , Cs } di [X]r con una funzione f : [X]r → {1, . . . , s}: Ci = f −1 {i}. In questo modo la proprietà dell’insieme Y in (10.21) può essere espressa da f [[Y ]r ] = {i}. 55 Mostreremo, nel caso particolare r = 4, s = 3, n = 5, che il Teorema 10.3 segue dal Teorema 10.4. Sarà evidente dalla dimostrazione che il caso particolare può essere generalizzato ad arbitrarie terne (r, s, n). Useremo una dimostrazione per assurdo, per cui il primo passo sarà esprimere la negazione del Teorema di Ramsey in quel caso particolare. Tale negazione è equivalente a: per ogni naturale m, NRm esiste un insieme X con m elementi ed una funzione f : [X]4 → {1, 2, 3} tale che, per ogni sottoinsieme Y di X con 5 elementi, esistono Z1 , Z2 , Z3 ∈ [Y ]4 tali che f (Z1 ) 6= 1, f (Z2 ) 6= 2, f (Z3 ) 6= 3. Si osservi che l’ultima parte di NRm dice proprio che f [[Y ]4 ] non è un singoletto {i} come vorrebbe il Teorema di Ramsey. Il prossimo passaggio è quello di esprimere NRm per mezzo di una formula di un opportuno linguaggio L del primo ordine. Oltre ai simboli logici e all’uguaglianza, questo linguaggio ha tre simboli per relazioni a 4 argomenti: R1 , R2 , R3 . Il significato che verrà attribuito alla formula Ri (x, y, z, t) è “l’elemento {x, y, z, t} di [X]4 appartiene all’i-esima componente della partizione”, o, nella notazione introdotta sopra, f ({x, y, z, t}) = i. Sulla base di queste considerazioni possiamo dare un senso alle seguenti formule dove V Dist(x1 , . . . , xk ) è la formula 1≤i<j≤k xi 6= xj , e quindi è vera quando x1 , . . . , xk vengono interpretati su k oggetti distinti. Le seguenti formule ϕ1 e ϕ2 esprimono il fatto che R1 , R2 , R3 determinano una partizione di [X]4 . def ϕ1 = ∀x, y, z, t (Dist(x, y, z, t) ↔ R1 (x, y, z, t) ∨ R2 (x, y, z, t) ∨ R3 (x, y, z, t)) def ϕ2 = ∀x, y, z, t [(R1 (x, y, z, t) → (¬R2 (x, y, z, t) ∧ ¬R3 (x, y, z, t)) ∧ (R2 (x, y, z, t) → (¬R1 (x, y, z, t) ∧ ¬R3 (x, y, z, t)) ∧ (R3 (x, y, z, t) → (¬R1 (x, y, z, t) ∧ ¬R1 (x, y, z, t))] L’insieme [X]4 è costituito da quaterne non ordinate e quindi l’appartenenza di una quaterna (a, b, c, d) ad un insieme Ci non dipende dall’ordine in cui i quattro elementi sono presentati. Anche questo fatto può essere espresso da una formula di L. Per la relazione Ri abbiamo: def ϕ3,i = ∀x, y, z, t [(Ri (x, y, z, t) → (Ri (x, y, t, z) ∧ · · · ∧ Ri (z, t, y, x)] dove nella congiunzione a destra di → compaiono tutte le permutazioni di x, y, z, t. Indichiamo con ϕ3 la formula ϕ3,1 ∧ ϕ3,2 ∧ ϕ3,3 . Ora dobbiamo esprimere il fatto che in NRm viene negato il Teorema di Ramsey nel caso n = 5. Ciò significa che, considerato un arbitrario insieme Y con 5 elementi, non può succedere che tutti i sottoinsiemi di Y con 4 elementi appartengano allo stesso elemento della partizione. Equivalentemente, possiamo dire che, per ogni elemento della partizione, esiste una quaterna ad elementi in Y che non appartiene a quell’elemento. Tenendo presente che gli elementi della partizione vengono rappresentati nel linguaggio dalle relazioni Ri , poniamo: def ϕ4,i = ∀x, y, z, t, w [Dist(x, y, z, t, w) → ¬(Ri (x, y, z, t) ∨ ¬Ri (x, y, z, w) ∨ . . . ] 56 dove a destra di → abbiamo la disgiunzione di tutte le formule del tipo ¬Ri (x1 , x2 , x3 , x4 ) con x1 , x2 , x3 , x4 elementi distinti dell’insieme {x, y, z, t, w}. Si osservi inoltre che la quantificazione “per ogni Y con 5 elementi” viene rappresentata dalla quantificazione ∀x, y, z, t, w (con la successiva clausola Dist(x, y, z, t, w)). Indichiamo con ϕ4 la formula ϕ4,1 ∧ ϕ4,2 ∧ ϕ4,3 . Infine, consideriamo la formula che esprime l’esistenza di almeno k oggetti: def ψ k = ∃x1 , . . . , xk Dist(x1 , . . . , xk ) Poniamo: Ψk = {ϕ1 , . . . , ϕ4 , ψ k } e Ψ = {ϕ1 , . . . , ϕ4 } ∪ {ψ k : k ∈ N} Proposizione 10.5 L’insieme Ψk ha modello se e solo se NRk è verificato. Dimostrazione. Supponiamo che NRk sia verificato e siano X e f l’insieme e la funzione che lo verificano. Il modello di Ψk avrà la forma I = hX, Ii, dove dobbiamo definire le interpretazioni RiI delle relazioni Ri . Poniamo RiI = {hx1 , . . . , x4 i : {x1 , . . . , x4 } ∈ f −1 [{i}]}. Per come sono state costruite le formule ϕi abbiamo che esse sono verificate da quell’interpretazione delle Ri . Consideriamo in particolare ϕ4 . Dati cinque elementi distinti y1 , . . . , y5 , possiamo considerare l’insieme Y = {y1 , . . . , y5 } e gli elementi Zi di [Y ]4 , la cui esistenza è stabilita da NRk . Per ogni i abbiamo che la quaterna ordinata costituita dagli elementi di Zi non appartiene a f −1 [{i}] e quindi non appartiene a RiI . Ciò significa che anche ϕ4,i è verificata. La formula ψk è verificata in tutte le strutture con almeno k elementi, quindi anche in quella considerata. Sia ora I = hD, Ii un’interpretazione in cui le formule in Ψk sono verificate. Allora D ha almeno k elementi e quindi possiamo considerare un suo sottoinsieme X con esattamente k elementi. Siano RiI le interpretazioni in I dei simboli Ri ; quindi ogni RiI è un sottoinsieme di D4 . Definiamo la funzione f : [X]4 → {1, 2, 3} tramite: f ({a, b, c, d}) = i ⇔ ha, b, c, di ∈ RiI . Poiché in I è verificate ϕ3 , f è ben definita (come funzione definita su quaterne non ordinate). Per ϕ1 e ϕ2 , f determina in effetti una partizione di [X]4 . Infine, per ϕ4 non esistono sottoinsiemi Y di X con 5 elementi tali che f risulti costante su [Y ]4 . Corollario 10.6 Se NRm è verificata per ogni m, allora Ψ ha modello numerabile. Dimostrazione. Osserviamo che, se un’interpretazione verifica ψ k , allora quell’interpre0 tazione verifica anche ψ k per ogni k 0 ≤ k. Dalla Proposizione 10.5 e dalle ipotesi segue quindi che ogni sottoinsieme finito di Ψ ha modello. Per il Teorema di Compattezza, Ψ stesso ha modello e, per il Teorema di Lövenheim-Skolem, ha modello numerabile. Proposizione 10.7 Esiste un naturale m tale che NRm non è verificata. Dimostrazione. Per il Corollario 10.6, se non vale la tesi possiamo considerare un modello numerabile I = hD, Ii di Ψ. Non è restrittivo supporre D = N. Come nella dimostrazione 57 della Proposizione 10.5 la funzione f : [N]4 → {1, 2, 3} definita da f ({a, b, c, d}) = i ⇔ ha, b, c, di ∈ RiI determina una partizione di [N]4 . Il fatto poi che I verifichi ϕ4 implica che non esiste un insieme Y di naturali con 5 elementi tale che f risulti costante su [Y ]4 . Ma ciò contraddice il Teorema 10.4, in base al quale esiste un insieme infinito Y 0 di naturali tale che f è costante su [Y 0 ]4 . Se Y ha 5 elementi ed è contenuto in Y 0 , allora f deve essere costante anche su [Y ]4 . Tenendo presente che l’enunciato del Teorema di Ramsey nel caso r = 4, s = 3, n = 5, esprime proprio l’esistenza di un m tale che NRm non è verificata, la proposizione conclude la dimostrazione del teorema in quel casa particolare. Il minimo tra questi naturali è R(4, 3, 5). È infine evidente che la dimostrazione può essere ripetuta per ogni valore di r, s e n. Ciò conclude la derivazione del Teorema di Ramsey dalla sua versione infinitaria. 10.1 Prodotti di ultrafiltri e dimostrazione del Teorema di Ramsey infinito I risultati di questa sezione sono tratti da [Di Nasso, 2009] dove vengono presentate anche altre interessanti applicazioni della teoria degli ultrafiltri. Dati gli ultrafiltri U e V, rispettivamente sugli insiemi X e Y , possiamo definire l’ultrafiltro prodotto U ⊗ V su X × Y . Posto, per A ⊆ X × Y e x ∈ X, Ax = {y ∈ Y : (x, y) ∈ A}, definiamo U ⊗ V = {A ⊆ X × Y : {x : Ax ∈ V} ∈ U} (10.22) Proposizione 10.8 L’insieme U ⊗ V è un ultrafiltro. Dimostrazione. Per ogni x ∈ X, ∅x = ∅ 6∈ V e quindi {x : ∅x ∈ V} = ∅ 6∈ U. Da ciò segue ∅ 6∈ U ⊗ V. Supponiamo A ∈ U ⊗ V e A ⊆ B. Per ogni x ∈ X, Ax ⊆ Bx . Quindi {x : Ax ∈ V} ⊆ {x : Bx ∈ V} e da {x : Ax ∈ V} ∈ U segue {x : Bx ∈ V} ∈ U. Supponiamo A, B ∈ U ⊗ V. Osserviamo che {x : Ax ∈ V} ∩ {x : Bx ∈ V} ⊆ {x : Ax ∩ Bx ∈ V} e (A ∩ B)x = Ax ∩ Bx . Se quindi {x : Ax ∈ V} ∈ U e {x : Bx ∈ V} ∈ U, allora anche {x : (A ∩ B)x ∈ V} ∈ U. Resta da dimostrare che U ⊗ V è massimale. Osserviamo preliminarmente che, per ogni A ⊆ X ×Y , (A)x = Ax . Supponiamo A 6∈ U ⊗V. Allora {x : (A)x ∈ V} = {x : Ax ∈ V} = {x : Ax 6∈ V} 6∈ U. Quindi, poiché U è un ultrafiltro, {x : Ax 6∈ V} = {x : Ax ∈ V} ∈ U, da cui segue A ∈ U ⊗ V. Esercizio 10.9 Dimostrare che, se U e V sono ultrafiltri non principali, allora anche U ⊗ V non è principale. Suggerimento. Se U ⊗ V fosse principale, allora conterrebbe un insieme della forma {hx, yi}. 58 Il prodotto di k ultrafiltri sugli insiemi X1 . . . Xk viene definito induttivamente da U1 ⊗ def · · · ⊗ Uk = U1 ⊗ (U2 ⊗ · · · ⊗ Uk ). Se X1 = · · · = Xk e U1 = · · · = Uk , tale prodotto viene indicato con U ⊗k . Nel caso in cui X è totalmente ordinato gli elementi di [X]r corrispondono biunivocamente agli elementi hx1 , . . . , xr i di X r con x1 < · · · < xr . Poiché gli insiemi che verranno considerati in seguito sono sottoinsiemi di N, useremo quindi la seguente definizione di [X]r (che è equivalente alla precedente). [X]r = {hx1 , . . . , xr i ∈ X r : x1 < · · · < xr } Lemma 10.10 Se U è un ultrafiltro non principale su N e X ∈ U, allora [X]r ∈ U ⊗r . Dimostrazione. Per r = 1 poniamo, per ogni A ⊆ X, As = {hai : a ∈ A}. L’insieme U ⊗1 = {As : A ∈ U} è dunque un ultrafiltro su [X]1 e [X]1 ∈ U ⊗1 . Supposto il lemma vero per k − 1 abbiamo [X]k n = {hn2 , . . . , nk i : hn, n2 , . . . , nk i ∈ [X]k } = [X ∩ [n + 1, ∞)]k−1 dove [n + 1, ∞) indica l’insieme dei naturali maggiore di n. In particolare, [n + 1, ∞) è un cofinito e quindi appartiene ad U che non è principale. Dunque anche X ∩ [n + 1, ∞) ∈ U. Per l’ipotesi induttiva [X ∩ [n + 1, ∞)]k−1 ∈ U ⊗(k−1) e quindi {n : [X]k n ∈ U ⊗(k−1) } = N ∈ U. Per la definizione di prodotto di ultrafiltri abbiamo quindi [X]k ∈ U ⊗k . Lemma 10.11 Se U è un ultrafiltro non principale su N, allora, per ogni r > 0 e ogni A ∈ U ⊗r , esiste un sottoinsieme infinito X di N tale che [X]r ⊆ A. Dimostrazione. (Bozza) Il caso r = 1 è banale. Ci limitiamo a dimostrare il lemma per r = 2. Negli altri casi la dimostrazione usa sostanzialmente la stessa idea. Dalla definizione di prodotto di ultrafiltri abbiamo che b = {n : An ∈ U} ∈ U A ∈ U ⊗2 ⇔ A (10.23) b Ah1 appartiene ad U e quindi possiamo considerare un h2 > h1 in A b ∩ Ah1 ; Dato h1 ∈ A, questa intersezione è infatti infinita come tutti gli elementi di un ultrafiltro non principale. b ∩ Ah1 ∩ Ah2 . Da In modo analogo, Ah2 ∈ U e quindi esiste un h3 > h2 appartenente a A (10.23) segue inoltre che le coppie hh1 , h2 i, hh2 , h3 i, hh1 , h3 i sono tutte in A. Iterando il procedimento otteniamo una successione infinita h1 < h2 < . . . , < hk < . . . tale che ogni coppia hhi , hj i con i < j appartiene ad A. Se X è l’insieme degli hi allora abbiamo [X]2 ⊆ A. Dimostrazione del Teorema di Ramsey infinito (T. 10.4). Sia {C1 , . . . , Cs } una partizione di [N]r . Consideriamo un ultrafiltro non principale U su N. Per il Lemma 10.10, tenendo presente che N ∈ U, [N]r ∈ U ⊗r . Dall’uguaglianza [N]r = C1 ∪ · · · ∪ Cs , per le proprietà degli ultrafiltri, segue che esiste i tale che Ci ∈ U, e quindi, per il Lemma 10.23, esiste un X infinito tale che [X]r ⊆ Ci . APPENDICI 59 A Tautologie Le tautologie sono le formule che risultano vere per la loro struttura logica (proposizionale). Supponiamo che una formula ϕ sia costruita per mezzo delle formule ϕ1 , . . . , ϕn per mezzo degli operatori logici proposizionali ¬, ∧, ∨, →, e ↔ (cioè senza usare ∀ o ∃), e che sia noto il valore di verità (V o F) di ϕ1 , . . . , ϕn . In tal caso il valore di verità di ϕ può essere determinato induttivamente per mezzo delle cosiddette Tavole di Verità: ϕ F V ¬ϕ V F ϕ F F V V ψ F V F V ϕ∧ψ F F F V ϕ∨ψ F V V V ϕ→ψ V V F V ϕ↔ψ V F F V Diciamo che la formula ϕ è una tautologia se risulta avere sempre il valore di verità V indipendentemente dai valori di verità delle sue componenti ϕ1 , . . . , ϕn . Nel caso in cui il valore di verità di ϕ risulti costantemente F diremo che ϕ è una contraddizione. Dalla prima tabella di verità risulta immediatamente che A è una tautologia se e solo se ¬A è una contraddizione, e viceversa. Risultano in particola tautologie le formule (ϕ ∧ ψ) ↔ ¬(¬ϕ ∨ ¬ψ) (ϕ ∨ ψ) ↔ ¬(¬ϕ ∧ ¬ψ) (ϕ → ψ) ↔ (¬ϕ ∨ ψ) (ϕ ∨ ψ) ↔ (¬ϕ → ψ) (ϕ ↔ ψ) ↔ ((ϕ → ψ) ∧ (ϕ → ψ)) che mostrano come l’operatore di negazione assieme ad un operatore tra ∧, ∨, → siano sufficienti per definire gli altri. Affermare DL3 (§1.1) equivale a dire che ogni teoria assiomatica T (basata sulla Logica Classica) viene ritenuta sufficiente ricca da poter dimostrare tutte le tautologie. Affinché questo avvenga è sufficiente che T abbia tra i suoi assiomi tutte le formule della forma ϕ → (ψ → ϕ), (ϕ → (ψ → χ)) → ((ϕ → ψ) → (ϕ → χ)) e (¬ψ → ¬ϕ) → ((¬ψ → ϕ) → ψ), e che tra le Regole di Deduzione di T compaia il Modus Ponens che permette di dedurre ψ da ϕ → ψ e ϕ.28 Questo risultato è noto come Completezza del Calcolo Proposizionale. Nella pratica matematica usuale gli assiomi che permettono di dimostrare tutte le tautologie non vengono specificati. Vengono solo usate delle tautologie come verità ‘autoevidenti’. B Insiemi In questa appendice vedremo, senza dimostrazioni, alcuni risultati e definizioni basilari di teoria degli insiemi. Per le dimostrazioni, che verranno svolte nella seconda parte del corso, si può vedere [Lolli, 1994]. 28 Oltre a questi assiomi e regole dobbiamo ovviamente assumere che gli operatori ∧, ∨ e ↔ siano definiti tramite ¬ e → nel modo indicato sopra. 60 Diciamo che l’insieme X ha cardinalità minore o uguale all’insieme Y (in simboli card(X) ≤ card(Y )) quando esiste una funzione iniettiva da X in Y . Diciamo che X e Y hanno la stessa cardinalità (card(X) = card(Y )) quando esiste una funzione biiettiva da X su Y . Con card(X) < card(Y ) intendiamo valgono simultaneamente card(X) ≤ card(Y ) e card(X) 6= card(Y ). Le precedenti definizioni forniscono una nozione di cardinalità relativa, nel senso che permettono di confrontare la ‘grandezza’ di due insiemi dati. Non viene però introdotta una nozione assoluta di cardinalità: l’espressione card(X), da sola, non ha nessun significato. Nella seconda parte del corso verrà definita una nozione assoluta di cardinalità (Card) associando ad ogni insieme un opportuno insieme cardinale. Teorema B.1 T. di Cantor-Schröder-Bernstein. Se card(X) ≤ card(Y ) e card(Y ) ≤ card(X), allora card(X) = card(Y ). Diciamo che un insieme X è numerabile se card(X) = card(N). Un insieme è dunque numerabile se può essere messo in corrispondenza biunivoca con l’insieme dei numeri naturali. Ciò significa che possiamo scrivere X come {x0 , x1 , . . . }, possiamo cioè enumerarne gli elementi. Il numerabile è la più piccola cardinalità infinita, nel senso che per ogni insieme infinito X, esiste una funzione iniettiva da N in X, cioè card(N) ≤ card(X). Questa disuguaglianza viene in effetti spesso usata come definizione di insieme infinito.29 Sugli insiemi numerabili possiamo fare molte delle usuali operazioni insiemistiche, ottenendo ancora insiemi numerabili. Abbiamo per esempio che se X e Y sono numerabili, allora sono numerabili anche gli insiemi X ∪ Y e il prodotto cartesiano X × Y di X e Y . Da ciò segue che anche il prodotto cartesiano X n = X × · · · × X è numerabile per ogni naturale n > 0. In particolare Z e Q sono insiemi numerabili. Un risultato più generale sulla numerabilità è il seguente Proposizione B.2 Se gli insiemi Xi sono finiti o numerabili per ogni i appartenente ad [ un insieme finito o numerabile I di indici, allora anche Xi è finito o numerale. i∈I Esistono insiemi X più che numerabili, cioè tali che card(N) < card(X). Uno di questi insieme è ℘(N), l’insieme potenza di N, cioè l’insieme di tutti i sottoinsiemi di N. In generale abbiamo che per ogni insieme X, card(X) < card(℘(X)) (Teorema di Cantor). Un insieme più che numerabile che incontriamo quotidianamente in matematica è R. Si dimostra infatti che card(℘(N)) = card(R). La seguente proposizione dice sostanzialmente che operazioni insiemistiche tra insiemi di cardinalità infinita diversa lasciano inalterata la cardinalità maggiore. In particolare il numerabile è trascurabile rispetto al più che numerabile. 29 Un’altra definizione, più elegante perché non usa l’insieme dei numeri naturali, è quella dovuta a Dedekind: un insieme X è infinito se esiste una corrispondenza biunivoca tra X e un suo sottoinsieme proprio. Le due definizioni risultano equivalenti. 61 Proposizione B.3 Supponiamo card(X) < card(Y ). Allora card(X ∪ Y ) = card(X × Y ) = card(Y \ X) = card(Y ) Unioni e prodotti cartesiani di insiemi con la stessa cardinalità non variano la cardinalità. Dalla proposizione precedente ricaviamo quindi: Proposizione B.4 Supponiamo card(X) ≤ card(Y ). Allora card(X ∪ Y ) = card(X × Y ) = card(Y ) Il Lemma di Zorn, è un principio in Teoria degli Insiemi che non è deducibile dagli usuali assiomi perché equivalente all’Assioma di Scelta. Per enunciare questo principio abbiamo bisogno di una definizione. Definizione B.5 Sia hS, i un insieme ordinato. Dato S 0 ⊆ S, diciamo che s ∈ S è un maggiorante per S 0 se s0 s per ogni s0 ∈ S 0 . Diciamo che un elemento s0 di S è massimale se non esiste s ∈ S tale che s0 ≺ s. Lemma di Zorn Sia hS, i un insieme ordinato tale che ogni S 0 ⊆ S totalmente ordinato da abbia maggiorante in S. Allora, per ogni s ∈ S esiste un s0 massimale tale che s s0 . Riferimenti bibliografici [Bell and Machover, 1977] Bell, J. and Machover, M. (1977). A Course in Mathematical Logic. North-Holland. [Berarducci, 2006] Berarducci, A. (2006). Corso di teoria dei modelli. http://www.dm.unipi.it/~berardu/Didattica/Appunti/modelli.pdf. Dispensa, [Boolos and Jeffrey, 1980] Boolos, G. and Jeffrey, R. (1980). Computability and Logic. Cambridge University Press. [Cohen and Ehrlich, 1963] Cohen, L. and Ehrlich, G. (1963). The Structure of the Real Number System. van Nostrand. [Di Nasso, 2009] Di Nasso, M. (2009). Logica matematica 1. http://www.dm.unipi.it/~dinasso/LOMA/loma09a.pdf. Dispensa, [Enderton, 1972] Enderton, H. (1972). A Mathematical Introduction to Logic. Harcourt Ac. Press. [Feferman, 1964] Feferman, S. (1964). The Number Systems - Foundations of Algebra and Analysis. Addison-Wesley. 62 [Fiori and Invernizzi, 2009] Fiori, C. and Invernizzi, S. (2009). Numeri Reali. Pitagora. [Lolli, 1994] Lolli, G. (1994). Dagli insiemi ai numeri. Boringhieri. [Mendelson, 1981] Mendelson, E. (1981). Boringhieri. Introduzione alla Logica Matematica. [Piacentini Cattaneo, 1996] Piacentini Cattaneo, G. M. (1996). Algebra - Un approccio algoritmico. Decibel. [Zanardo, 2014] Zanardo, A. (2014). Costruzione della struttura dei numeri reali. Dispensa, http://www.math.unipd.it/~azanardo/Fond_Mat/Reali_2013_14.pdf. Indice analitico [x]r , 54 ℵ0 , 18 α-categoricità, 18 L, 5 TN , 23 I, 6 |=, 7 A, 46 `, 5 A B, 6 cI , fIn , RIn , 6 adeguatezza, 21 algebrici, reali, 20 antisimmetria, 3 arietà, 5 assioma, 2 Assioma di Scelta, 61 Assiomi di Peano, 22 associatività, 2 back-and-forth, 20 buon ordinamento, 32 campi ordinati, 3 Campi Ordinati Completi, 3 campo, 2 cardinalità, 60 categoricità, 17 coerenza, 9 cofinito, 46 commutatività, 3 compatibilità dell’ordine con il prodotto, 3 compatibilità dell’ordine con l’addizione, 3 compatibilità di ≤ con le operazioni, 3 Compattezza Semantica, 14 Compattezza Sintattica, 10 completezza, 3 completezza semantica, 20 completezza sintattica, 21 consistente, 10 contraddittorietà, 9 contraddizione, 10, 59 decidibilità, 12 densità, 4 dipendenza, 11 distributività, 3 dominio, 6 eliminazione dei quantificatori, 44 enunciato, 6 filtro, 47 filtro di Frechet, 47 filtro principale, 47 finitamente assiomatizzabile, 43 forma normale prenessa, 44 gruppi, 2 immediato predecessore, 33 immediato successore, 33 indipendenza, 11 Induzione, Definizione per, 25, 27 insieme potenza, 60 insiemi definibili, 36 interpretazione, 6 isomorfismo, 16 Löwenheim-Skolem, 15 Lemma di Zorn, 61 letterale, 44 libera, variabile, 6 linearità, 3 linguaggi del primo ordine, 5 linguaggio formale, 4 maggiorante, 61 massimale, 61 modelli non-standard, 38 modello, 9 modello standard, 36 naturali (non) standard, 38 numerabile, insieme, 60 63 64 numerale, 37 Numero di Ramsey, 54 ordine totale, 3 più che numerabile, insieme, 60 predecessore, 24 primo ordine, quantificazione, 4 Principio d’Induzione, 23 Principio di Induzione, seconda forma, 32 prodotto di naturali, 30 prodotto diretto, 48 proprietà dell’intersezione finita, 47 Ramsey, Teorema, 54 regole di verità, 7 riflessività, 3 secondo ordine, quantificazione, 4 segnatura, 5 soddisfacibile, 9 somma di naturali, 28 successore, 24 tautologia, 59 tavole di verità, 59 teorema, 2 Teorema di Loś, 51 termini, 5 totalità, 3 transitività, 3 trascendenti, reali, 20 ultrafiltro, 47 ultrafiltro principale, 47 ultrafiltro prodotto, 57 ultrapotenza, 51 ultraprodotto, 51 valutazione, 7 vincolata, variabile, 6