1 prova 3 prova p prova 5 prova Capitolo 1 La teoria cantoriana degli insiemi De…nition 1 Un insieme è …nito se è vuoto oppure è biettivo ad un numero naturale. Altrimenti è in…nito. De…nition 2 Due insiemi A e B sono equinumerosi (in simboli A » B) se esiste una biezione tra loro. Theorem 3 La relazione » è una relazione di equivalenza. Theorem 4 Sia f una funzione da A a B. f è biettiva se e solo se, per ogni X µ A, (f [X])c = f [X c ] : (Il complemento dei sottinsiemi di A è inteso rispetto ad A; cioè X c = A¡X; il complemento dei sottinsiemi di B è inteso rispetto a B). Dimostrazione. ()) Per de…nizione, dato X µ A, (f [X])c = fy 2 B : :9x 2 X f(x) = yg f [Xc ] = fy 2 B : 9x 2 X c f(x) = yg Mostriamo che (f [X])c µ f [X c] : Sia y 2 (f [X])c : Allora, poiché non esiste x 2 X tale che f(x) = y deve esistere, essendo f suriettiva, x 2 X c tale che f(x) = y: Quindi y 2 f [Xc ] : Mostriamo ora che f [X c ] µ (f [X])c : Sia y 2 f [X c ] : Poiché esiste x 2 Xc tale che f(x) = y, non può esistere, essendo f iniettiva, x0 2 X tale che f(x0 ) = y. In tal modo y 2 (f [X])c : 7 8 CAPITOLO 1. LA TEORIA CANTORIANA DEGLI INSIEMI (() Supponiamo che f non sia biettiva. Allora è non suriettiva o non iniettiva. Se non è suriettiva allora esiste y 2 B tale che non esiste x 2 A per c cui f(x) = y: Sia X un qualunque sottinsieme di A. Risulta che y 2 (f [X]) ma y 2 = f [X c] : Se invece f non è iniettiva allora esistono x1 ; x2 2 A tali che f(x1 ) = y = f(x2 ): Sia X = fx1 g : Abbiamo che y 2 = (f [X])c in quanto f(x1 ) = y; mentre y 2 f [X c] in quanto x2 2 Xc e f(x2) = y: Remark 1 Si osservi come il precedente risultato equivalga a dire che f è biettiva sse la funzione © : P(A) ! P (B) tale che ©(X) = f [X] è un isomor…smo tra le strutture (P (A);c ) e (P (B);c ) : De…nition 5 Un insieme A è immergibile in un insieme B (in simboli A ¹ B) se esiste una funzione iniettiva da A a B. Scriviamo A Á B se A ¹ B e non A » B: Chiaramente, la relazione ¹ è ri‡essiva e transitiva. De…nition 6 Una funzione F da P (A) a P (A) è monotona rispetto a µ se, per ogni X; Y µ A se X µ Y allora F (X) µ F(Y ): Lemma 7 Se una funzione F da P (A) a P (A) è monotona allora ammette almeno un punto …sso, cioè se esiste X 2 P(A) tale che F (X) = X: Dimostrazione. Sia Z = fX 2 P (A) : F (X) µ Xg L’insieme Z è non vuoto, dal momento che A 2 Z: Sia dunque \ T= X X2Z Mostriamo che T è un punto …sso. Per ogni X 2 Z; vale T µ X; da cui, per monotonia, segue F (T ) µ F (X): Da questo segue, essendo F (X) T µ X, che per ogni X 2 Z vale F (T ) µ X: Ciò implica che F(T ) µ X , X 2Z cioè F(T ) µ T: Da ciò, per la monotonia T di F , segue F(F(T )) µ F(T ); dunque F (T ) 2 Z: Quindi, essendo T = X; abbiamo anche T µ F (T ); e …nalmente F (T ) = T: X 2Z 9 Theorem 8 ( Cantor-Bernstein). Siamo A e B due insiemi. Se A ¹ B e B ¹ A allora A » B: Dimostrazione. (Il complemento dei sottinsiemi di A è inteso rispetto ad A; cioè X c = A¡X; lo stesso per B). Sia f una iniezione da A a B e g una iniezione da B ad A: De…niamo la seguente funzione F da P(A) a P (A): c F(X) = (g [(f [X])c]) Dimostriamo che F è monotona rispetto a µ. Siano X1; X2 2 P (A). Se c c c X1 µ X2 allora f [X1 ] µ f [X2] ; (f [X2 ]) µ (f [X1]) ; g [f [X2 ] ] µ c c g [f [X1]c ] ; (g [f [X1 ]c ]) µ (g [f [X2]c]) ; F(X1 ) µ F (X2) : Dunque (v. Lemma 7) F ha almeno un punto …sso, cioè esiste X 2 P(A) c tale che (g [(f [X])c]) = X: Quindi (¤) X c = g [(f [X])c] Impieghiamo il punto …sso X per de…nire la biezione h: Essendo g iniettiva, g¡1 è una funzione iniettiva (avente per dominio g [B] µ ¡1 A) ; da (¤) segue che X c µ g [B] e dunque g=X c è iniettiva. A questo punto de…niamo la funzione h da A a B in questo modo: h(x) = f(x) se x 2 X g¡1 (x) se x 2 Xc Dimostriamo che h è una biezione. Iniziamo mostrando che h è iniettiva. Se x1; x2; con x1 6= x2; appartengono entrambi ad X o entrambi a Xc allora, essendo f e g¡1 iniettive, h(x1) 6= h(x2 ): Consideriamo quindi il caso in cui x1 2 X e x2 2 X c . Da x1 2 X e h(x1 ) = f(x1) segue che h(x1 ) 2 f [X] : Invece, da x2 2 Xc segue, per (¤); che esiste y 2 (f [X])c tale che g(y) = x2 ; dunque essendo g ¡1 (x2 ) = y e h(x2 ) = g¡1 (x2 ), abbiamo h(x2 ) 2 (f [X])c : Dunque h(x1 ) 6= h(x2 ): Mostriamo in…ne che h è suriettiva. Sia y 2 B. Allora g(y) 2 A: Se g(y) 2 X allora g(y) 2 = Xc , per cui da (¤) segue che c g(y) 2 = g [(f [X]) ] e quindi y 2 f [X] ; y 2 h [X] e y 2 h [A] ; se g(y) 2 X c allora, per come h è stata de…nita, h(g(y)) = g¡1 (g(y)) = y; per cui, anche in questo caso y 2 h [A]. (Attenzione: è presto per dire che, per ogni A; B, una tra A ¹ B e B ¹ A vale. La dimostrazione di questa proprietà, detta Tricotomia, richiederà l’assioma di scelta v. Th.121). 10 CAPITOLO 1. LA TEORIA CANTORIANA DEGLI INSIEMI De…nition 9 Un insieme A è numerabile se A » N. Un insieme A è contabile se è …nito oppure numerabile. Lemma 10 Ogni insieme in…nito A contiene un sottinsieme numerabile. Dimostrazione. Impieghiamo una forma intuitiva del Principio di scelta; supponiamo cioè che, dato un qualunque insieme non vuoto A, esista una funzione f : (P (A) ¡ f?g) ! A tale che, per ogni X µ A, f(X) 2 X: Supponiamo dunque che A sia in…nito e di disporre di una tale funzione f. De…niamo una successione a0; a1 ; a2 ; ::: di elementi di A in questo modo: a0 = f(A) (cioè, a0 è scelto in A); a1 = f(A¡fa0 g); a2 = f(A¡fa0 ; a1g); ::: : Siccome A è in…nito, an esiste per ogni n 2 N; e dunque fa0; a1 ; a2 ; :::g è un sottinsieme numerabile di A: Theorem 11 Un insieme A è in…nito sse esiste B ½ A tale che B » A (cioè se è in…nito nel senso di Dedekind): Dimostrazione. ()) Per il Lemma precedente A contiene un sottinsieme numerabile D = fa0; a1 ; :::g : Sia B = A ¡ fa0g : La funzione f : A ! B tale che ½ a se a 2 =D f(a) = an+1 se a = an è biettiva. (( ) Per contronominale. Se jAj = n allora il risultato segue dal Pigeon-hole Principle, che usiamo come assioma: se ci sono m nidi e n piccioni, come m < n, allora in almeno un nido stanno almeno due piccioni. Theorem 12 Le seguenti espressioni sono equivalenti: (1) A è non vuoto e contabile. (2) Esiste una funzione iniettiva da A ad N: (3) Esiste una funzione suriettiva da N ad A: Dimostrazione. (1) ) (2). Se A = fa1; :::; an g allora la funzione f(ai ) = i è una iniezione da A ad N. Se A è in…nito (e contabile) allora, per de…nizione, esiste una biezione g da A ad N. (2) ) (1). Sia h una iniezione da A ad N. Dunque A è biettivo ad h [A], che essendo un sottinsieme di N, è contabile. Dunque A è contabile. (2) ) (3). Sia f l’iniezione da A ad N: Dunque f è una biezione da A a f[A] 11 e f ¡1 è una biezione da f[A] ad A. Si scelga un elemento a 2 A. La funzione g da N ad A tale che ½ ¡1 f (n) se n 2 f [A] g(n) = a se n 2 = f [A] è suriettiva. (3) ) (2). Sia g una suriezione da N ad A. La funzione f da A ad N tale che f(a) = min fn : g(n) = ag è iniettiva. Theorem 13 L’unione di due insiemi A e B contabili è contabile. Dimostrazione. Siano f : N ! A e g : N ! B funzioni suriettive (la cui esistenza è data dal Th. precedente). Si consideri la seguente funzione h : N ! A [ B: ½ f(k) se n = 2k (k 2 N) h(n) = g(k) se n = 2k + 1 (k 2 N) h è suriettiva (per ogni k 2 N, f(k) = h(2k) e g(k) = h(2k + 1)) e quindi A [ B è contabile. Corollary 14 Z è contabile (infatti Z = N+ [f0g[f¡n : n 2 Ng) e dunque, essendo in…nito, numerabile. Il teorema precedente può esser rinforzato. Theorem 15 L’unione di un insieme numerabile di insiemi contabili è numerabile. S Dimostrazione. Sia A = i2N Ai e sia fi : N ! Ai suriettiva. De…niamo f : N ! A come segue: f(0) = f0 (0) mentre, per n > 0, scriviamo n nella forma n = 2k ¢ 3l ¢ m dove m non è divisibile per 2 o per 3. Per l’unicità della scomposizione in fattori primi di un numero naturale, i valori k ed l sono univocamente determinati per cui possiamo univocamente porre f(n) = fk (l): La funzione f è suriettiva. Sia infatti x 2 A: Allora x 2 Ai per qualche i 2 N: Dunque x = fi (r) per qualche r 2 N, e quindi x = f(2 i ¢ 3r ): 12 CAPITOLO 1. LA TEORIA CANTORIANA DEGLI INSIEMI Theorem 16 Q+ è numerabile. n o Dimostrazione. Dal teorema precedente, ponendo Ai = :q2N . + p q Oppure: si consideri f : Q ! N tale che f(x) = 2 ¢ 3 dove x = pq e p; q sono coprimi. f è iniettiva. i q Corollary 17 Q è numerabile (infatti Q = Q+ [ f0g [ Q¡ ): Theorem 18 Il prodotto cartesiano di un insieme …nito di insiemi contabili è contabile. Dimostrazione. Siano f1 : A1 ! N,..., fn : An ! N funzioni iniettive. Sia h : A1 £ ::: £ An ! N così de…nita: h(a1; :::; an ) = 2f 1(a1 ) ¢ ::: ¢ pn fn (an ) dove pn è l’n¡esimo numero primo. Dal il Teorema di unicità di scomposizione in fattori primi di un numero naturale e dall’iniettività di ogni fi segue che h è iniettiva. Theorem 19 (Teorema di Cantor). Non esiste una funzione suriettiva da A a P (A). Dimostrazione. Supponiamo per assurdo che esista una funzione suriettiva f da A a P (A): De…niamo il seguente insieme X : X = fa 2 A : a 2 = f(a)g : X è un sottinsieme di A e quindi appartiene a P(A): Dall’ipotesi che f sia suriettiva segue che esiste a 2 A tale che f(a) = X: Ci chiediamo se a 2 X e mostriamo che ciascuna delle due possibili risposte implica la sua negazione. Se la risposta è positiva, cioè se a 2 X; allora, per de…nizione di X, a 2 = f(a); ed essendo f(a) = X; segue che a 2 = X; quindi (a 2 X) ! (a 2 = X) : Se la risposta è negativa, cioè se a 2 = X allora, per de…nizione di X, a 2 f(a); ed essendo f(a) = X; segue che a 2 X; quindi (a 2 = X) ! (a 2 X) : Dunque, dall’ipotesi che esista a tale che f(a) = X segue (a 2 = X) $ (a 2 X) ; che è una contraddizione. Non esiste quindi una funzione suriettiva da A a P (A): 1.1. CARDINALI 13 De…nition 20 Diciamo che un insieme A è più che numerabile (o non numerabile) se è in…nito e non numerabile, cioè se è in…nito e non A » N: Lemma 21 Se I è un intervallo limitato di R allora I » R. Dimostrazione. Supponiamo dapprima che I sia un intervallo aperto (a; b): La funzione lineare f tale che f(a) = ¡ ¼2 e f(b) = ¼2 è una biezione da (a; b) a (¡ ¼2 ; ¼2 ) : La funzione tan è una biezione da (¡ ¼2 ; ¼2 ) a R. Quindi tan(f(x)) è una biezione da (a; b) ad R. Supponiamo ora che I non sia aperto. Allora contiene un intervallo aperto J. Da J ¹ I e R » J segue R ¹ I: Ma da I µ R segue I ¹ R. Per il Teorema di Cantor-Bernstein I » R: Theorem 22 R » P(N) (dunque R è più che numerabile). Dimostrazione. Dimostriamo [0; 1) » P (N) (da cui, per il Lemma 21, segue il risultato). La funzione f : P (N) ! [0; 1) tale che, per ogni X µ N, f(X) = 0:a0 a1 a2::: ½ 0 se i 2 =X è iniettiva. Quindi P(N) ¹ [0; 1). Viceversa, 1 se i 2 X sappiamo che ogni x 2 [0; 1) può essere espresso in uno ed un sol modo in forma decimale x = 0:a0a1a2:::, con 0 · ai · 9, che non termina con una sequenza in…nita di 9. De…niamo g : [0; 1) ! P (N) come segue: © ª g(x) = ai ¢ 10i : i 2 N : dove ai = g è iniettiva e dunque [0; 1) ¹ P (N): Per il Teorema di Cantor-Bernstein, [0; 1) » P (N): 1.1 Cardinali De…nition 23 Due insiemi A e B hanno la stessa cardinalità se esiste una biezione tra loro. In simboli: Card(A) = Card(B) se A » B: 14 CAPITOLO 1. LA TEORIA CANTORIANA DEGLI INSIEMI In tal modo, indirettamente, intendiamo un numero cardinale come ciò che insiemi di ugual cardinalità hanno in comune. Dal punto di vista intuitivo possiamo intendere ciascun cardinale come una classe di equivalenza, i.e: Card(X) = [X]» = fY : Y » Xg : Tuttavia questa strada non può essere perseguita formalmente in quanto, come vedremo, conduce a contraddizione. De…nition 24 Diciamo che la cardinalità di A è minore o uguale alla cardinalità di B se esiste una iniezione da A a B: In simboli: Card(A) · Card(B) se A ¹ B: Intendendo ciascun cardinale (intuitivamente) come una classe di equivalenza, allora · è una relazione d’ordine. Ovviamente è ri‡essiva e transitiva. L’antisimmetria è data dal Teorema di Cantor-Bernstein. Infatti se Card(A) · Card(B) e Card(B) · Card(A) allora A ¹ B e B ¹ A; da cui segue A » B e quindi Card(A) = Card(B). Per ora, attribuiamo un simbolo speci…co solo a due tipi di cardinalità in…nite: se A » N allora scriviamo Card(A) = @0 ; se A » P(N) allora scriviamo Card(A) = @: Alcuni dei teoremi precedenti possono essere riscritti in questo nuovo linguaggio: ² Card(Z) = Card(Q) =@0: ² Card(A) < Card(P (A)) (Cantor) ² Card(R) =@: Lemma 25 Siano A; B; C; D insiemi tali che A » C e B » D: Valgono (1) A £ B » C £ D; (2) se A \ B = C \ D = ? allora A [ B » C [ D: Dimostrazione. Siano f : A ! C e g : B ! D biezioni. (1) La funzione h : A £ B ! C £ D tale che h(x; y) = (f(x); g(y)) 1.1. CARDINALI 15 è una biezione. (2) La funzione h : A [ B ! C [ D tale che ½ f(x) se x 2 A h(x) = g(x) se x 2 B è una biezione. Il lemma precedente rende ben de…nite le seguenti operazioni: De…nition 26 Card(A) ¢ Card(B) = Card(A £ B): Se A \ B = ?allora Card(A) + Card(B) = Card(A [ B) Theorem 27 Somma e prodotto sono associativi, commutativi e il prodotto è distributivo rispetto alla somma. Dimostrazione. Ci limitiamo alla distributività. Card(A) ¢ (Card(B) + Card(C)) = Card(A £ (B [ C)): Ma (A £ (B [ C)) = (A £ B) [ (A £ C); e da B \ C = ; seguono (A £ B) \ (A £ C) = ; e Card((A £ B) [ (A £ C)) = Card(A)Card(B) + Card(A)Card(C): Pertanto Card(A)(Card(B) + Card(C)) = Card(A)Card(B) + Card(A)Card(C): Siano A; B due insiemi. Con la scrittura BA intendiamo l’insieme delle funzioni da A a B. Lemma 28 Dati A; B; C; D, se A » C e B » D allora BA » DC : (La dimostrazione è lasciata per esercizio). Il lemma precedente rende ben de…nita la seguente operazione: De…nition 29 Card(B)Card(A) = Card(BA ): 16 CAPITOLO 1. LA TEORIA CANTORIANA DEGLI INSIEMI Lemma 30 Per ogni A, P (A) » f0; 1gA : Dimostrazione. La funzione f(B) = gB che associa ad ogni B µ A la sua ½ funzione caratteristica gB , cioè la funzione 1 se x 2 B gB : A ! f0; 1g tale che gB (x) = , è una biezione. 0 se x 2 =B Ponendo Card(f0; 1g) uguale a 2 abbiamo: Theorem 31 Per ogni A Card(P (A)) = 2C ard(A) : Dimostrazione. Per il Lemma 30 Card(P (A)) = Card(f0; 1gA ) e dunque, per de…nizione, Card(P(A)) = Card(f0; 1g)Card(A) : Corollary 32 2@0 = @: Corollary 33 @0 < 2@0 < 22 1.2 @0 < 22 2@ 0 < ::: : Ordinali De…nition 34 Una relazione R su un insieme x è un buon ordine se R è una relazione d’ordine su x e ogni sottinsieme non vuoto di x ammette minimo rispetto ad R, i.e., se 8y(y µ x ^ y 6= ? ! 9z(z 2 y ^ 8w(w 2 y ! zRw))): Nel seguito, indicheremo spesso R con · : L’impiego dei simboli <; ¸; > sarà standard. Theorem 35 Un buon ordine è un ordine totale. Dimostrazione. Siano y; z 2 x: Allora fy; zg µ x e dunque fy; zg ha minimo. 1.2. ORDINALI 17 De…nition 36 Un insieme ben ordinato è una coppia (x; ·) dove · è un buon ordine su x. De…nition 37 Una biezione © da un insieme ordinato (x; ·1) a un insieme ordinato (y; ·2) è un isomor…smo se rispetta l’ordine, i.e. tale che, per ogni a; b 2 x; a ·1 b sse ©(a) ·2 ©(b): (Nel seguito ometteremo gli indici). Naturalmente, se (x; ·) è un buon ordine e (y; ·) è isomorfo a (x; ·); allora anche (y; ·) è un buon ordine. De…nition 38 Sia (x; ·) un insieme ben ordinato e a 2 x: Il segmento iniziale di x determinato da a è xa = fy : y 2 x ^ y < ag : Lemma 39 Sia (x; ·) un insieme ben ordinato. (1) Sia y µ x tale che, per ogni b 2 y, xb µ y. Allora y = x o y è un segmento iniziale di x. (2) Se f : x ! x è iniettiva e rispetta l’ordine (cioè è un isomor…smo da x ad un suo sottinsieme) allora, per ogni a 2 x, vale a · f(a): (3) L’unico automor…smo su (x; ·) è l’identità. (4) (x; ·) non può essere isomorfo ad un suo segmento iniziale. Dimostrazione. (1) Supponiamo y 6= x e sia u = min(x¡y): Dimostriamo y = xu: Chiaramente, essendo u = min(x ¡ y); abbiamo xu µ y: Dobbiamo allora dimostrare y µ xu : Supponiamo per assurdo che esista un b tale che b 2 y ¡ xu: Essendo · un ordine totale, da b 2 = xu (i.e. :(b < u)) segue o b = u (ma in tal caso contraddiciamo l’ipotesi u = min(x ¡ y); oppure b > u, i.e., u 2 xb: Dalle ipotesi su y e da b 2 y segue xb µ y e dunque u 2 y, contro l’ipotesi. Quindi xu µ y: (2) Supponiamo per assurdo che a 2 x e :(a · f(a)): Allora, essendo · totale f(a) < a: Essendo f un isomor…smo, seguono f(a) < f(f(a)), f 2 (a) < f 3 (a) e così via, generando una catena in…nita discendente, contro l’ipotesi che · sia un buon ordine. (3) Sia f : x ! x un automor…smo. Allora anche f ¡ 1 : x ! x è un automor…smo. Da (2) segue che per ogni a 2 x abbiamo a · f(a) e f(a) · f ¡1 (f(a)), i.e., f(a) · a: Dunque a = f(a) per ogni a: (4) Supponiamo per assurdo che esistano b 2 x ed un isomor…smo f : x ! xb : Allora f soddisfa le condizioni del punto (2), per cui b · f(b): Ma f(b) deve appartenere ad xb e dunque, per de…nione, f(b) < b: contraddizione. 18 CAPITOLO 1. LA TEORIA CANTORIANA DEGLI INSIEMI Theorem 40 Se f : x ! y e g : x ! y sono isomor…smi tra (x; ·) e (y; ·), allora f = g: Dimostrazione. f ± g¡1 : x ! x è un automor…smo; dunque, per Lemma 39 (3), è l’identità, da cui segue g¡1 = f ¡ 1 e f = g: Theorem 41 Dati due insiemi ben ordinati, essi sono isomor… oppure uno è isomorfo ad un segmento iniziale dell’altro. Dimostrazione. Siano (X; ·) e (Y; ·) due insiemi ben ordinati e supponiamo che non siano isomor…. Se uno dei due insiemi è vuoto, allora il risultato segue dal fatto che ? è segmento iniziale di ogni insieme ordinato. Supponiamo allora entrambi non vuoti e siano x0 e y0 i rispettivi minimi. Allora Xx 0 = Yy0 = ? ed in tal modo i due segmenti iniziali sono isomor…. Da ciò segue che l’insieme A = fa : a 2 X ^ 9b(b 2 Y ^ (Xa ; ·) » = (Yb; ·))g non è vuoto, poiché x0 2 A: (Scrivendo (Xa ; ·) intendiamo l’insieme Xa con la relazione su X ristretta ad Xa , e analogamente per (Yb; ; ·) ). Per il Lemma 39 (4) e la transitività della relazione di isomor…smo, per ogni a 2 X un tale elemento b 2 Y , se esiste, è unico, ed inoltre uno stesso b non può corrispondere a due distinti elementi di A. Quindi © : A ! Y , dove ©(a) = b; è una funzione ed è iniettiva. Domostriamo ora che (¤) A = X o A è un segmento iniziale di X. © [A] = Y o © [A] è un segmento iniziale di Y . Veri…chiamo che A soddisfa le condizioni del Lemma 39 (1). Sia a 2 A e x 2 Xa . Per de…nizione di A, esiste un isomor…smo f : Xa ! Yb , e da x 2 Xa segue f(x) 2 Yb : Inoltre la funzione f=Xx : Xx ! Yf (x) è un isomor…smo, e dunque x 2 A. Pertanto Xa µ A e dunque A soddisfa le condizioni del Lemma 39 (1), e pertanto abbiamo che A = X o A è un segmento iniziale di X. La prova che ©(A) = Y oppure ©(A) è un segmento iniziale di Y è analoga, e pertanto abbiamo (*). Dimostriamo ora che © è rispetta l’ordine. Siano a; c 2 A con a 6= c e supponiamo a < c; i.e., a 2 Xc: Da c 2 A segue l’esistenza di un isomor…smo g : Xc ! Y©(c) : Ma Xa ½ Xc ; ed in tal modo g=Xa è un isomor…smo tra Xa 1.2. ORDINALI 19 e Yg(a) ; con g(a) 2 Y©(c) ; e dunque g(a) < ©(c): Ma poiché a 2 A, esiste un isomor…smo h : Xa ! Y©(a) : Vale g(a) = ©(a): Infatti se g(a) < ©(a) allora h¡1 ±g sarebbe un isomor…smo tra Y©(a) e il suo segmento iniziale Yg(a) ; contro il Lemma 39 (4). Per lo stesso motivo, è impossibile g(a) > ©(a): A questo punto da g(a) = ©(a) e da g(a) < ©(c) segue ©(a) < ©(c): Pertanto ©, essendo iniettiva, è un isomor…smo da A a © [A]. Da ciò e da (*) segue che © e ©¡1 soddisfano il teorema per tre delle quattro combinazioni possibili (A = X e © [A] = Y , oppure A = X e © [A] segmento iniziale di Y , e in tali casi il mor…smo è ©; oppure A segmento iniziale di X e © [A] = Y; e in tal caso il mor…smo è ©¡1 ). Dimostriamo che la quarta possibilità, cioè A segmento iniziale di X e © [A] segmento iniziale di Y , è impossibile: Sia c = min(X ¡ A) e d = min(Y ¡ © [A]): Allora, poiché A soddisfa le condizioni del Lemma 39 (1), A = Xc e © [A] = Yd : In tal modo © è un isomor…smo tra Xc e Yd e così c 2 A, contro quanto supposto. De…nition 42 Un insieme ® è un ordinale se è ben ordinato e, per ogni x 2 ®, x = ®x : Theorem 43 (1) Ogni elemento di un ordinale è un ordinale (1bis) Ogni segmento iniziale di un ordinale è un ordinale. (2) La relazione d’ordine di un ordinale è µ : (3) Se due ordinali sono isomor… allora sono uguali. (4) Se ® e ¯ sono ordinali allora una (ed una sola) delle seguenti vale: ® = ¯; ® 2 ¯; ¯ 2 ®: (5) Se ® e ¯ sono ordinali ® ½ ¯ , ® 2 ¯: Dimostrazione. (1) Sia ® un ordinale e sia x 2 ®: Dobbiamo dimostrare che (a) x è un buon ordine e (b) che, per ogni y 2 x, xy = y: (a) Da x = ®x µ ® segue che R=x è un buon ordine. (b) Se y 2 x ; essendo x = ®x ; allora y 2 ®x e dunque y < x: Ma da y 2 ®x segue anche y 2 ® e dunque y = ®y = (®x )y = xy . (l’uguaglianza ®y = (®x )y è basata sul fatto che da y < x segue ®y = fz : z 2 ® ^ z < yg = (®x )y = fz : z 2 ®x ^ z < yg = fz : z 2 ® ^ z < x ^ z < yg : L’uguaglianza (®x )y = xy segue da x = ®x ). (1bis) Sia ®x il segmento iniziale determinato da x. Per de…nizione di ordinale ®x = x e, per (1), x è un ordinale. (2) Sia · la relazione su ®: Dimostriamo che, per ogni x; y 2 ®, x · y sse x µ y: Per de…nizione di ordine, x · y sse ®x µ ®y sse, per de…nizione di 20 CAPITOLO 1. LA TEORIA CANTORIANA DEGLI INSIEMI ordinale, x µ y. (3) Sia f un isomor…smo tra ® e ¯ e supponiamo che f non sia l’identità. Allora fx : f(x) 6= xg 6= ? e dunque ha minimo elemento y (per (2), rispetto a µ). Quindi, per ogni z ½ y, f(z) = z, e dunque f è l’identità tra ®y (= fz : z ½ yg) e ¯f (y ) ; cioè ®y = ¯f (y ) . Essendo ® e ¯ ordinali, ®y = y e ¯f (y) = f(y): Pertanto y = f(y) contro quanto ipotizzato. Dunque fx : f(x) 6= xg deve essere vuoto e f è l’identità tra ® e ¯. (4) Dati ® e ¯, per il Teorema 41 essi sono isomor… oppure uno è isomorfo ad un segmento iniziale dell’altro. Nel primo caso, per (3), sono uguali. Nel secondo, ad esempio se ® » = ¯x per x 2 ¯, allora essendo, per (1bis), ¯x un ordinale, abbiamo, per (3), ® = ¯x . Ma, essendo ¯ un ordinale e x 2 ¯, ¯x = x e dunque ® = x 2 ¯: (5) (()® 2 ¯ implica, essendo ¯ un ordinale, ® = ¯® ½ ¯: ()) Per (4), ® ½ ¯ ! ® 6= ¯ !(4) ® 2 ¯ _ ¯ 2 ®: Ma, per l’implicazione precedente, ¯ 2 ® implica ¯ ½ ®; che contraddice ® ½ ¯: Resta dunque ® 2 ¯: Nel seguito, scriveremo ® < ¯ per indicare indi¤erentemente ® ½ ¯ o ® 2 ¯; e scriveremo ® · ¯ per indicare indi¤erentemente ® µ ¯ o ® 2 ¯ o ® = ¯: De…nition 44 Un insieme X è detto transitivo se x 2 X implica x ½ X; cioè se y 2 x 2 X implica y 2 X. Corollary 45 Sia ® un insieme ben ordinato dalla relazione · tale che x · y : x 2 y _ x = y: ® è un ordinale sse è transitivo. Dimostrazione. ()) Sia x 2 ®: Da Th.43 (1) e (5) segue x ½ ®: Dunque ® è transitivo. (() Sia x 2 ®. Devo dimostrare x = ®x : Dalla de…nizione di · segue che ®x = fz : z 2 ® ^ z 2 xg : Ma per la transitività di ®, da z 2 x e x 2 ® segue z 2 ® e dunque fz : z 2 ® ^ z 2 xg = fz : z 2 xg = x: Un risultato fondamentale sugli ordinali è il seguente: Theorem 46 Ogni insieme ben ordinato è isomorfo ad uno ed un solo ordinale. 1.2. ORDINALI 21 La dimostrazione non può essere fatta al di fuori della teoria assiomatica (in cui il concetto di insieme subirà delle speci…cazioni), per cui dovrà si attendere (vedi Th.107). Ora presentiamo alcuni risultati tramite i quali è possibile costruire ordinali. De…nition 47 Per ogni insieme x, poniamo S(x) = x [ fxg : Theorem 48 Se ® è un ordinale allora S(®) è un ordinale ed è il minimo ordinale ¯ : ® < ¯. Dimostrazione. Banalmente, S(®) è totalmente ordinato da µ (infatti, se x; y 2 ® allora, essendo ® totalmente ordinato da µ; x µ y o y µ x; se invece x 2 ® e y = ® allora x µ ® = y). Dimostriamo che S(®) è ben ordinato da µ : Sia X 6= ; e X µ S(®): Se X = f®g allora, essendo jf®gj = 1, X ha minimo elemento (® stesso). Se invece X \ ® 6= ; allora, essendo ® ben ordinato, X \ ® ha un minimo y che è anche minimo di X: infatti non può esistere z 2 y e z 2 = ®, dal momento che y 2 ® ed ® è transitivo. Dunque S(®) è ben ordinato da µ. Dimostriamo in…ne che se x 2 S(®) allora x = (S(®))x : Se x = ® allora (S(®))® = fy : y 2 S(®) e y 2 ®g = (essendo ® µ S(®) ) = fy : y 2 ®g = ®: Se x 6= ® allora x 2 ® e quindi (S(®))x = ®x = x (la prima identità vale in quanto ® 2 = x e quindi, essendo ® l’unico elemento di S(®)¡®, fy : y 2 S(®) ^ y 2 xg = fy : y 2 ® ^ y 2 xg ; la seconda identità vale in quanto ® è un ordinale). Quindi S(®) è un ordinale, e poiché ® 2 S(®) abbiamo ® < S(®): In…ne, non esiste ® < ¯ < S(®) in quanto ciò signi…cherebbe ® 2 ¯ 2 S(®), e da ¯ 2 S(®) segue ¯ 2 ® o ¯ = ®, in contraddizione con ® 2 ¯ (Th.43(4)). Lemma 49 Sia X un insieme di ordinali. Allora X è ben ordinato da µ : Dimostrazione. Dal Teorema 43 (4)-(5) segue che µ è un ordine totale su X: Sia ? ½ Y µ X e sia ° 2 Y: Se ° non è min Y allora esiste ± tale che ± 2 Y e ± ½ °: Quindi, essendo ° e ± ordinali, ± 2 ° e dunque Y \ ° 6= ?: Ma Y \ ° µ ° e ° è un ordinale. Pertanto Y \ ° ha minimo ®: Ma tale ® è anche minimo di Y ; altrimenti avremmo che esiste ¯ 2 Y ¡ ° tale che ¯ ½ ® (i.e ¯ 2 ®), il che, essendo ® 2 ° ed essendo ° transitivo, conduce a ¯ 2 ° (in contrasto con ¯ 2 Y ¡ °). Pertanto µ è un buon ordine su X: 22 CAPITOLO 1. LA TEORIA CANTORIANA DEGLI INSIEMI S De…nition 50 Dato un insieme x, de…niamo x = fy : 9z(y 2 z ^ z 2 x)g : (Si osservi come tale de…nizione abbia un senso solo se gli elementi di x sono a loro volta insiemi). S Theorem 51 Sia X un insieme di ordinali. Allora X è un ordinale, ed è il minimo ordinale maggiore o uguale ad ogni ordinale di X: S Dimostrazione. Supponiamo x 2 X: Allora x 2 ® 2 X , per un ordinale ®, e dunque anche x è un ordinale (Teorema 43(1)). Quindi anche S S gli elementi di X sono ordinali e dunque, per il Lemma 49 riferito a X, S S X è ben ordinato da µ :SPer dimostrare che X è un ordinale, resta da S veri…care Dimostriamo dapprima che da S che, per ogni S x 2 X; ( X)x = x: S x 2 X segue x µ X: Sia y 2 x: Da x 2 X segue X da cui, S x 2 ® 2S per la transitività di ®; otteniamo y 2 ®: Quindi y 2 X e x µ X: Ora, S S S sia x 2 X: ( X)xS= fz : z 2 X ^ z ½ xg (infatti, per il Lemma 49, la relazione che dimostrato che gli S ordina X è µ) eSquindi, poiché abbiamo S elementi di X sono ordinali, ( X) z 2 X ^ z 2 xg : In tal modo S x = fz :S (per de…nizione di intersezione) ( X)x = X \ x e, avendo dimostrato S S S che x µ X, ( X)x = x; come volevamo dimostrare. Quindi X è un ordinale. Inoltre, per de…nizione di unione, è il minimo insieme che include ogni elemento di X ed è pertanto il minimo ordinale maggiore degli ordinali contenuti in X: De…nition 52 Un ordinale ¯ e un ordinale successore se ¯ = S(®) per un certo ®: Un ordinale ¯ e un ordinale limite se ¯ 6= 0 e ¯ non è successore. Costruzione di ordinali mediante i Teoremi 48 e 51. ? è un ordinale. Dunque lo sono S (?) = f?g, S (S (?)) = S (f?g) = f?; f?gg, S(S(S(?))) = S(f?; f?gg) = f?; f?g ; f?; f?ggg .... In questo contesto, indichiamo ? con 0; S(?) con 1, S(S(?)) con 2, etc. Dalle de…nizioni segue che n = f0; 1; :::; n ¡ 1g : Indichiamo poi con ! l’ordinale limite [ ! = fn : n 2 Ng Come si vede, ! è null’altro che N inteso come un ordinale (ben ordinato da · e, a questo punto, da µ). 1.2. ORDINALI 23 Indichiamo S(S(:::S(!))) con ! + n (attenzione: ”! + n" è un nome e non il risultato di una operazione che ancora non abbiamo). S Indichiamo f! + n : n 2 Ng con !2 (stessa osservazione di prima; sarebbe più eufonico 2!, ma, come vedremo, creerebbe problemi). Indichiamo Indichiamo S S f!2 + n : n 2 Ng con !3 etc. f!n : n 2 Ng con !2 ; etc. Sempre per i teoremi 48 e 51, valgono le seguenti disuguaglianze: 0 < 1 < :::! < ! + 1 < :::!2 < :::!3 < :::!2 < :::!3 < :::!! < ::: Osservazione. (1) Per il Teorema 15, tutti gli ordinali elencati sono numerabili. (2) Procedendo per passaggi al successore e passaggi al limite, non si tralascia alcun ordinale (minore di quelli che si stanno ottenendo). 1.2.1 Aritmetica ordinale Somma ordinale. Fissato ®, de…niamo ® + ¯ per ogni ordinale ¯ : ®+0 = ® ® + S(¯)S= S(® + ¯); per ogni ¯; ® + ¯ = f® + ° : ° < ¯g per ogni ordinale limite ¯: Si osservi che, sui numeri naturali, tale operazione coincide con la somma usuale. La somma ordinale è associativa ma non è commutativa: ! + 1 = ! + S(0) = S(! + 0) = S(!) = ! [ f!g ; 1+ ! = S f1 + n : n < !g = S ! + m = S(S(:::(S(!)):::)) > ! f1; 2; 3; :::g = ! < ! [ f!g : 24 CAPITOLO 1. LA TEORIA CANTORIANA DEGLI INSIEMI m+! = S fm + n : n < !g = In e¤etti: S fm; m + 1; m + 2; :::g = !: Se ¯ < ° allora ® + ¯ < ® + °: Se ¯ < ° allora ¯ + ® · ° + ®: Per la somma ordinale possiamo impiegare il seguente modello. Siano » ® = (A; R), ¯ » = (B; S) con A \ B = ?: Allora ® +¯ » = (A [ B; T) con T = R [ S [ f(x; y) : x 2 A; y 2 Bg : Ad esempio: ponendo 2 » = (A; R), ! » = (B; S) abbiamo 2+! » = f0 A; 1 A; 0B ; 1B ; 2B ; 3B ::: g » =! mentre ! +2 » = f0 B ; 1B ; 2B ; 3B ::: 0A; 1Ag 6 » =! Prodotto ordinale. Fissato ®, de…niamo ® ¢ ¯ per ogni ordinale ¯ : ®¢ 0= 0 ® ¢ S(¯)S= (® ¢ ¯) + ®; per ogni ¯; ® ¢ ¯ = f® ¢ ° : ° < ¯g per ogni ordinale limite ¯. Il prodotto ordinale è associativo ma non è commutativo. Infatti: ! ¢ 2 = ! ¢ 1 + ! = ((! ¢ 0) + !) + ! = ! + ! = mentre S 2 ¢ ! = f2 ¢ n : n < !g = !. S f! + n : n < !g = !2 Alcune proprietà: Se ® > 0 e ¯ > 1 allora ® ¢ ¯ > ®: Se ® > 0 e ¯ > 1 allora ¯ ¢ ® ¸ ® (non vale il minore stretto: 2 ¢ ! = !) 1.2. ORDINALI 25 Se ¯ < ° e ® > 0 allora ® ¢ ¯ < ® ¢ °: Se ¯ < ° e ® > 0 allora ¯ ¢ ® · ° ¢ ® (non vale il minore stretto: 2 ¢ ! = 3 ¢ ! = !). Vale la proprietà distributiva destra del prodotto rispetto alla somma: ® ¢ (¯ + °) = ® ¢ ¯ + ® ¢ ° Non vale la proprietà distributiva sinistra. Ad esempio: (! + 3) ¢ ! 6= (! ¢ !) + (3 ¢ !) in quanto ½ ¾ S S (! + 3)¢! = f(! + 3) ¢ n : n < !g = (! + 3) + ::: + (! + 3): n < ! = n volte ½ ¾ ½ ¾ S = ! + (3 + !)::: + (3 + !) + 3 : n < ! = ! + ::: + ! + 3: n < ! = n volte n¡1 volte S f!n + 3 : n < !g = !2 mentre (! ¢ !) + (3 ¢ !) = !2 + ! > !2: Anche per il prodotto è possibile aver un modello. Siano ® » = (A; R) e » ¯ = (B; S): Allora ® ¢¯ » = (A £ B; W ) con W = f((x; y); (z; t)) : (ySt e y 6= t) o (y = t e xRz)g (ordine lessicogra…co partendo dal fondo). Ad esempio, ponendo 2 » = (A; R), » ! = (B; S) abbiamo 2¢! » = f(0A; 0 B ); (1A; 0B ); (0A; 1B ); (1A; 1B ); (0A; 2B ); (1A ; 2B ); :::g » =! mentre ! ¢2 » = f(0 B ; 0A ); (1B ; 0A ); (2B ; 0A ); :::::(0B ; 1A); (1 B ; 1A ); (2 B ; 1A ); :::g » = !+! Altro esempio: ponendo ! » = (A; R), ! » = (B; S) abbiamo » !¢!= f(0A ; 0B ); (1A ; 0B ); (2A ; 0B ); :::::(0A ; 1B ); (1A ; 1B ); (2A ; 1B ); :::::(0A; 2B ); (1A ; 2B ); (2A ; 2B ); :::g » = ! + ! + ! + ::::: : 26 CAPITOLO 1. LA TEORIA CANTORIANA DEGLI INSIEMI Esponenziazione ordinale. Fissato ® 6= 0 poniamo: ®0 = 1; ®S(¯) = ®¯ ¢ ®; per ogni ordinale ¯; S ®¯ = f®° : ° < ¯g ; per ogni ordinale limite ¯: Primi esempi: !2 = !S (1) = !1 ¢ ! = (!0 ¢ !) ¢ ! = (1 ¢ !) ¢ ! = ! ¢ !: !! = 2! = S S f!n : n < !g f2 n : n < !g = !: Alcune proprietà: ®1 = ® 1® = 1 Se ¯ < ° e ® > 1 allora ®¯ < ®° : Se ¯ < ° e ® > 1 allora ¯® · °® : Valgono la prima e seconda legge delle potenze: ®¯+° = ®¯ ¢ ®° e ®¯¢° = (®¯ )° : Invece, come mostra il seguente esempio, esistono ®; ¯; ° tali che (® ¢ ¯)° 6= ®° ¢ ¯° : S (2 ¢ 3)! = 6! = f6n : n < !g = ! mentre S S 2! ¢ 3! = f2n : n < !g ¢ f3n : n < !g = ! ¢ ! > !: 1.2. ORDINALI 27 Ulteriori esempi di operazioni: 2! = !: 2!+3 = 2! ¢ 8 = ! ¢ 8 = !8 oppure 2!+2 ¢ 2 = 2!+ 1 ¢ 2 ¢ 2 = 2! ¢ 2 ¢ 2 ¢ 2: 2!+n = ! ¢ 2n 2 2!2 = (2! ) = !2 oppure n 2!n = (2! ) = !n S f2 !+n : n 2 !g = S f! ¢ 2n : n 2 !g = ! ¢ !: S S S 2 n 2! = (2!n : n 2 !) = ((2! ) : n 2 !) = (!n : n 2 !) = !! 3 2 2 ! ! 2 2! = 2! ¢! = (2! ) = (!! ) = !!¢! = !! (le parentesi, quando non indicate, si intendono a destra) n !)!::: n¡1 2! = (:::((!! ) n ¡ 1 volte) = !! !! 2 o ª S n ! n¡1 S © !n ! = 2 :n 2! = ! : n 2 ! = !! ! 2!¢2 Vale inoltre !! = 22!¢2 : Infatti !2 2 2 ! ! 22 = 2! = !! e 22 = 2! = !! : Particolare rilevo (in logica) ha l’ordinale :: "0 = ! !! o Sn ! !! ottenuto elevando ! alla ! ! volte, cioè come !; !! ; !! ; !! ; ::: : Dopo !; "0 è il minimo ordinale ¯ tale che se ® < ¯ allora 2 ® < ¯: Nel §.6.0.16 uni…cheremo i concetti di numero ordinale e numero cardinale de…nendo i cardinali come particolari ordinali. Le due aritmetiche rimarranno però distinte. 28 CAPITOLO 1. LA TEORIA CANTORIANA DEGLI INSIEMI Capitolo 2 Il concetto di dimostrazione 2.1 La composizione degli Elementi. Il primo esempio di teoria assiomatica giunto …no a noi è costituito dagli Elementi di Euclide (c. 300 a. C.). Come risulta da varie fonti, gli Elementi non costituiscono la prima opera sistematica di geometria; ma il fatto stesso che i lavori precedenti siano completamente scomparsi indica la superiorità dell’opera euclidea, la quale risulta di fatto il maggior ”best seller”del mondo occidentale, dopo la Bibbia. L’in‡uenza di questa opera è stata enorme, in quanto per quasi 2000 anni essa è stata il simbolo del rigore, il paradigma del procedere matematico. La sua novità non consiste tanto nel rigore delle singole dimostrazioni, né nella loro quantità, ma nel fatto di costituire un sistema globale in cui le dimostrazioni singole sono disposte in un ordine che permette a ciascuna di loro di essere utilizzata nelle dimostrazioni successive. Il risultato é, ad un tempo, logicamente fondato, ”economico” ed elegante. E’l’attuazione del canone aristotelico di una costruzione che parte da un piccolo numero di ”de…nizioni”, ”postulati” e ”nozioni comuni”, e sviluppa le successive ”proposizioni” a partire da questi senza aggiungere (almeno consapevolmente) ulteriori assunzioni oltre quelle iniziali. Contenuto dei singoli libri: Libro 1: Libro 2: Libro 3: Libro 4: Fondamenti di geometria piana. La geometria dei rettangoli. La geometria del cerchio. Poligoni regolari inscritti in un cerchio. 29 30 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE Libro Libro Libro Libro Libro Libro Libro Libro Libro 5: Teoria generale delle proporzioni. 6: La geometria piana di …gure simili. 7: Fondamenti di aritmetica. 8: Numeri in proporzioni continue. 9: Numeri in proporzioni continue. La teoria del pari e dispari. 10: Grandezze incommensurabili. 11: Fondamenti di geometria solida. 12: Aree e volumi. 13. I solidi platonici. Tradizionalmente, i libri degli Elementi vengono divisi in tre gruppi (con il libro X che resta isolato): Geometria piana: 1-6. Aritmetica: 7-9. Geometria solida: 11-13. ((01)) 2.1.1 L’inizio degli Elementi Gli Elementi iniziano dalle ”de…nizioni”, seguite dai ”postulati” (gli assiomi geometrici) e dalle ”nozioni comuni” (gli assiomi non speci…ci). DEFINIZIONI. I. Punto è ciò che non ha parti. II. Linea è lunghezza senza larghezza. III. Estremi di una linea sono punti. IV. Linea retta è quella che giace ugualmente rispetto ai suoi punti. V. Super…cie è ciò che ha soltanto lunghezza e larghezza. VI. Estremi di una super…cie sono linee. VII. Super…cie piana è quella che giace ugualmente rispetto alle sue rette. VIII. Angolo piano è l’inclinazione reciproca di due linee su un piano, le quali si incontrino fra loro e non giacciano in linea retta. IX. Quando le linee che comprendono l’angolo sono rette, l’angolo si chiama rettilineo. X. Quando una retta innalzata su un’altra retta forma gli angoli adiacenti uguali tra loro, ciascuno dei due angoli uguali è retto, e la retta innalzata si chiama perpendicolare a quella su cui è innalzata. XI. Angolo ottuso è quello maggiore di un retto. XII. Angolo acuto è quello minore di un retto. 2.1. LA COMPOSIZIONE DEGLI ELEMENTI. 31 XIII. Termine è ciò che è estremo di qualche cosa. XIV. Figura è ciò che è compreso da uno o più termini. XV. Cerchio è una …gura piana compresa da un’unica linea tale che tutte le rette, le quali cadano sulla linea a partire da un punto tra quelli che giacciono internamente alla …gura, sono uguali fra loro. XVI. Quel punto si chiama centro del cerchio. XVII. Diametro del cerchio è una retta condotta per il centro e terminata da ambedue le parti dalla circonferenza del cerchio, la quale retta taglia anche il cerchio per metà. XVIII. Semicerchio è la …gura compresa dal diametro e dalla circonferenza da esso tagliata. E centro del semicerchio è quello stesso che è anche centro del cerchio. XIX. Figure rettilinee sono quelle comprese da rette, vale a dire: …gure trilatere quelle comprese da tre rette, quadrilatere quelle comprese da quattro, e multilatere quelle comprese da più di quattro rette. XX. Delle …gure trilatere, è triangolo equilatero quello che ha i tre lati uguali, isoscele quello che ha soltanto due lati uguali, e scaleno quello che ha i tre lati disuguali. XXI. In…ne, delle …gure trilatere, è triangolo rettangolo quello che ha un angolo retto, ottusangolo quello che ha un angolo ottuso, ed acutangolo quello che ha i tre angoli acuti. XXII. Delle …gure quadrilatere, è quadrato quella che è insieme equilatera ed ha angoli retti, rettangolo quella che ha gli angoli retti, ma non è equilatera, rombo quella che è equilatera, ma non ha gli angoli retti, romboide quella che ha i lati e gli angoli opposti uguali tra loro, ma non è equilatera né ha gli angoli retti. E le …gure quadrilatere oltre a queste si chiamino trapezi. XXIII. Parallele sono quelle rette che, essendo nello stesso piano e venendo prolungate illimitatamente dall’una e dall’altra parte, non si incontrano tra loro da nessuna delle due parti. POSTULATI I. Risulti postulato: che si possa condurre una linea retta da un qualsiasi punto ad ogni altro punto. II. E che una retta terminata si possa prolungare continuamente in linea retta. III. E che si possa descrivere un cerchio con qualsiasi centro ed ogni distanza. IV. E che tutti gli angoli retti siano uguali fra loro. 32 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE V. E che, se una retta venendo a cadere su due rette forma gli angoli interni e dalla stessa parte minori di due retti, le due rette prolungate illimitatamente verranno ad incontrarsi da quella parte in cui sono gli angoli minori di due retti. NOZIONI COMUNI I. Cose che sono uguali ad una stessa cosa sono uguali anche fra loro. II. E se cose uguali sono addizionate a cose uguali, le totalità sono uguali. III. E se da cose uguali sono sottratte cose uguali, i resti sono uguali. [IV.] E se cose uguali sono addizionate a cose disuguali, le totalità sono disuguali. [V.] E doppi di una stessa cosa sono uguali fra loro. [VI.] E metà di una stessa cosa sono uguali tra loro. VII. E cose che coincidono fra loro sono fra loro uguali. VIII. Ed il tutto è maggiore della parte.” Alcune osservazioni. 1) Se consideriamo che gli assiomi sono ”teoremi primitivi”, e cioè asserti che si assumono per poter dimostrare altri asserti, si può a¤ermare che lo stesso dovrebbe essere fatto per i concetti: sarebbe cioè necessario assumere alcuni concetti come primitivi e quindi inde…niti, e tramite loro de…nire gli altri concetti della teoria. Ed in e¤etti ciò accade nelle moderne teorie assiomatiche: in tal caso gli assiomi, esprimendo le proprietà primitive di questiconcetti, li de…niscono indirettamente, implicitamente. Euclide invece, moderno per quanto riguarda l’assunzione degli assiomi, non lo è altrettanto per le de…nizioni. Non vi sono concetti primitivi, tutto è de…nito. Si nota tuttavia il diverso tenore che distingue le prime de…nizioni, ”assolute”, dalle successive, che de…niscono nuovi concetti tramite le prime. 2) In modo un po’paradossale, l’enorme in‡uenza degli Elementi è anche in parte dovuta a quello che fu considerato il più grave dei suoi difetti (naevo, ”neo”, dirà Saccheri nell’intento di emendarlo): la minore evidenza del V Postulato rispetto agli altri. Infatti, i vani tentativi di dimostrare il V Postulato a partire dagli altri quattro portarono ad un ra¢namento delle tecniche dimostrative, e comunque ad una maggiore consapevolezza del concetto di sistema assiomatico. 3) Le ”nozioni comuni”, in…ne, esprimono proprietà dell’identità in cui 2.2. IL MODELLO DIMOSTRATIVO EUCLIDEO 33 sono coinvolte le 4 operazioni elementari (manca invece ogni accenno all’ordine). Il loro ruolo formale nelle dimostrazioni è analogo a quello dei postulati (anche esse sono infatti proprietà che si assumono senza dimostrazione), ma si distinguono da quelli per il fatto che non sono proprietà speci…camente geometriche, ma più generali. Vedremo come che lo status particolare che caratterizza le proprietà dell’identità si sia conservato …no ad oggi. Le moderne teorie matematiche formalizzate distinguono gli assiomi in tre classi: quelli logici (assenti nella trattazione euclidea, così come ogni altro riferimento alla logica), quelli speci…ci (gli assiomi propri della teoria, i postulati euclidei) e quelli dell’identità (compresi da Euclide nelle nozioni comuni). ((2)) 2.2 Il modello dimostrativo euclideo La seguente de…nizione, che considera la dimostrazione come un trasferimento di verità da assiomi a teoremi, è tradizionale nel pensiero matematico occidentale, ed ha come modello gli Elementi di Euclide. De…nition 53 Una dimostrazione è una catena di deduzioni attraverso le quali la verità della proposizione che deve essere dimostrata viene derivata dagli assiomi e da proposizioni precedentemente dimostrate. Una dimostrazione è quindi un fatto linguistico, un insieme di frasi, che si conclude con una a¤ermazione a cui si vuole dare, mediante il discorso che la precede, uno status di certezza pari a quello di altre a¤ermazioni già stabilite; tale discorso si compone di proposizioni, logicamente connesse, che hanno lo scopo di pervenire all’a¤ermazione …nale. Ciascuna di esse può intervenire solo in base a rigidi requisiti: (a) la proposizione appartiene ad un insieme di frasi inizialmente ammesse: gli assiomi. Emerge chiaramente da questo il fatto che la de…nizione usuale di dimostrazione di un enunciato prevede che l’enunciato stesso non sia isolato, ma inserito in una teoria assiomatica. (b) la proposizione è già stata ricavata con un procedimento analogo a quello che si sta descrivendo, è cioè la conclusione di una dimostrazione precedente, un teorema già dimostrato; 34 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE (c) la proposizione non è già in nostro possesso come nei casi (a) e (b) ma viene costruita nel momento in cui compare come risultato della ”trasformazione” di frasi che la precedono nella dimostrazione mediante le cosiddette ”regole logiche”. Osserviamo che la de…nizione 53 non considera esplicitamente i teoremi in cui compaiono delle ipotesi speci…che, i quali peraltro sono molto frequenti; in tal caso tra le proposizioni inizialmente ammesse si trovano, oltre agli assiomi, anche le ipotesi del teorema. Si può riformulare sinteticamente quanto detto con la seguente nuova ”de…nizione”, un po’più formale della precedente: De…nition 54 Una dimostrazione nella teoria T della tesi ¯ dall’insieme di ipotesi ®1 ; :::; ®n è una sequenza …nita di espressioni che termina con ¯ e tale che ogni espressione soddisfa una delle seguenti condizioni: (i) è un assioma di T o una ipotesi del teorema, (ii) è un teorema di T già dimostrato, (iii) deriva da espressioni precedenti mediante una regola logica. I cardini su cui ruota il concetto di dimostrazione sono quindi due: assiomi della teoria e regole logiche. Cominciamo da queste ultime. 2.3 Le regole logiche E’un dato di fatto che in matematica, usualmente, non si esplicitino le regole logiche. E’vero che talvolta alcuni metodi vengono segnalati ed hanno un nome proprio (assurdo, contronominale, per casi, ...), ma, nello sviluppo di una dimostrazione, oltre a queste regole con nome ne intervengono molte altre, che rimangono anonime. Una regola si con…gura in modo naturale come una particolare relazione tra proposizioni, esprimibile nella forma '1 : : 'n à 2.3. LE REGOLE LOGICHE 35 (o, più comodamente, '1; ::; 'n =Ã) dove le proposizioni '1; ::; 'n vengono dette premesse e à conclusione della regola. Dobbiamo ora a¤rontare il problema delle condizioni che una sequenza '1 ; ::; 'n =à deve soddisfare per essere una regola logica. Una prima de…nizione è la seguente: De…nition 55 Una sequenza '1 ,..,'n /à è una regola logica se e solo se ogniqualvolta le proposizioni '1 ,..,'n e à hanno senso in un universo di enti ( modello) ed in esso sono vere le premesse '1 ,..,'n , allora anche la conclusione à è vera. Il dato che emerge dalla De…nizione 55 è che la funzione delle regole logiche è quella di trasmettere alla conclusione l’eventuale verità delle premesse, e di fare ciò in ogni modello, con l’unica condizione che per le proposizioni che intervengono nella regola sia sensato chiedersi se sono o no vere nel modello. A parte questa condizione di leggibilità, le regole logiche devono dunque essere universali, i.e. indipendenti dal contesto. (La richiesta che abbia senso chiedersi se una proposizione è vera o falsa relativamente a un modello richiederà, come vedremo, un approfondimento dei concetti di verità e di modello. Di conseguenza, sarà necessario precisare, a ritroso, anche i concetti di proposizione e di linguaggio.) Dalla de…nizione segue che la verità, pasando dalle premesse alla conclusione, non deve diminuire. Si tratta a questo punto di trovare quelle relazioni tra formule che soddisfano tale condizione, e il modo più e¢cace per e¤ettuare tale ricerca è di fatto consistito nel convertire tali relazioni in opportune formule. In questa ottica, la regola '1 ; '2 ; ::; 'n =à viene tradotta nella formula ('1 ^ '2 ^ ::: ^ 'n ) ! à la quale riproduce la sua lettura intuitiva. Indicheremo tale formula come formula corrispondente alla regola, e viceversa. La richiesta, per una regola, della conservazione della (eventuale) verità delle premesse corrisponde, a causa della tavola di verità dell’implicazione, alla richiesta che la formula 36 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE corrispondente non sia mai falsa. Questa condizione è certamente veri…cata se ('1 ^ '2 ^ :: ^ 'n) ! à è una tautologia, per cui arriviamo a questa prima conclusione: ² Se ('1 ^ '2 ^ :: ^ 'n ) ! à è una tautologia allora '1 ; '2; :::; 'n =à è una regola logica. (Attenzione: la norma precedente non è una equivalenza. Lascia infatti aperta la possibilità che la formula corrispondente ad una regola logica non sia una tautologia. Come vedremo nel § 2.3.2, ciò non signi…ca che la tale formula possa esser falsa; signi…ca soltanto che il linguaggio proposizionale è spesso insu¢ciente ad esprimere tutti i legami logici tra le proposizioni; in particolare, il linguaggio proposizionale non è in grado di esprimere quei legami che impediscono di valutare ciascuna variabile p; q; r::: in modo indipendente dalle altre, come invece avviene per valutare la tautologicità di una formula proposizionale.) 2.3.1 Il livello proposizionale Analizziamo ora una serie di dimostrazioni comuni, allo scopo di fare emergere le regole logiche impiegate. Il primo esempio (trovato con una certa di¢coltà) è stato scelto per le sue caratteristiche elementari dal punto di vista logico. E’tratto dagli Elementi e non costituisce un esempio ”tipo”, nel senso che la semplicità con cui riusciamo a evidenziarne la struttura logica è decisamente atipica. La traduzione che riportiamo è fedele, salvo l’omissione, indicata da asterischi, di due frasi interlocutorie, inessenziali ai …ni dimostrativi ma la cui persenza farà tuttavia cambiare verso alla trascrizione formale che proponiamo. Proposizione I.25. Se due triangoli ABC e DEF hanno due lati rispettivamente uguali e i terzi lati disuguali, allora al lato maggiore è opposto l’angolo maggiore. Dimostrazione. Siano AB=DE e AC=DF e BC>EF. Dimostriamo che BAC^>EDF^. Se così non fosse sarebbe uguale o minore. Ma se BAC^=EDF^allora BC=EF [Proposizone I.4: Due triangoli che hanno rispettivamente uguali due lati e l’angolo da essi compreso sono uguali], e ciò è contro l’ipotesi. (*) E se BAC^<EDF^ allora BC<EF [Proposizione I.24: Se due triangoli hanno due lati rispettivamente uguali e gli angoli compresi disuguali, allora all’an- 2.3. LE REGOLE LOGICHE 37 golo maggiore è opposto il lato maggiore (e quindi all’angolo minore il lato minore)], e ciò è contro l’ipotesi. (*) Pertanto BAC^>EDF^. Individuiamo ora le proposizioni coinvolte (con il termine proposizione (o enunciato) intendiamo una frase a senso compiuto, per la quale abbia senso chiedersi se sia vera o falsa). Assegnamo poi delle lettere alle proposizioni atomiche, cioè non ulteriormente decomponibili in proposizioni più piccole. p0 p1 p2 p3 p4 p5 p6 p7 : : : : : : : : AB = DE, AC = DF, BC > EF, BAC^> EDF^, BAC^ = EDF^, BAC^< EDF^, BC = EF, BC < EF, (si osservi come le relazioni = e < rappresentino, dal punto di vista linguistico, copula e predicato nominale). Le ipotesi del teorema sono p0, p1 e p2 , la tesi è p3. La riscrittura della dimostrazione, con le abbreviazioni succitate, è la seguente: 1) 2) 3) 4) 5) 6) 7) 8) 9) p0 (Ipotesi) p1 (Ipotesi) p2 (Ipotesi) (:p3 ) ! (p4 _ p5) (Proprietà della relazione ·) (p0 ^ p1 ^ p4) ! p6 (Elementi I,4) (p0 e p1 nel testo sono nsottintesi) p6 ! :p2 (Proprietà della relazione ·) (p0 ^ p1 ^ p5) ! p7 (Elementi I,24) p7 ! :p2 (Proprietà della relazione ·) p3 A questa schematizzazione della dimostrazione (in cui non non sono ancora indicate le regole logiche impiegate) siamo giunti tramite l’individuazione degli enunciati ”atomici”. Il vocabolario utilizzato da questi enunciati atomici coinvolge unicamente simboli per denotare enti geometrici (segmenti ed angoli) e simboli per denotare relazioni (uguaglianza e disuguaglianza). 38 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE Possiamo considerare tale linguaggio come il linguaggio speci…co della teoria (nella fattispecie la geometria del piano). Tali enunciati atomici sono stati poi composti in enunciati di livello superiore, ottenuti impiegando parentesi e connettivi logici. Del vocabolario con cui abbiamo riscritto la dimostrazione fanno dunque parte: a) un insieme di lettere (da intendesi come enunciati), b) le parentesi, c) i connettivi. Si tratta, come noto, del linguaggio proposizionale. E veniamo alle regole logiche impiegate nel precedente esempio (che, ripetiamo, è stato scelto ad hoc). Data l’estrema semplicità dell’esempio, le prime 8 formule dalla sequenza soddisfano le condizioni di tipo (i) o (ii) della De…nizione 54 (la 4 e la 8 derivano dalla linearità della relazione ·. E’una carenza degli Elementi l’assenza, tra le nozioni nozioni comuni, di proprietà riguardante l’ordine. Tuttavia queste proposizioni sono catalogabili come assiomi o teoremi precedenti). Si tratta dunque di formule svincolate l’una dell’altra. La logica si concentra tutta nel passaggio dalle prime otto righe alla nona, essendo la formula 9 la prima proposizione introdotta in base alla condizione (iii) della De…nizione 54. Volendo rimanere vincolati a questa sequenza di 9 formule, la risposta è in qualche modo obbligata: è intervenuta un’unica regola logica, quella le cui premesse sono le 1-8 e la conclusione è la 9. La regola sarebbe insomma questa, che indichiamo con RG: ®0 ®1 ®2 (:®3 ) ! (®4 _ ®5 ) (®0 ^ ®1 ^ ®4) ! ®6 ®6 ! :®2 (®0 ^ ®1 ^ ®5) ! ®7 ®7 ! :®2 ®3 2.3. LE REGOLE LOGICHE 39 Il cambio di lettere (da p ad ®) ha lo scopo di evidenziare il fatto che la validità di RG non deve essere limitata alle formule p0 ¡ p9 , che nell’esempio hanno un signi…cato preciso, ma deve essere universale. In e¤etti, la formula corrispondente a RG: (®0 ^ ®1 ^ ®2 ^ (:®3 ) ! (®4 _ ®5 ) ^ ::: ^ (®7 ! :®2 ))::) ! ®3 è una tautologia e dunque RG è una regola logica. (Essendo presenti 8 variabili proposizionali, la tavola di verità ha 28 = 256 righe. Sono consigliabili metodi di veri…ca alternativi !). La presenza della riga 9 nella sequenza dimostrativa può pertanto essere giusti…cata in questo modo: 9) p3 (da 1-8 mediante RG). Tuttavia non è certo questa la regola che abbiamo applicato a livello intuitivo quando abbiamo riconosciuto come convincente la precedente dimostrazione. Le regole che applichiamo intuitivamente hanno di rado più di due-tre premesse (salvo il caso in cui queste siano molto omegonee tra loro) e coinvolgono non più di tre-quattro variabili. Inoltre, le regole non sono funzionali ad una speci…ca dimostrazione (come invece è la nostra RG), ma sono applicabili in modo di¤uso. L’impiego di regole più ”piccole” richiede però di allungare la dimostrazione nel passaggio tra 8 e 9. Qui di seguito una possibile proposta: 8a) p0 ^ p1 (da 1 e 2 mediante R0) 8b) p4 ! p6 (Da 8a e 5 mediante R1) 8c) p4 ! :p2 (Da 6 e 8b mediante R2) 8d) p5 ! p7 (Da 8a e 7 mediante R1) 8e) p5 ! :p2 (Da 8 e 8d mediante R2) 8f) (p4 _ p5) ! (:p2) (Da 8c e 8e mediante R3) 8g) (:p3 ) ! (:p2) (Da 4 e 8f mediante R2) 8h) p2 ! p3 (Da 8g mediante R4) 9) p3 (Da 3 e 8h mediante R5) con: 40 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE ® ¯ R0 ®^¯ ®!° ¯ !° R3 (® _ ¯) ! ° ® (® ^ ¯) ! ° R1 ¯ !° R4 :¯ ! :® ®!¯ ®!¯ ¯ !° R2 ®!° ® ® !¯ R5 ¯ Le formule corrispondenti a R0-R5 sono tutte tautologie, per cui R0-R5 sono regole logiche. Presumiamo però che questa volta non sia necessario veri…care il fatto in quanto la validità di tali regole (come di tutte quelle effettivamente applicate a livello intuitivo) deve essere percepita intuitivamente (il concetto di dimostrazione precede di millenni quello di tautologia). Le nuove proposizioni 8a-8h possono essere inserite tutte, in quell’ordine, tra 8 e 9. Tuttavia possono anche essere inserite non in blocco. Le proposizioni che compaiono in una dimostrazione possono subire permutazioni; l’unica condizione è che nell’applicazione di una regola le premesse precedano la conclusione. Questa libertà (vincolata) viene abitualmente sperimentata quando si espone una dimostrazione: la scelta è tra (a) trarre subito determinate conclusioni o (b) attendere a farlo quando vengono impiegate. Seguendo (b) all’estremo, le 8a-8h vengono inserite tra 8 e 9. Seguendo (a) all’estremo, il risultato il seguente: 1) p0 (Ipotesi) 2) p1 (Ipotesi) 8a) p0 ^ p1 (da 1 e 2 mediante R0) 8b) p4 ! p6 (Da 8a e 5 mediante R1) 3) p2 (Ipotesi) 4) (:p3) ! (p4 _ p5 ) (Proprietà della relazione ·) 5) (p0 ^ p1 ^ p4) ! p6 (Elementi I,4) 6) p6 ! :p2 (Proprietà della relazione ·) 8c) p4 ! :p2 (Da 6 e 8b mediante R2) 7) (p0 ^ p1 ^ p5) ! p7 (Elementi I,24) 8d) p5 ! p7 (Da 8a e 7 mediante R1) 8) p7 ! :p2 (Proprietà della relazione ·) 2.3. LE REGOLE LOGICHE 41 8e) p5 ! :p2 (Da 8 e 8d mediante R2) 8f) (p4 _ p5) ! (:p2) (Da 8c e 8e mediante R3) 8g) (:p3 ) ! (:p2) (Da 4 e 8f mediante R2) 8h) p2 ! p3 (Da 8g mediante R4) 9) p3 (Da 3 e 8h mediante R5) E veniamo ora alle frasi del testi euclideo che abbiamo omesso nella nostra traduzione sostiotuendole con due asterischi. Al posto del primo asterisco, compare l’espressione ”Perciò non BAC^= EDF^”, mentre al posto del secondo asterisco vi è la frase ”perciò non BAC^< EDF^. Ma fu altresì dimostrato che non BAC^= EDF^”. Le proposizioni ”Perciò non BAC^= EDF^” e ”perciò non BAC^< EDF^” corrispondono a :p4 and :p5 . Generalmente, nelle formulazioni moderne di una dimostrazione che non intenda essere particolarmente didascalica, vengono omesse, lasciando all’intuizione del lettore il compito di fare mentalmente il punto della situazione. Aggiungendole, otteniamo la seguente sequenza dimostrativa, che a questo punto formalizza fedelmente il testo euclideo, tranne il fatto che non abbiamo considerato la frase, presente nel testo euclideo: ”Ma fu altresì dimostrato che non BAC^= EDF^”, in quanto si tratta di un promemoria per :p4 , già presente: ripetere le proposizioni è consuetudine durante una esposizione non formale di una dimostrazione, ma non è opportuno, anche se non contravviene la de…nizione, inserire due volte una stessa formula nella sequenza dimostrativa. 1) p0 (Ipotesi) 2) p1 (Ipotesi) 3) p2 (Ipotesi) 4) (:p3 ) ! (p4 _ p5) (Proprietà della relazione ·) 5) (p0 ^ p1 ^ p4) ! p6 (Elementi I,4) 6) p6 ! :p2 (Proprietà della relazione ·) 6b) :p4 7) (p0 ^ p1 ^ p5) ! p7 (Elementi I,24) 8) p7 ! :p2 (Proprietà della relazione ·) 8b) :p5 9) p3 Come si vede, in questo caso, oltre alla 9, anche le proposizioni 6b e 8b sono ricavate logicamente dalle precedenti, sono cioè conformi alla condizione 42 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE (iii) della De…nizione 54. Lo scopo delle frasi (formalmente inutili) che abbiamo tolto era, conformemente a quanto visto, quello di distribuire l’intervento della logica, traendo delle conclusioni parziali. E’ possibile anche in questo caso giusti…care ciascuna delle 6b, 8b, 9 mediante singole regole ad hoc. Ad esempio, l’introduzione di 6b può essere considerata il prodotto della regola: ®0 ®1 ®2 (:®3 ) ! (®4 _ ®5 ) (®0 ^ ®1 ^ ®4) ! ®6 ®6 ! :®2 :®4 (è una regola logica in quanto la formula corrispondente è una tautologia). Ma, come già osservato, a livello intuitivo le regole devono coinvolgere poche premesse e poche variabili, per cui, anche questa volta, possiamo aggiungere righe alla sequenza in modo da impiegare regole piccole. La seguente proposta è una delle tante possibili; si può comunque osservare come la presenza delle nuove proposizioni 6b e 8b faccia prendere alla dimostrazione un’altra strada rispetto a quella precedente. 1) p0 (Ipotesi) 2) p1 (Ipotesi) 3) p2 (Ipotesi) 4) (:p3) ! (p4 _ p5 ) (Proprietà della relazione ·) 5) (p0 ^ p1 ^ p4) ! p6 (Elementi I,4) 5a) p0 ^ p1 (da 1 e 2 per R0 5b) p4 ! p6 (da 5 e 5a per R1) 6) p6 ! :p2 (Proprietà della relazione ·) 6b) p4 ! :p2 (da 5b e 6 per R3) 6c) :p4 (da 3 e 6b per R6 ) 7) (p0 ^ p1 ^ p5) ! p7 (Elementi I,24) 7b) p5 ! p7 (da 5a e 7 per R1) 8) p7 ! :p2 (Proprietà della relazione ·) 2.3. LE REGOLE LOGICHE 43 8b) p5 ! :p2(da 7b e 8 per R3) 8c) :p5 (da 3 e 8b per R6) 9) p3 (da 4, 6c, 8c per R7) con: :® ! (¯ _ °) ®!¯ :¯ :¯ :° R6 (Modus Tollens) R7 :® ® (entrambe le formule corrispondenti sono tautologie). A questo punto è chiaro il signi…cato dell’espressione ”Ma fu altresì dimostrato che non BAC^= EDF^”, che noi abbiamo omessa in quanto ribadisce un enunciato già ottenuto, e che invece Euclide reinserisce tra 8c e 9. La sua funzione è chiara: suggerisce la regola logica da applicare, nel senso che indica che in tale regola deve intervenire la lontana :p4 (la :¯ della regola R7). ==BOX: La logica proposizionale stoica ========== La prima trattazione del livello porposizionale della logica risale alla scuola Stoica, a cui si deve anche il primo tentativo di assiomatizzazione di tale logica. Secondo gli Storici, ogni regola inferenziale proposizionale avrebbe dovuto essere derivabile da cinque assiomi, chiamati indimostrabili (le variabili proposizionali erano nominate primo e secondo): 1) Se il primo allora il secondo; ma il primo; dunque il secondo. 2) Se il primo allora il secondo; ma non il secondo ; dunque non il primo. 3) Non: e il primo e il secondo; ma il primo; dunque non il secondo. 4) O il primo o il secondo; ma il primo; dunque non il secondo. 5) O il primo o il secondo; ma non il secondo; dunque il primo. Alcune osservazioni: a) La prima di queste regole è il modus ponens, la seconda il modus tollens. b) Compaiono tutti i connettivi (se.. allora, non, e, o), ma la o è forte, cioè è veri…cata quando uno e solo uno dei disgiunti è vero. c) Tutte le regole hanno due premesse. Quando Antipatro, che fu capo della scuola tra il 160 e il 130 a.C., introdusse regole con una sola premessa (ad 44 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE esempio, il primo e il secondo; dunque il primo), questo fatto fu considerato una novità. d) Si tratta di tavole di verità dei connettivi rovesciate, nel senso che sono attribuiti valori di verità alla espressione composta e ad uno dei suoi componenti, e viene poi dedotto il valore del secondo componente. d) Se consideriamo gli indimostrabili come regole di derivazione per ulteriori regole, allora non abbiamo assiomi. Punto di partenza di una derivazione sono dunque soltanto le premesse della regola che si vuole dimostrare. ============================== ===BOX. Tutte le tautologie sono equivalenti ma ...==== Un fatto, peraltro ovvio, è che nonostante tutte le tautologie siano logicamente equivalenti, non per questo tutte le corrispondenti regole logiche sono intuitive allo stesso modo. E neppure sono state accettate in blocco (si consideri anche che il concetto di tautologia è dei primi del ’900). Negli Elementi troviamo esempi di dimostrazioni che sarebbero eliminabili o sempli…cabili impiegando regole che invece sono state evitate. Nel primo libro, sono numerose le proposizioni che sono contronominali di altre. L’inserzione (inutile?) di un asserto che è contronominale di un altro si trova anche all’interno di singoli enunciati, quale ad esempio quello della Proposizione X.9 (i neretti e le parentesi sono nostri): [Quadrati di rette commensurabili in lunghezza hanno fra loro il rapporto che un numero quadrato ha con un numero quadrato;] ed [i quadrati che abbiano fra loro il rapporto che un numero quadrato ha con un numero quadrato, avranno anche i lati commensurabili in lunghezza]. Invece, [i quadrati di rette incommensurabili in lunghezza non hanno fra loro il rapporto he un numero quadrato ha con un numero quadrato]; ed [i quadrati che non abbiano fra loro il rapporto che un numero quadrato ha con un numero quadrato, non avranno anche i lati commensurabili in lunghezza]. Abbiamo ® ! ¯; ¯ ! ®; :® ! :¯; :¯ ! :®: Essendo (® ! ¯) $ (:¯ ! :®) una tautologia (i.e., essendo (® ! ¯)=(:¯ ! :®) e (:¯ ! :®)=(® ! ¯) regole logiche), la seconda metà dell’enunciato è ”super‡ua”. Ciò comporta che parte di dimostrazione euclidea che riguarda la seconda metà sia puramente logica, totalmente indipendente dal contenuto degli enunciati coinvolti. Tale dimostrazione, schematizzata, è: 2.3. LE REGOLE LOGICHE 45 ”vogliamo dimostrare :¯ ! :®: Supponiamo :¯ e supponiamo (per assurdo) ®: Ma abbiamo dimostrato ® ! ¯: Dunque abbiamo ¯; in contraddizione con l’ipotesi :¯:" Come si vede, si tratta di una dimostrazione della regola contronominale per mezzo del modus ponens e dell’assurdo. I signi…cati di ® e ¯ sono inin‡uenti. Un secondo esempio di ”ri…uto”di una regola logica riguarda la cosiddetta Consequentia Mirabilis: :® ! ® = ®, cui corrisponde la tautologia (:® ! ®) ! ®. La proposizione degli Elementi in questione è: Proposizione IX.12. Se i numeri 1; a; a2 ; :::; an costituiscono una progressione geometrica, e un numero primo p divide an , allora p divide a. Presentiamo dapprima una formulazione moderna della dimostrazione euclidea. Dimostrazione. Sia an = m ¢ p e supponiamo che p non divida a; allora essendo p primo, risulta che p e a sono primi tra loro (VII. 29). Essendo an = a ¢ an¡1 , risulta a ¢ an¡1 = m ¢ p, cioè a : p = m : an¡1 (VII.19) e quindi, dato che a e p sono primi tra loro, p divide an¡1 (VII. 20, 21). Ripetendo lo stesso procedimento si dimostra che p divide an¡2 , e così via, …no ad ottenere che p divide a. Da questo, per Consequentia Mirabilis, otteniamo l’asserto. Ecco al riguardo il commento di Clavio (Commentaria in Euclidis Elementa Geometrica, 1574) E’veramente meravigliosa la prima parte di questa dimostrazione. In essa infatti Euclide dal fatto di a¤ermare che E [il p della nostra versione] non divide A, fa vedere con una dimostrazione diretta che E divide proprio A: il che sembra impossibile. Infatti ove qualcuno stabilisca di dimostrare che Socrate è bianco dal fatto che non lo è, sembrerà che coinvolga qualcosa di paradossale e di strano. Non dissimile tuttavia è ciò che qui ha fatto Euclide sui numeri, nonché in altre proposizioni successive. Anche Car- 46 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE dano ha proceduto in modo analogo trattando delle grandezze nel Libro 5 del De Proportionibus alla proposizione 201, e si gloria di avere trovato lui, primo fra tutti, questa regola dimostrativa. Io credo che non si sarebbe espresso così se si fosse dedicato con maggior diligenza a questa dimostrazione, o certamente, avendolo fatto, se gli fosse tornata alla mente. Perché anche Euclide ha impiegato, molto prima di lui, questo procedimento dimostrativo, come risulta proprio dal Teorema 12 di prima. Tuttavia la gran parte dei manoscritti degli Elementi non si ferma al punto della nostra ricostruzione (e da quella riportata nell’edizione di Clavio), ma procede oltre: Dunque p ed a non sono primi fra loro; avranno quindi qualche divisore comune [VII.def.14]. E poiché per ipotesi p è primo, ed un numero primo non ha altri divisori all’infuori di sè stesso [VII. def.11], p divide i numeri a. Similmente si dimostra che ogni altro divisore primo di an è anche divisore di a. Questa parte …nale della dimostrazione euclidea non compare nella nostra ricostruzione perché è ”inutile”. La sua funzione è quella di convertire il ragionamento per Consequentia Mirabilis in una forma più usuale di riduzione all’assurdo. Proprio per questo alcuni editori e commentatori di Euclide, tra cui Clavio, omettono questo periodo ritenendolo una aggiunzione successiva. La questione non è di pura …lologia: se la parte conclusiva della dimostrazione è autentica, risulterebbe che Euclide non ha riconosciuto, o non ha ritenuto su¢cientemente convincente, il procedimento dimostrativo della Consequentia Mirabilis; in caso contrario questo stesso dubbio è stato proprio della maggior parte dei commentatori (ad esempio, l’edizione moderna del testo euclideo di Heiberg accoglie la versione ampliata). ===================================== 2.3. LE REGOLE LOGICHE 2.3.2 47 Limiti della congettura proposizionale Abbiamo visto che se ('1 ^ '2 ^ :: ^ 'n ) ! à è una tautologia allora '1 ; '2; :::; 'n =à è una regola logica. Vale anche il viceversa? Se '1 ; '2 ; :::'n =à e’una regola logica, ('1 ^ '2 ^ :: ^ 'n ) ! à e’una tautologia? Tutti gli esempi di regole incontrati nella precedente analisi hanno dato luogo a tautologie, suggerendo quindi una risposta a¤ermativa. Se questa previsione (che chiameremo congettura proposizionale) risultasse vera, la caratterizzazione dell’insieme delle regole logiche si realizzarebbe mediante il concetto di tautologia e, grazie all’algoritmo delle tavole di verità, avverrebbe in modo e¤ettivo. Il compito della logica in quanto ricerca di condizioni che assicurano la validità delle deduzioni sarebbe così concluso. Le cose sono andate diversamente. Consideriamo le seguenti frasi: ': ”Non tutti i numeri pari sono divisibili per quattro”, Ã: ”Esiste un numero pari non divisibile per quattro”. Appare evidente che, nel corso di una qualunque dimostrazione, si può passare correttamente dall’una all’altra proposizione. Se scriviamo A(x) e B(x) per indicare rispettivamente ”x è numero pari” ed ”x è divisibile per quattro”, il passaggio precedente verrà così rappresentato: (*) :8x(A(x) ! B(x)) 9x(A(x) ^ :B(x)) Gli enunciati minimi che compaiono in (*) sono p = 8x(A(x) ! B(x)) e q = 9x(A(x ^ :B(x)). Infatti A(x) e B(x) non sono enunciati, e neppure lo sono A(x) ! B(x) e A(x) ^ :B(x), in quanto, …no a che non si pone una qualche condizione su x; non ha senso chiedersi se è vero che ”x è numero pari” o ”x è divisibile per quattro”. (Se si pensa che A(x) ! B(x) possa esser un enunciato, è perchè si è, mentalmente, quanti…cata universalmente la x). Quindi, essendo p e q gli enunciati minimi, la regola (*), espressa nel linguaggio proposizionale, diventa :p e la sua trasformazione in q formula proposizionale risulta :p ! q; formula che non è, ovviamente, una tautologia. Se volessimo salvare a tutti i costi la congettura proposizionale dovremmo allora accettare che il passaggio da ' (=:p) a à (=q) non esprima alcuna regola logica. A tal …ne potremmo considerare ' ! à un teorema 48 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE (o un assioma) dell’aritmetica, cioè relativo ai numeri naturali, ed attuare la deduzione come segue: 1) :8x(A(x) ! B(x)) (Ipotesi), 2) (:8x(A(x) ! B(x))) ! (9x(A(x)^ :B(x))) (teorema dell’aritmetica) 3) 9x(A(x) ^ :B(x)) (da (1) e (2) mediante Modus Ponens) Tale espediente non è però plausibile. Il fatto che, in (*), A signi…chi ”essere numero pari” e B ”essere divisibile per quattro” è irrilevante; ogni altra interpretazione dei predicati A e B (ad esempio A(x) con ”x è un triangolo” e B(x) con ”x è equilatero”) non altera la validità del passaggio da ' a Ã. Tale validità infatti non dipende da ciò che esprimono A e B, ma dalla combinazione delle parole ”non”,”e”, ”se..allora” (cioè dei connettivi), con le parole ”per ogni” ed ”esiste” (e questo è il fatto nuovo). La regola (*) ha quindi quella universalità che abbiamo indicato come la caratteristica delle regole logiche. Un altro modo per salvare la congettura proposizionale potrebbe consistere nel dimostrare che le parole ”per ogni” ed ”esiste”, che non compaiono nel linguaggio proposizionale, sono abbreviazioni di espressioni costruite soltanto con connettivi e sono quindi eliminabili. Un suggerimento in tal senso deriva dal fatto che il quanti…catore universale ha le caratteristiche di una congiunzione, e quello esistenziale di una disgiunzione. Se, nell’esempio precedente, invece di riferirci all’insieme di tutti i numeri naturali, considerassimo soltanto i numeri minori o uguali ad un certo n allora le proposizioni 8x(A(x) ! B(x)) e 9x(A(x) ^ :B(x)) diventerebbero rispettivamente abbreviazioni di (A(0) ! B(0)) ^ (A(1) ! B(1)) ^ ::: ^ (A(n) ! B(n)) e (A(0) ^ :B(0)) _ (A(1) ^ :B(1)) _ ::: _ (A(n) ^ :B(n)): La regola (*) si ridurrebbe allora a :((A(0) ! B(0)) ^ (A(1) ! B(1)) ^ ::: ^ (A(n) ! B(n))) (A(0) ^ :B(0)) _ (A(1) ^ :B(1)) _ ::: _ (A(n) ^ :B(n)) e la formula proposizionale corrispondente sarebbe una tautologia. Ma se x varia su un dominio in…nito, allora, salvo eccezioni, non è possibile trovare una formula proposizionale, cioè senza quanti…catori, che sia equivalente a 2.3. LE REGOLE LOGICHE 49 8xA(x) (o ad 9xA(x) ), a meno che non si rinunci al fatto che una formula sia una scrittura …nita. Tentativi in tale direzione sono stati comunque compiuti, ma la rinuncia alla …nitezza nella scrittura delle formule è un pedaggio troppo caro. Dobbiamo pertanto accettare il fatto che la congettura proposizionale non sia valida. Un altro esempio che evidenzia i limiti della congettura è il sillogismo. Consideriamo il seguente esempio (per una volta senza ricordare a Socrate il suo triste destino): Se qualche multiplo di 9 è pari e ogni multiplo di 9 è un multiplo di 3 allora qualche multiplo di 3 è pari . Gli enunciati minimi (atomici) della frase sono: p : “qualche multiplo di 9 è pari” q : “ogni multiplo di 9 è un multiplo di 3” r : “qualche multiplo di 3 è pari”. La Logica Proposizionale non è quindi in grado di condurre la sua analisi oltre alla scrittura (p ^ q) ! r: Questa formula non è una tautologia; tuttavia la verità del precedente sillogismo non dipende dal particolare contenuto delle proposizioni, ma possiede quelle caratteristiche di universalità e di indipendenza dal contesto che è proprio delle regole logiche. Il problema è che quelle p; q; r non sono variabili indipendenti, ma sono legate tra loro, e per scoprire tale legame (e di conseguenza la struttura logica che rende il precedente sillogismo indipendente dal contesto) non basta isolare gli enunciati atomici, ma bisogna entrare all’interno di essi. Indichiamo con R; P; F i predicati “essere una multiplo di 9 ”, “essere pari” e “essere un multiplo di 3” e impieghiamo i quanti…catori: p : (qualche multiplo di 9 è pari) 9x (P (x) ^ Q(x)) q : (ogni multiplo di 9 è un multiplo di 3) 8x (P(x) ! S(x)) ; r : (qualche multiplo di 3 è pari) 9x (S(x) ^ Q(x)) : 50 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE Il sillogismo precedente viene a questo punto espresso nel modo seguente: (9x (P (x) ^ Q(x)) ^ 8x (P (x) ! S(x))) !9x (S(x) ^ Q(x)) | {z } | {z } | {z } p q (2.1) r Come si può vedere, questa formalizzazione è ben più complessa di quella attuabile dalla Logica Proposizionale (semplicemente (p ^ q) ! r), ma riesce nell’intento di mostrare il valore di regola logica del precedente sillogismo. Il fatto è che l’espressione “valido indipendentemente dal contesto”non signi…ca più “qualunque signi…cato abbiano le proposizioni p; q; r”, ma “qualunque signi…cato abbiamo i predicati R; P; F e qualunque tipo di oggetto denoti x”. Ora, la formula proposizionale (p ^ q) ! r è falsa in un solo caso: quando p e q sono vere e r è falsa. Ma questo caso non si può veri…care in (2.1), in quanto quelle formule p; q; r sono legate dal fatto di coinvolgere oggetti comuni, i predicati R; P; F; e quindi il valore di verità delle une in‡uenza il valore di verità delle altre. Infatti, una grande di¤erenza tra la Logica Proposizionale e quella che stiamo de…nendo sta proprio in questo: nella Logica Proposizionale la verità di una formula è legata al valore di verità di un’altra formula solo se è quest’ultima è una sua sottoformula, mentre in questa nuova logica anche i valori di verità di due formule atomiche, cioè prive di sottoformule, possono essere legati tra loro. ===BOX: Il sillogismo ========== La …gura del sillogismo compare per la prima volta nell’Organon di Aristotele (384-322 a.C.) e, per due millenni, è stata la struttura logica per antonomasia. Le proposizioni coinvolte in un sillogismo possono essere di quattro tipi: tipo tipo tipo tipo A (universali a¤ermative): ogni P è Q. I (particolari a¤ermative) : qualche P è Q. E (universali negative): ogni P non è Q. O (particolari negative) : qualche P non è Q. Per motivi di simmetria, abbiamo scritto l’universale negativa in questa forma anzichè nella più usuale, ma equivalente, ”nessun P è Q”. Le lettere A, I sono le prime vocali di a¢rmo, mentre E ed O lo sono di nego. I sillogismi vengono divisi in quattro …gurae: 2.3. LE REGOLE LOGICHE 51 P-Q S-P —– S-Q Q-P S-P —– S-Q P-Q P-S —– S-Q Q-P P-S —– S-Q I …gura II …gura III …gura IV …gura dove, ad esempio, P-Q indica una proposizione di uno qualunque dei quattro tipi precedenti espressa nei termini P e Q nell’ordine. Le tre proposizioni di un sillogismo sono dette premessa maggiore, premessa minore e conclusione. Nella I …gura il termine P (detto termine medio, presente in entrambe le premesse ed assente nella conclusione) si trova a sinistra nella premessa maggiore e a destra nella premessa minore (cioè, è il soggetto della prima ed il predicato nominale della seconda). Nella II …gura P è invece il predicato nominale di entrambe le premesse, etc. La conclusione ha sempre la forma S-Q. Una classi…cazione ulteriore si ottiene in base al tipo di formule coinvolte. Un sillogismo sarà, ad esempio, di tipo AEE se le premesse sono, nell’ordine, di tipo A e di tipo E e la conclusione è di tipo E. (Il sillogismo dell’esempio precedente è del tipo IAI ed è della III …gura). Un sillogismo è corretto, o conclude in modo valido, se, qualunque sia l’interpretazione dei termini P,Q ed S, la verità delle premesse comporta la verità della conclusione. Di estremo interesse, per quanto ci riguarda, è la trattazione che del sillogismo troviamo nella Logica Demostrativa di Gerolamo Saccheri. I primi capitoli dell’opera contengono una trattazione dei principali risultati della logica classica, caratterizzata dal fatto che le usuali regole della sillogistica sono dedotte, ispirandosi agli Elementi di Euclide, da assiomi e postulati. Tale impostazione rappresenta, a parte i tentativi inediti di Leibniz, il primo esempio di un sistema di logica predicativa formulato in modo assiomatico. Le proposizioni iniziali assunte da Saccheri sono le seguenti: Assiomi: Una stessa cosa non può contemporaneamente essere e non essere. Ogni cosa è o non è. 52 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE Postulato: Si postula che non tutti i termini siano coestensivi, cioè conseguenza l’uno dell’altro, oppure tra loro contraddittori, ma che esistano termini superiori e inferiori e anche termini tra loro indipendenti. La verità di questo è manifesta; dato tuttavia che non può essere dimostrato, almeno in logica, per procedere in modo scienti…co lo si deve ammettere come postulato. I due Assiomi, di chiara derivazione aristotelica, esprimono il principio di non contraddizione :(p ^ :p) e il terzo escluso p _ :p; il Postulato richiede che esistano predicati le cui estensioni (cioè gli insiemi degli oggetti che li soddisfano) stiano tra di loro in tutti i modi possibili. Ciò che il Postulato a¤erma è, potremmo dire, la varietà del mondo; esso si distingue quindi dai due assiomi per la sua natura extralogica. La formulazione esplicita di un simile postulato, così ”ovvio”, rivela la sensibilità logica di Saccheri. Ma ancor più importante è il tentativo che l’autore compie per a¤rancarsi da esso. Il Capitolo XI della Logica è infatti dedicato non alla dimostrazione di risultati nuovi ma alla ridimostrazione senza uso del Postulato di alcuni teoremi precedenti. E lo strumento che Saccheri utilizza per eliminare questa assunzione extralogica è la Consequentia Mirabilis, che egli conosceva attraverso Clavio e Cardano. Saccheri si propone di trovare nuove dimostrazioni dei teoremi precedenti percorrendo una via nobilior, cioè puramente logica, che consiste nell’assumere la negazione delle proposizioni da dimostrare e da essa, ”in modo chiarissimo e diretto”, ottenere la tesi proposta. Viene impiegato un lemma: Lemma. Se da una coppia di premesse, di un certo tipo e disposte in una certa …gura, non segue correttamente alcuna conclusione, allora da qualunque coppia di premesse dello stesso tipo e nella stessa …gura non segue correttamente alcuna conclusione. Il Lemma è semplicemente il Teorema di Sostituzione riferito al sillogismo. (Nei moderni trattati di logica il Teorema di Sostituzione compare all’inizio, subito dopo la de…nizione degli elementi del linguaggio, in quanto esso esprime la proprietà fondamentale delle tautologie: la loro natura formale, cioè la loro invarianza rispetto ai contenuti). Due esempi. 2.3. LE REGOLE LOGICHE 53 Teorema 1: Ogni sillogismo della prima …gura di tipo AEE non è un sillogismo valido. Dimostrazione. Si consideri lo schema AEE della I …gura: Ogni P è Q ogni S non è P ____________ ogni S non è Q e si interpretino P,Q,S nel modo seguente: P: ”sillogismo della I …gura di tipo EAE” , Q: ”sillogismo valido”, S: ”sillogismo della I …gura di tipo AEE”. Si ottiene quindi il seguente sillogismo: Premessa maggiore: Ogni sillogismo della I …gura di tipo EAE è un sillogismo valido. Premessa minore: Ogni sillogismo della I …gura di tipo AEE non è un sillogismo della I …gura di tipo EAE. Conclusione: Ogni sillogismo della I …gura di tipo AEE non è un sillogismo valido. Le premesse di tale sillogismo sono vere: la maggiore per un teorema dimostrato in precedenza, la minore in quanto conseguenza immediata delle de…nizioni. La conclusione coincide con l’enunciato del teorema. Ora, supponiamo che tale enunciato sia falso. Da ciò consegue che il precedente sillogismo non è valido, in quanto ha premesse vere e conclusione falsa. Ma tale sillogismo è appunto della I …gura di tipo AEE. Quindi, sotto tale ipotesi, esiste un sillogismo della I …gura di tipo AEE che non è valido, e allora, per il Lemma, ogni sillogismo della I …gura di tipo AEE non è valido. Pertanto, dall’ipotesi che l’asserto del teorema sia falso segue che esso è vero, e quindi, per Consequentia Mirabilis, l’asserto è vero. In questo primo esempio la tesi dell’enunciato da dimostrare coincide con la conclusione del sillogismo (si osservi anche come il sillogismo, falso, sia 54 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE formato da tre proposizioni vere). Nell’esempio successivo, invece, la tesi coincide con la negazione di una delle premesse. Teorema 2. Ogni sillogismo della I …gura di tipo IAA non è un sillogismo valido. Dimostrazione. Si consideri lo schema IAA della I …gura: Qualche P è Q ogni S è P ___________ ogni S è Q e si interpretino P,Q,S nel modo seguente: P: ”sillogismo valido”, Q: ”sillogismo con la premessa maggiore universale”, S: ”sillogismo della I …gura di tipo IAA”. Si ottiene quindi il seguente sillogismo: Premessa maggiore: Qualche sillogismo valido è un sillogismo con la premessa maggiore universale. Premessa minore: Ogni sillogismo della I …gura di tipo IAA è un sillogismo valido. Conclusione: Ogni sillogismo della I …gura di tipo IAA è un sillogismo con la premessa maggiore universale. La premessa maggiore di tale sillogismo è vera (è stata dimostrata in precedenza), mentre la conclusione è ovviamente falsa (le espressioni tipo I sono particolari). La premessa minore equivale alla negazione dell’enunciato del teorema; infatti la negazione di ”Ogni sillogismo della I …gura di tipo IAA è un sillogismo valido” è ”Qualche sillogismo della I …gura di tipo IAA non è un sillogismo valido” e, per il Lemma, ciò implica che ”Ogni sillogismo della I …gura di tipo IAA non è un sillogismo valido”. Ora, supponiamo che tale enunciato sia falso. Allora la premessa minore del sillogismo precedente è vera, ed essendo vere entrambe le premesse e falsa la conclusione, tale sillogismo non è valido. E poiché è un sillogismo della I …gura di tipo IAA, ne consegue, per il Lemma, che ogni sillogismo di questo tipo non è valido. 2.3. LE REGOLE LOGICHE 55 Pertanto, dall’ipotesi che l’asserto del teorema sia falso segue che esso è vero, ed allora, per Consequentia Mirabilis, l’asserto è vero. Come abbiamo detto, queste dimostrazioni hanno lo scopo di a¤rancarsi dall’impiego del Postulato. Impiegandolo, per dimostrare il Teorema 1 sarebbe stato su¢ciente osservare che i predicati P,Q,S, le cui estensioni P; Q; S stanno tra loro come in Figura 1, soddisfano le premesse dello schema (infatti P µ Q, cioè ”ogni P è Q”, e S \ P = ? cioè ”ogni S non è P”) e non soddisfano la conclusione (S \ Q 6= ? e quindi ”ogni S non è Q” è falsa). In modo analogo, la Figura 2 costituisce una ”dimostrazione” del secondo esempio. In questo tipo di dimostrazioni, tuttavia, occorre postulare che esistano predicati la cui estensioni stanno tra di loro in quel determinato rapporto. Invece, tramite l’autoreferenza, i termini del sillogismo che falsi…ca una determinata forma vengono interpretati su concetti logici, e ciò consente di dimostrare anzichè postulare che si trovino in un determinato rapporto. Oltre due secoli dopo incontriamo questa stessa caratteristica nella maggior parte delle dimostrazioni di completezza di sistemi formali: il problema è ancora quello di determinare un esempio opportuno (un modello), e la via per ottenerlo consiste ancora nell’interpretare i termini del sistema logico su oggetti che a loro volta hanno natura logica, in modo da poterli ottenere senza ricorrere ad assunzioni extralogiche. ============================ 2.3.3 Il livello predicativo Come abbiamo visto nel paragrafo precedente, la congettura proposizionale è falsa: esistono regole logiche che, tradotte con gli strumenti del linguaggio proposizionale, non danno luogo a tautologie. Dobbiamo allora arricchire il linguaggio superando la barriera proposizionale e analizzando la struttura 56 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE interna delle proposizioni, in modo da tener conto dei quanti…catori oltre che dei connettivi. La quanti…cazione non solo rende più articolato il linguaggio formale, ma impone una sua più stretta connessione con quello che abbiamo chiamato il ”linguaggio della teoria”. Infatti i quanti…catori, ed a causa loro i connettivi, entrano negli enunciati ”minimi” della teoria, ed allora non esisterà più, come nel caso proposizionale, una ”base” di enunciati indi¤erenziati (p0,p1 ,p2 ...) atti ad operare come variabili. Da ciò deriva la necessità di un concetto più dettagliato di formula, ed anche il concetto di verità dovrà raccordarsi a questa nuova con…gurazione, risultando quindi molto più articolato. In particolare, l’attribuzione di verità alle formule ”minime” comporterà un loro confronto con il tipo modello che la teoria matematica descrive. E’dunque opportuno presentarne una de…nizione. De…nition 56 Una struttura (o modello) è una quadrupla < A; R; G; D > in cui: i) A è un insieme non vuoto che prende il nome di dominio o sostegno del modello ; ii) R = fRi : i 2 Ig è un insieme di relazioni su A. iii) G = fgj : j 2 Jg è un insieme di funzioni su A. (iv) D µ A. (D contiene gli elementi privilegiati, cioè con proprietà particolari, della struttura). ((3)) Quando R; G; D sono …niti, una struttura viene indicata mediante A =< A; R1; R2; :::; g1 ; g2 ; :::; d1 ; d2 ; ::: > La de…nizione di struttura determina in modo abbastanza naturale le caratteristiche di un linguaggio atto a parlarne: occorrerà avere un insieme di simboli di relazione e di funzione per denotare le relazioni e le funzioni, ed un insieme di simboli di costante per denotare gli elementi particolari di A. Questa parte del linguaggio, che sostanzialmente coincide con quello che abbiamo precedentemente chiamato il ”linguaggio della teoria”, dipende di volta in volta dalle strutture di cui si vuole parlare. Oltre ad essa (non essendo più praticabile la separazione netta tra linguaggio della teoria e linguaggio delle regole ) ogni linguaggio dovrà contenere una parte …ssa, costituita dai connettivi, dai quanti…catori, dalle parentesi, da un simbolo relazionale binario = esprimente l’identità, e da un insieme X di variabili che, a di¤erenza 2.3. LE REGOLE LOGICHE 57 dal caso proposizionale, non denoteranno enunciati bensì elementi del dominio delle strutture. Un linguaggio di questo tipo è chiamato ”linguaggio dei predicati al I ordine con identità”. De…nition 57 L’alfabeto di un linguaggio al I ordine con identità è un insieme L = fP; F; C; X; ^; _; :; !; $; (; ); 8; 9; =g dove P = fp0 ; p1 :::::g è un insieme di simboli relazionali (o predicativi), avente ciascuno una …ssata arietà; F = ff0 ; f1:::::g è un insieme di simboli funzionali, avente ciascuno una …ssata arietà; C = fc0; c1 ; :::g è un insieme di costanti individuali; X = fxi : i 2 Ng e l’insieme delle variabili individuali. Si osservi che X è un insieme numerabile, ed è l’unico insieme su cui viene fatta una richiesta di cardinalità. I sottoinsiemi fX; ^; _; :; !; $; (; ); 8; 9; = g e fP; F; Cg costituiscono rispettivamente la parte logica e la parte speci…ca (o propria) di L. Evidentemente per caratterizzare un linguaggio al I ordine basterà indicarne la parte speci…ca fP; F; Cg del suo alfabeto e, nel caso P; F; C siano …niti, viene abitualmente rappresentato nella forma L = fp1 ; p2 ; :::; f1 ; f2 ; :::; c1; c2 ; :::g: Ora, percorrendo a ritroso la strada che ci ha portato dalle strutture ai linguaggi, diamo la seguente De…nition 58 Una struttura A =< A; R; G; D > si dice realizzazione (o modello) di un linguaggio L = fP; F; Cg se esiste una funzione ¼ che associa ad ogni simbolo relazionale p 2 P una relazione R 2 R avente la stessa arietà (R è detta interpretazione di p secondo ¼), ad ogni simbolo funzionale f 2 F una funzione g 2 G avente la stessa arietà, ed ad ogni simbolo di costante c un elemento d 2 D, e al simbolo = la relazione identica su A (cioè f(a; a) : a 2 Ag). 58 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE Osserviamo che il concetto di modello di un linguaggio è molto debole (ben più forte sarà il concetto di modello di una teoria, dove interverranno le formule di L e dove si parlerà di verità). Lo scopo della de…nizione di modello di un linguaggio è quello di stabilire in quali contesti ”abbiano senso” le proposizioni di quel linguaggio. E sono appunto le proposizioni (le formule) di un linguaggio al I ordine e la loro interpretazione in una struttura che dobbiamo ora de…nire. La de…nizione di formula predicativa al I ordine passa attraverso una tripla induzione: sui termini, sulle formule atomiche e sulle formule tutte. De…nition 59 L’insieme i T L dei termini di L è quell’insieme che soddisfa le seguenti condizioni: i) X µ T L (ogni variabile è un termine), ii) C µ T L (ogni simbolo di costante è un termine), iii) se t1; ::; tn 2 T L ed f è un simbolo funzionale n-ario di F , allora f(t1; ::; tn ) 2 T L, iv) null’altro appartiene a T L. De…nition 60 L’insieme AT L delle formule atomiche di L è quell’insieme che soddisfa le seguenti condizioni: i) Se t1 ; t2 2 TL allora (t1 = t2 ) 2 AT L, ii) se t1 ; :::; tn 2 T L e P è un simbolo relazionale di P avente arietà n, allora P (t1; ::; tn ) 2 ATL: iii) null’altro appartiene ad ATL. Osservazione: 99 il diverso ruolo di simboli funzionali e relazionali (gli uni impiegati per costruire termini, gli altri per costruire formule) può sembrare in contrasto con il fatto che, in teoria degli insiemi, le funzioni sono trattate come particolari relazioni. Consideriamo ad esempio la funzione log 2 : Come relazione su R, è la relazione binaria che contiene tutte le coppie (x; y) tali che y è in relazione log2 con x; tra le altre, quindi, contiene la coppia (8; 3): Stante, dato x; l’unicità di y, possiamo indicare l’elemento 3 nella forma log 2 8: Ora la scrittura log 2 8 è un termine, e, come vedremo non appena 2.3. LE REGOLE LOGICHE 59 avremo chiarito l’interpretazione di un termine, diventa il nome di un oggetto in quanto esprime uno dei modi con cui il linguaggio denota l’elemento 3 del modello R; invece, la scrittura 3 = log 2 8 è una espressione, alternativa a (8; 3) 2 log2 ; che, interpretata nel modello R, è vera. E ancora, scrittura log 2 x è un termine, che, non appena valutato x, denota un elemento del modello R; invece, la scrittura y = log2 x è una espressione, alternativa a (x; y) 2 log2 ; che, una volta interpretate le variabili nel modello R, può essere vera o falsa. De…nition 61 L’insieme F L delle formule ben formate di L è quell’insieme che soddisfa la seguenti condizioni: (i) ATL µ FL (ogni formula atomica è una formula ben formata), (ii) se '; à 2 F L allora (:') 2 F L e ('¤Ã) 2 F L, dove ¤ è un qualunque connettivo binario. (iii) se ' 2 FL e x 2 X allora (8x)' 2 F L e (9x)' 2 F L (in tal caso ' viene detta campo di azione del quanti…catore, ed x variabile del quanti…catore, o di quanti…cazione). (iv) null’altro appartiene a F L. Con la de…nizione di formula non siamo ancora arrivati all’analogo proposizionale, cioè agli enunciati. De…nition 62 Una formula ' in cui ogni variabile è variabile di quanti…cazione o si trova nel campo di azione di un quanti…catore che la ha come variabile di quanti…cazione si dice formula chiusa, o enunciato; altrimenti ' è detta formula aperta. Le formule a cui siamo interessati sono quelle che, interpretate, dicono qualcosa della struttura , e cioè le formule chiuse. Come vedremo, anche le formule aperte sono importanti in logica, ma tale interesse si manifesta soprattutto nell’ambito delle de…nizioni. Al momento, essendo il nostro interesse rivolto alle regole logiche, le formule aperte costituiscono solamente un passaggio verso la de…nizione di formula chiusa. Passaggio non eliminabile: l’insieme delle formule chiuse di un linguaggio al I ordine, infatti, non si presta ad una de…nizione ricorsiva. Ad esempio, la formula chiusa 60 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE 8x(P(x) ! Q(x)) non può essere considerata il risultato di un processo di costruzione che parta da formule chiuse più piccole, in quanto né P (x) né Q(x) , né P(x) ! Q(x) lo sono. Le formule aperte sono un passaggio necessario anche nella de…nizione di verità di una formula, in quanto anche questa de…nizione avviene per recursione. Solo una de…nizione informale di verità di una formula può essere limitata alle formule chiuse: De…nition 63 (De…nizione informale di verità di una formula chiusa). Una formula chiusa ' di L è vera in un modello A che è una realizzazione di L, in simboli A j= ', se: (i) interpretando mediante ¼ i simboli relazionali, funzionali e di costante nelle corrispondenti relazioni, funzioni e nei corrispondenti elementi di A, (ii) interpretando il simbolo = nell’identità su A, (iii) facendo operare i connettivi in modo conforme alle rispettive tavole di verità, (iv) leggendo 8 ed 9 come ”per ogni” ed ”esiste” ed interpretando le variabili su generici elementi di A, ciò che otteniamo è vero nella struttura. Una ' formula chiusa di L si dirà valida, e si indicherà con j= ', se è vera in ogni struttura che è una realizzazione di L. In altri termini, j= ' se e solo se A j= ' per ogni A di L. Tuttavia, ribadiamo, per rendere rigorosa le precedente de…nizione è necessario passare attraverso le formule aperte, e prima ancora attraverso i termini: De…nition 64 (Interpretazione di un termine mediante una sequenza). Sia § l’insieme delle sequenze in…nite (a1 , a2 ,...,an,...) di elementi di A, e sia ¾ 2 § . De…niamo, in corrispondenza della sequenza ¾ , una funzione ¾¤ da TL ad A, cioè una funzione che associa ad ogni termine t del linguaggio L un elemento della struttura A nel modo seguente: 2.3. LE REGOLE LOGICHE 61 i) se t è una variabile xi allora ¾¤(xi) = ai ii) se t è una costante ci , allora ¾¤(ci) = ¼(ci) iii) se t è un termine della forma f(t1; :::; tn ), allora ¤ ¾ (f(t1 ; :::; tn )) = ¼(f)(¾¤(t1 ); :::; ¾¤ (tn )); Occorre osservare che il fatto di attribuire, mediante la sequenza ¾ , un signi…cato a tutte le variabili è sicuramente ridondante per quel che riguarda un singolo termine o un insieme …nito di termini, in quanto in essi compaiono al più un numero …nito di variabili. In altre parole se con t(x1; x2; :::; xn ) indichiamo il fatto che in t compaiono al più le variabili (x1; x2; :::; xn), (eventualmente quindi non tutte) e ¾1 , ¾2 sono due sequenze di elementi di A coincidenti sui primi n termini, risulterà ¾¤1 (t) = ¾¤2 (t). Nel seguito scriveremo t[a1; a2 ; :::; an ] per indicare ¾¤(t) relativamente a tutte le ¾ che hanno a1 ; a2 ; :::; an ai primi n posti. De…nition 65 (Soddisfazione di una formula mediante una sequenza.) Sia ' una formula di L e ¾ una sequenza. De…niamo, per recursione sulla costruzione di ', il concetto ”' è soddisfatta dalla coppia < A; ¾ > ”, che indichiamo con < A; ¾ >j= ': i) Sia ' atomica, cioè della forma P (t1; t2; :::; tn ), dove P è un simbolo relazionale n-ario di L; allora < A; ¾ > j= ' se (¾¤ (t1 ); ¾¤ (t2); :::; ¾¤(tn)) 2 ¼(P), cioè se gli n elementi di A associati da ¾¤ a t1; t2; :::; tn stanno tra loro nella relazione n-aria ¼(P ). ii) Sia ' della forma (:Ã); < A; ¾ >j= ' se < A; ¾ >2 Ã, cioè se < A; ¾ > non soddisfa Ã. iii) < A; ¾ >j= Ã1 ^ Ã2 se < A; ¾ >j= à 1 e < A; ¾ >j= Ã2 ; < A; ¾ >j= Ã1 _ Ã2 se < A; ¾ >j= Ã1 oppure < A; ¾ >j= à 2; < A; ¾ >j= Ã1 ! à 2 se < A; ¾ >2 Ã1 oppure < A; ¾ >j= à 2; < A; ¾ >j= Ã1 $ à 2 se < A; ¾ >j= à 1 e < A; ¾ >j= Ã2 oppure < A; ¾ >2 Ã1 e < A; ¾ >2 Ã2 . 62 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE iv) sia ' della forma (8xi )Ã; < A; ¾ >j= ' se per ogni sequenza ¾0 coincidente con ¾ escluso al più l’i-esimo termine vale < A; ¾0 >j= Ã. v) sia ' della forma (9xi )Ã; < A; ¾ >j= ' se esiste una sequenza ¾0 coincidente con ¾ escluso al più l’i-esimo termine tale che < A; ¾0 >j= Ã. Il senso delle de…nizioni precedenti è abbastanza naturale salvo che nel caso dei quanti…catori: …ssata un’interpretazione speci…ca per le variabili (se queste compaiono nella formula), il primo passo a¤erma che questa interpretazione soddisfa la formula se gli oggetti in questione stanno realmente nella relazione che la formula stessa denomina, mentre quelli relativi ai connettivi si limitano a de…nire la soddisfazione secondo le relative tavole di verità. Riguardo ai quanti…catori, si osservi che nel passaggio in questione il ruolo della sequenza speci…ca ¾ relativamente alla i-sima componente è vani…cato dal fatto di far intervenire tutte le sequenze che di¤eriscono proprio per l’elemento ai (nel caso del quanti…catore universale) oppure una di tali sequenze (nel caso del quanti…catore esistenziale). Come notazione, se le variabili contenute in ' sono comprese tra x1; x2; :::; xn, allora si scrive '(x1 ; x2 ; :::; xn ) e si indica con A j= '[a1 ; a2 ; :::; an] il fatto che valga < A; ¾ > j= ' per tutte le sequenze ¾ aventi a1 ; a2; :::; an ai primi n posti. A questo punto, possiamo facilmente dare la de…nizione di verità di una formula in una struttura. De…nition 66 (Verità di una formula). ' è vera in A, in simboli A j= ' se, per ogni ¾ 2 § , < A; ¾ >j= '. In tal caso si dice che A è modello di '. Un confronto tra le de…nizioni di soddisfazione e di verità mette in luce due fatti importanti, che hanno notevoli conseguenze sul rapporto tra regole logiche e formule: 2.3. LE REGOLE LOGICHE 63 Osservazioni. (1) Se una formula ' è chiusa allora < A; ¾ > j= ' se e solo se A j= ' dove ¾ è una qualunque valutazione. (2) Se una formula ' è aperta e le sue variabili libere sono comprese tra x1; x2; :::xn allora A j= ' se e solo se A j= (8x1)(8x2 ):::(8xn)': La prima osservazione esprime il fatto che la scelta di ¾ è inin‡uente in presenza di formule chiuse, mentre la seconda mostra l’equivalenza, relativamente alla verità in una struttura , di una formula aperta con la sua chiusura universale. Torniamo ora al problema che ci riguarda. Come individuare le regole logiche nell’ambito dei linguaggi predicativi? Il criterio, naturalmente, è sempre quello della validità universale (cioè indipendentemente dal contesto) che in questo caso diventa Criterio. Una sequenza '1 ; ::; 'n =à è una regola logica se ogni modello di '1 ,..,'n è anche modello di Ã. Rimane inoltre inalterata, rispetto a quanto osservato nel caso proposizionale, la corrispondenza ”regole logiche - formule valide”, a condizione però che le formule siano chiuse. Abbiamo cioè che ² se '1 ; ::; 'n ; à sono formule chiuse, allora '1 ; ::; 'n =à è una regola logica se e solo se ('1 ^ ::: ^ 'n) ! à è valida . Osservazioni. (1) Abbiamo …nalmente un se e solo se, e non soltanto un se, come nel caso proposizionale. Al I ordine, infatti, il linguaggio della teoria è parte del linguaggio logico, e quindi non ci sono livelli linguistici che entrino maggiormente all’interno delle proposizioni. (2) In presenza di formule aperte può accadere che '1; ::; 'n =à sia una regola logica (e cioè che à sia vera ogniqualvolta lo sono '1,..,'n ) senza che ('1 ^ :: ^ 'n ) ! à sia una formula valida. Ciò è dovuto a cause formali, che derivano dalla de…nizione di verità per le formule aperte. La de…nizione infatti è tale per cui '(x) è vera in A se e solo se 8x'(x) è vera in A. Riguardo alla verità in una struttura, quindi, una formula aperta si comporta esattamente come la sua chiusura universale. Per questo motivo accade ad esempio che '(x)=8x'(x) soddis… il criterio di validità universale; infatti, per 64 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE ogni A, se A j= '(x) allora A j= 8x'(x)) e quindi '(x)=8x'(x) è una regola logica (si chiama Generalizzazione); per contro, la corrispondente formula '(x) ! 8x'(x) non è una formula valida: per falsi…carla è su¢ciente considerare una struttura A che falsi…chi 8(x)'(x) e veri…chi '[a] per un certo a. 2.3.4 Come individuare le regole predicative valide. Riepilogo dei passi compiuti …nora: i) problema dell’individuazione delle regole logiche; ii) collegamento tra regole logiche e formule valide; iii) possibilità di individuare queste ultime, a livello di linguaggio proposizionale, mediante un opportuno procedimento (tavole di verità); iv) congettura proposizionale; v) sua caduta: insu¢cienza del livello proposizionale per la formulazione di ragionamenti matematici comuni; vi) costruzione di un nuovo linguaggio o, più propriamente, di una nuova famiglia di linguaggi: quelli predicativi; vii) verità di una formula in un modello; viii) criterio per individuare le regole logiche predicative. Ora: mentre il criterio per individuare le regole logiche predicative è stato sostanzialmente identico a quello per le regole proposizionali (il criterio della validità universale, dell’indipendenza dal contesto), una notevole di¤erenza si manifesta nelle modalità (nelle di¢coltà, potremmo dire) di applicazione del criterio stesso. Infatti, data una formula proposizionale ' in n variabili proposizionali p1 ,...,pn, ogni modello su cui la formula ha senso renderà vera o falsa ciascuna delle p1 ,...,pn , e ciò potrà avvenire in non più di 2 n modi. La veri…ca della validità di ' consisterà allora nell’analisi di questi 2n modi, che corrispondono alle diverse valutazioni delle variabili. In altri termini, i modelli a cui ' si riferisce vengono ripartiti in 2n classi, una per ogni valutazione, ed i modelli di ciascuna classe si trovano ad avere un comportamento uniforme rispetto a '. Invece, se ' è una formula predicativa in cui compaiono in modo essenziale i quanti…catori, allora non si può ripetere l’operazione di suddividere la classe dei modelli in un numero …nito di classi aventi comportamento equivalente rispetto a '. 2.3. LE REGOLE LOGICHE 65 A questo punto si presenta il problema della eventuale esistenza di un processo che sostituisca quello delle tavole di verità e che permetta il riconoscimento delle formule predicative valide e quindi delle corrispondenti regole logiche. Se esistesse un procedimento di questo tipo, il compito della logica riguardo al chiarimento e alla giusti…cazione delle dimostrazioni matematiche apparirebbe, nel complesso, assolto nel modo più soddisfacente. Non a caso David Hilbert, uno dei massimi matematici del ’900 e uno dei fondatori della forma attuale della logica matematica, giudicava che il problema dell’esistenza di un procedimento per determinare la validità di un’arbitraria formula predicativa chiusa fosse il problema fondamentale della logica moderna. Gli avvenimenti non hanno corrisposto alle speranze. Negli anni ’30 è stato dimostrato che la precedente richiesta non può essere soddisfatta. Il risultato in questione, dovuto a Alonzo Church, è così formulabile: Theorem 67 (Church, 1936). Non esiste alcuna procedura generale mediante la quale sia possibile determinare con un numero …nito di passi se una data formula chiusa del calcolo dei predicati sia o no valida . (In altri termini: l’insieme delle formule valide chiuse non è decidibile). Il fallimento del progetto precedente, così come è stato presentato, è quindi de…nitivo ed inapellabile. Possiamo però tentare di attestarci su una linea più arretrata, chiedendoci se è possibile che l’insieme in questione risulti almeno enumerabile (ricordiamo che un insieme A è enumerabile se esiste un procedimento che permette di generare, uno dopo l’altro, gli elementi di A. Vale che: A è decidibile sse A e Ac sono enumerabili). La risposta, come vedremo alla …ne del paragrafo seguente, è a¤ermativa, e la enumerabilità delle formule predicative valide costituisce la caratteristica decisiva della logica al I ordine dei predicati. Le ”macchine”che storicamente sono state inventate per elencare, enumerare, un insieme di formule sono i sistemi formali. 66 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE 2.3.5 Sistemi formali Gli elementi che intervengono nella de…nizione di un sistema formale sono tre: 1) Un insieme LS di simboli. A partire da LS si de…nisce l’insieme FS delle formule ben formate, il quale costituisce un sottoinsieme dell’insieme di tutte le sequenze …nite di simboli di LS . 2) Un insieme AS , sottoinsieme di FS . AS è l’insieme degli assiomi di S. 3) Un insieme …nito RS = fRji : i · ng di regole di inferenza, dove, per ogni i · n, Rji è una funzione j-aria da (FS )j a FS e¤ettivamente computabile. In pratica, Rji è una legge che associa a j formule di FS una ulteriore formula che si può e¤ettivamente determinare. In luogo di Rji ('1 ; :::; 'j) = à si scrive usualmente '1 ; :::; 'j =à mediante Rji ; in tal caso si dice che la formula à è conseguenza diretta di '1 ; :::'j mediante Rji . Un sistema formale S è quindi individuato dalla terna < LS ; AS ; RS > : Una dimostrazione (o deduzione) in S è una sequenza …nita di formule di FS tale che ogni formula appartiene ad AS o è conseguenza diretta di formule che la precedono mediante una regola di RS . Un teorema di S è la formula …nale ' di una dimostrazione in S, che in tale caso viene detta dimostrazione di '. Il fatto che ' sia un teorema di S viene denotato con S ` ' oppure `S '. Si può osservare che ogni formula che compare in una dimostrazione è un teorema, la cui dimostrazione è quella parte di sequenza che la precede. Naturalmente, gli esempi più importanti di sistemi formali sono di carattere logico e matematico (la scelta dei nomi quali formule, regole, dimostrazioni, lo denota chiaramente). Il concetto di sistema formale è però più generale, nel senso che l’insieme LS può essere un insieme qualunque. Theorem 68 L’insieme dei teoremi di un sistema formale il cui insieme di assiomi è decidibile, è un insieme enumerabile. 2.3. LE REGOLE LOGICHE 67 L’idea, piuttosto intuitiva, è quella di elencare, procedendo a zig-zag, tutte le sequenze …nite di formule ben formate vagliando per ognuna se soddis… le condizioni di essere una dimostrazione e, in caso positivo, selezionando la formula …nale. Nel BOX a …ne paragrafo diamo un esempio. L’assenza di un criterio e¤ettivo di decisione per l’insieme delle formule al I ordine valide ci porta quindi a convertire la logica in teoria formale, dotata di assiomi (alcune formule valide) da cui si deducono i teoremi (altre formule valide, possibilmente tutte). Ma con quali strumenti, con quali regole dedurremo i teoremi della logica dagli assiomi? Conformemente alla de…nizione di sistema formale, la risposta sarà: mediante un opportuno insieme RS di regole di derivazione. Prima della de…nizione di teoria formale però, la risposta alla domanda ”come derivare i teoremi dagli assiomi” sarebbe stata: ”mediante regole logiche”. Entrambe le risposte sono corrette; infatti le regole di derivazione saranno alcune regole logiche. Un elemento di possibile confusione nel caso delle teorie formali della logica è rappresentato dal fatto che gli assiomi e teoremi della teoria sono regole logiche trasformate in formule. Convertire la logica in un sistema formale vuol dire allora trovarsi in questa situazione singolare: da alcune regole logiche trasformate in formule (gli assiomi di S) si derivano altre regole logiche trasformate in formule (i teoremi di S) mediante alcune …ssate regole logiche (le regole di inferenza di S). Il vantaggio che si ottiene, naturalmente è quello di rendere ”dominabile” l’insieme delle regole logiche. Tuttavia il fatto di trasformare la logica stessa in una particolare teoria, alla stessa stregua delle teorie matematiche che contribuisce a gestire, è poco intuitiva. Nell’intuizione comune, infatti, la logica svolge il suo compito strumentale ponendosi su un livello distinto da quello delle teorie matematiche cui si applica. Da quanto detto segue naturalmente che, dato il linguaggio LS , la scelta di AS ed RS verrà e¤ettuata con l’intento di soddisfare i seguenti requisiti: A) tutti i teoremi di S devono essere formule valide di LS (tale criterio prende il nome di validità di S); B) i teoremi di S devono esaurire, se possibile, le formule valide di LS (tale criterio, ben più di¢cile da soddisfare, prende il nome di completezza di S). 68 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE Quindi, (A) e (B) insieme richiedono che l’insieme dei teoremi coincida con l’insieme delle formule valide. Le strade per raggiungere questo obiettivo possono variare. I sistemi formali infatti hanno un parametro di scelta in più rispetto ai classici sistemi assiomatici della matematica: non si scelgono solo gli assiomi (ed i concetti primitivi, la cui scelta nel caso dei sistemi formali è rappresentata dalla scelta di LS ), ma anche le regole di inferenza (le quali nei sistemi classici sono invece assunte in blocco, in modo del tutto intuitivo). Ora, una maggiore ricchezza di assiomi consentirà generalmente una maggiore parsimonia nelle regole, e viceversa. Questo è uno dei punti, forse il più appariscente, su cui si distinguono le due fondamentali ”scuole” di formalizzazione della logica: la prima, che risale a Frege e Hilbert, riduce al minimo le regole e necessita quindi di un insieme di assiomi più impegnativo, la seconda, che risale al logico tedesco Gerhard Gentzen, riduce al minimo gli assiomi ed assume un maggior numero di regole (i cosiddetti Calcoli naturali). Il primo esempio di formalizzazione che, di solito, viene presentato riguarda la logica delle proposizioni, la quale è sicuramente molto più semplice da trattare rispetto alla logica dei predicati al I ordine. Tuttavia, come abbiamo osservato, è il linguaggio dei predicati, con il suo insieme di formule valide non decidibile, che rende necessaria la trasformazione della logica in teoria formale, al …ne di poter almeno enumerare l’insieme stesso. Questo problema non sussiste per la logica proposizionale, dove l’algoritmo delle tavole di verità permette di decidere se una data formula proposizionale è valida, cioè se è una tautologia. Poiché però l’insieme delle tautologie proposizionali può essere considerato un sottoinsieme dell’insieme delle formule predicative valide, ogni formalizzazione della logica proposizionale costituisce una base che può essere estesa ad una formalizzazione della logica al I ordine. Prendiamo come esempio un sistema alla Hilbert. Il sistema M0 =< LM 0 ; AM 0; RM 0 > (Elliot Mendelson) è de…nito come segue: 1) LM 0 = ffpi : i 2 Ng; :; !; (; )g. Sono presenti solo due connettivi, mediante i quali gli altri vengono introdotti come abbreviazione (infatti f:; !g è un insieme di connettivi adeguato). L’insieme FM 0 è de…nito ricorsivamente come segue: 2.3. LE REGOLE LOGICHE 69 (i) 8i 2 N, pi 2 FM 0; (ii) se '; à 2 FM 0 allora (:') 2 FM 0 e (' ! Ã) 2 FM 0 , (iii) null’altro appartiene ad FM 0 . 2) AM 0 è composto da tutte e sole le formule aventi uno dei seguenti schemi: AM1: (' ! (à ! Ã)) AM2: ((' ! (à ! »)) ! ((' ! Ã) ! (' ! »))) AM3 ((:à ! :') ! ((:à ! ') ! Ã)): M0 ha quindi un numero in…nito di assiomi, che si ottengono sostituendo formule del linguaggio in ciascuno degli schemi di assioma AM1-AM3. Il fatto che il numero degli schemi sia …nito rende decidibile l’insieme AM0 (si ricordi che la decidibilità dell’insieme degli assiomi è necessaria a¢nché l’insieme dei teoremi sia enumerabile) 3) RM 0 è composto da una sola regola: '; ' ! Ã=à (Modus Ponens). Il sistema M0 soddisfa le condizioni (A) e (B) precedentemente espresse, cioè è valido e completo. In simboli: Theorem 69 `M 0 ' se e solo se j= '. (La dimostrazione, nel caso proposizionale, non è legata ad un nome speci…co. Con il simbolo j= denotiamo le formule valide, cioè, nel caso proposizionale, le tautologie) Il passaggio ad un sistema formale per la logica al I ordine, che denotiamo con M1; avviene come ampliamento del sistema M0: 1) LM 1 è un qualunque linguaggio al I ordine (v. Def.57), la cui parte logica primitiva è f:; !; 8; (; ); Xg (cioè LM 0 [ f8; Xg). L’insieme FM 1 delle formule è costruito secondo le de…nizioni 59, ?? e 61. 2) AM 1 è composto da in…niti assiomi, ottenuti sostituendo formule di LM 1 alle (meta)variabili dei seguenti schemi: 70 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE AM1 , AM2, AM3 (di M0) AM4 : 8xi '(xi ) ! '(t), dove t è un termine libero per xi in '(xi ) . (t è libero per xi in ' se nessuna occorrenza libera di xi in ' si trova nel campo di un quanti…catore relativo ad una variabile xj che compare in t ) AM5 : 8xi (' ! Ã) ! (' ! 8xi Ã), dove ' è una formula che non contiene occorrenze libere di xi . 3) RM 1 è composto da due regole: il Modus Ponens e la regola di Gene' ralizzazione 8x' Dal fatto che sia gli schemi di assioma sia le regole di M0 appartengono ad M1, segue che i teoremi del primo sistema sono anche teoremi del secondo. Più precisamente, sia ' è una formula di LM 0, e denotiamo con '(p1; :::; pn ) il fatto che p1; :::; pn sono le uniche lettere proposizionali che compaiono in ', e con '(Ã1 ; ::; Ãn ) la formula ottenuta da '(p1 ; :::; pn ) sostituendo uniformemente ogni occorrenza di pi con Ãi . Abbiamo allora: ² se '(p1; :::; pn) è un teorema di M0 e Ã1 ; ::; à n sono formule di LM1 allora '(Ã1 ; ::; Ãn ) è un teorema di M1. Anche da un punto di vista formale quindi, la logica predicativa al I ordine è una estensione ella logica proposizionale. Ricordando che i teoremi, e quindi gli assiomi, delle teorie logiche formalizzate devono essere formule valide, e che le formule valide chiuse e in forma implicativa corrispondono a regole logiche, possiamo chiederci quali regole logiche siano rappresentate dagli assiomi AM4 ed AM5. L’assioma AM4 esprime la cosiddetta regola di particolarizzazione (il Dictum de omni medioevale: se qualcosa vale per ogni oggetto, vale per l’oggetto t). Essa costituisce una regola logica di frequentissimo impiego nelle dimostrazioni, anche se la sua immediatezza intuitiva fa sì che l’applicazione sia automatica e inconscia. L’assioma AM5 esprime semplicemente il fatto che se la formula ' non contiene occorrenze libere della variabile x, allora il quanti…catore 8x può essere posposto a '. La validità di questo assioma si fonda sul fatto che, secondo la de…nizione di verità, se una stessa occorrenza di variabile è nel campo di due suoi quanti…catori, allora l’e¤etto del quanti…catore esterno è annullato da quello interno. Ad esempio, la formula 8x9xP (x) (che è una ab- 2.3. LE REGOLE LOGICHE 71 breviazione della formula ben formata 8x:8x:P (x) ) è vera (in un modello secondo una certa interpretazione) se e solo se è vera 9xP (x) ; il quanti…catore esterno è quindi inin‡uente. Anche la natura dell’esempio mostra come l’assioma AM5 abbia scarso interesse intuitivo, e il suo impiego quindi sia dovuto essenzialmente a ragioni formali. Più problematica risulta invece la regola di generalizzazione. Di essa abbiamo già parlato: costituisce infatti un esempio di regola che, nel caso in cui le formule coinvolte siano aperte (cioè contengano variabili libere), può non avere come corrispondente una formula valida. In altri termini: la regola asserisce che se '(x) è un teorema allora 8x'(x) è un teorema, ma la formula '(x) ! 8x'(x) può non essere un teorema . Comunque anche tale regola esiste in funzione delle formule aperte. Anche il sistema M1 soddisfa le condizioni di validità e completezza. Theorem 70 ( Teorema di completezza della logica al I ordine, Gödel 1930). `M 1 ' se e solo se j= '. Theorem 71 ( Teorema di completezza estesa, Gödel 1930) Un insieme di formule è consistente sse ha un modello. Quindi, l’insieme dei teoremi del sistema formale M1 (così come di ogni altro equivalente sistema di assiomi per la logica al I ordine) coincide con l’insieme delle formule valide. E poiché i teoremi di un sistema formale sono enumerabili, risulta che Corollary 72 L’insieme delle formule al I ordine valide sono enumerabili. E poiché, ancora, l’insieme di tali formule corrisponde all’insieme delle regole logiche, otteniamo …nalmente Corollary 73 L’insieme delle regole logiche è enumerabile. === BOX. Enumerazione dei teoremi di M0 =========== Come esempio, mostriamo come enumerare i teoremi di M0. Essendo M0 decidibile, si tratta di un compito inutile; è più semplice però da descrivere 72 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE rispeto al sistema M1, per il quale, non essendo decidibile, tale enumerazione è utile. Cominciamo col de…nire una biezione g che associ ad ogni simbolo di LM 0 un numero naturale non nullo. Ad esempio: g(:)=1, g(!)=2, g(()=3, g())=4, e, per ogni n, g(pn )=n+5 (cioè, g(p0)=5, g(p1 )=6 etc.). A questo punto possiamo immaginare che il lavoro venga svolto da sette macchine T1-T7 in sequenza, che svolgono le seguenti operazioni: T1 elenca, in ordine, i numeri naturali, partendo da 2 : (2; 3; 4; 5; 6; 7:::) e li fornisce a T2. T2 li scompone in fattori primi scritti in ordine crescente (21; 31; 22; 5 1; 2 131 ; 71 ; 23 ; 32 ; 21 51 ; 111 ; 22 31; :::): T3 compie una operazione di selezione: dato un numero scomposto in fattori primi, se le basi della scomposizione formano un segmento iniziale dell’insieme dei numeri primi (cioè, iniziano da 2 e procedono senza saltare numeri primi) allora questo numero viene inviato a T4, altrimenti viene scartato (tra i numeri …no a 12, ad esempio, vengono inviati a T4 i numeri 21; 22; 213 1; 2 3; 2 231 ;, e scartati gli altri). T4 converte ogni numero 2n1 3n2 ::: che riceve nella sequenza di simboli di LM 0 < g ¡1(n1 ); g¡1 (n2); :: >. (Si ricordi che g è una biiezione). Queste sequenze di simboli di LM 0 vengono inviate a T5, cui spetta, insieme a T6, il compito più elaborato. T5 seleziona quelle sequenze di simboli che sono formule ben formate o sequenze di formule ben formate di LM 0 ; queste vengono inviate a T6, le altre vengono scartate. E’importante osservare questo fatto: il problema di determinare se una stringa di simboli di LM 0 è una formula ben formata costituisce un problema decidibile e meccanico. Ed è ugualmente decidibile in modo meccanico se una stringa è una sequenza di formule ben formate. Infatti, mentre nel linguaggio naturale è necessario disporre di una qualche forma di spaziatura (spazi bianchi, o trattini) per distinguere tra loro, ad esempio, le espressioni ”oh, primavera primavera” e ”oh, prima vera primavera”, la 2.3. LE REGOLE LOGICHE 73 de…nizione di formula ben formata rende le separazioni formalmente inutili; non è infatti possibile che la giustapposizione di due formule ben formate sia ancora una formula ben formata. Ad esempio, è un fatto non ambiguo che la stringa (p0 ! p1 )p2 p4 (:p3 )(p2 ! (p1 ! (:p0 ) costituisce una sequenza delle cinque formule (p0 ! p1); p2; p4; (:p3 ); (p2 ! (p1 ! (:p0): T6, che riceve da T5 sequenze di formule, seleziona quelle che sono dimostrazioni di M0. Anche questo e’un compito meccanico: infatti sono problemi decidibili sia quello di stabilire se una data formula è un assioma, cioè se è stata ottenuta per sostituzione da uno degli schemi di assioma che il sistema M0 possiede in numero …nito, sia quello di veri…care se una data formula deriva da formule precedenti mediante una delle regole di inferenza, poichè anche le regole sono in numero …nito. Le sequenze che sono derivazioni vengono inviate a T7, le altre scartate. T7, in…ne, elenca le formule …nali delle deduzioni ricevute. E’importante osservare che, prima o poi, ogni teorema del sistema uscirà da T7. Sia infatti ' un qualunque teorema e < Ã1 ; Ã2 ; :::; Ãn ; ' > una sua dimostrazione. Allora à 1Ã2 :::Ãn ' è una stringa di simboli di LM 0 e, mediante g, diviene una sequenza < n1 ; n2; :::; ns > di numeri naturali non nulli (s è uguale al numero complessivo dei simboli delle formule della deduzione). Quando da T1 uscirà il numero n = 2n1 3n2 :::pns s , dove ps è l’s-mo numero primo, T2 lo scomporrà e lo invierà a T3 che, riconoscendolo come buono (le basi della scomposizione sono numeri primi consecutivi a partire da 2), lo invierà a T4. Questa macchina lo trasformerà nella sequenza < g¡1 (n1 ); g ¡1(n2 ); :: >; cioè à 1Ã2 :::à n', da cui, attraverso T5-T7, avremo '. Il procedimento è chiaramente generalizzabile. L’insieme dei teoremi di un sistema formale (che, come M0, soddis… l’ovvia condizione di avere l’insieme degli assiomi decidibile) è quindi un insieme enumerabile. In un processo come quello appena descritto la quantità di numeri ”scartati”, cioè emessi da T1 e non giunti (opportunamente trasformati) a T7, è enorme. Il primo 74 CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE teorema di M0 emesso da T7, che sarà (p0 ! (p0 ! p0 )) e che, essendo un assioma, ha come dimostrazione una sequenza composta da una sola formula, corrisponde al numero n = 23 35 5273 115 132 17519423 4 (infatti, le basi sono numeri primi successivi, e gli esponenti sono, nell’ordine, le controimmagini mediante g dei simboli della formula). Ciò signi…ca che tutti i numeri da 2 ad n sono stati scartati, in una o nell’altra fase di elaborazione . Poichè n è circa uguale a 2; 3 ¤ 1031 , abbiamo che, alla velocità di mille numeri al secondo, il nostro n, che è il primo utile, verrebbe elencato dopo circa 1021 anni, mille miliardi di volte l’attuale vita del nostro universo. Il metodo presentato, di particolare semplicità espositiva, è una forma sempli…cata di quel tipo di codi…ca che prende il nome di ”gödelizzazione”, e non è certo il metodo più e¢ciente. Tuttavia, qualunque tipo di enumerazione si scelga, la lentezza è comunque esasperante e, come nel caso precedente, uno stesso teorema compare in…nite volte (infatti questi procedimenti individuano i teoremi come formule …nali di deduzioni, ed uno stesso teorema ammette in…nite deduzioni diverse, ad esempio inserendo arbitrariamente assiomi tra una formule e l’altra di una deduzione data). Occorre ricordare tuttavia che non siamo alla ricerca di una macchina che produca solo teoremi (in tal caso sarebbero possibili drastiche sempli…cazioni), ma di una macchina che produca tutti e soli i teoremi del sistema, nel senso che ognuno di essi, prima o poi, deve comparire in uscita. Ed è in questo ”tutti” che risiede il signi…cato del processo: un insieme in…nito, in generale non decidibile, viene ”dominato” con mezzi …niti. ========================= Capitolo 3 Gli assiomi dell’Aritmetica Alla …ne del § 2.1.1 abbiamo visto come i cardini su cui ruota il concetto di dimostrazione siano due: assiomi della teoria e regole logiche. Il capitolo precedente ha fornito delle risposte riguardo al problema delle regole. Affrontiamo ora alcuni aspetti riguardanti gli assiomi, concentrandoci su quelli dell’aritmetica. 3.1 La frattura geometria-aritmetica Torniamo dunque alla Proposizione I.25, trattata all’inizio del §.2.3. Essa è, anche per quanto riguarda gli assiomi, conforme alla De…nizione 54. Infatti, ci muoviamo all’interno di una teoria (la geometria del piano), ed anche se gli assiomi non intervengono direttamente, il ragionamento utilizza teoremi precedenti che a loro volta si fondano sugli assiomi. Non sempre tuttavia le cose stanno in questo modo. Si consideri questa nuova proposizione, sempre dagli Elementi: Proposizione IX.20. L’insieme dei numeri primi è in…nito. Dimostrazione. Supponiamo per assurdo che l’insieme X dei numeri primi sia …nito, e siano p0 ; p1 ; :::; pn i suoi elementi. Consideriamo il numero q de…nito dalla formula q = (p0 ¢ p1 ¢ ::: ¢ pn) + 1: Il numero q non è divisibile per nessuno elemento di X, poiché il resto di ogni divisione sarà sempre 1. In tal caso o q è primo (e non appartiene ad X) 75 76 CAPITOLO 3. GLI ASSIOMI DELL’ARITMETICA oppure è divisibile per un numero primo che non compare in X. In entrambi i casi esiste un numero primo che non appartiene ad X;contro quanto supposto. Traduzione letterale: I numeri primi sono in numero maggiore di ogni quantità assegnata. Siano A,B,C i numeri primi dati: dico che ci sono più numeri primi di questi. Si prenda il più piccolo numero multiplo di A,B,C e sia K; e si aggiunga a K l’unità U.Ora il numero K+U è primo oppure non lo è. Consideriamo prima che lo sia. Allora si sono trovati i numeri primi A,B,C,K+U che sono in numero maggiore di A,B,C. Come secondo caso sia K+U non primo.Allora è divisibile per un numero primo D [VII.31]. Dico che D non coincide con alcuno dei numeri A,B,C.Infatti, se possibile, sia uguale a uno di essi. Ma A, B,C dividono K; quindi anche D dividerebbe K. Ma D divide anche K+U. Allora D, essendo un numero, dividerebbe l’unità U che rimane di K + U [ossia la di¤erenza tra K e K+U], e questo è assurdo. Quindi D non coincide con alcuno dei numeri A,B,C e per ipotesi è primo.Allora si sono trovati i numeri primi A,B,C,D che sono in numero maggiore della quantità assegnata A,B,C.((5)) Considerando questa dimostrazione per quanto concerne il problema in esame, cioè la presenza degli assiomi, osserviamo che in essa non ne vengono citati, né compaiono teoremi che ad essi si ricolleghino. Infatti, nessun assioma (o postulato) riguardante i numeri compare negli Elementi. La dimostrazione quindi, secondo la de…nizione data, manca del punto essenziale. Essa appare però del tutto convincente, e così è apparsa nei secoli. Tale dimostrazione lega, mediante una deduzione, l’asserto da dimostrare non già ad assiomi stabiliti in inizio di teoria, ma a varie proprietà ”evidenti” dei numeri naturali (ad esempio: il fatto che il prodotto di due o più numeri sia un numero, che il successore di un numero sia un numero, etc.). Anche se la prima assiomatizzazione dei numeri naturali risale a tempi recenti (1889), le proprietà più complesse dei numeri non sono state, …no ad allora, semplicemente formulate, ma ”dimostrate” (nel senso appena visto) sulla base di una serie di a¤ermazioni semplici volta a volta riconosciute vere. Questo fenomeno non è isolato: la grande maggioranza delle usuali dimostrazioni matematiche non fa riferimento ad assiomi e si fonda su un insieme di proprietà evidenti, individuate ogni volta in funzione della tesi. Appare chiaro quindi che la De…nizione 54 non descrive in generale la realtà e¤ettiva. Tuttavia, lo sviluppo storico della matematica mostra la tendenza al 3.2. L’INDUZIONE MATEMATICA. 77 passaggio da uno stato non assiomatico ad uno assiomatico, e pertanto le dimostrazioni tendono ad adeguarsi, almeno in linea di principio, a tale de…nizione. Infatti, se in un primo momento le dimostrazioni sono riservate esclusivamente a proprietà non immediatamente percepibili e si fondano su proposizioni evidenti scelte di volta in volta, in una fase più evoluta sorge la necessità di organizzare l’insieme delle dimostrazioni in modo da uniformare e ridurre il ricorso all’evidenza. Ciò porta da un lato a …ssare dei punti di partenza (assiomi), dall’altro alla necessità di dimostrare anche asserti banali (la dimostrazione di asserti ovvi è una della caratteristiche più visibili dei sistemi assiomatici). 3.1.1 Gli assiomi di Peano. Abbiamo dunque visto come l’aritmetica sia rimasta priva di assiomi …no al 1889. A tale data risale infatti l’assiomatizzazione di Giuseppe Peano (Cuneo 1858, Torino 1932). Essa rappresenta anche il primo esempio di applicazione di un linguaggio completamente simbolico alla matematica. Data la diversità del simbolismo di Peano da quello attuale, riportiamo i suoi assiomi in linguaggio naturale: P1 : 0 è un numero naturale. P2 : Se x è un numero naturale, esiste un altro numero naturale denotato da S(x) e chiamato successore di x. P3 : 0 6= S(x) per ogni numero naturale x (cioè, 0 non è successore di alcun numero). P4 : Se S(x) = S(y) allora x = y. P5 : Se P è una proprietà relativa ai numeri naturali tale che vale per 0 e tale che se vale per x allora vale per S(x), allora P vale per tutti i naturali. 3.2 L’induzione matematica. L’assioma P5 rappresenta il ² Principio di induzione. 78 CAPITOLO 3. GLI ASSIOMI DELL’ARITMETICA PI : da e segue P (0) 8k(P(k) ! P(k + 1)) 8nP (n): (3.1) P (0) viene de…nita base di induzione; la condizione 8k(P (k) ! P (k + 1)) è il passo induttivo; l’antecedente P(k) è l’ipotesi induttiva. Chiaramente, non è necessario che la proprietà P valga, o sia de…nita, a partire dal numero 0. Dato un qualunque numero naturale n0 possiamo prendere P (n0) come base di induzione e dedurre una dimostrazione di P (n) per ogni n ¸ n0 (ad esempio, la proprietà 2n < n! si dimostra per induzione per n > 4. Volendo rispettare la de…nizione, si può trasformare nella forma 2n+4 < (n + 4)!, che vale a partire da 0.) Nella de…nizione precedente abbiamo detto che la proprietà P è “relativa ai numeri naturali”; se così non fosse le scritture P (0) e P (n) non avrebbero senso. Tuttavia, almeno in apparenza, ciò contrasta con il fatto che si trovano dimostrazioni per induzione nei più svariati campi della matematica, della logica e dell’informatica, che sono esterni all’aritmetica. Preciseremo in seguito questo problema. Una variante di PI è data dal Principio di induzione completa (o sull’ordine). PIC : da ® : 8k [8x((x < k) ! P(x)) ! P (k)] segue ¯ : 8nP (n): (3.2) A parole: sia P una proprietà tale che, per ogni k 2 N, se è soddisfatta da tutti gli x < k allora è soddisfatta anche da k. Allora P è soddisfatta da ogni numero naturale n: Apparentemente sparisce la base di induzione. Si osservi però che se k = 0 allora, essendo fx : x < kg = ;, l’implicazione 8x((x < k) ! P(x)) è sempre soddisfatta (a vuoto, come si suol dire) e quindi ® diventa P (0). L’altra novità rispetto a PI consiste nel fatto che l’ipotesi induttiva non si limita al passo precedente (k per avere k + 1), ma considera tutti i passi precedenti (tutti i minori di k per avere k). In tal modo l’ipotesi induttiva si ra¤orza, il passo induttivo (che ha l’ipotesi induttiva come antecedente) si indebolisce, e la regola tutta (avendo ipotesi più deboli e stessa tesi) apparentemente si 3.2. L’INDUZIONE MATEMATICA. 79 ra¤orza. In e¤etti, la regola diventa talvolta più facilmente applicabile ma non più forte: le forme PI e PIC sono equivalenti. E’infatti su¢ciente applicare k volte l’implicazione P(n) ! P(n + 1) per ottenere P (0); P (1); ::: P(k ¡ 1). 3.2.1 La natura del pricipio di induzione matematica. Perché l’impiego del termine induzione? Il nome induzione è onnipresente nella storia del pensiero scienti…co e …loso…co, essendo il “problema dell’induzione” l’argomento centrale dell’epistemologia. Secondo una distinzione ben radicata nella teoria della conoscenza, questa procede “per induzione” e “per deduzione” . Ecco come S.Mill presenta i termini della dicotomia: Il ragionamento, nel senso in cui il termine è sinonimo di inferenza, si dice comunemente che è di due generi: il ragionamento che va dai particolari al generale e il ragionamento che va dal generale ai particolari; il primo si chiama induzione, il secondo argomentazione o sillogismo [deduzione]; (...) più propriamente, si ha induzione quando dall’osservazione di un numero di casi individuali saliamo ad una proposizione generale o quando, combinando più proposizioni generali, concludiamo ad un’altra proposizione ancor più generale; (...) si ha invece argomentazione quando da una proposizione generale combinata con altre proposizioni inferiamo una proposizione dello stesso grado di generalità, o una proposizione meno generale, o anche una proposizione individuale. Il metodo induttivo è dunque lo strumento che caratterizza la fase euristica ed empirica della conoscenza e, secondo l’epistemologia tradizionale, è incapace di fornire alle conclusioni lo stesso grado di certezza delle premesse. Il Problema dell’induzione, che è la versione moderna del medioevale Problema degli universali, consiste appunto in questo: come giusti…care una quanti…cazione universale, cioè un per ogni, dopo un insieme limitato e non esaustivo di esperimenti. In ciò, tale metodo è ben distinto dal metodo deduttivo, caratteristico delle scienze matematiche, il quale interviene soprattutto nella fase di sistematica della conoscenza e a cui è stata sempre riconosciuta la capacità di fornire alle conclusioni lo stesso grado di certezza delle premesse. Essendo questi i termini della distinzione, appare evidente che, nella dicotomia induttivo-deduttivo, l’induzione matematica appartiene all’ambito 80 CAPITOLO 3. GLI ASSIOMI DELL’ARITMETICA deduttivo; essa infatti interviene nelle dimostrazioni matematiche e fornisce conclusioni tanto certe quanto le premesse. E’però chiaro che la relazione tra metodo induttivo e induzione matematica non si riduce ad un mero caso di omonimia. Vi è un …lo che lega tra loro l’accezione epistemologica e quella matematica del termine induttivo. In e¤etti, la conclusione della regola di induzione matematica è sempre espressa da una formula universale 8nP (n) che sembra ottenuta da tanti risultati particolari. Ora, se con ottenuta intendiamo dimostrata, allora la sensazione è falsa: quando si dimostra 8nP (n) per induzione, non è da asserti particolari che lo si deduce, ma da un asserto altrettanto universale (cioè 8k(P (k) ! P (k + 1)) coadiuvato da un asserto particolare (P (0)). Viceversa, se con ottenuta si intende ipotizzata, arguita, se, insomma, ci si riferisce alla formulazione di una congettura, allora la sensazione è vera, e rende conto del fatto che, molto spesso, si giunge a formulare un asserto per tutti i numeri naturali dopo averne constatato la validità per alcuni di essi. Perché l’impiego della parola principio? Questo termine, più frequente in …sica che in matematica (dal Principio di Archimede a quello di Heisemberg), è di regola associato a leggi fondamentali; nel nostro caso, dunque, esprime una legge fondamentale dei numeri naturali, quasi si trattasse di una proprietà empiricamente veri…cata. Perché tra gli assiomi? Gli assiomi posti da Euclide a fondamento della geometria sono cinque, e il quinto, quello “delle parallele”, è il meno intuitivo e il più travagliato. A questo riguardo, la situazione nell’assiomatizzazione di Peano è analoga. I primi quattro assiomi, a parole, dicono che 0 è un numero naturale, che ogni numero ha un successore, che 0 non è successore di alcuno, che se due numeri hanno lo stesso successore allora sono uguali; il quinto assioma, il Principio di induzione, è di gran lunga il meno immediato. Non sembra inoltre di di¢cile dimostrarlo: Dimostrazione del Principio di induzione. Supponiamo per assurdo che le ipotesi P(0) e 8k(P (k) ! P (k + 1)) siano vere e che la tesi 8nP (n) sia falsa. Allora l’insieme X costituito dai numeri naturali che non soddisfano P è non vuoto. Sia ¹n il minimo elemento di X. Da P (0) si deduce che ¹n 6= 0; quindi n ¹ ¡ 1 è un numero naturale. Inoltre, dal fatto che ¹n è il minimo elemento 3.2. L’INDUZIONE MATEMATICA. 81 di X si deduce che n ¹¡1 2 = X, e quindi soddisfa P . Ma questo, unitamente all’ipotesi 8k(P(k) ! P (k + 1)), implica che anche n ¹ soddis… P, in contraddizione con la sua appartenenza ad X. Questa dimostrazione risulta convincente. Perché allora inserire l’Induzione tra gli assiomi? Se passiamo in rassegna le proprietà impiegate nella precedente dimostrazione, vediamo che una è meno immediata delle altre: l’assunzione che l’insieme X, il quale è un generico insieme non vuoto di numeri naturali, abbia minimo. Questa proprietà: ²ogni insieme non vuoto di numeri naturali ammette minimo prende il nome di Principio del minimo numero, ed equivale ad a¤ermare che N è ben ordinato da ·. Nonostante la sua maggiore evidenza, tale principio è aritmeticamente equivalente al Principio di induzione. Ciascuno dei due principi può quindi essere posto come assioma e impiegato per dimostrare l’altro. Che la scelta di Peano sia caduta sulla proprietà meno intuitiva delle due è conseguenza del fatto che, mentre il Principio del minimo numero è espresso mediante la relazione d’ordine · (assente dagli altri assiomi), il Principio di induzione è espresso mediante la funzione S di passaggio al successore (già presente). Tale scelta è quindi più economica. Per contro, nella teoria (ingenua) degli insiemi, che già dispone di una relazione d’ordine, il Principio di induzione viene dimostrato mediante il Principio del minimo numero, nel modo appena visto (per una dimostrazione nella teoria formalizzata si veda Th. 103. Nel §. 3.2.4 vedremo anche una dimostrazione del principio di induzione esteso ad un numero ordinale qualunque). 3.2.2 Induzione e recursione Spesso, al di fuori dell’aritmetica (ad esempio in logica), si incontrano delle dimostrazioni, dette ”per induzione”, dove non compare alcun riferimento ai numeri naturali. Consideriamo, ad esempio, l’insieme F bf delle formule della logica proposizionale: 1) ogni variabile proposizionale pi , con i 2 N; è una formula; 2) se ® è una formula allora anche (:®) è una formula; 82 CAPITOLO 3. GLI ASSIOMI DELL’ARITMETICA 20 ) se ® e ¯ sono formule allora anche (® ^ ¯); (®_ ¯); (® ! ¯) e (® $ ¯) sono formule; 3) nient’altro è una formula. e dimostriamo il seguente banalissimo fatto: il numero f(®) delle parentesi di una qualunque formula proposizionale ® è pari. Dimostrazione. Se ® è una variabile proposizionale, allora f(®) = 0 ed è quindi pari (base). Se f(®) è pari (ipotesi di induzione), allora f(:(®)) è pari, in quanto uguale a f(®) + 2. Analogamente, se f(®) ed f(¯) sono pari e ¤ è uno qualunque tra ^; _; !; $, allora f((®¤ ¯)) è pari, in quanto uguale a f(®) + f(¯) + 2. Quindi ogni formula del linguaggio proposizionale ha un numero pari di parentesi. Questa dimostrazione ha chiaramente le caratteristiche di una dimostrazione per induzione, ma in essa i numeri servono solo per descrivere una proprietà delle formule e non riguardano a¤atto il processo induttivo, che invece avviene seguendo la costruzione delle formule. Lo schema applicato in questo esempio non è quindi PI (né PIC). La precedente dimostrazione si fonda sul modo in cui è stato de…nito l’insieme delle formule. Questo tipo di de…nizione è detto per recursione ed ha la seguente forma: De…nition 74 Siano U un insieme, H un sottinsieme non vuoto di U e K = fg1; :::; gs g un insieme …nito di funzioni di qualunque arietà da una potenza di U ad U. La de…nizione ricorsiva dell’insieme A; con A µ U, a partire da H mediante le funzioni di K è la seguente: 1) H µ A; 2i ) se gi è una funzione n-aria di K e x1; :::; xn 2 A allora g(x1 ; :::; xn ) 2 A; 3) null’altro appartiene ad A. Gli elementi di H e quelli di K vengono detti rispettivamente elementi di base e funzioni di costruzione. 3.2. L’INDUZIONE MATEMATICA. 83 A questo punto, una dimostrazione per induzione del fatto che una proprietà P vale per ogni elemento di A può seguire i passi mediante i quali A è stato costruito a partire da H e K, e la forma che assume è la seguente: PGI : da e segue 8x (x 2 H ! P (x)) 8g8x1:::8xn (((g 2 K) ^ (x1 ; :::; xn 2 A) ^ P (x1) ^ ::: ::: ^ P(xn )) ! P (g(x1 ; :::; xn ))) 8x(x 2 A ! P (x)): A parole: dal fatto che ogni elemento della base H soddisfa P e dal fatto che, per ogni n-pla x1; :::; xn di A e per ogni funzione g di K, se x1 ; :::; xn soddisfano P allora g(x1 ; :::; xn ) soddisfa P , segue che ogni elemento di A soddisfa P . La sigla PGI stà per Principio generale di Induzione. Adattare la precedente costruzione dell’insieme Fbf a questa de…nizione generale non è di¢cile: U è in questo caso l’insieme delle sequenze …nite di simboli dell’alfabeto proposizionale; H è l’insieme delle variabili proposizionali; K è costituito da una funzione unaria g1 tale che per ogni sequenza di simboli ® 2 U, g1(®) = (:®); e da quattro funzioni binarie g2 ; :::; g5 tali che, per ogni coppia di sequenze di simboli ®; ¯ 2 U, g2 (®; ¯) = (® ^ ¯), g3 (®; ¯) = (® _ ¯), g4(®; ¯) = (® ! ¯), g5 (®; ¯) = (® $ ¯). Dunque, la regola PGI presuppone la de…nizione ricorsiva dell’insieme su cui si applica. In altri termini, il “metodo per induzione matematica” è qui costituito dalla coppia hdefinizione ricorsiva; dimostrazione induttivai: L’induzione sui numeri naturali non fa eccezione, in quanto i numeri naturali stessi sono de…nibili per recursione (in modo esplicito nell’ambito generale della teoria degli insiemi, in modo implicito mediante gli assiomi P1 e P2). Per come le regole PI e PGI sono state formulate, la prima è un caso speci…co della seconda. E’tuttavia possibile, anche se a costo di una perdita di immediatezza, ricondurre una qualunque forma di dimostrazione per induzione che impieghi PGI alla forma PI, cioè riferirla ai numeri naturali e alla sola funzione di successore S. In tal modo PI ritrova la sua centralità nell’ambito delle dimostrazioni per induzione. Per mostrare come ciò avvenga, consideriamo una dimostrazione per induzione sulla costruzione degli 84 CAPITOLO 3. GLI ASSIOMI DELL’ARITMETICA elementi di un insieme A; diverso da N; de…nito per recursione secondo la De…nizione 74. La costruzione di tali elementi avviene per passi successivi a partire dalla base H e, in virtù delle condizioni (2) e (3), ogni elemento è ottenibile a partire dalla base mediante un numero …nito di passi. E’possibile allora de…nire una funzione rango ½ da A a N; dove ½(x) dipende dal numero dei passi con cui x è stato costruito. Mediante ½, una dimostrazione per induzione sulla costruzione di A può essere trasformata in una dimostrazione per induzione sui numeri naturali. Per mostrare come ciò possa avvenire, consideriamo di nuovo l’esempio precedente, ma questa volta lo dimostriamo per induzione sui numeri naturali (nella forma PIC), anziché mediante PGI. (nuova dimostrazione) Data ® 2 F bf, poniamo ½(®) uguale al numero n dei connettivi che compaiono nella formula stessa. A questo punto la dimostrazione si svolge per induzione su n. Sia P (n) la proprietà “ogni formula ® tale che ½(®) = n ha un numero pari di parentesi”. Se ½(®) = 0 allora ® 2 H ed ha 0 parentesi. Supponiamo k > 0 e P (x) per ogni x < k, e sia ® una formula tale che ½(®) = k. Se ® = (:¯) allora ½(¯) = k ¡ 1 e quindi, per ipotesi induttiva, ¯ ha un numero pari s di parentesi e ®, che ne ha s + 2, ha anch’essa un numero pari di parentesi. Se ® = (®1 ¤ ®2 ); dove ¤ è uno tra ^; _; !; $, allora ½(®1 ) < k e ½(®2 ) < k. Per ipotesi induttiva ciascuna di esse ha un numero pari (che indichiamo con s1 ed s2) di parentesi, ed allora anche il numero di parentesi di ®, che è s1 + s2 + 2; è pari. 3.2.3 De…zione ricorsiva di funzioni Oltre che un insieme, anche una funzione f può essere de…nita per recursione. Il caso generale verrà trattato nel paragrafo successivo. Per ora ci limitiamo a casi particolari ma signi…cativi. Una funzine può esser de…nita …ssando il suo valore a su 0 mediante la condizione 1) f(0) = a (3.3) e formulando una legge del tipo 2) f(n + 1) = g(n; f(n)) (3.4) 3.2. L’INDUZIONE MATEMATICA. 85 dove g è una funzione nota in due variabili che consente di passare da f(n) a f(n + 1). Il fatto che ci debba essere una ed una sola funzione f che soddisfa questi requisiti è intuitivo: il valore iniziale f(0) = a è univocamente determinato e, tramite la legge f(n + 1) = g(n; f(n)); ricaviamo univocamente f(1) = g(0; f(0)), f(2) = g(1; f(1)), f(3) = g(2; f(2)) e così via per ogni numero naturale n. Questo risultato di esistenza ed unicità va comunque sotto il nome di Teorema di Recursione, e verrà dimostrato nel paragrafo successivo (Th. 77) con riferimento ad un ordinale qualunque. Un esempio di questo tipo è la de…nizione ricorsiva della funzione fattoriale 1) 0! = 1; 2) (n + 1)! = (n + 1) ¢ n! la quale si riconduce alle (3.3) e (3.4) ponendo f(0) = 1 e g(n; f(n)) = (n + 1) ¢ f(n): Un caso un po’diverso si ha quando la funzione g è in una sola variabile, e quindi la (3.4) diventa 2) f(n + 1) = g(f(n)): Ad esempio, la de…nizione ricorsiva della funzione esponenziale an ad esponente naturale 1) a0 = 1; 2) an+ 1 = a ¢ an : è di questo tipo, ponendo f(0) = 1 e g(f(n)) = a ¢ f(n). La funzione g mediante la quale viene de…nita la funzione f può esser più complessa,m in quanto non sempre per il computo di f(n + 1) ci si riferisce soltanto a f(n):. Ad esempio, la seguente de…nizione di f : f(0) = 2 f(n + 1) = X 0·k <n+1 (n + 1 ¡ k)f(k) è ricorsiva, a non rientra nei casi precedenti in quanto ogni volta si considerano tutti i valori precedenti, che ogni volta aumentano di numero. Vedremo nel paragrafo successivo come de…nire una funzione g da cui ottenere f. 86 CAPITOLO 3. GLI ASSIOMI DELL’ARITMETICA Anche operazioni binarie quali la somma e il prodotto si prestano ad essere de…nite ricorsivamente. Solitamente, trattandosi di funzioni in due variabili, si considera una variabile per volta, parametrizzando l’altra: 1) per ogni n 2 N; f(n; 0) = n; 2) f(n; S(m)) = S(f(n; m)): (f è la funzione somma, S è la funzione successore). In tal caso abbiamo che una operazione corrisponde ad in…nite funzioni in una variabile. Ma è possibile de…nire la somma direttamente come funzione in due variabili: 1) f(0; 0) = 0; 2) f(n; S(m)) = S(f(n; m)); 20 ) f(S(n); m) = S(f(n; m)). Nel primo caso, la de…nizione corrisponde alla costruzione ricorsiva del dominio N2 a partire da N : 1D ) per ogni n 2 N; (n; 0) 2 N2 ; 2D ) se (n; m) 2 N2 allora (n; S(m)) 2 N2 ; 3D ) null’altro appartiene ad N2 . Nel secondo caso invece il dominio viene costruito partendo dalla sola coppia (0; 0): 1D ) (0; 0) 2 N2; 2D ) se (n; m) 2 N2 allora (n; S(m)) 2 N2 ; 20D ) se (n; m) 2 N2 allora (S(n); m) 2 N2 ; 3D ) null’altro appartiene ad N2 . (Per il prodotto valgono considerazioni sostanzialmente analoghe a quelle fatte per la somma). 3.2.4 Induzione trans…nita In questa sezione dimostriamo i Teoremi di Induzione e di Recursioni relativamente ad un qualunque ordinale ®, anziché riferirli, come di consueto, ad ! (N). Theorem 75 ( Teorema di Induzione trans…nita) Sia ® un ordinale non nullo e sia A µ ®: 3.2. L’INDUZIONE MATEMATICA. da segue 87 8°((° < ® ^ ° µ A) ! ° 2 A) A=® (a parole: se per ogni ordinale ° < ® vale che da ° µ A segue ° 2 A; allora A = ®. Si osservi come, a causa della de…nizione insiemistica degli ordinali, si preferisca usare, al posto di una proprietà P, l’insieme A; che può essere inteso come estensione di P). Dimostrazione (nella teoria ingenua degli insiemi). Supponiamo per assurdo ® ¡ A 6= ?: Allora, essendo ® un buon ordine, ® ¡ A contiene un minimo elemento °. Tutti i predecessori di ° sono dunque contenuti in A, cioè ° µ A: Ma allora, per le ipotesi fatte, ° 2 A: Nel caso ® = !; il precedente enunciato corrisponde a PIC e la precedente dimostrazione coincide con quella vista nel § 3.2.1. Il principio può anche essere espresso in forma analoga a PI : Theorem 76 Sia ® un ordinale non nullo e A µ ®. da e e segue 02A 8°((° < ® ^ ° 2 A) ! S(°) 2 A) 8°((° < ® ^ Lim(°) ^ 8¯(¯ < ° ! ¯ 2 A)) ! ° 2 A) A= ® La dimostrazione è analoga alla precedente. De…niamo ora, con riferimento ad un qualunque ordinale ®, il concetto di de…nizione ricorsiva di una funzione f mediante una funzione g (concetto di cui nel pargarafo precedente abbiamo visto alcuni esempi, con ® = !). Theorem 77 ( Recursione trans…nita) Sia ® un ordinale, X un insieme, e sia §® = fh : h è una funzione da ¯ ad X; con ¯ < ®g : Possiamo identi…care §® con l’insieme di tutte le sequenze (successioni) di elementi di X di lunghezza minore di ®: In §® c’è anche la funzione h = ;; cioè la sequenza nulla, avente per dominio 0). Data una funzione g : §® ! X 88 CAPITOLO 3. GLI ASSIOMI DELL’ARITMETICA esiste una ed una sola funzione f :®!X tale che, per ogni ° < ® f(°) = g(f=°) (si osservi che f=° è una funzione h di §® : Ad esempio, f(4) = g(f(0); f(1); f(2); f(3)):) Dimostrazione. Cominciamo dall’unicità. Supponiamo che f e f 0 soddis…no le condizioni richieste. Dimostriamo, per induzione trans…nita, che f = f 0 : Sia A = f° : ° < ® ^ f 0 (°) = f(°)g : Innanzitutto, A µ ®: Osserviamo poi che da ? 2 §® segue A 6= ?; in quanto f(0) = g(f=0) = g(?) = g(f 0 =0) = f 0 (0) Supponiamo ora ° < ® e ° µ A: Allora, per de…nizione di A, per ogni ± < ° vale f(±) = f 0 (±), cioè f=° = f 0 =°: Allora, per le ipotesi su f e f 0, f(°) = g(f=°) = g(f 0 =°) = f 0 (°); e quindi ° 2 A: Per il Teorema di induzione trans…nita (Th.75), A = ®, cioè f(°) = f 0 (°) per ogni ° < ®, e quindi f = f 0 : A questo punto possiamo indicare con f® la funzione f: Dimostriamo ora l’esistenza di f® procedendo per assurdo. Supponiamo, dati g ed X, che f® non esista e sia B = f¯ : ¯ · ® e non esiste f¯ g : B 6= ? (contiene, per ipotesi assurda, almeno ®) e B µ ®: Dunque ammette minimo. Sia ¯0 il minimo di B: Allora, per ogni (eventuale) ± < ¯0 ; esiste (ed è unica) f± : ± ! X tale che, per ogni ° < ±; f± (°) = g(f± =°): Ora, ¯0 6= 0, in quanto la funzione f0 = ? è una funzione da 0 ad X e soddisfa, a vuoto, la condizione f(°) = g(f=°) per ogni (inesistente) ° < 0. 3.2. L’INDUZIONE MATEMATICA. 89 Ma ¯0 non è nemmeno un ordinale successore. Infatti, da ¯0 = S(±) segue l’esistenza di f± : ± ! X tale che, per ogni ° < ±; f± (°) = g(f± =°) Ma f± 2 §® e quindi appartiene al dominio di g: Possiamo in tal modo estendere f± ad una funzione f : S(±) ! X così de…nita: f = f± [ (±; g(f ± )) : In tal modo, per i valori ° < ± abbiamo f(°) = f± (°) = g(f± =°) = g(f=°) ed inoltre, essendo f± = f=±, f(±) = g(f± ) = g(f=±): Pertanto f(°) = g(f=°) per ogni ° < S(±), cioè ¯0; dunque f è f¯ 0 ; contro l’ipotesi ¯0 2 B: Dimostriamo in…ne che ¯0 non può essere un ordinale limite. Supponiamo per assurdo che lo sia. Supponiamo ± < ´ < ¯0 e dimostriamo che (¤) f± = f´ =± Infatti, per ogni ° < ±, (f´ =±) (°) = f´ (°) = g(f´ =°) = g((f´ =±) =°): (f´ =±) e quindi una funzione da ± ad X che soddisfa la condizione (f´ =±) (°) = g((f´ =±) =°): Per la già dimostrata unicità, otteniamo allora f± = f´ =±: Ora de…niamo f : ¯0 ! X come segue: per ogni ± < ¯ 0; f(±) = fS (±) (±) (essendo ¯0 limite, se ± < ¯ allora S(±) < ¯0 ). Da (¤) segue che f estende ogni funzione f± (infatti f(°) = fS (°) (°) = f± (°) per ° < ± < ¯ 0): Pertanto f(°) = f± (°) = g(f± =°) = g(f=°): Dunque f è f¯ 0 ; contro l’ipotesi ¯0 2 B: 90 CAPITOLO 3. GLI ASSIOMI DELL’ARITMETICA Capitolo 4 Formalizazione di una teoria matematica Dimostrazioni ”senza assiomi”, cioè all’interno di teorie non assiomatizzate, sono frequenti non solo in aritmetica, ma anche in analisi e in vasti settori della geometria. Queste teorie hanno una importante caratteristica comune: ciascuna di esse fa riferimento ad un unico universo di enti. Sono cioè teorie che descrivono un ”modello naturale” (o ”modello inteso”, come talvolta viene chiamato), e che si sono sviluppate in base alla familiarità che abbiamo con esso. Ad esempio, nel caso della geometria c’è, nell’intuizione geometrica usuale, un solo universo di punti, rette e piani; di quello parlano le proposizioni della teoria, e ad esso ci si riferisce per determinare la loro verità. Punto, retta, piano vengono assunti come concetti primitivi (o ”de…niti”, come nel caso degli Elementi), e gli assiomi (quando ci sono) individuano un insieme di proprietà su¢ciente allo sviluppo delle dimostrazioni. Così, se da un punto di vista logico gli assiomi rappresentano (come ogni insieme di assiomi) un punto di partenza, di fatto la loro funzione è quella di costituire un punto di arrivo, un arresto a quel processo dal complicato al semplice che caratterizza le dimostrazioni su tali enti. In modo analogo, anche l’aritmetica fa riferimento ad un unico universo; anzi, in questo caso, l’unicità del modello dei numeri naturali è talmente presente e le sue caratteristiche elementari sono così fondamentali che la ricerca degli assiomi è iniziata oltre due millenni dopo quelli della geometria. In…ne, anche l’analisi matematica ha la caratteristica di far riferimento ad un sistema di enti unico: il campo dei numeri reali. Ora se consideriamo che aritmetica, geometria elementare ed analisi costituiscono il corpus più noto della matematica, appare chiaro come 91 92CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA la caratteristica di riferirsi ad un solo modello possa passare inosservata e venire considerata universale. Chiameremo le teorie con questa caratteristica ”teorie a modello unico” . E’con la nascita dell’algebra astratta (cioè con lo studio di strutture algebriche quali gruppi, anelli, campi etc.) che tale caratteristica perde la sua valenza universale. Lo scopo delle teorie dell’algebra astratta non è la descrizione il più possibile completa di un’unica struttura, ma, all’opposto, la descrizione di proprietà comuni ad una molteplicità di strutture, che vengono in tal modo descritte in forma necessariamente e volutamente incompleta. Anzi, l’eterogeneità delle strutture che rientrano nell’ambito di un’ unica de…nizione costituisce uno dei principali motivi di interesse di questo tipo di teorie. Chiameremo queste teorie ”teorie a più modelli ”. La descrizione delle condizioni, delle proprietà da soddisfare per essere un modello della teoria vengono elencate in modo esplicito, ed hanno un ruolo iniziale. Che rapporto hanno queste proprietà, queste condizioni, con gli assiomi delle teorie a modello unico? Raramente la parola ”assioma” è impiegata per queste proprietà, ma il loro ruolo è proprio quello degli assiomi. Sarà il concetto di teoria formalizzata che mostrerà al meglio l’identità dei due ruoli. Ma già l’esempio successivo è in questa direzione. Example 78 Il teorema che segue riguarda gli anelli, di cui elenchiamo le proprietà da soddisfare: (R1) a+b = b+a (R2) (a+b)+c = a+(b+c) (R3) (ab)c = a(bc) (R4) esiste un elemento, indicato con 0 e detto elemento neutro rispetto alla somma, tale che, per ogni a, a+0=a. (R5) esiste un elemento, indicato con 1 e detto elemento neutro rispetto al prodotto, tale che, per ogni a, a¢1=a. (R6) per ogni a esiste un b, detto inverso di a rispetto alla somma, tale che a+b=0. (R7) a(b+c) = ab+ ac (distributività del prodotto rispetto alla somma). Dimostrare una asserzione sugli anelli, cioè dimostrare che vale per tutti gli anelli, signi…ca farla discendere da R1-R7, che si comportano quindi come 4.1. LE TEORIE MATEMATICHE FORMALIZZATE 93 gli assiomi della teoria. Come esempio presentiamo un teorema che, nell’anello dei numeri reali (o razionali, o interi), esprime la ben nota ”regola dei segni”. Teorema: In ogni anello A e per ogni coppia a e b di elementi di A valgono le seguenti proprietà: (i) (-a)b = -(ab) e (ii) (-a)(-b) = ab. Schema rapido di dimostrazione. (i): (1) 0¢b=(a+(-a))b (per R6) (2) (a+(-a))b=(ab)+((-a)b) (per R7) (3) 0=0¢b (teorema precedente della teoria)) (4) (ab)+((-a)b)=0 (dalle precedenti (1)-(3) per la transitività dell’uguaglianza) (5) -(ab)=(-a)b (da (4) per il teorema, precedente nella teoria, dell’unicità dell’opposto) Si dimostra analogamente che (i’): (a)(-b) = -(a b). (ii): (1) (-a)(-b) = -(a(-b)) = -(-(ab)) (da (i) e (i’) ) (2) -(- (ab))=ab (dal teorema, precedentemente nella teoria, dell’unicità dell’opposto) (3) (-a)(-b) = ab (da (1) e (2) per la transitività dell’uguaglianza) Il ruolo delle proprietà R1-R7 nella precedente dimostrazione è stata in tutto e per tutto analogo a quello degli assiomi; il concetto di teoria formale sancisce questa analogia. 4.1 Le teorie matematiche formalizzate Con la formalizzazione della logica (cioè la conversione della logica in un sistema formale, dotato di assiomi e regole di derivazione) siamo passati dalla situazione (euclidea) in cui le regole logiche costituiscono un insieme non organizzato, ad una nuova situazione in cui ci si muove su tre livelli distinti: mediante le regole di inferenza (Modus Ponens e Generalizzazione) si deducono i teoremi logici dagli assiomi logici, ed a loro volta i teoremi logici, trasformati nelle corrispondenti regole logiche, consentono la deduzione dei 94CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA teoremi della teoria matematica dagli assiomi della teoria stessa. Questa situazione transitoria prelude ad una terza sistemazione, che si ottiene inglobando in un unico sistema formale sia la teoria matematica in oggetto, sia la logica. Nascono così i sistemi formali delle teorie matematiche, comunenente detti teorie matematiche formalizzate. Per ottenere una teoria matematica formalizzata si procede dunque in questo modo. Come primo passo si individua il linguaggio L (predicativo al I ordine) idoneo a descrivere la teoria (v. § 2.3.3). Si considera quindi la teoria formale della logica al I ordine (ad esempio il sistema M1 trattato nel § 2.3.5) interpretando le metavariabili dei suoi assiomi nel linguaggio L. Agli assiomi logici viene aggiunto un insieme di assiomi relativi all’identità. In…ne, si aggiungono gli assiomi speci…ci della teoria matematica in oggetto (ovviamente espressi in L). De…nition 79 Se T è una teoria espressa nel linguaggio L ed A è un modello di L, si dirà che A è modello di T (in simboli A j= T) se A rende veri gli assiomi di T . Poichè il Modus Ponens e la Generalizzazione conservano la validità delle formule coinvolte, se A è modello di T allora A renderà veri anche tutti i teoremi di T . (Si osservi la di¤erenza tra i concetti ”essere modello di un linguaggio L” (v. Def. 58) ed ”essere modello di una teoria T ” (def. 79). Nel primo caso viene soddisfatto un semplice requisito di sensatezza: se A è modello di L sono allora le formule di L sono interpretabili, e quindi vere o false, in A. Nel secondo caso invece le formule di L che sono teoremi di T sono vere in A.) Come esempi di sistema formale di una teoria matematica presentiamo la teoria formalizzata dell’aritmetica e la teoria formalizzata degli anelli (entrambe presentate precedentemente in modo assiomatico non formalizzato). Example 80 La teoria formale al I ordine dell’aritmetica. Il linguaggio in cui esprimiamo questa teoria, che indichiamo con T A, è LA = f+; ¢; S; 0g, dove S è un simbolo funzionale unario (che esprime la funzione di passaggio al successore). L’insieme di assiomi di TA è il seguente: 4.1. LE TEORIE MATEMATICHE FORMALIZZATE 95 AM1-AM5 (v. § 2.3.5) AI1 (8x)(x = x) AI2 (8x)(8y)((x = y) ! ('(x; x) ! '(x; y)), dove '(x,y) è ottenuta da '(x,x) sostituendo y ad alcune (non necessariamente tutte) occorrenze di x libere per y. AA1 8x(0 6= S(x)) AA2 8x8y(S(x) = S(y) ! (x = y)) AA3 8x(x + 0 = x) AA4 8x8y(x + S(y) = S(x + y)) AA5 8x(x ¢ 0 = 0) AA6 8x8y(x ¢ S(y) = (x ¢ y) + x) AA7 '(0) ! ((8x('(x) ! '(S(x))) ! (8x'(x)) (dove '(x) è una qualunque formula di LA avente x libera) Gli schemi AM1-AM5 sono detti assiomi logici (si tratta di schemi di assiomi, come anche AI2 e AA7, le cui metavariabili '; Ã; ::: devono essere sostituite con formule di LA: Ciascuno schema sta quindi per in…niti assiomi. Ovviamente AM1-AM5 possono essere sostituiti da qualunque altro sistema per la logica al I ordine che sia completo). Gli schemi AI1-AI2 sono detti assiomi dell’identità AI1-AI2; gli assiomi AA1-AA7, che formalizzano i precedenti A1-A7 scostituiscono assiomi speci…ci (o propri) della teoria. Poichè ogni modello rende veri sia gli assiomi logici AM1-AM5 sia gli assiomi dell’identità AI1-AI2, per determinare se una data struttura è modello di una teoria è su¢ciente controllare se veri…ca gli assiomi speci…ci della teoria stessa. Gli assiomi dell’identità sono messi in un gruppo a parte in quanto esi non sono assiomi logici in senso stretto, ma sarebbe fuorviante considerarli assiomi speci…ci delle singole teorie, dal momento che descrivono proprietà valide in ogni struttura. AI1 ed AI2 in e¤etti appartengono ad ogni teoria formalizzata al I ordine, così come il simbolo relazionale ”=” appartiene ad ogni linguaggio formale al I ordine. Questa situazione colloca l’identità in una posizione intermedia tra i concetti logici e quelli matematici: dei primi ha infatti l’universalità ma non la natura puramente linguistica. Questo particolarità è stata del resto riconosciuto …n dall’antichità; si ricorderanno al riguardo le ”nozioni comuni” degli Elementi, che sono in parte assiomi dell’identità e che Euclide ha separato dai postulati geometrici (v. § 2.1.1). E’ importante però osservare che la distinzione tra assiomi logici, assiomi dell’i- 96CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA dentità ed assiomi speci…ci (cosi come la distinzione tra parte logica e parte speci…ca di un linguaggio, v. Def. 57) è esterna alla teoria. Da un punto di vista formale infatti, nulla distingue i vari tipi di assiomi, e nulla quindi separa, nell’insieme dei teoremi della teoria formalizzata, i teoremi speci…ci della teoria dai teoremi puramente logici o dai teoremi che riguardano soltanto l’identità . Tra gli assiomi speci…ci, non vi sono i corrispondenti di P1 e P2, in quanto 0 ed S sono elementi del linguaggio, e quindi l’esistenza in ogni modello di un elemento corrispondente alla costante 0 e di una funzione corrispondente al simbolo funzionale S è garantita dal concetto di modello di un linguaggio. Gli assiomi AA1 e AA2 corrispondono a P3 e P4 : Gli assiomi AA3-AA6 costituiscono la de…nizione ricorsiva di somma e prodotto. L’assioma AA7 esprime il Principio di induzione. Tuttavia, tra l’assioma P5 di Peano e AA7 vi è una sostanziale di¤erenza. Il primo costituisce una singola espressione con una quanti…cazione sui predicati (”Se P è una proprietà ....). Il secondo rappresenta uno schema di assioma, ed esprime quindi in…nite formule al I ordine, una per ciascuna formula '(x) di LA. Ogni '(x), contenendo una variabile libera, esprime una proprietà dei numeri naturali de…nibile attraverso il linguaggio della teoria. Ma le proprietà così formulabili sono numerabili (dal momento che l’intero insieme delle formule di LA è numerabile), e dunque non esauriscono tutte le proprietà dei naturali, che hanno la potenza del continuo. AA7 è quindi più debole di P5 . Example 81 La teoria formale al I ordine degli anelli. Il linguaggio in cui tale sistema formale, che indichiamo con T R; è LR = f+; ¢; 0; 1g. TR ha ancora gli schemi AM1-AM5 e AI1-AI2 ma, naturalmente, questa volta le metavariabili '; Ã::: che in essi compaiono devono essere sostituite con formule del linguaggio LR: Gli assiomi speci…ci sono ottenuti formalizzando i precedenti R1-R7 dell’es.78 AR1 AR2 AR3 AR4 AR5 (8x)(8y)(x + y = y + x) (8x)(8y)(8z)((x + y) + z = x + (y + z)) (8x)(8y)(8z)((xy)z = x(yz)) (8x)(x + 0 = x) (8x)(x ¢ 1 = x) 4.1. LE TEORIE MATEMATICHE FORMALIZZATE 97 AR6 (8x)(9y)(x + y = 0) AR7 (8x)(8y)(8z)(x(y + z) = xy + xz) I modelli del linguaggio LR che rendono veri gli assiomi di TR saranno i modelli di T R, e cioè gli anelli con unità. A rendere la trasformazione delle teorie in teorie formalizzate non un semplice arti…cio linguistico ma un potente strumento di indagine matematica è la possibilità di estendere a tali teorie il Teorema di Completezza di Gödel (1930) relativo al sistema formale della logica al I ordine. (Th.70). Occorre de…nire un nuovo concetto: De…nition 82 Sia ' una formule di L. ' è conseguenza logica di T (in simboli T j= ') se ogni modello di T è modello di ', cioè se A j= T implica A j= '. Il precedente Th.71 può essere qui riscritto in questo modo: Theorem 83 ( Teorema di Completezza Estesa, Gödel 1930). T ` ' se e solo se T j= '. Questo risultato dimostra la piena corrispondenza tra il concetto sintattico ”essere teorema di T ” e quello semantico di ”essere conseguenza logica di T ”. Il verso ovvio del teorema (quello della validità: T ` ' ) T j= ') asserisce che se un modello rende veri gli assiomi di una teoria allora rende veri tutti i suoi teoremi. Il verso opposto (T j= ' ) T ` ') dimostra che se una formula è vera in tutti i modelli di una teoria, allora è dimostrabile nella teoria. I livelli sintattico e semantico si trovano dunque a coincidere. ===BOX La riconversione delle formule in regole: il Modus Ponens === L’insieme delle regole di inferenza di una teoria matematica formalizzata è quello della teoria logica su cui si innesta. Questo fatto mostra che la speci…cità di una teoria si rivela nel linguaggio e negli assiomi, non nella deduzione, la quale rimane una competenza speci…catamente logica ed è uniforme per tutte le teorie. Pertanto, la macchina che enumera tutti i teoremi della teoria è mossa solo dal Modus Ponens con l’aiuto della Generalizzazione (la quale è 98CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA signi…cativa limitatamente alle formule aperte e quindi ha un ruolo abbastanza secondario). Tutto il peso deduttivo è quindi sostanzialmente concentrato su una regola sola. Il modo in cui essa è in grado di sostituire, all’interno delle teorie matematiche formalizzate, tutti i ”vecchi” metodi dimostrativi, lo si può vedere con un esempio: '!à la regola contronominale :Ã!:' non è una regola di inferenza dei nostri sistemi. Supponiamo ora che ' ! à sia un teorema di una teoria formalizzata S, assumiamo cioè S ` ' ! Ã. Tra i teoremi di S vi è anche la formula (' ! Ã) ! (:à ! :') (infatti (' ! Ã) ! (:à ! :') è una tautologia, quindi è valida, quindi, per il Teorema di completezza, è un teorema logico e quindi un teorema della teoria S ). Ora, da S ` ' ! à e S ` (' ! Ã) ! (:à ! :') si ottiene S ` :à ! :' mediante Modus Ponens. L’esempio precedente infatti si può generalizzare. Se '1 ; :::; 'n à è una regola logica (composta di formule chiuse) allora '1 ! ('2 ! (:::'n ! Ã)::) (che è equivalente a ('1 ^::: ^'n ) ! Ã) è valida e quindi è un teorema logico e, conseguentemente, è un teorema di ogni teoria matematica formalizzata S. Ed allora, da S ` '1 ; :::; S ` 'n e S ` '1 ! ('2 ! (:::'n ! Ã)::) otteniamo S`à mediante n applicazioni del Modus Ponens. In virtù di quest’unica regola (con la Generalizzazione e gli assiomi logici) è quindi come se la teoria disponesse di tutte le regole logiche . Del resto, il Modus Ponens formalizza la riga della tavola di verità che interessa più direttamente le dimostrazioni: l’eventuale verità delle ipotesi deve passare alla tesi (se v(A) = 1 e v(A ! B) = 1 allora v(B) = 1:): In tal modo l’implicazione linguistica ('1 ^ ::: ^ 'n ) ! à è trasformata in una implicazione metalinguistica: se S ` '1; :::; S ` 'n allora S ` Ã: ================================= 4.1. LE TEORIE MATEMATICHE FORMALIZZATE 4.1.1 99 Le de…nizioni Il primo atto che si compie nel processo di formalizzazione di una teoria matematica consiste, come abbiamo osservato, nella scelta del linguaggio formale in cui esprimerla. Tale scelta è, a sua volta, determinata dall’insieme dei concetti che si decide di assumere come primitivi. E’nello spirito di ogni impostazione assiomatica, di cui le teorie formalizzate sono l’espressione evoluta, il tentare di ridurre quanto più possibile il numero dei concetti primitivi (così come il numero degli assiomi, che di questi esprimono le proprietà iniziali). Ad esempio, le dimostrazioni di geometria elementare parlano correntemente di triangoli particolari (isosceli, rettangoli,..), di bisettrici, di altezze; è tuttavia estremamente improbabile che una geometria formalizzata (o anche una geometria assiomatizzata come quella degli Elementi) assuma tutti questi enti come primitivi e doti il linguaggio di opportuni predicati per esprimerli. Nel caso dell’Aritmetica abbiamo scelto come concetti primitivi f+; ¢; S; 0g: Nel caso della assiomatizzazione della geometria elementare di Hilbert, ad esempio, i concetti primitivi sono sei: punto, retta, piano, ”stare tra”, incidenza e congruenza (quindi, tre relazioni unarie (predicati), una relazione ternaria e due relazioni binarie). Tutto il resto è de…nito. Un procedimento essenziale ed ineliminabile nello sviluppo delle teorie matematiche consiste dunque nel de…nire nuovi concetti. Dimostrazioni e de…nizioni costituiscono infatti i due poli nello sviluppo naturale delle teorie. Se l’attenzione della logica è esplicitamente concentrata sul primo di essi, cioè sui teoremi, è perché le de…nizioni sono, da un punto di vista logico, eliminabili. Ma questa è soltanto una parte della storia, quella a posteriori; da un punto di vista euristico, le de…nizioni non sono eliminabili e senza di esse non esisterebbe la matematica così come noi la conosciamo (il Teorema di Pitagora non è pensabile in termini di soli punti e rette, nonostante che triangoli e quadrati siano de…nibili a partire da essi). La gestione delle nuove de…nizioni all’interno di una teoria formale è a¢data alle formule aperte. Consideriamo ad esempio la teoria T A dell’aritmetica. Il linguaggio in cui è espressa è LA = f+; ¢; S; 0g. Dovendo de…nire la relazione x · y impiegheremo la formula aperta 9z(x + z = y), che, avendo libere x ed y, indicheremo con '(x; y). Dovendo de…nire la relazione D(x; y) (x è divisore di y) ricorreremo alla formula aperta Ã(x; y) = 9z(x ¢ z = y): I due esempi precedenti si generalizzano a relazioni qualunque. Infatti, una formula aperta con n variabili libere, che indichiamo con '(x1 ; ::; xn ), 100CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA individua una relazione n-aria R su ogni modello A del linguaggio in cui ' è espressa: R = f(a1 ; :::; an ) : A j= ' [a1; :::; an ]g : I predicati, intesi come relazioni unarie, verranno de…niti da formule in una variabile libera. Il problema della de…nizione di nuove funzioni è un po’più complesso rispetto a quello delle relazioni. Poiché una funzione n-aria f su un insieme A è una particolare relazione n + 1-aria R , essa verrà in prima istanza rappresentata da una formula aperta in n + 1 variabili. Le proprietà di ”esistenza ed unicità”, cioè il fatto che per ogni n-pla a1 ,..,an esiste uno ed un solo b tale che (a1 ; ::; an ; b) 2 R, verrà espressa da una ulteriore formula chiusa. Ad esempio, considerando ancora TA, la funzione binaria MCD(x; y) = z è de…nita come relazione ternaria P (x; y; z) dalla formula aperta '(x; y; z) = D(z; x) ^ D(z; y) ^ 8t((D(t; x) ^ D(t; y)) ! D(t; z)): dove D(x; y) esprime la erlazione ”esser divisore di” ed è formalizzata da lla formula Ã(x; y) = (x 6= 0 ^ y 6= 0 ^ 9t(x ¢ t = y): La richiesta che la relazione R sia una funzione è data poi dalla formula chiusa à = 8x8y9z('(x; y; z) ^ 8w('(x; y; w)) ! (z = w)): La congiunzione '(x; y; z)^à esprime il MCD: Lo scrivere MCD(x; y) = z al posto di P (x; y; z) si riduce, a questo punto, a una pura questione notazionale. 4.1.2 Tornando alle teorie a modello unico e a più modelli Se consideriamo gli esempi 80 e 81 di teoria formale che abbiamo presentato (aritmetica, anelli) appare evidente come il concetto di teoria formalizzata abbia completamente uniformato il ruolo degli assiomi (postulati) in quelle che abbiamo chiamato teorie a modello unico (come l’aritmetica) e il ruolo degli assiomi (proprietà- condizioni) nelle teorie a più modelli (come la Teoria degli anelli). Questa uniformità di ruolo non signi…ca che le problematiche relative agli assiomi nelle teorie relative agli assiomi nelle teorie a modello unico siano analoghe a quelle relative agli assiomi nelle teorie a più modelli. Anzi. I 4.1. LE TEORIE MATEMATICHE FORMALIZZATE 101 criteri che determinano la scelta degli assiomi nelle une e nelle altre sono radicalmente diversi. Nelle prime gli assiomi intervengono a posteriori per uniformare e ridurre il ricorso all’evidenza; è desiderabile quindi che questo intervento sia attuato ad un livello di massima plausibilità, minima complessità e con la più grande economia. In altri termini, queste esigenze ri‡ettono rispettivamente i classici problemi della verità, della intuitività e, in molti casi, della indipendenza degli assiomi. Nelle teorie a più modelli, invece, le richieste di evidenza e verità perdono addirittura di signi…cato, in quanto l’assioma ”precede” la struttura, poiché determina l’appartenenza o meno di questa all’insieme dei modelli della teoria. Il problema dell’indipendenza, pur non perdendo di signi…cato, è molto meno importante: infatti mentre nelle teorie a modello unico gli assiomi hanno lo status (negativo) di ciò che viene assunto senza dimostrazione, nelle teorie a più modelli essi costituiscono delle descrizioni, e quindi una eventuale ridondanza è sì inelegante ma può risultare utile (si pensi alle assiomi delle Algebre di Boole). Tutto questo, ripetiamo, scompare nella formalizazione delle teorie. Non solo. Il concetto di teoria formalizzata si spinge oltre, riducendo la caratteristica saliente di quelle che abbiamo chiamato teorie a modello unico (appunto l’unicità del modello) ad una caratteristica del nostro atteggiamento verso di esse piuttosto che una loro proprietà intrinseca. Naturalmente, parlando di modello unico intendiamo unico a meno di isomor…smi, essendo quello di isomor…smo il concetto più appropriato di ”uguaglianza matematica” tra due modelli. Il concetto logico che esprime la proprietà di aver un unico modello a meno di isomor…smo prende il nome di categoricità. De…nition 84 Una teoria al I ordine T è categorica se da A j= T e A0 j= T segue A » = A0 . Il seguente teorema chiude subito il discorso: Theorem 85 (Löwenheim-Skolem 1915, 1919). Se una teoria formalizzata al I ordine T ha un modello in…nito, allora non è categorica. La categoricità è quindi eventuale appannaggio di teorie che non hanno modelli in…niti. Poiché tutte le teorie ”storiche” della matematica (aritmetica, geometria, analisi) hanno modelli in…niti, nessuna formalizzazione al I 102CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA ordine di queste teorie può essere categorica, cioè a modello unico. Il teorema precedente rappresenta quindi un risultato ”negativo”: il tipo di linguaggi che abbiamo impiegato per formalizzare la logica e le teorie matematiche (cioè i linguaggi predicativi al I ordine) non sono su¢cientemente ”espressivi” da descrivere i modelli con una precisione tale da evitare modelli indesiderati. Né vi sono soluzioni migliori: 99aumentando la potenza del linguaggio al …ne di poter avere teorie categoriche anche con modelli in…niti, passando cioè ad ordini predicativi superiori, si perde l’enumerabilità dei teoremi logici, ed in tal modo il controllo della teoria (v. Box a …ne capitolo). La Teoria T A dell’aritmetica, che abbiamo preso come esempio di teoria (nelle nostre intenzioni) a modello unico, ammette modelli non isomor… ad N (in conseguenza di ciò, N prende il nome di modello standard). E non di tratta soltanto di modelli di cardinalità superiore ad N: Infatti, in risposta al Teorema di Loweneim-Skolem, è stato introdotto un nuovo concetto, più debole: De…nition 86 Sia ® un cardinale e T una teoria al I ordine. T è categorica nella potenza ® se tutti i modelli di T di cardinalità ® sono isomor…. E’stato dimostrato che i casi possibili sono pochi, in quanto vale che Theorem 87 (Morley, 1965). Se una teoria al I ordine T è ® categorica per un cardinale non numerabile ®, allora è ® categorica per ogni cardinale non numerabile. (Un esempio di teoria di questo tipo è la teoria dei campi algebricamente chiusi di …ssata caratteristica) La teoria T A dell’aritmetica non è neppure ® categorica. Ma non è ancora questo il risultato che mostra appieno l’incapacità di TA a descrivere compiutamente N. Un modo ben più drastico di indebolire il concetto di catagoricità passa attraverso il concetto di equivalenza elementare: De…nition 88 Due modelli A è B di un linguaggio al I ordine L sono elementarmente equivalenti (in simboli A ´ B) se per ogni formula ' di L, si ha A j= ' sse B j= '. 4.1. LE TEORIE MATEMATICHE FORMALIZZATE 103 Dunque, due modelli sono equivalenti se non possono essere distinti mediante formule del linguaggio. Potremmo quindi intendere come teorie a modello unico quelle teorie che hanno un solo modello a meno di equivalenza, anziché a meno di isomor…smo. Che questo passaggio costituisca un indebolimento della richiesta è una conseguenza del fatto che Theorem 89 Se A » = B allora A ´ B: Il viceversa vale solo se A è …nito. Diamo dunque la seguente De…nition 90 Una teoria al I ordine T in un linguaggio L è ( sintatticamente) completa se, per ogni formula ' di L, si ha T ` ' o T ` :'. Theorem 91 Una teoria T è completa sse tutti i suoi modelli sono elementarmente equivalenti. A questo punto, le ”teorie a modello unico a meno di equivalenza” sono le teorie complete. Ma, come dimostrato nel teorema logico più famoso del XX secolo, la teoria T A dell’aritmetica non è tra queste. Theorem 92 ( Teorema di incompletezza, Gödel, 1931). La teoria T A non è completa. Da questo risultato segue l’esistenza di una formula ' tale che T A 0' e T A 0:'; e poiché una tra ' e :' è vera nel modello N (una formula è falsa in un modello se e solo se la sua negazione è vera), il teorema dimostra l’esistenza di una formula vera in N e non dimostrabile in TA . Inoltre, da TA 0' e TA 0:' segue che T A[ f'g e TA [f:'g sono teorie consistenti, e quindi, per il Teorema di Completezza estesa (v.Th.71), ciascuna di loro ha un modello. Questi due modelli, soddifacendo un insieme diverso di formule, non saranno equivalenti tra loro. Il teorema di incompletezza, nella forma sopra esposta (che è quella usuale), non sembra essere però tale da giusti…care la risonanza che ha avuto anche fuori dall’ambiente matematico. Infatti, mentre il Teorema di LöwenheimSkolem è generale e comporta l’impossibilità per qualunque teoria al I ordine dell’aritmetica di essere categorica (una si¤atta teoria dovrà avere N come 104CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA modello, ed N é in…nito), il Teorema di incompletezza, come espresso precedentemente, asserisce l’inadeguatezza degli assiomi di T A. In altri termini, se la non categoricità di T A è la conseguenza di una ”de…cienza” intrinseca dell’intera costruzione della logica al I ordine e non ha quindi possibilità di soluzione, l’incompletezza di T A sembra un fatto locale, una inadeguatezza speci…ca di T A. Tuttavia, una conseguenza della dimostrazione del Teorema di Incompletezza di Gödel è la seguente: Corollary 93 Non esiste una teoria dell’aritmetica che sia non contraddittoria , completa e il cui insieme di assiomi sia decidibile. L’incompletezza quindi non è una caratteristica della teoria T A, ma di ogni teoria formale dell’aritmetica in cui si possa decidere, data una formula ', se essa è o no un assioma. Ciò comporta che qualunque tentativo si faccia per caratterizzare con un sistema di assiomi i numeri naturali, esisteranno sempre delle proprietà dei numeri vere ma indimostrabili. (La parola decidibile, che compare nell’enunciato, è essenziale. Se noi considerassimo come insieme di assiomi l’insieme T h(N) delle formule vere nel modello N, allora avremmo una teoria dell’aritmetica completa, anche se non categorica. Il fatto è che l’insieme T h(N) non è decidibile). Quanto detto riguardo all’aritmetica vale a fortiori per quelle teorie, come la geometria, o l’analisi, che estendono l’aritmetica. Non esistono quindi teorie storiche a modello unico, né nel senso forte della categoricità, né in quello più debole della completezza. La distinzione fatta in precedenza tra teorie a modello unico e teorie a più modelli è dunque relativa nel nostro atteggiamento verso di esse. Tale atteggiamento si manifesta già dalla nomenclatura. Da un lato, ad esempio, i modelli della teoria TA diversi da N sono chiamati modelli non standard, a marcarne la di¤erenza da quello che avremmo voluto esser l’unico modello. Viceversa, nel caso delle teoria a più modelli, la pluralità di modelli è per esse un punto di forza e non una debolezzale. Tali teorie sono dunque non solo volutamente non categoriche, ma anche volutamente incomplete. Inoltre, il Teorema di completezza estesa di Gödel (v.Th.83: se una formula è vera in tutti i modelli di T allora è un teorema di T ), pur essendo valido per tutte le teorie al I ordine, risulta ”naturale solo per quelle teorie che formalizzano teorie a più modelli. Nel caso della Teoria degli 4.1. LE TEORIE MATEMATICHE FORMALIZZATE 105 anelli, ad esempio, il Teorema di completezza asserisce che i teoremi di T R sono tutte e sole le formule vere in tutti gli anelli , ed è esattamente quello che ci aspettavamo dalla teoria; nel caso della Teoria dell’aritmetica asserisce che i teoremi di T A sono tutte e sole le formule vere in tutte le aritmetiche: ma di aritmetica, in mente, ne abbiamo una sola. 4.1.3 Teoremi e metateoremi Nelle teorie non formalizzate a più modelli, con lo stesso nome di ”teorema” si denotano due diversi tipi di enunciati i quali, pur non sembrando diversi a livello intuitivo, appartengono a due classi che la formalizazione mostra essere ben distinte. Innanzitutto, con ”teorema di T” si intende una proprietà che discende in modo assiomatico-deduttivo dagli assiomi (ad esempio, la proprietà dei segni nella Teoria degli anelli, v. Esempio 78), e che per questo vale in tutti i modelli della teoria. Ma la pluralità dei modelli fa sì che siano oggetto di investigazione anche i rapporti tra i modelli (ad esempio il Teorema di omomor…smo tra anelli), ed i risultati a cui si perviene in tale ambito vengono ancora chiamati ”teoremi di T”. In questi casi però non ci si muove a partire dagli assiomi, bensì gli assiomi servono a caratterizare gli oggetti tra cui ci si muove, che non sono più soltanto elementi di un generico modello, ma anche modelli. Con la formalizzazione, questa distinzione emerge con chiarezza. Considerando ancora l’esempio degli anelli, abbiamo che i teoremi di T R, che sono formule di L = f+; ¢; 0; 1g, esprimono quelle proprietà che sono vere in ogni modello di T R, cioè sono soddisfatte dagli elementi di ogni modello. Teoremi di questo tipo sono, ad esempio, l’unicità dell’elemento neutro, il fatto che se un elemento è neutro per un altro elemento allora è l’elemento neutro, l’unicità dell’opposto per un dato elemento, e, appunto, la regola dei segni; essi sono espressi rispettivamente dalle seguenti formule di LR, dove le variabili individuali stanno per elementi di un modello: 8x(8y(y + x = y) ! (x = 0)), 8x(9y(y + x = y) ! (x = 0)), 8x8y8z((x + y = 0 ^ x + z = 0) ! (y = z), 8x8y((¡x) ¢ y = ¡(x ¢ y)): Tuttavia, scorrendo i teoremi sugli anelli di qualunque testo di algebra astratta, ci rendiamo conto che solo una piccola parte di tali teoremi esprime proprietà degli anelli nel senso precedente. Molto più spesso essi esprimono proprietà di rapporti tra anelli, o condizioni di esistenza di anelli, o, ancora, 106CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA proprietà di particolari anelli. E questi enunciati non sono esprimibili come teoremi di T R. Ad esempio, ogniqualvolta nell’enunciato di un teorema compaiono le parole ”sottoanello”, o ”isomor…smo”, o ”omomor…smo”, ciò signi…ca che stiamo parlando di proprietà di coppie di anelli, e quindi ci troviamo irrimediabilmente fuori T R. Lo stesso avviene quando si dimostra che, per ogni n, esiste un anello di n elementi, o ancora quando si dimostra che l’anello delle matrici ”n per n” non è commutativo. Trasformando una teoria naturale a più modelli in teoria formalizzata, accade dunque che quasi tutti i teoremi della prima non sono teoremi della seconda, ma teoremi sui modelli della seconda, cioè suoi metateoremi. La distinzione tra teoremi e metateoremi, tra teoremi degli anelli e teoremi sugli anelli, che può passare inosservata a livello naturale, si manifesta a livello formale in modo inequivocabile. Anche per le teorie a modello unico ci sono metateoremi di questo tipo, ma rappresentano una indesiderata anomalia (e, soprattutto, sono studiati dai logici e non dagli aritmetici, o dai geometri o dagli analisti). Si pone allora il seguente problema: i metateoremi (ad esempio, il Teorema di omomor…smo sugli anelli) di quale teoria sono teoremi? Dalle considerazioni fatte segue che una tale teoria 1) non deve avere gli anelli come suoi modelli, ma come elementi dei suoi modelli; 2) ma anche gli elementi degli anelli devono essere elementi dei suoi modelli; 3) deve inoltre essere dotata di una relazione (l’appartenenza) che leghi gli elementi che sono elementi-di-un-anello agli elementi che sono anelli. Insomma: la teoria in questione è la Teoria degli insiemi. Gli assiomi di anello diventano, in questo grande ambiente, la de…nizione di anello, in quanto ci dicono quali elementi del modello standard della teoria degli insiemi sono anelli. E sia i teoremi degli, sia quelli sugli anelli, e cioè sia i teoremi che i metateoremi di T R, risultano ugualmente teoremi in questo contesto. Un fatto forse ovvio, ma comunque da tener presente, è che la Teoria ”naturale” degli insiemi, in cui troviamo come teoremi sia i metateoremi sia i teoremi delle altre teorie (a più modelli e no) é, nelle intenzioni, una teoria a modello unico, il più unico di tutti. Alla sua formalizzazione sarà dedicato il Capitolo seguente. 4.1. LE TEORIE MATEMATICHE FORMALIZZATE 107 ===BOX. Perché fermarsi al I ordine? ======= L’analisi che ha condotto alla de…nizione dei linguaggi predicativi al I ordine, assume che l’entità minima del discorso sia formata da una relazione e dagli individui in essa coinvolti; le formule atomiche hanno infatti la forma P(x1; :::; xn ) (nel caso di relazioni unarie, otteniamo la forma P (x) che esprime la coppia predicato-soggetto dell’analisi aristotelica). Su questa scelta tuttavia si è inserita una precisa limitazione, segnalata dalla quali…cazione ”al I ordine”. Tali linguaggi possono nominare sia individui speci…ci (attraverso le costanti individuali) sia individui generici (attraverso le variabili individuali), e queste ultime possono venire quanti…cate. Invece, le proprietà e le relazioni possono invece esser nominate solo in modo speci…co, tramite costanti. I linguaggi al I ordine non dispongono di variabili per relazioni o funzioni, ed è dunque impossibile parlare di relazioni o funzioni generiche nello stesso modo in cui si parla di individui generici; di conseguenza, è impossibile imporre loro delle quanti…cazioni. Questo limite è poco avvertibile per il fatto che le frasi al I ordine sono di gran lunga le più comuni. Tuttavia non è di¢cile mettere in luce i limiti dei linguaggi al I ordine. Consideriamo i seguenti enunciati, che, tra l’altro, sono di importanza cruciale nelle teorie in cui vengono formulati: a) Principio di induzione matematica. Sia P una proprietà relativa ai numeri naturali, e sia a un naturale …ssato. Se etc. . b) Principio del minimo numero. Se una proprietà P è soddisfatta da un numero naturale n, allora esiste il più piccolo naturale m che soddisfa P. c) Assioma di completezza per i numeri reali. Ogni sottoinsieme non vuoto di R ammette estremo superiore. Osserviamo che tutte e tre le frasi hanno quanti…cazioni (universali) su proprietà od insiemi, in modo esplicito o con l’uso dell’articolo indeterminativo. Una trascrizione ”formale”, ad esempio, di (b), sarebbe: 8P (9xP (x) ! 9y(P y ^ 8z(P (z) ! (y · z)))): Questa formula non è una espressione al I ordine di un linguaggio formale nato per descrivere N. P è infatti una ”variabile per proprietà” e la scrittura 8P non appartiene alla morfologia dei linguaggi che abbiamo considerato. 108CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA Tutto questo suggerirebbe di considerare i linguaggi al I ordine non come la conclusione, ma come una tappa di un processo da estendere ulteriormente, de…nendo linguaggi più potenti, del II, III ordine etc., in cui oltre a poter parlare di individui generici e poterli quanti…care, si possano quanti…care anche proprietà e relazioni generiche, proprietà di proprietà e così via. Del resto, non è di¢cile de…nire rigorosamente linguaggi di ordine superiore, ampliando l’alfabeto, la morfologia e conseguentemente la semantica di quelli del I ordine. Emerge però una di¢coltà di fondo. Per i linguaggi al II ordine, ed a fortiori per quelli di ordine superiore, vale infatti il seguente risultato : Theorem 94 ( Teorema di incompletezza per il II ordine). L’insieme delle formule valide al II ordine non è enumerabile . Risulta evidente la portata negativa del precedente risultato. Ogni tentativo di trasformare in sistema formale la logica del II ordine, sulla scia di quanto fatto per il I ordine, è a priori destinato al fallimento: qualunque insieme di assiomi e di regole di inferenza si propongano, esisteranno sempre delle formule valide che non sono teoremi del sistema. Questi problemi, che sono intrinseci, hanno portato di fatto alla progressiva scomparsa dalla logica matematica degli ordini successivi al I. Ad ovviare le limitazioni di questi ultimi ha provveduto una tendenza generale della matematica che ha contribuito a rendere surrogabili, e quindi ”inutili”, le espressioni di ordine superiore al I. Nel paragrafo precedente, il principio di induzione e quello del minimo numero, erano stati formulati in relazione a proprietà, mentre la completezza dei reali è stata presentata, come è usuale, in forma insiemistica. Passando dalle proprietà alle loro estensioni, tutte e tre le formule possono diventare frasi al I ordine di un linguaggio in grado di parlare, contemporaneamente, di elementi e di insiemi di elementi: questo linguaggio è quello della Teoria degli insiemi. La Teoria degli insiemi al I ordine rappresenta infatti un ambiente sostanzialmente simile ai linguaggi di ordine superiore (comprese ovviamente le limitazioni). L’impostazione estensionale della teoria degli insiemi ha, a questo riguardo, avuto la meglio sulla versione linguistica della logica. 4.1. LE TEORIE MATEMATICHE FORMALIZZATE 4.1.4 109 Costruzioni nel passaggio dalle teorie non formalizzate alle teorie formalizzate. Prima 99 di passare alla teoria degli insiemi99 dobbiamo terminare la ricostruzione del concetto di dimostrazione nel passaggio dalle teorie naturali a quelle formalizzate, a¤rontando un problema non ancora considerato: quello delle costruzioni. Facciamo il punto. Finora, i problemi a¤rontati sono stati quelli delle regole logiche e degli assiomi. Il primo è stato ”risolto” con la costruzione dei sistemi formali della logica al I ordine; il secondo con la costatazione che, progressivamente, tutte le teorie tendono comunque (pur se con modalità molto diverse) ad uno stato assiomatico, preludio necessario alla loro formalizzazione. Tuttavia, una parte generalmente cospicua della maggioranza delle dimostrazioni naturali non consta di passaggi logici a partire da assiomi (dichiarati o meno), ma è costituita da costruzioni e da nuove de…nizioni. Questi processi, a prima vista, sembrano non riconducibili in un ambito di ordinate concatenazioni logiche tra espressioni. Consideriamo questo passo, preso da una proposizione proprio all’inizio degli Elementi (Proposizione I.5): [...] Sia ABC un triangolo isoscele avente il lato AB uguale al lato AC, e si prolunghino per diritto i lati AB, AC in BD, CE; dico che l’angolo ABC è uguale all’angolo ACB e l’angolo CBD uguale all’angolo BCE. Infatti, si prenda su BD un punto a piacere F, dalla retta maggiore AE si sottragga la retta AG uguale alla minore AF e si traccino le congiungenti FC, GB.[...]” Se proviamo a formalizzare questa dimostrazione, ci arrestiamo subito; il linguaggio impiegato, così carico di imperativi (”si prolunghino..”, ”si prenda..”) non appare a¤atto assimilabile ad un impianto deduttivo. Eppure ciò è possibile: gli ordini, le costruzioni e le de…nizioni contenuti in una dimostrazione possono essere tradotti in forma deduttiva. Vediamo brevemente come ciò avvenga. Poiché gli ordini e le costruzioni sono in genere accompagnati da imposizioni di nomi (lettere dell’alfabeto) ad oggetti, il primo problema da a¤rontare è quello delle cosiddette costanti provvisorie. 110CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA Le costanti provvisorie. La dimostrazione del precedente teorema euclideo coinvolge vari nomi di oggetti (i vertici A, B, C del triangolo, gli estremi D ed E dei prolungamenti, il punto a piacere F, etc.). Tali nomi non compaiono nell’enunciato del teorema, il quale è un asserto universale sui triangoli isosceli. Le lettere A, B,..., F non svolgono il ruolo che i linguaggi formali riservano alle costanti, in quanto queste ultime hanno una interpretazione …ssa in ogni modello del linguaggio; e neppure sono assimilabili alle variabili dei linguaggi formali, perché le lettere A, B, C etc. denotano oggetti che, pur se generici, rimangono immutati nel corso di tutta la dimostrazione. Esse costituiscono una sorta di costanti provvisorie, e sono frequentissime nelle dimostrazioni naturali (soprattutto in geometria, dove gli oggetti minimi, i punti, sono davvero indi¤erenziati l’uno dall’altro). Vi è un importante teorema logico il quale asserisce: se, di un asserto, esiste una dimostrazione che fa uso di costanti provvisorie, allora dello stesso asserto esiste una dimostrazione in cui esse non intervengono (e quindi la deduzione avviene nel linguaggio originale della teoria). Tale teorema si sviluppa in due tempi: nel primo viene de…nita una regola aggiuntiva, detta Regola S, 9x'(x) ¡ ¡¡ '(b) che permette l’introduzione di nuove costanti, e poi si dimostra come ogni applicazione di tale regola possa essere eliminata. E’ super‡uo osservare come la perdita delle costanti provvisorie, fondamentali in fase euristica, sia assolutamente negativa per quanto concerne la comprensibilità della dimostrazione. Gli ordini e le costruzioni. Nel trattare il problema della formalizzazione di quelle espressioni del linguaggio naturale che impongono di considerare o costruire un certo oggetto matematico (o comunque di eseguire una certa ”operazione” nel corso di una dimostrazione), possiamo assumere 4.1. LE TEORIE MATEMATICHE FORMALIZZATE 111 di fare uso di costanti provvisorie, sapendo dal risultato precedente che, una volta raggiunta una formalizzazione anomala in cui compaiono questi elementi estranei al linguaggio formale originario, è meccanicamente ottenibile una formalizzazione in cui esse non …gurano più. Esempli…chiamo la nostra analisi su una frase del frammento precedente: ”si prenda su BD un punto a piacere F ”. Innanzitutto, si tratta di eseguire un ordine. Ma ciò che in questa frase del linguaggio naturale è sottinteso e che invece nella traduzione formale deve essere esplicitato, è il fatto che tale ordine sia eseguibile; e a¢nché ciò accada, deve esistere un punto F con queste proprietà. Che un ordine di costruzione comporti una assunzione di esistenza è un dato costante: in espressioni come ”si congiungano i due punti...”, ”si tracci la parallela a...” etc., si sottintende sempre che rette con le proprietà richieste esistano. La formalizzazione di ciò che il linguaggio naturale esprime con un ordine deve allora iniziare con la dimostrazione di un teorema generale di esistenza (ed eventualmente unicità, se si assume che tale oggetto debba essere unico). Nel nostra caso la formula sarà 8x18x2('(x1; x2) ! 9y(Ã(y; x1 ; x2 ))) (1) dove '(x1 ; x2) esprime l’asserto ”x1 e x2 sono punti distinti” e Ã(y; x1 ; x2 ) esprime ”y è un punto ed è compreso tra x1 e x2 ”. Il secondo passo consiste in una espressione particolare asserente che B e D sono punti distinti, cioè soddisfano '(x1; x2 ): (2) '(B; D): (Le costanti provvisorie B e D devono sono state introdotte in precedenza mediante la Regola S da una espressione 919x2'(x1 ; x2) ). Il terzo momento è costituito da due istanze dell’assioma di particolarizzazione (lo schema AM4, v. § 2.3.5), necessarie per passare da x1; x2 a B e D. (3) 8x18x2('(x1; x2 ) ! 9yÃ(y; x1 ; x2)) ! (8x2'(B; x2 ) ! 9yÃ(y; B; x2 )) (4) 8x2 '(B; x2 ) ! 9yÃ(y; B; x2 )) ! ('(B; D) ! 9yÃ(y; B; D)) 112CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA Quindi otteniamo: (5) 8x2 '(B; x2) ! 9yÃ(y; B; x2 )) (da (1) e (3) per MP); (6) '(B; D) ! 9yÃ(y; B; D) (da (4) e (5) per MP); (7) 9yÃ(y; B; D) (da (2) e (6) per MP). L’espressione (7) asserisce l’esistenza di un punto compreso tra B e D. In…ne, mediante una applicazione della Regola S denominiamo F questo punto, ottenendo …nalmente (8) Ã(F; B; D): Le costruzioni presenti nelle dimostrazioni naturali danno dunque luogo, quando vengono formalizzate, ad una lunga catena di enunciati, di cui uno esistenziale. Se si considera inoltre che le applicazioni della Regola S comportano ogni volta un gran numero di righe di deduzione (le quali, insieme alla dimostrazione di (1), devono essere aggiunte alle otto righe che costituiscono la deduzione precedente) appare chiara la notevole lunghezza che viene ad assumere la traduzione dell’originaria frase ”si prenda su BD un punto a piacere F ”, la cui immediatezza è completamente perduta. 4.1.5 Un commento …nale sulla formalizzazione delle teorie La trasformazione di una teoria matematica in sistema formale consente una de…nizione formale di dimostrazione all’interno di tale teoria, e questo fatto comporta la possibilità di enumerare meccanicamente tutti i suoi teoremi. La formalizzazione delle teorie matematiche porta così a compimento il processo di rigorizzazione della de…nizione di dimostrazione. Ma in che rapporto stanno le dimostrazioni naturali e le loro formalizzazioni? Primo problema: se siamo in possesso della dimostrazione ”naturale” di un asserto in una certa teoria, possiamo asserire che del corrispondente 4.1. LE TEORIE MATEMATICHE FORMALIZZATE 113 asserto formalizzato esisterà una dimostrazione nella corrispondente teoria formalizzata? Se leggiamo questa domanda nel modo seguente : ”Esiste un teorema che dimostra che per ogni dimostrazione naturale ne esiste la versione formalizzata?”, allora la domanda è priva di senso. Si richiederebbe infatti di dimostrare l’equivalenza tra un concetto rigorosamente de…nito (quello di dimostrazione all’interno di un sistema formale) ed un concetto intuitivo (quello di dimostrazione matematica non formalizzata, ”naturale”). Ma a¢nché sia possibile dimostrare l’equivalenza tra due concetti, è necessario che entrambi siano de…niti in modo rigoroso: nel nostro caso però uno dei due è nato proprio per essere la de…nizione rigorosa dell’altro. La domanda precedente deve essere allora intesa come una sorta di esame di coscienza collettivo: crediamo, con la de…nizione di sistema formale, di aver centrato l’obiettivo? La risposta a¤ermativa prende il nome di ”Tesi di Hilbert ”, dove la parola ”tesi” ha il signi…cato etimologico di ”posizione assunta”: La nozione matematica informale di dimostrazione, cioè la nozione applicata implicitamente quando si a¤erma di ricavare un teorema dagli assiomi di una qualche branca della matematica, è correttamente formalizzata dalla logica del I ordine. Questa tesi non potrà mai essere ”dimostrata”, ma semplicemente suffragata dal successo di molti casi particolari e dalla fecondità del concetto formalizzato . A suo favore si può portare tuttavia un’altra argomentazione: se interpretiamo una dimostrazione informale non come la versione sintetica della eventuale dimostrazione formalizzata, ma come un evento di portata essenzialmente semantica, che assicura che l’asserto ricavato vale in tutti i modelli della teoria, allora il Teorema di completezza estesa di Gödel dimostra l’esistenza appunto di una dimostrazione formale. Un secondo problema è il seguente: quanto sono lontane le dimostrazioni naturali dalle corrispondenti versioni formalizzate? Che queste ultime siano più lunghe, meno immediate e poco ”a misura d’uomo”, è un fatto che ognuno può facilmente prevedere. Tutto il movimento logico è sostenuto dal Modus Ponens (con l’ausilio della Generalizzazione), ed è quindi necessario che il numero dei passi dimostrativi cresca. Ma non è solo il problema dello sviluppo delle ”vecchie” regole logiche a dilatare la lunghezza della deduzione. La formalizzazione di ogni de…nizione ed ogni costruzione porta poi ad una totale perdita di immediatezza , elevando il numero dei passi necessari a valori tali 114CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA da rendere umanamente impraticabile il controllo delle traduzioni formali di dimostrazioni naturali anche molto brevi. Una teoria formale non può quindi essere riguardata come una macchina da metter in modo per produrre teoremi al posto nostro. Il concetto di teoria formale in prima istanza è il punto di arrivo di un processo volto a chiarire il concetto di dimostrazione. Il fatto che l’esplicitazione completa dei passaggi dimostrativi faccia esplodere la più innocua della dimostrazioni naturali è segno della ricchezza concettuale che tali dimostrazioni racchiudono. Ma il concetto di teoria formalizzata è anche un punto di partenza della logica moderna la quale, risulto il compito di determinare le regole logiche (cioè teoremi della logica), si volge a scoprire metateoremi. Tutti i principali ”teoremi” enunciati in questo capitolo, a cominciare dal più famoso di tutti (il Teorema di incompletezza di Gödel) non sono teoremi di teorie formali ma metateoremi su terie folrmali. Non a caso, tra i nomi con cui nel secolo scorso la nascente logica matematica è stata chiamata (nome poi caduto in disuso), c’è stato quello di metamatematica. 4.1. LE TEORIE MATEMATICHE FORMALIZZATE 115 116CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA Capitolo 5 La teoria assiomatica degli insiemi. La teoria ”ingenua” degli insiemi si basa sul seguente Principio di comprensione: Data una proprietà P, esiste l’insieme fx : P (x)g : Il principio di comprensione conduce a contraddizione: Paradosso di Russell (1902): Sia P (x) = :(x 2 x) e sia A = fx : P (x)g = fx : :(x 2 x)g : A 2 A? Si ! No; No ! Si. (Attenzione: non è una dimostrazione per assurdo o per CM, cioè una dimostrazione di contradditorietà di un certo asserto. E’una prova di contradditorietà della teoria di cui l’asserto è parte). Il precedente paradosso rappresenta il casus belli, l’evento assunto ad emblema di un processo che, all’inizio del secolo scorso, ha portato all’assiomatizzazione della teoria degli insiemi. Bertrand Russell comunicò la sua scoperta a Frege in una lettera che, anche per il tenore della risposta, rappresenta un documento davvero singolare: ”Caro collega, Da un anno e mezzo sono venuto a conoscenza dei suoi Grundgesetze der Arithmetik, ma solo ora mi è stato possibile trovare il tempo per uno studio completo dell’opera come avevo intenzione 117 118 CAPITOLO 5. LA TEORIA ASSIOMATICA DEGLI INSIEMI. di fare. Mi trovo completamente d’accordo con lei su tutti i punti essenziali, in modo particolare col suo ri…uto di ogni elemento psicologico nella logica e col fatto di attribuire un grande valore all’ideogra…a per quel che riguarda i fondamenti della matematica e della logica formale, che, per inciso, si distinguono di¢cilmente tra loro. Riguardo a molti problemi particolari trovo nella sua opera discussioni, distinzioni e de…nizioni che si cercano invano nelle opere di altri logici. Specialmente per quel che riguarda le funzioni (cap. 9 del suo Begri¤sschrift), sono giunto per mio conto a concezioni identiche, per…no nei dettagli. C’è solo un punto in cui ho trovato una di¢coltà. Lei a¤erma (p.17) che anche una funzione può comportarsi come l’elemento indeterminato. Questo è ciò che io credevo prima, ma ora tale opinione mi pare dubbia a causa della seguente contraddizione. Sia w il predicato ”essere un predicato che non può predicarsi di se stesso”. w può essere predicato di se stesso? Da ciascuna risposta segue l’opposto. Quindi dobbiamo concludere che w non è un predicato. Analogamente non esiste alcuna classe (concepita come totalità) formata da quelle classi che, pensate ognuna come totalità , non appartengono a se stesse. Concludo da questo che in certe situazioni una collezione de…nibile non costituisce una totalità. Sto …nendo un libro sui principi della matematica e in esso vorrei discutere la sua opera in tutti i dettagli. Ho già i suoi libri o li acquisterò presto, ma Le sarei molto grato se mi potesse inviare gli estratti degli articoli usciti su riviste. Nel caso non sia possibile, comunque, potrò averli da una biblioteca. La trattazione rigorosa della logica nelle questioni fondamentali, dove i simboli non sono suf…cienti, è rimasta molto indietro; nella sua opera ho trovato la migliore elaborazione del nostro tempo, e mi sono quindi permesso di esprimerle il mio profondo rispetto. Sono spiacente che Lei non abbia ancora pubblicato il secondo volume dei suoi Grundgesetze: spero tuttavia che ciò avvenga. Molto rispettosamente suo Bertrand Russell (Ho scritto a Peano di questo fatto, ma non ho ancora ricevuto risposta.)” Frege, che vide in tale antinomia il crollo del suo programma di riduzione della aritmetica alla logica, riduzione che passava attraverso un uso 119 sistematico dell”’estensione” dei concetti, espresse in questo modo la sua desolazione: ”A uno scrittore di scienza ben poco può giungere più sgradito del fatto che, dopo aver completato un lavoro, venga scosso uno dei fondamenti della sua costruzione. Sono stato messo in questa situazione da una lettera del signor Bertrand Russell, quando la stampa di questo volume stava per essere …nita. [...] Ma veniamo al fatto! Il signor Russell ha scoperto una contraddizione che ora esporrò. Nessuno vorrà asserire, della classe degli uomini, che essa è un uomo. Abbiamo qui una classe che non appartiene a se stessa. Dico infatti che qualcosa appartiene a una classe se questo qualcosa cade sotto un concetto, la cui estensione è proprio la classe stessa. Fissiamo ora il concetto: classe che non appartiene a se stessa! L’estensione di questo concetto, ammesso che se ne possa parlare, è, per quanto detto, la classe delle classi che non appartengono a se stesse. Vogliamo chiamarla brevemente la classe K. Chiediamoci ora se questa classe K appartenga a se stessa! Supponiamo in primo luogo che essa appartenga a se stessa. Se qualcosa appartiene a una classe, cade sotto il concetto la cui estensione è la classe in esame, di conseguenza, se la nostra classe appartiene a se stessa, allora é una classe che non appartiene a se stessa. La nostra prima supposizione conduce quindi a una contraddizione. Supponiamo, in secondo luogo, che la nostra classe K non appartenga a se stessa: in questo caso essa cade sotto il concetto di cui essa stessa rappresenta l’estensione, quindi appartiene a se stessa: qui di nuovo abbiamo una contraddizione!” 5.0.6 Assiomi di ZF Stante la contraddittorietà del concetto intuitivo di insieme legato al principio di comprensione, le teorie assiomatiche provvedono a de…nire implicitamente, mediante assiomi, ciò che è un insieme. La teoria di Zermelo-Fraenkel procede stabilendo, a partire dal vuoto, quali operazioni permettono di ottenere insiemi da insiemi. 120 CAPITOLO 5. LA TEORIA ASSIOMATICA DEGLI INSIEMI. Tali assiomi sono dei tentativi. Nessuno sa se sono consistenti o se invece da loro può esser ottenuta una contraddizione. Gli assiomi inizialmente posti da Zermelo nel 1908 sono stati via via modi…cati ed integrati, in primis da Skolem e Fraenkel nel 1922. Ad altri sistemi accenneremo in seguito. Bisogna comunque rimarcare che l’assiomatizzazione della teoria degli insiemi è qualcosa di dinamico, in quanto costituisce il punto di collegamento tra la matematica formalizzata e le idee intuitive, che sono comunque ‡uide. Linguaggio: LZF = f2g : Si osservi che non esistono, come simboli primari, le parentesi f e g : Le variabili indicano sempre insiemi: non esiste la proprietà ”essere elemento” ma la relazione ”essere elemento di”. Si osservi anche come gran parte degli assiomi (in particolare ZF2-ZF5), asserrendo l’esistenza di nuovi insiemi a partire da vecchi insiemi, di fatto predisponga le de…nizione di nuove operazioni (quelle tramite le quali si ottengono i nuovi insiemi) e nuove costanti. Ciò avviene, come descritto in § 4.1.4, mediante formule aperte. Si consideri la formula aperta '(x; y) = 8z(z 2 x ! z 2 y): Tale espressione esprime un simbolo relazionale binario e viene abbreviata con x µ y: Mentre per i simboli relazionali è su¢ciente una formula aperta, per i simboli funzionali bisogna anche dimostrare esistenza ed unicità (v. § 4.1.4). Alle dimostrazioni di unicità provvede il primo assioma: (ZF1) (Estensionalità) Due insiemi sono uguali sse hanno gli stessi elementi. 8x8y(8z(z 2 x $ z 2 y) ! x = y) Alle dimostrazioni di esistenza provvedono, volta per volta, assiomi speci…ci. Iniziamo, ovviamente, dal basso. (ZF2) (Insieme vuoto) Esiste un insieme privo di elementi. 9x8y:(y 2 x) 121 Si consideri la formula aperta '(x) = 8y:(y 2 x): Da ZF2 otteniamo 9x'(x) e, per ZF1, 8x8z('(x)^'(z) ! x = z): Abbiamo dunque esistenza ed unicità e dunque la '(x) esprime una funzione 0-aria, cioè una costante (si ricordi che una relazione n + 1 esprime una funzione n-aria). L’espressione '(x) viene abbreviata con ?: (ZF3) (Coppia) Dati due insiemi x ed y, esiste un insieme i cui unici elementi sono x ed y 8x8y9z8w(w 2 z $ (w = x _ w = y))) La formula de…nitoria è '(x; y; z) = 8w(w 2 z $ (w = x _ w = y))): Da ZF3 e ZF1 segue, dati x e y, l’esistenza e l’unicità di tale insieme z; e pertanto si giusti…ca l’introduzione di un simbolo funzionale f(x; y), che viene indicato con fx; yg : Se x = y la scrittura fx; xg viene abbreviata con fxg : (ZF4) (Unione) Dato un insieme x esiste un insieme i cui elementi sono elementi di elementi di x. 8x9y8z(z 2 y $ 9w(z 2 w ^ w 2 x) Considerazioni analoghe alle precedenti giusti…cano l’introduzione del simS bolo x: S (Attenzione: il simbolo indica una funzione unaria, ed non coincide S con l’usuale simbolo di grande unione come operazione n-aria: in e¤etti, x S corrisponde alla grande unione yi). A questo punto, l’usuale scrittura y i 2x S y [ z diventa una abbreviazione per fy; zg : Le usuali scritture di insiemi …niti tra parentesi gra¤e vengono poi ottenute in questo modo: fy; z; tg =def S fy1 ; :::; yn g =def ffy; zg ; ftgg e, ricorsivamente, S ffy1 ; :::; yn¡1g ; fyn gg : (ZF5) (Insieme potenza) Dato un insieme x esiste un insieme i cui elementi sono i sottinsiemi di x. 8x9y8z(z 2 y $ z µ x)) 122 CAPITOLO 5. LA TEORIA ASSIOMATICA DEGLI INSIEMI. Considerazioni analoghe alle precedenti giusti…cano l’introduzione del simbolo P(x): Vale che [ P(x) = x: S Infatti a 2 P(x) sse a 2 b 2 P(x) sse a 2 b µ x sse a 2 x. Invece abbiamo [ x µ P( x): S S Infatti a 2 x ! a µ x ! a 2 P( x): In questo caso nonSvale l’uguaglianza, S come mostra il seguente esempio: se x = ff?gg allora x = f?g e P( x) = f?; f?gg : (ZF6) (Separazione) Non è un assioma ma uno schema d’assioma (abbiamo un assioma per ogni formula '). Data una formula ben formata '(z) e dato un insieme x, esiste un insieme costituito dagli elementi di x che soddisfano ': 8x9y8z(z 2 y $ (z 2 x ^ '(z))) Tale insieme viene denotato con y = fz : z 2 x ^ '(z)g (si noti come tale principio costituisca un indebolimento del principio di comprensione, per il quale si avrebbe semplicemente y = fz : '(z)g ). In virtù degli assiomi ZF4 e ZF6 possiamo introdurre l’intersezione tra insiemi, de…nendola come un sottinsieme dell’unione. De…niamo dapprima l’operazione unaria n o \ [ x =def y : y 2 x ^ 8u(u 2 x ! y 2 u) (che, per gli assiomi citati, denota un insieme). Quindi poniamo \ y \ z =def fy; zg : Per quanto riguarda l’operazione di di¤erenza insiemistica abbiamo y ¡ z =def fw : w 2 y ^ :(w 2 z)g : (Come si ricorderà, nell’usuale linguaggio insiemistico il complementare di un insieme è riferito all’insieme universo U, spesso sottinteso, per cui zc =def U ¡ z: Tale operazione non ha senso nella teoria generale degli insiemi.) 123 Per poter de…nire il prodotto cartesiano abbiamo bisogno del concetto di coppia ordinata. Non disponiamo però di alcuna relazione d’ordine. Il problema è superato tramite il seguente Lemma 95 Se ffcg ; fc; dgg = ffag ; fa; bgg allora c = a e d = b: Dimostrazione. (Per comodità usiamo simboli linguistici nel metalinguaggio). Da ZF1 segue che ffcg ; fc; dgg = ffag ; fa; bgg ! (fcg = fag o fcg = fa; bg) e (fc; dg = fag o fc; dg = fa; bg) Ma (fcg = fag ! c = a) e (fcg = fa; bg ! c = a = b): Quindi, in ogni caso, c = a: Nel caso fc; dg = fag abbiamo fc; dg = fag ! c = d = a e quindi, in questo caso, ffcg ; fc; dgg = ffcgg e poiché fa; bg 2 ffcg ; fc; dgg segue fa; bg = fcg da cui risulta c = d = a = b: Rimane il caso fc; dg = fa; bg con c 6= d: Da d 2 fa; bg) segue d = a o d = b: Ma ((d = a _ d = b) ^ (c = a) ^ (c 6= d)) ! d = b: Dal lemma segue che l’insieme ffag ; fa; bgg si comporta come una coppia ordinata (a; b) (infatti, nella teoria ingenua, (c; d) = (a; b) sse c = a e d = b). Poniamo dunque (a; b) =def ffag ; fa; bgg : A questo punto possiamo de…nire il prodotto x£y. Supponiamo che a 2 x e b 2 y: Da (a; b) µ P(fa; bg) e da fa; bg µ x [ y segue (a; b) µ P(x [ y) e dunque (a; b) 2 P(P(x [ y)): Ed è su P(P(x [ y)) che applichiamo l’assioma ZF6: x £ y =def fz : z 2 P(P(x [ y)) ^ 9a9b(a 2 x ^ b 2 y ^ z = (a; b)g : (ZF7) (Rimpiazzamento. Anche in questo caso si tratta di uno schema d’assioma) Data una formula ben formata '(x; y) e dato un insieme w esiste un insieme v = fy : '(x; y) per un x 2 wg : Più precisamente: 8w9u8y(y 2 u $ (9x(x 2 w ^ '(x; y)) 124 CAPITOLO 5. LA TEORIA ASSIOMATICA DEGLI INSIEMI. Lo schema ZF7 è riferito a generiche formule in due variabili libere. Tuttavia basta limitarsi a quelle formule '(x; y) che de…niscono una funzione, cioè formule per cui, dato x vale l’esistenza e l’unicità di y (v. § 4.1.4). La lettura più intuitiva di ZF7 è dunque: l’immagine di un insieme mediante una funzione è a sua volta un insieme. ZF7 fu aggiunto da Fraenkel nel 1922, quando fu chiaro che ZF6 non era in grado di provvedere a costruzioni insiemistiche intuitivamente accettabili. ZF7 implica ZF6 (ponendo '(x; y) = ((x = y) ^ '(y)) ). Tuttavia l’assioma Z6 viene usualmente lasciato tra gli assiomi per la sua praticità di impiego. Si osservi ancora che ZF7 non implica che, data una formula '(x; y); tutte le coppie (x; y) che la soddisfano sia un insieme; implica solo che tutte le coppie (x; y) che soddisfano ' con x appartenente ad un dato insieme w sia un insieme. Di conseguenza, una formula che de…nisce una funzione non de…nisce una funzione tout court, ma de…nisce una funzione per ogni insieme w scelto come dominio. (ZF8) (In…nito) Esiste un insieme x tale che ; 2 x e tale che se y 2 x allora y [fyg 2 x: Il LZF , impiegando i concetti …nora de…niti, la formula è 9x(? 2 x ^ 8y(y 2 x ! y [ fyg 2 x)) (si noti come, tramite le nuove de…nizioni, il linguaggio sia divenuto più espressivo). (ZF9) (Fondatezza) Ogni insieme non vuoto x contiene un elemento y tale che x \ y = ;. 8x(9y(y 2 x) ! 9y(y 2 x ^ :9z(z 2 x ^ z 2 y))) Da questo assioma deriva l’inesistenza di catene di appartenenza in…nite discendenti. Supponiamo infatti che x contenga una catena discendente e sia z l’insieme degli elementi della catena. Tale z non soddisfa l’assioma, in quanto non esiste y 2 z tale che y \z = ?. Dall’assenza di catene discendenti deriva poi che, per ogni x, x 2 = x. 5.0.7 Assiomi di VNB Il sistema VNB (Von Neumann-Bernays) fu originariamente sviluppato da Von Neumann nel 1925 e in seguito modi…cato da Bernays e Goedel. La 125 maggiore di¤erenza da ZF consiste nel fatto che il Principio di comprensione, che permane, e denota classi. Ad evitare paradossi provvede la restizione che impedisce a certe classi (quelle troppo grandi) di appartenere ad altre classi. Si inserisce in tal modo una distinzione tra le classi: quelle che possono essere elementi di altre classi (chiamate insiemi) e quelle che non possono esserlo (chiamate classi proprie). LV NB = f2g Dunque LV NB = LZF: Le variabili sono intese denotare classi e, tradizoinalmente sono indicate con lettere maiuscole. Il concetto ”X è un insieme”, indicato con M(X) viene de…nito nel modo seguente: M(X) =def 9Y (X 2 Y ): I quanti…catori variano su classi, per cui l’espressione ”per ogni insieme X vale '” diventa 8X(M(X) ! '(X)) Il principio di comprensione viene espresso in questa forma (attenzione all’uso delle parole ’classe’e ’insieme’): Assioma di comprensione. Sia '(X) una formula in cui i quanti…catori sono riferiti ad insiemi. Allora esiste una classe fX : M(X) ^ '(X)g composta da tutti gli insiemi che soddisfano ': Gli altri assiomi sono simili a quelli di ZF. L’assioma di estensionalità (corrispondente a ZF1) e quello di fondazione (corrispondente a ZF9) sono riferiti a classi, mentre gli assiomi del vuoto, della coppia, dell’unione, della potenza e dell’in…nito (corrispondenti a ZF2-5 e ZF8) sono riferiti ad insiemi. L’assioma di rimpiazzamento (corrispondente a ZF7) ha questa forma: dato un insieme u ed una funzione f (intesa come una classe di coppie ordinate tali che...) esiste un insieme v consistente in tutti gli y per i quali esiste x 2 u per cui (x; y) 2 f: Mostriamo ora come il Paradosso di Russel non si presenti più: Sia A = fX : M(X) ^ :(X 2 X)g : Ci domandiamo se A 2 A: Se A 2 A, allora A è un insieme e A 2 = A: Quindi (Consequentia Mirabilis) 126 CAPITOLO 5. LA TEORIA ASSIOMATICA DEGLI INSIEMI. A2 = A: (Ci dovremmo fermare qui. Ma proseguiamo perchè è la teoria che è in dubbio). Se A 2 = A, allora A non soddisfa una delle seguenti condizioni: (1) A è un insieme; (2) A 2 = A: Poiché quest’ultima vale per ipotesi, segue che A non è un insieme ed è dunque una classe propria. Abbiamo quindi accertato che A non è un insieme e A 2 = A: Nonostante la diversità di impostazione dei sistemi ZF e VNB, le due teorie sono equiconsistenti: Theorem 96 (Rosser-Wang, 1950) ZF è consistente sse lo è VNB. 5.0.8 L’Assioma di scelta Alcuni risultati nella teoria ingenua degli insiemi dipendono da quello che abbiamo chiamato Principio di scelta. Data la sua criticità, questo assioma viene considerato a parte e, eventualmente, aggiunto alle teorie. In ZF ha le seguenti versioni: (AC) Dato un insieme non vuoto x i cui elementi sono insiemi non vuoti a due a due disgiunti, esiste un insieme y che contiene uno ed un solo elemento per ciascuno degli elementi di x. (y è chiamato insieme di scelta per x). ZF + AC viene denotato con ZFC. Il fatto che si tratti di una aggiunta e¤ettiva è dimostrato dal seguente teorema: Theorem 97 Se ZF è consistente, allora ZF0AC. Versione per VNB: (AC) Data una classe non vuota X i cui elementi sono insiemi non vuoti a due a due disgiunti, esiste una classe y che contiene uno ed un solo elemento per ciascuno degli elementi di X. Theorem 98 Se VNB è consistente, allora VNB0AC. 127 ² Forme equivalenti alla scelta Si dimostra (relativamente ad entrambi i sistemi) che l’Assioma di scelta è equivalente a ciascuna delle seguenti proprietà: (AC’) Dato un insieme non vuoto x i cui elementi sono insiemi non vuoti esiste una funzione f tale che, per ogni a 2 x, f(a) 2 a: Lemma di Zorn: Se x è un insieme ordinato non vuoto tale che ogni catena in x ha un con…ne superiore, allora x contiene almeno un elemento massimale. Principio del Buon ordinamento. Dato un insieme x esiste una relazione R tale che (x; R) è un buon ordine. Tricotomia. Dati due insiemi x; y allora x ¹ y o y ¹ x: 5.0.9 Aritmetica in ZF La teoria T A dell’aritmetica può essere inglobata dalla teoria degli insiemi, che provvede a de…nirne i concetti primitivi e a dimostrarne gli assiomi. Ci riferiamo a ZF (un’analoga riduzione è possibile anche in VNB). La de…nizione dei numeri (postulata da P1 e P2), si basa sul fatto che ; e un insieme (ZF2) e, se x è un insieme, anche x [ fxg è un insieme (ZF3-4) e, per ZF9, è diverso da x. Possiamo quindi porre De…nition 99 0 =def ; e S(x) =def x [ fxg. Per ottenere l’insieme N (…nora abbiamo ottenuto soltanto i suoi elementi), si procede in questo modo: De…nition 100 Un insieme x è induttivo se soddisfa la seguente formula: Ind(x) =def (? 2 x) ^ (y 2 x ! S(y) 2 x): 128 CAPITOLO 5. LA TEORIA ASSIOMATICA DEGLI INSIEMI. Per l’Assioma dell’in…nito, esiste un insieme induttivo e, per de…nizione, ogni insieme induttivo include tutti i numeri naturali. Problema: esiste un insieme costituito da tutti e soli i numeri naturali? Lemma 101 Se v è un insieme i cui elementi sono insiemi induttivi allora T v è un insieme induttivo. T Dimostrazione. Ogni y di v contiene il ;: Quindi ? 2 v: Inoltre, se T z 2 v alloraT8y(y 2 v ! z 2 y), da cui segue 8y(y 2 v ! S(z) 2 y) e quindi S(z) 2 v: Theorem 102 Esiste un insieme induttivo che è sottinsieme di ogni insieme induttivo. Dimostrazione. Sia x un qualunque insieme induttivo (ZF8). Per ZF5 e ZF6 esiste l’insieme v = fu : u 2 P(x) ^ Ind(u))g : T Per il Lemma 101, v è induttivo. Dimostriamo che è il minimo insieme induttivo. 101, T Sia z un qualunque insieme induttivo. Allora, per il Lemma T x\z ( = Tfx; zg) è induttivo. T Ma x\z 2 P(x): Dunque x\z 2 v; v µ x\z e quindi v µ z: Pertanto v è l’insieme cercato. Lo indichiamo con !: Dunque: != f0; 1; 2; :::g Theorem 103 Gli assiomi di Peano sono dimostrabili in ZF relativamente ad !: Dimostrazione. (P1 ) 0 2 !: (0 = ? e ! è induttivo) (P2 ) x 2 ! ! S(x) 2 !: (! è induttivo) (P3 ) x 2 ! ! S(x) 6= 0 (per ogni x, x 2 S(x). Quindi S(x) 6= ?; cioè 0) 129 (P4) (x 2 ! ^ y 2 ! ^ S(x) = S(y)) ! x = y ( (S(x) = S(y) ^ x 2 S(x)) ! x 2 S(y): Quindi o x 2 fyg (cioè x = y, …ne) o x 2 y. In modo analogo o y 2 fxg (cioè y = x, …ne) o y 2 x: Ma x 2 y e y 2 x insieme contraddicono ZF9. Quindi x = y: (P5) (y µ ! ^ ? 2 y ^ (x 2 y ! S(x) 2 y)) ! y = !: (? 2 y ^ (x 2 y ! S(x) 2 y implica Ind(y). Quindi, per Th. 102, ! µ y, che, insieme all’ipotesi y µ !, implica y = !: Si osservi che il Principio di Induzione viene dimostrato proprio nella forma P5, cioè riferendosi ad un generico sottinsieme y di !, e non nella forma AA7. In ZF è dimostrabile anche il Principio di Recursione. Theorem 104 ( Teorema di recursione su !). Sia '(x; y) una formula di ZF che de…nisce una funzione, cioè tale che 8x91 y'(x; y). Allora, per ogni insieme a, esiste una unica funzione f di dominio ! tale che f(0) = a e '(f(n); f(S(n))) vale per ogni n: Essendo ' una formula che determina una funzione, possiamo scrivere '(x; y) come g(x) = y ed avere la recursione nella forma canonica f(0) = a f(S(n)) = g(f(n)): Mediante tale teorema, possiamo ad esempio dimostrare che, dato un insieme a, la scrittura fa; P(a); P(P(a)); :::g è un insieme. Prendendo '(x; y) come y = S(x), otteniamo che esiste una funzione f di dominio ! tale che f(0) = ! e f(S(n)) = P(f(n)) vale per ogni n: L’immagine di questa funzione è fa; P(a); P(P(a)); :::g che, per ZF7, è un insieme. 5.0.10 Ancora ordinali e cardinali Ottenuto l’insieme ! possiamo, tramite ZF3-4, ottenere gli insiemi S(!), S(S(!)), ..., cioè tutti gli ordinali ! + n: Più in generale, se ® è un insieme 130 CAPITOLO 5. LA TEORIA ASSIOMATICA DEGLI INSIEMI. S(®) è un insieme. Per gli ordinali limiti dobbiamo impiegare il teorema di recursione su !: Theorem 105 !2 è un insieme. Dimostrazione. Sia '(x; y) la formula y = S(x): Allora esiste una funzione f di dominio ! tale che f(0) = ! e f(S(n)) = S(f(n)) vale per ogni n: L’immagine di questa S funzione è f!; S(!); S(S(!)); :::g che, per ZF7, è un insieme. Per ZF4, f!; S(!); S(S(!)); :::g, cioè !2, è un insieme. In modo analogo si dimostra che ogni ordinale limite (di ordinali che abbiamo già dimostrato esser insiemi) è un insieme. Il contenuto dei §. 1.2 e 3.2.4 può essere dunque trasferito in ZF. Theorem 106 Non esiste l’insieme di tutti gli ordinali. Dimostrazione. S Supponiamo che X sia l’insieme di tutti gli ordinali. Allora, per ZF3, X è un insieme e, per il Teorema 51(2), è anche un ordinale. S Sia ® = S( X), i.e., n[ o [ ®= X[ X : S Dunque, anche ® è un ordinale. Sia ° 2 X: Allora ° µ XS e dunque, essendo S entrambi ordinali, dal Teorema 43(5) segue che S ° 2 X oppure ° = X: Nel primo caso ° è un segmento iniziale di X e dunque di ®; S nel secondo caso è un segmento iniziale di S( X); cioè, di nuovo, di ®: In entrambi i casi dunque ° 6= ®: Poiché ciò accade per ogni ° 2 X, abbiamo che ® 2 = X, contro l’ipotesi che X fosse l’insieme di tutti gli ordinali. Pertanto, in ZF non esiste l’insieme di tutti gli ordinali. In VNB esiste la classe di tutti gli ordinali (indicata on On). E’de…nita mediante l’Assioma di comprensione. Non è un insieme (come dimostrato dal teorema precedente). E’dunque una classe propria. Siamo ora in grado di dimostrare il risultato fondamentale che abbiamo enunciato all’inizio del corso. Theorem 107 Sia (X; R) un insieme ben ordinato. Esiste (ed è unico) un ordinale ® isomorfo ad (X; R): Tale ordinale viene indicato con ord(X; R): 131 Dimostrazione. L’unicità deriva dal Teorema 43(3). Dimostriamo l’esistenza. Sia X in insieme ben ordinato e ® un ordinale. Per il Teorema 41, oX» =®,oX » = ®y , per un certo y 2 ® , o ® » = Xz per un certo z 2 X: Nel primo caso il teorema è dimostrato. Così pure nel secondo, considerato il Teorema 43(1bis). Supponiamo quindi che, per ogni ®, non valgano i primi due casi. Allora, per ogni ordinale ® esiste z 2 X tale che ® » = Xz : Sia D l’insieme dei segmenti iniziali di X isomor… ad un ordinale e sia '(x; y) la formula che esprime il seguente concetto: x 2 D e y è l’ordinale isomorfo ad x. Per ZF7, f® : 9x'(x; ®)g è un insieme, ed è l’insieme di tutti gli ordinali. Ciò contraddice il teorema precedente. Nella teoria ingenua degli insiemi non abbiamo de…nito rigorosamente i numeri cardinali, ma solo la relazione avere uguale (o maggiore) cardinalità, lasciando il concetto di cardinale nella forma vaga di ”ciò che hanno in comune insiemi equinumerosi”. Ora, nella teoria assiomatazzata, possiamo de…nire i cardinali come particolari ordinali. De…nition 108 Un ordinale in…nito ® è detto ordinale iniziale (oppure un aleph) se non è equinumeroso a nessun ordinale minore. De…nition 109 Un ordinale ® è un cardinale se è …nito oppure è un ordinale iniziale. ! è il minimo ordinale iniziale e, come cardinale, viene denotato con @0: Il teorema successivo mostra l’esistenza (in ZF) di insiemi cardinalità non numerabile. Theorem 110 Per ogni ordinale ® esiste un cardinale ¯ tale che ® < ¯: Dimostrazione. Se ® è un ordinale …nito, S(®) e …nito, dunque cardinale, e ® < S(®): Supponiamo che ® sia in…nito. Dimostriamo prima che la classe degli ordinali ° tali che ° ¹ ® è un insieme. Sia '(R) la formula di ZF che esprime la proprietà ”R è un b.o. su un insieme X µ ®”. 132 CAPITOLO 5. LA TEORIA ASSIOMATICA DEGLI INSIEMI. Per l’assioma di isolamento (ZF6) esiste l’insieme W = fR : R 2 P(® £ ®) ^ '(R)g : (5.1) Sia Ã(R; °) la formula di ZF che esprime la seguente relazione: ”'(R) e (° è un ordinale) e (ord(X; R) = °). Allora, per ZF7, l’immagine di W mediante la funzione determinata da '(R; °) è un insieme, ed è l’insieme cercato; lo indichiamo con D: Dunque D = f° : ° è un ordinale e ° ¹ ®g : S S Per il Teorema 51, D è un ordinale, e per il Teorema 48 ± = S( D) è un ordinale maggiore di ogni ordinale in D: Quindi ± 2 = D e non ± » ®: Pertanto f° : ® < ° < S(±) ^ :(° » ®)g 6= ; e dunque ammette minimo ¯: ¯ è un cardinale (in quanto se fosse biettivo ad un ordinale minore di lui, dovrebbe essere biettivo ad ®) e ® < ¯: Theorem 111 Ad ogni ordinale ® può essere associato un cardinale @® tale che ° < ® < ¯ implica @° < @® < @¯ : Dimostrazione. Per induzione trans…nita: @0 = ! @S (° ) = S il minimo cardinale maggiore di @° ; S @¸ = f@° : ° < ¸g, per ogni ordinale limite ¸:( f@° : ° < ¸g e un cardinale, in quanto è il minimo ordinale maggiore ad @° : ° < ¸:) Il seguente risultato impiega l’assioma di scelta. Theorem 112 Dato un insieme X, esiste un numero cardinale biettivo ad X. Dimostrazione. Sia X un insieme. Per l’assioma di scelta (nella forma del buon ordinamento), esiste una relazione R tale che (X; R) è un insieme ben ordinato. Per il Teorema 107, esiste un ordinale ® isomorfo a (X; R): Pertanto l’insieme (perché tale è) degli ordinali biettivi ad X e minori od uguali ad ® non è vuoto. Per il Lemma 49, tale insieme è ben ordinato da µ 133 (cioè ·) e quindi ammette minimo. Questo minimo ordinale è un cardinale. Viene indicato con Card(X) A questo punto possiamo tradurre formalmente le operazioni cardinali, che ripetiamo, considerando però i cardinali come particolari ordinali e quindi come insiemi: ® +c ¯ = Card((® £ f0g) [ (¯ £ f1g) ® ¢c ¯ = Card(® £ ¯) ¯® = Card(¯® ) dove fuori parentesi intendiamo l’esponenziazione cardinale e dentro parentesi l’insieme delle funzioni da ® a ¯ (per evitare possibili equivoci, talvolta l’esponenziazione cardinale si indica con exp(¯; ®): Supponendo la tricotomia (e quindi AC), abbiamo: Theorem 113 Se ® e ¯ sono cardinali non nulli di cui almeno uno in…nito allora ® +c ¯ = ® ¢c ¯ = max(®; ¯) Essendo ciascun cardinale un ordinale, tra di essi si possono eseguire sia le operazioni ordinali che quelle cardinali. I risultati, in genere, non coincidono. Ad esempio: ® +c ® = ® mentre ® +o ® = ®2 6= ®: Chiaramente, ®2 non è un cardinale, il che mostra che l’insieme dei cardinali non è chiuso rispetto alla somma ordinale. Lo stesso accade per il prodotto: ® ¢c ® = ® mentre ® ¢o ® = ®2 6= ®: In entrambi i casi, tuttavia, i due ordinali ottenuti come risultato sono biettivi tra loro (hanno lo stesso cardinale). Nel caso dell’esponenziazione non accade più neppure questo. Infatti, ad esempio, l’esponenziazione ordinale !! è numerabile, mentre quella cardinale è più che numerabile. 134 CAPITOLO 5. LA TEORIA ASSIOMATICA DEGLI INSIEMI. 5.0.11 Ipotesi del continuo Sappiamo (Corollario 32) che 2@0 = @ e (Th. di Cantor) che @0 < @: Il problema è: quale indice ha il cardinale @: CH (Ipotesi del continuo): 2@0 = @1 GCH (Ipotesi del continuo generalizzato): per ogni ordinale ®; 2@® = @®+ 1: Theorem 114 (Goedel 1938) Se ZF è consistente allora ZF+GCH è consistente. Theorem 115 ZF+GCH`AC. (99 la tricotomia richiede la scelta, mentre la GCH la implica99) Theorem 116 (Cohen 1963) Se ZF è consistente, allora ZFC0CH (e quindi ZFC0GCH). Per il Teorema di Cohen, se vogliamo posizionare @ dobbiamo aggiungere quindi un assioma (è frustrante, in una teoria desiderabilmente a modello unico, dover aggiungere un assioma su una questione simile). Inoltre è consistente con ZF ipotizzare 2 @0 = @® , dove @® è un cardinale che non ha sottinsiemi co…nali contabili (dato un buon ordine (X; R) e y µ X, y è co…nale se 8x9y(x 2 X ^ y 2 y ^ xRy):) Ad esempio, @! ha un insieme co…nale contabile: fmin(@n+1 ¡ @n ) : n 2 !g Pertanto ZF + (2@0 = @! ) non è consistente. Invece, per ogni n, @n non ha sottinsiemi co…nali contabili, e dunque (2@ 0 = @n ) è consistente con ZF. Capitolo 6 La teoria assiomatica degli insiemi. La teoria ”ingenua” degli insiemi si basa sul seguente Principio di comprensione: Data una proprietà P, esiste l’insieme fx : P (x)g : Il principio di comprensione conduce a contraddizione: Paradosso di Russell (1902): Sia P (x) = :(x 2 x) e sia A = fx : P (x)g = fx : :(x 2 x)g : A 2 A? Si ! No; No ! Si. (Attenzione: non è una dimostrazione per assurdo o per CM, cioè una dimostrazione di contradditorietà di un certo asserto. E’una prova di contradditorietà della teoria di cui l’asserto è parte). Il precedente paradosso rappresenta il casus belli, l’evento assunto ad emblema di un processo che, all’inizio del secolo scorso, ha portato all’assiomatizzazione della teoria degli insiemi. Bertrand Russell comunicò la sua scoperta a Frege in una lettera che, anche per il tenore della risposta, rappresenta un documento davvero singolare: ”Caro collega, Da un anno e mezzo sono venuto a conoscenza dei suoi Grundgesetze der Arithmetik, ma solo ora mi è stato possibile trovare il tempo per uno studio completo dell’opera come avevo intenzione 135 136 CAPITOLO 6. LA TEORIA ASSIOMATICA DEGLI INSIEMI. di fare. Mi trovo completamente d’accordo con lei su tutti i punti essenziali, in modo particolare col suo ri…uto di ogni elemento psicologico nella logica e col fatto di attribuire un grande valore all’ideogra…a per quel che riguarda i fondamenti della matematica e della logica formale, che, per inciso, si distinguono di¢cilmente tra loro. Riguardo a molti problemi particolari trovo nella sua opera discussioni, distinzioni e de…nizioni che si cercano invano nelle opere di altri logici. Specialmente per quel che riguarda le funzioni (cap. 9 del suo Begri¤sschrift), sono giunto per mio conto a concezioni identiche, per…no nei dettagli. C’è solo un punto in cui ho trovato una di¢coltà. Lei a¤erma (p.17) che anche una funzione può comportarsi come l’elemento indeterminato. Questo è ciò che io credevo prima, ma ora tale opinione mi pare dubbia a causa della seguente contraddizione. Sia w il predicato ”essere un predicato che non può predicarsi di se stesso”. w può essere predicato di se stesso? Da ciascuna risposta segue l’opposto. Quindi dobbiamo concludere che w non è un predicato. Analogamente non esiste alcuna classe (concepita come totalità) formata da quelle classi che, pensate ognuna come totalità , non appartengono a se stesse. Concludo da questo che in certe situazioni una collezione de…nibile non costituisce una totalità. Sto …nendo un libro sui principi della matematica e in esso vorrei discutere la sua opera in tutti i dettagli. Ho già i suoi libri o li acquisterò presto, ma Le sarei molto grato se mi potesse inviare gli estratti degli articoli usciti su riviste. Nel caso non sia possibile, comunque, potrò averli da una biblioteca. La trattazione rigorosa della logica nelle questioni fondamentali, dove i simboli non sono suf…cienti, è rimasta molto indietro; nella sua opera ho trovato la migliore elaborazione del nostro tempo, e mi sono quindi permesso di esprimerle il mio profondo rispetto. Sono spiacente che Lei non abbia ancora pubblicato il secondo volume dei suoi Grundgesetze: spero tuttavia che ciò avvenga. Molto rispettosamente suo Bertrand Russell (Ho scritto a Peano di questo fatto, ma non ho ancora ricevuto risposta.)” Frege, che vide in tale antinomia il crollo del suo programma di riduzione della aritmetica alla logica, riduzione che passava attraverso un uso 137 sistematico dell”’estensione” dei concetti, espresse in questo modo la sua desolazione: ”A uno scrittore di scienza ben poco può giungere più sgradito del fatto che, dopo aver completato un lavoro, venga scosso uno dei fondamenti della sua costruzione. Sono stato messo in questa situazione da una lettera del signor Bertrand Russell, quando la stampa di questo volume stava per essere …nita. [...] Ma veniamo al fatto! Il signor Russell ha scoperto una contraddizione che ora esporrò. Nessuno vorrà asserire, della classe degli uomini, che essa è un uomo. Abbiamo qui una classe che non appartiene a se stessa. Dico infatti che qualcosa appartiene a una classe se questo qualcosa cade sotto un concetto, la cui estensione è proprio la classe stessa. Fissiamo ora il concetto: classe che non appartiene a se stessa! L’estensione di questo concetto, ammesso che se ne possa parlare, è, per quanto detto, la classe delle classi che non appartengono a se stesse. Vogliamo chiamarla brevemente la classe K. Chiediamoci ora se questa classe K appartenga a se stessa! Supponiamo in primo luogo che essa appartenga a se stessa. Se qualcosa appartiene a una classe, cade sotto il concetto la cui estensione è la classe in esame, di conseguenza, se la nostra classe appartiene a se stessa, allora é una classe che non appartiene a se stessa. La nostra prima supposizione conduce quindi a una contraddizione. Supponiamo, in secondo luogo, che la nostra classe K non appartenga a se stessa: in questo caso essa cade sotto il concetto di cui essa stessa rappresenta l’estensione, quindi appartiene a se stessa: qui di nuovo abbiamo una contraddizione!” 6.0.12 Assiomi di ZF Stante la contraddittorietà del concetto intuitivo di insieme legato al principio di comprensione, le teorie assiomatiche provvedono a de…nire implicitamente, mediante assiomi, ciò che è un insieme. La teoria di Zermelo-Fraenkel procede stabilendo, a partire dal vuoto, quali operazioni permettono di ottenere insiemi da insiemi. 138 CAPITOLO 6. LA TEORIA ASSIOMATICA DEGLI INSIEMI. Tali assiomi sono dei tentativi. Nessuno sa se sono consistenti o se invece da loro può esser ottenuta una contraddizione. Gli assiomi inizialmente posti da Zermelo nel 1908 sono stati via via modi…cati ed integrati, in primis da Skolem e Fraenkel nel 1922. Ad altri sistemi accenneremo in seguito. Bisogna comunque rimarcare che l’assiomatizzazione della teoria degli insiemi è qualcosa di dinamico, in quanto costituisce il punto di collegamento tra la matematica formalizzata e le idee intuitive, che sono comunque ‡uide. Linguaggio: LZF = f2g : Si osservi che non esistono, come simboli primari, le parentesi f e g : Le variabili indicano sempre insiemi: non esiste la proprietà ”essere elemento” ma la relazione ”essere elemento di”. Si osservi anche come gran parte degli assiomi (in particolare ZF2-ZF5), asserrendo l’esistenza di nuovi insiemi a partire da vecchi insiemi, di fatto predisponga le de…nizione di nuove operazioni (quelle tramite le quali si ottengono i nuovi insiemi) e nuove costanti. Ciò avviene, come descritto in § 4.1.4, mediante formule aperte. Si consideri la formula aperta '(x; y) = 8z(z 2 x ! z 2 y): Tale espressione esprime un simbolo relazionale binario e viene abbreviata con x µ y: Mentre per i simboli relazionali è su¢ciente una formula aperta, per i simboli funzionali bisogna anche dimostrare esistenza ed unicità (v. § 4.1.4). Alle dimostrazioni di unicità provvede il primo assioma: (ZF1) (Estensionalità) Due insiemi sono uguali sse hanno gli stessi elementi. 8x8y(8z(z 2 x $ z 2 y) ! x = y) Alle dimostrazioni di esistenza provvedono, volta per volta, assiomi speci…ci. Iniziamo, ovviamente, dal basso. (ZF2) (Insieme vuoto) Esiste un insieme privo di elementi. 9x8y:(y 2 x) 139 Si consideri la formula aperta '(x) = 8y:(y 2 x): Da ZF2 otteniamo 9x'(x) e, per ZF1, 8x8z('(x)^'(z) ! x = z): Abbiamo dunque esistenza ed unicità e dunque la '(x) esprime una funzione 0-aria, cioè una costante (si ricordi che una relazione n + 1 esprime una funzione n-aria). L’espressione '(x) viene abbreviata con ?: (ZF3) (Coppia) Dati due insiemi x ed y, esiste un insieme i cui unici elementi sono x ed y 8x8y9z8w(w 2 z $ (w = x _ w = y))) La formula de…nitoria è '(x; y; z) = 8w(w 2 z $ (w = x _ w = y))): Da ZF3 e ZF1 segue, dati x e y, l’esistenza e l’unicità di tale insieme z; e pertanto si giusti…ca l’introduzione di un simbolo funzionale f(x; y), che viene indicato con fx; yg : Se x = y la scrittura fx; xg viene abbreviata con fxg : (ZF4) (Unione) Dato un insieme x esiste un insieme i cui elementi sono elementi di elementi di x. 8x9y8z(z 2 y $ 9w(z 2 w ^ w 2 x) Considerazioni analoghe alle precedenti giusti…cano l’introduzione del simS bolo x: S (Attenzione: il simbolo indica una funzione unaria, ed non coincide S con l’usuale simbolo di grande unione come operazione n-aria: in e¤etti, x S corrisponde alla grande unione yi). A questo punto, l’usuale scrittura y i 2x S y [ z diventa una abbreviazione per fy; zg : Le usuali scritture di insiemi …niti tra parentesi gra¤e vengono poi ottenute in questo modo: fy; z; tg =def S fy1 ; :::; yn g =def ffy; zg ; ftgg e, ricorsivamente, S ffy1 ; :::; yn¡1g ; fyn gg : (ZF5) (Insieme potenza) Dato un insieme x esiste un insieme i cui elementi sono i sottinsiemi di x. 8x9y8z(z 2 y $ z µ x)) 140 CAPITOLO 6. LA TEORIA ASSIOMATICA DEGLI INSIEMI. Considerazioni analoghe alle precedenti giusti…cano l’introduzione del simbolo P(x): Vale che [ P(x) = x: S Infatti a 2 P(x) sse a 2 b 2 P(x) sse a 2 b µ x sse a 2 x. Invece abbiamo [ x µ P( x): S S Infatti a 2 x ! a µ x ! a 2 P( x): In questo caso nonSvale l’uguaglianza, S come mostra il seguente esempio: se x = ff?gg allora x = f?g e P( x) = f?; f?gg : (ZF6) (Separazione) Non è un assioma ma uno schema d’assioma (abbiamo un assioma per ogni formula '). Data una formula ben formata '(z) e dato un insieme x, esiste un insieme costituito dagli elementi di x che soddisfano ': 8x9y8z(z 2 y $ (z 2 x ^ '(z))) Tale insieme viene denotato con y = fz : z 2 x ^ '(z)g (si noti come tale principio costituisca un indebolimento del principio di comprensione, per il quale si avrebbe semplicemente y = fz : '(z)g ). In virtù degli assiomi ZF4 e ZF6 possiamo introdurre l’intersezione tra insiemi, de…nendola come un sottinsieme dell’unione. De…niamo dapprima l’operazione unaria n o \ [ x =def y : y 2 x ^ 8u(u 2 x ! y 2 u) (che, per gli assiomi citati, denota un insieme). Quindi poniamo \ y \ z =def fy; zg : Per quanto riguarda l’operazione di di¤erenza insiemistica abbiamo y ¡ z =def fw : w 2 y ^ :(w 2 z)g : (Come si ricorderà, nell’usuale linguaggio insiemistico il complementare di un insieme è riferito all’insieme universo U, spesso sottinteso, per cui zc =def U ¡ z: Tale operazione non ha senso nella teoria generale degli insiemi.) 141 Per poter de…nire il prodotto cartesiano abbiamo bisogno del concetto di coppia ordinata. Non disponiamo però di alcuna relazione d’ordine. Il problema è superato tramite il seguente Lemma 117 Se ffcg ; fc; dgg = ffag ; fa; bgg allora c = a e d = b: Dimostrazione. (Per comodità usiamo simboli linguistici nel metalinguaggio). Da ZF1 segue che ffcg ; fc; dgg = ffag ; fa; bgg ! ! (fcg = fag o fcg = fa; bg) e (fc; dg = fag o fc; dg = fa; bg) Ma (fcg = fag ! c = a) e (fcg = fa; bg ! c = a = b): Quindi, in ogni caso, c = a: Se fc; dg = fag allora fc; dg = fag ! c = d = a e quindi, in questo caso, ffcg ; fc; dgg = ffcgg ; e poiché fa; bg 2 ffcg ; fc; dgg, otteniamo fa; bg = fcg da cui risulta c = d = a = b: Rimane il caso fc; dg = fa; bg con c 6= d: Da d 2 fa; bg) segue d = a o d = b: Ma ((d = a _ d = b) ^ (c = a) ^ (c 6= d)) ! d = b: Dal lemma segue che l’insieme ffag ; fa; bgg si comporta come una coppia ordinata (a; b) (infatti, nella teoria ingenua, (c; d) = (a; b) sse c = a e d = b). Poniamo dunque (a; b) =def ffag ; fa; bgg : A questo punto possiamo de…nire il prodotto x£y. Supponiamo che a 2 x e b 2 y: Da (a; b) µ P(fa; bg) e da fa; bg µ x [ y segue (a; b) µ P(x [ y) e dunque (a; b) 2 P(P(x [ y)): Ed è su P(P(x [ y)) che applichiamo l’assioma ZF6: x £ y =def fz : z 2 P(P(x [ y)) ^ 9a9b(a 2 x ^ b 2 y ^ z = (a; b)g : (ZF7) (Rimpiazzamento. Anche in questo caso si tratta di uno schema d’assioma) Data una formula ben formata '(x; y) e dato un insieme w esiste un insieme v = fy : '(x; y) per un x 2 wg : Più precisamente: 8w9u8y(y 2 u $ (9x(x 2 w ^ '(x; y)) 142 CAPITOLO 6. LA TEORIA ASSIOMATICA DEGLI INSIEMI. Lo schema ZF7 è riferito a generiche formule in due variabili libere. Tuttavia basta limitarsi a quelle formule '(x; y) che de…niscono una funzione, cioè formule per cui, dato x vale l’esistenza e l’unicità di y (v. § 4.1.4). La lettura più intuitiva di ZF7 è dunque: l’immagine di un insieme mediante una funzione è a sua volta un insieme. ZF7 fu aggiunto da Fraenkel nel 1922, quando fu chiaro che ZF6 non era in grado di provvedere a costruzioni insiemistiche intuitivamente accettabili. ZF7 implica ZF6 (ponendo '(x; y) = ((x = y) ^ '(y)) ). Tuttavia l’assioma Z6 viene usualmente lasciato tra gli assiomi per la sua praticità di impiego. Si osservi ancora che ZF7 non implica che, data una formula '(x; y); tutte le coppie (x; y) che la soddisfano sia un insieme; implica solo che tutte le coppie (x; y) che soddisfano ' con x appartenente ad un dato insieme w sia un insieme. Di conseguenza, una formula che de…nisce una funzione non de…nisce una funzione tout court, ma de…nisce una funzione per ogni insieme w scelto come dominio. (ZF8) (In…nito) Esiste un insieme x tale che ; 2 x e tale che se y 2 x allora y [fyg 2 x: Il LZF , impiegando i concetti …nora de…niti, la formula è 9x(? 2 x ^ 8y(y 2 x ! y [ fyg 2 x)) (si noti come, tramite le nuove de…nizioni, il linguaggio sia divenuto più espressivo). (ZF9) (Fondatezza) Ogni insieme non vuoto x contiene un elemento y tale che x \ y = ;. 8x(9y(y 2 x) ! 9y(y 2 x ^ :9z(z 2 x ^ z 2 y))) Da questo assioma deriva l’inesistenza di catene di appartenenza in…nite discendenti. Supponiamo infatti che x contenga una catena discendente e sia z l’insieme degli elementi della catena. Tale z non soddisfa l’assioma, in quanto non esiste y 2 z tale che y \z = ?. Dall’assenza di catene discendenti deriva poi che, per ogni x, x 2 = x. 6.0.13 Assiomi di VNB Il sistema VNB (Von Neumann-Bernays) fu originariamente sviluppato da Von Neumann nel 1925 e in seguito modi…cato da Bernays e Goedel. La 143 maggiore di¤erenza da ZF consiste nel fatto che il Principio di comprensione, che permane, e denota classi. Ad evitare paradossi provvede la restizione che impedisce a certe classi (quelle troppo grandi) di appartenere ad altre classi. Si inserisce in tal modo una distinzione tra le classi: quelle che possono essere elementi di altre classi (chiamate insiemi) e quelle che non possono esserlo (chiamate classi proprie). LV NB = f2g : Dunque LV NB = LZF: Le variabili sono intese denotare classi e, tradizoinalmente sono indicate con lettere maiuscole. Il concetto ”X è un insieme”, indicato con M(X) viene de…nito nel modo seguente: M(X) =def 9Y (X 2 Y ): I quanti…catori variano su classi, per cui l’espressione ”per ogni insieme X vale '” diventa 8X(M(X) ! '(X)) Il principio di comprensione viene espresso in questa forma (attenzione all’uso delle parole ’classe’e ’insieme’): Assioma di comprensione. Sia '(x) una formula in cui i quanti…catori sono riferiti ad insiemi. Allora esiste una classe fX : M(X) ^ '(X)g composta da tutti gli insiemi che soddisfano ': Gli altri assiomi sono simili a quelli di ZF. L’assioma di estensionalità (corrispondente a ZF1) e quello di fondazione (corrispondente a ZF9) sono riferiti a classi, mentre gli assiomi del vuoto, della coppia, dell’unione, della potenza e dell’in…nito (corrispondenti a ZF2-5 e ZF8) sono riferiti ad insiemi. L’assioma di rimpiazzamento (corrispondente a ZF7) ha questa forma: dato un insieme u ed una funzione f (intesa come una classe di coppie ordinate tali che...) esiste un insieme v consistente in tutti gli y per i quali esiste x 2 u per cui (x; y) 2 f: Mostriamo ora come il Paradosso di Russel non si presenti più: Sia A = fX : M(X) ^ :(x 2 x)g : Ci domandiamo se A 2 A: Se A 2 A, allora A è un insieme e A 2 = A: Quindi (Consequentia Mirabilis) 144 CAPITOLO 6. LA TEORIA ASSIOMATICA DEGLI INSIEMI. A2 = A: (Ci dovremmo fermare qui. Ma proseguiamo perchè è la teoria che è in dubbio). Se A 2 = A, allora A non soddisfa una delle seguenti condizioni: (1) A è un insieme; (2) A 2 = A: Poiché quest’ultima vale per ipotesi, segue che A non è un insieme ed è dunque una classe propria. Abbiamo quindi accertato che A non è un insieme e A 2 = A: Nonostante la diversità di impostazione dei sistemi ZF e VNB, le due teorie sono equiconsistenti: Theorem 118 (Rosser-Wang, 1950) ZF è consistente sse lo è VNB. 6.0.14 L’Assioma di scelta Alcuni risultati nella teoria ingenua degli insiemi dipendono da quello che abbiamo chiamato Principio di scelta. Data la sua criticità, questo assioma viene considerato a parte e, eventualmente, aggiunto alle teorie. Tra parentesi quadre le modi…che per VNB (AC) Dato un insieme [classe] non vuoto x i cui elementi sono insiemi non vuoti a due a due disgiunti, esiste un insieme [clase] y che contiene uno ed un solo elemento per ciascuno degli elementi di x. (y è chiamato insieme [classe] di scelta per x). ZF + AC viene denotato con ZFC. Il fatto che si tratti di una aggiunta e¤ettiva è dimostrato dal seguente teorema: Theorem 119 Se ZF è consistente, allora ZF0AC. (Lo steso vale per VNB). ² Forme equivalenti alla scelta Si dimostra (relativamente ad entrambi i sistemi) che l’Assioma di scelta è equivalente a ciascuna delle seguenti proprietà: (AC’) Dato un insieme [classe] non vuoto x i cui elementi sono insiemi non vuoti esiste una funzione f tale che, per ogni a 2 x, f(a) 2 a: (f è de…nita funzione di scelta). 145 Lemma di Zorn: Se x è un insieme [classe] ordinato non vuoto tale che ogni catena in x ha un con…ne superiore, allora x contiene almeno un elemento massimale. Principio del Buon ordinamento. Dato un insieme [classe] x esiste una relazione R tale che (x; R) è un buon ordine. ² Alcuni risultati che richiedono l’assioma di scelta. Theorem 120 Se x è in…nito allora x è Dedekind in…nito. (La dimostrazione che abbiamo dato in Th. 11 impiega il Lemma 10 e dunque il Principio di Scelta. Si può dimostrare che tale impiego è necessario). Theorem 121 ( tricotomia) Dati due insiemi x; y, x ¹ y o y ¹ x: 6.0.15 Aritmetica in ZF La teoria T A dell’aritmetica può essere inglobata dalla teoria degli insiemi, che provvede a de…nirne i concetti primitivi e a dimostrarne gli assiomi. Ci riferiamo a ZF (un’analoga riduzione è possibile anche in VNB). La de…nizione dei numeri (postulata da P1 e P2), si basa sul fatto che ; e un insieme (ZF2) e, se x è un insieme, anche x [ fxg è un insieme (ZF3-4) e, per ZF9, è diverso da x. Possiamo quindi porre De…nition 122 0 =def ; e S(x) =def x [ fxg. Per ottenere l’insieme N (…nora abbiamo ottenuto soltanto i suoi elementi), si procede in questo modo: De…nition 123 Un insieme x è induttivo se soddisfa la seguente formula: Ind(x) =def (? 2 x ^ (y 2 x ! S(y) 2 x)): 146 CAPITOLO 6. LA TEORIA ASSIOMATICA DEGLI INSIEMI. Per l’Assioma dell’in…nito, esiste un insieme induttivo e, per de…nizione, ogni insieme induttivo include tutti i numeri naturali. Problema: esiste un insieme costituito da tutti e soli i numeri naturali? Lemma 124 Se v è un insieme i cui elementi sono insiemi induttivi allora T v è un insieme induttivo. T Dimostrazione. Ogni y di v contiene il ;: Quindi ? 2 v: Inoltre, se T z 2 v alloraT8y(y 2 v ! z 2 y), da cui segue 8y(y 2 v ! S(z) 2 y) e quindi S(z) 2 v: Theorem 125 Esiste un insieme induttivo che è sottinsieme di ogni insieme induttivo. Dimostrazione. Sia x un qualnque insieme induttivo (per ZF8 un tale x esiste). Per ZF5 e ZF6 esiste v = fu : u 2 P(x) ^ Ind(u))g T e, ancora per ZF8, non è vuoto. Per il Lemma 101, v è induttivo. DiT mostriamo che v è l’insieme cercato. Sia z un qualunque insieme induttiT vo. Allora, ancora per il Lemma 101, x \ z ( = T fx; zg) è induttivo. Ma T x \ z 2 P(x): Dunque x \ z 2 v; da cui seguono v µ x \ z e v µ z: T Pertanto v è contenuto in ogni insieme induttivo. Indichiamo tale insieme con !: Dunque: != f0; 1; 2; :::g : Theorem 126 Gli assiomi di Peano sono dimostrabili in ZF relativamente all’insieme !: Dimostrazione. (P1 ) 0 2 !: (Infatti, 0 = ? e ! è induttivo.) (P2 ) x 2 ! ! S(x) 2 !: (Infatti, ! è induttivo.) 147 (P3) x 2 ! ! S(x) 6= 0: (Infatti, per ogni x, x 2 S(x). Quindi S(x) 6= ?; cioè 0.) (P4) (x 2 ! ^ y 2 ! ^ S(x) = S(y)) ! x = y: (Infatti, (S(x) = S(y) ^ x 2 S(x)) ! x 2 S(y): Quindi x 2 y o x = y. In modo analogo y 2 x o y = x. Ma x 2 y e y 2 x insieme contraddicono ZF9. Quindi x = y (e dunque, sempre per ZF9, non valgono né x 2 y né y 2 x). (P5) (y µ ! ^ ? 2 y ^ (x 2 y ! S(x) 2 y)) ! y = !: (Infatti, ? 2 y ^ (x 2 y ! S(x) 2 y) implica Ind(y). Quindi, per Th. 102, ! µ y, che, insieme all’ipotesi y µ !, implica y = !: Si osservi che il Principio di Induzione viene dimostrato proprio nella forma P5, cioè riferendosi ad un generico sottinsieme y di !, e non nella forma AA7. In ZF è dimostrabile anche il Principio di Recursione che, riferito ad !, assume questa forma: Theorem 127 ( Teorema di recursione su !). Sia '(x; y) una formula di ZF che de…nisce una funzione, cioè tale che 8x91 y'(x; y). Allora, per ogni insieme a, esiste una unica funzione f di dominio ! tale che f(0) = a e '(f(n); f(S(n))) vale per ogni n: Si osservi che, essendo ' una formula che determina una funzione, possiamo scrivere '(x; y) come y = g(x) ed avere la recursione nella forma canonica f(0) = a f(S(n)) = g(f(n)): Tra i motivi che hanno portato all’introduzione dell’assioma di rimpiazzamento ZF7 al posto dell’assioma di isolamento ZF6, vi è stata l’impossibilità di considerare come insiemi scritture del tipo fa; P(a); P(P(a)); :::g 148 CAPITOLO 6. LA TEORIA ASSIOMATICA DEGLI INSIEMI. dove a è un insieme. Mediante il Teorema di recursione e ZF7 ciò diventa possibile. Infatti, prendendo '(x; y) come y = P(x), otteniamo che esiste una funzione f di dominio ! tale che f(0) = ! e f(S(n)) = P(f(n)) vale per ogni n: L’immagine di questa funzione è fa; P(a); P(P(a)); :::g e, per ZF7, tale immagine è un insieme. 6.0.16 Ancora ordinali e cardinali Ottenuto l’insieme ! possiamo, tramite ZF3-4, ottenere gli insiemi S(!), S(S(!)), ..., cioè tutti gli ordinali ! + n: Per gli ordinali limiti dobbiamo impiegare il Teorema di recursione su !: Theorem 128 !2 è un insieme. Dimostrazione. Sia '(x; y) la formula y = S(x): Allora, per il Teorema di redursione du !, esiste una funzione f di dominio ! tale che f(0) = a e, per ogni mn; f(S(n)) = S(f(n)): L’immagine di questa funzione è S f!; S(!); S(S(!)); :::g che, per ZF7, è un insieme. Per ZF4, f!; S(!); S(S(!)); :::g, cioè !2, è un insieme. In modo analogo si dimostra che ogni ordinale successore (di un ordinale che abbiamo già dimostrato essere un insieme) e ogni ordinale limite (di ordinali che abbiamo già dimostrato essere insiemi) sono insiemi. Il contenuto dei §. 1.2 e 3.2.4 può essere dunque trasferito in ZF. In ZF vale inoltre che Theorem 129 Non esiste l’insieme di tutti gli ordinali. Dimostrazione. Supponiamo S per assurdo che esista l’insieme X di tutti gli ordinali. Allora, per ZF3, X è un insieme e, per il Teorema 51, è anche S un ordinale. Sia ® = S( X), i.e., n[ o [ ®= X[ X : Dunque, anche ® è un insieme ed un ordinale e dunque ® 2 X: Allora ® µ S entrambi ordinali, dal Teorema 43(5) segue che ® 2 S X e dunque, essendo S X oppure ® = X: In entrambi i casi ® 2 ®, contro ZF9. 149 Pertanto, in ZF non esiste l’insieme di tutti gli ordinali. In VNB esiste la classe di tutti gli ordinali (indicata on On). E’de…nita mediante l’Assioma di comprensione. Non è un insieme (come dimostrato dal teorema precedente). E’dunque una classe propria. Siamo ora in grado di dimostrare il risultato fondamentale che abbiamo enunciato all’inizio del corso. Theorem 130 Sia (X; R) un insieme ben ordinato. Esiste (ed è unico) un ordinale ® isomorfo ad (X; R): Tale ordinale viene indicato con ord(X; R): Dimostrazione. L’unicità deriva dal Teorema 43(3). Dimostriamo l’esistenza. Sia X in insieme ben ordinato e ® un ordinale. Per il Teorema 41, oX» =®,oX » = ®y , per un certo y 2 ® , o ® » = Xz per un certo z 2 X: Nel primo caso il teorema è dimostrato. Così pure nel secondo, considerato il Teorema 43(1bis). Supponiamo per assurdo che, per ogni ®, non valgano i primi due casi. Allora, per ogni ordinale ® esiste z 2 X tale che ® » = Xz : Sia Z l’insieme (tale è per ZF6) degli elementi z 2 X tali che Xz è isomorfo ad un ordinale e sia '(x; y) la formula che esprime il seguente concetto: x 2 Z e y l’ordinale isomorfo ad x. Per ZF7, f® : 9z(z 2 Z ^ '(z; ®)g è un insieme, ed è l’insieme di tutti gli ordinali. Ciò contraddice il teorema precedente. Nella teoria ingenua degli insiemi non abbiamo de…nito rigorosamente i numeri cardinali, ma solo la relazione avere uguale (o maggiore) cardinalità, lasciando il concetto di cardinale nella forma vaga di ”ciò che hanno in comune insiemi equinumerosi”. Ora, nella teoria assiomatazzata, possiamo de…nire i cardinali come particolari ordinali. De…nition 131 Un ordinale in…nito ® è detto ordinale iniziale (oppure un aleph) se non è equinumeroso a nessun ordinale minore. De…nition 132 Un ordinale ® è un cardinale se è …nito oppure è un ordinale iniziale. ! è il minimo ordinale iniziale e, come cardinale, viene denotato con @0: Il teorema successivo mostra l’esistenza (in ZF) di insiemi cardinalità non numerabile. 150 CAPITOLO 6. LA TEORIA ASSIOMATICA DEGLI INSIEMI. Theorem 133 Per ogni ordinale ® esiste un cardinale ¯ tale che ® < ¯: Dimostrazione. Se ® è un ordinale …nito, S(®) e …nito, dunque cardinale, e ® < S(®): Supponiamo che ® sia in…nito. Dimostriamo prima che la classe degli ordinali ° tali che ° ¹ ® è un insieme. Sia '(R) la formula di ZF che esprime la proprietà ”R è un b.o. su un insieme X µ ®”. Per l’assioma di isolamento (ZF6) esiste l’insieme W = fR : R 2 P(® £ ®) ^ '(R)g : (6.1) Sia Ã(R; °) la formula di ZF che esprime la seguente relazione: ”'(R) e (° è un ordinale) e (ord(X; R) = °). Allora, per ZF7, l’immagine di W mediante la funzione determinata da '(R; °) è un insieme, ed è l’insieme cercato; lo indichiamo con D: Dunque D = f° : ° è un ordinale e ° ¹ ®g : S S Per il Teorema 51, D è un ordinale, e per il Teorema 48 ± = S( D) è un ordinale maggiore di ogni ordinale in D: Quindi ± 2 = D e non ± » ®: Pertanto l’insieme di ordinali E = f° : ® < ° · ± ^ :(° » ®)g 6= ; e dunque ammette minimo ¯: ¯ è un cardinale (in quanto se fosse biettivo ad un ordinale minore di lui, dovrebbe essere biettivo ad ®) e ® < ¯: Theorem 134 Ad ogni ordinale ® può essere associato un cardinale @® tale che ° < ® < ¯ implica @° < @® < @¯ : Dimostrazione. Per induzione trans…nita: @0 = ! @S (° ) = S il minimo cardinale maggiore di @° ; S @¸ = f@° : ° < ¸g, per ogni ordinale limite ¸:( f@° : ° < ¸g e un cardinale, in quanto è il minimo ordinale maggiore ad @° : ° < ¸:) @(x) si comporta quindi cme una funzione dalla classe degli ordinali alla classe dei cardinali, e rispetta l’ordine. Il seguente risultato impiega l’assioma di scelta. 151 Theorem 135 Dato un insieme X, esiste un numero cardinale biettivo ad X. Dimostrazione. Sia X un insieme. Per l’assioma di scelta (nella forma del buon ordinamento), esiste una relazione R tale che (X; R) è un insieme ben ordinato. Per il Teorema 107, esiste un ordinale ® isomorfo a (X; R): Pertanto l’insieme (perché tale è) degli ordinali biettivi ad X e minori od uguali ad ® non è vuoto. Per il Lemma 49, tale insieme è ben ordinato da µ (cioè ·) e quindi ammette minimo. Questo minimo ordinale è un cardinale. Viene indicato con Card(X) A questo punto possiamo tradurre formalmente le operazioni cardinali, che ripetiamo, considerando però i cardinali come particolari ordinali e quindi come insiemi: ® +c ¯ = Card((® £ f0g) [ (¯ £ f1g) ® ¢c ¯ = Card(® £ ¯) ¯® = Card(¯® ) dove fuori parentesi intendiamo l’esponenziazione cardinale e dentro parentesi l’insieme delle funzioni da ® a ¯ (per evitare possibili equivoci, talvolta l’esponenziazione cardinale si indica con exp(¯; ®): Supponendo la tricotomia (e quindi AC), abbiamo: Theorem 136 Se ® e ¯ sono cardinali non nulli di cui almeno uno in…nito allora ® +c ¯ = ® ¢c ¯ = max(®; ¯) Essendo ciascun cardinale un ordinale, tra di essi si possono eseguire sia le operazioni ordinali che quelle cardinali. I risultati, in genere, non coincidono. Ad esempio: ® +c ® = ® mentre ® +o ® = ®2 6= ®: Chiaramente, ®2 non è un cardinale, il che mostra che l’insieme dei cardinali non è chiuso rispetto alla 152 CAPITOLO 6. LA TEORIA ASSIOMATICA DEGLI INSIEMI. somma ordinale. Lo stesso accade per il prodotto: ® ¢c ® = ® mentre ® ¢o ® = ®2 6= ®: In entrambi i casi, tuttavia, i due ordinali ottenuti come risultato sono biettivi tra loro (hanno lo stesso cardinale). Nel caso dell’esponenziazione non accade più neppure questo. Infatti, ad esempio, l’esponenziazione ordinale !! è numerabile, mentre quella cardinale è più che numerabile. 6.0.17 Ipotesi del continuo Sappiamo (Corollario 32) che 2@0 = @ e (Th. di Cantor) che @0 < @: Il problema è: quale indice ha il cardinale @: CH (Ipotesi del continuo): 2@0 = @1 GCH (Ipotesi del continuo generalizzato): per ogni ordinale ®; 2@® = @®+ 1: Theorem 137 (Goedel 1938) Se ZF è consistente allora ZF+GCH è consistente. Theorem 138 ZF+GCH`AC. Theorem 139 (Cohen 1963) Se ZF è consistente, allora ZFC0CH (e quindi ZFC0GCH). Pertanto, per il Teorema di Cohen, se vogliamo posizionare @ dobbiamo aggiungere un assioma.