1 prova - Dipartimento di Ingegneria dell`informazione e scienze

1
prova
3
prova
5
prova
Capitolo 1
Primi risultati su cardinali e
ordinali
De…nition 1 Un insieme è …nito se è vuoto oppure è biettivo ad un numero
naturale. Altrimenti è in…nito.
De…nition 2 Due insiemi A e B sono equinumerosi (in simboli A » B) se
esiste una biezione tra loro.
Theorem 3 La relazione » è una relazione di equivalenza.
Theorem 4 Sia f una funzione da A a B. f è biettiva se e solo se, per ogni
X µ A, (f [X])c = f [X c ] : (Il complemento dei sottinsiemi di A è inteso
rispetto ad A; cioè X c = A¡X; il complemento dei sottinsiemi di B è inteso
rispetto a B).
Dimostrazione. ()) Per de…nizione, dato X µ A,
(f [X])c = fy 2 B : :9x 2 X f(x) = yg
f [Xc ] = fy 2 B : 9x 2 X c f(x) = yg
Mostriamo che (f [X])c µ f [X c] : Sia y 2 (f [X])c : Allora, poiché non esiste
x 2 X tale che f(x) = y deve esistere, essendo f suriettiva, x 2 X c tale che
f(x) = y: Quindi y 2 f [Xc ] :
Mostriamo ora che f [X c ] µ (f [X])c : Sia y 2 f [X c ] : Poiché esiste x 2 Xc
tale che f(x) = y, non può esistere, essendo f iniettiva, x0 2 X tale che
f(x0 ) = y. In tal modo y 2 (f [X])c :
7
8
CAPITOLO 1. PRIMI RISULTATI SU CARDINALI E ORDINALI
(() Supponiamo che f non sia biettiva. Allora è non suriettiva o non iniettiva. Se non è suriettiva allora esiste y 2 B tale che non esiste x 2 A per
c
cui f(x) = y: Sia X un qualunque sottinsieme di A. Risulta che y 2 (f [X])
ma y 2
= f [X c] : Se invece f non è iniettiva allora esistono x1 ; x2 2 A tali
che f(x1 ) = y = f(x2 ): Sia X = fx1 g : Abbiamo che y 2
= (f [X])c in quanto
f(x1 ) = y; mentre y 2 f [X c] in quanto x2 2 Xc e f(x2) = y:
Remark 1 Si osservi come il precedente risultato equivalga a dire che f è
biettiva sse la funzione © : P(A) ! P (B) tale che ©(X) = f [X] è un
isomor…smo tra le strutture (P (A);c ) e (P (B);c ) :
De…nition 5 Un insieme A è immergibile in un insieme B (in simboli A ¹
B) se esiste una funzione iniettiva da A a B.
Scriviamo A Á B se A ¹ B e non A » B: Chiaramente, la relazione ¹ è
ri‡essiva e transitiva.
De…nition 6 Una funzione F da P (A) a P (A) è monotona rispetto a µ se,
per ogni X; Y µ A
se X µ Y allora F (X) µ F(Y ):
Lemma 7 Se una funzione F da P (A) a P (A) è monotona allora ammette
almeno un punto …sso, cioè se esiste X 2 P(A) tale che F (X) = X:
Dimostrazione. Sia
Z = fX 2 P (A) : F (X) µ Xg
L’insieme Z è non vuoto, dal momento che A 2 Z: Sia dunque
\
T=
X
X2Z
Mostriamo che T è un punto …sso. Per ogni X 2 Z; vale T µ X; da cui, per
monotonia, segue F (T ) µ F (X): Da questo segue, essendoT
F (X) µ X, che
per ogni X 2 Z vale F (T ) µ X: Ciò implica che F(T) µ
X e, essendo
X 2Z
T il più grande insieme contenuto in tutti gli X di Z; F(T ) µ T: Da ciò,
per la monotonia
T di F , segue F (F (T )) µ F (T ); dunque F(T) 2 Z: Quindi,
essendo T =
X; abbiamo anche T µ F (T ); e …nalmente F(T) = T:
X2Z
9
Theorem 8 ( Cantor-Bernstein). Siamo A e B due insiemi. Se A ¹ B e
B ¹ A allora A » B:
Dimostrazione. (Il complemento dei sottinsiemi di A è inteso rispetto ad
A; cioè X c = A¡X; lo stesso per B). Sia f una iniezione da A a B e g una
iniezione da B ad A: De…niamo la seguente funzione F da P(A) a P (A):
c
F(X) = (g [(f [X])c])
Dimostriamo che F è monotona rispetto a µ. Siano X1; X2 2 P (A). Se
X1 µ X2 allora f [X1 ] µ f [X2] ; (f [X2 ])c µ (f [X1])c ; g [f [X2 ]c] µ
c
c
g [f [X1]c ] ; (g [f [X1 ]c ]) µ (g [f [X2]c]) ; F(X1 ) µ F (X2) :
Dunque (v. Lemma 7) F ha almeno un punto …sso, cioè esiste X 2 P(A)
c
tale che (g [(f [X])c]) = X: Quindi
(¤) X c = g [(f [X])c]
Impieghiamo il punto …sso X possiamo de…nire la biezione h:
Essendo g iniettiva, g ¡1(x) è una funzione iniettiva (avente per dominio
g [B]) ; da (¤) segue che X c µ g [B] e dunque g¡1
=X c è iniettiva. A questo
punto de…niamo la funzione h da A a B in questo modo:
h(x) =
f(x) se x 2 X
g¡1 (x) se x 2 Xc
Dimostriamo che h è una biezione. Iniziamo mostrando che h è iniettiva. Se
x1; x2; con x1 6= x2; appartengono entrambi ad X o entrambi a Xc allora,
essendo f e g¡1 iniettive, h(x1) 6= h(x2 ): Consideriamo quindi il caso in cui
x1 2 X e x2 2 X c . Da x1 2 X e h(x1 ) = f(x1) segue che h(x1 ) 2 f [X] :
Invece, da x2 2 Xc segue, per (¤); che esiste y 2 (f [X])c tale che g(y) = x2 ;
dunque essendo g ¡1 (x2 ) = y e h(x2 ) = g¡1 (x2 ), abbiamo h(x2 ) 2 (f [X])c :
Dunque h(x1 ) 6= h(x2 ): Mostriamo in…ne che h è suriettiva. Sia y 2 B.
Allora g(y) 2 A: Se g(y) 2 X allora g(y) 2
= Xc , per cui da (¤) segue che
c
g(y) 2
= g [(f [X]) ] e quindi y 2 f [X] ; y 2 h [X] e y 2 h [A] ; se g(y) 2 X c
allora, per come h è stata de…nita, h(g(y)) = g¡1 (g(y)) = y; per cui, anche
in questo caso y 2 h [A].
(Attenzione: è presto per dire che, per ogni A; B, una tra A ¹ B e B ¹
A vale. La dimostrazione di questa proprietà, detta Tricotomia, richiederà
l’assioma di scelta v. Th.121).
10
CAPITOLO 1. PRIMI RISULTATI SU CARDINALI E ORDINALI
De…nition 9 Un insieme A è numerabile se A » N. Un insieme A è
contabile se è …nito oppure numerabile.
Lemma 10 Ogni insieme in…nito contiene un sottinsieme numerabile.
Dimostrazione. Impieghiamo una forma intuitiva del Principio di scelta;
supponiamo cioè che, dato un qualunque insieme non vuoto A, esista una
funzione f : (P (A) ¡ f?g) ! A tale che, per ogni X µ A, f(X) 2 X:
Supponiamo dunque che A sia in…nito e di disporre di una tale funzione f.
De…niamo una successione a0; a1 ; a2 ; ::: di elementi di A in questo modo:
a0 = f(X) (cioè, a0 è scelto in X); a1 = f(X ¡ fa0 g); a2 = f(X ¡
fa0; a1 g); ::: : Siccome A è in…nito, an esiste per ogni n 2 N; e dunque
fa0; a1 ; a2 ; :::g è un sottinsieme numerabile di X:
Theorem 11 Un insieme A è in…nito sse esiste B ½ A tale che B » A
(cioè se è in…nito nel senso di Dedekind):
Dimostrazione. ()) Per il Lemma precedente A contiene un sottinsieme
numerabile D = fa0; a1 ; :::g : Sia B = A ¡ fa0g : La funzione f : A ! B tale
che
½
a se a 2
=D
f(a) =
an+1 se a = an
è biettiva.
(( ) Per contronominale. Se jAj = n allora il risultato segue dal Pigeon-hole
Principle: se ci sono m nidi e n piccioni, come m < n, allora in almeno un
nido stanno almeno due piccioni.
Theorem 12 Le seguenti espressioni sono equivalenti:
(1) A è non vuoto e contabile.
(2) Esiste una funzione iniettiva da A ad N:
(3) Esiste una funzione suriettiva da N ad A:
Dimostrazione. (1) ) (2). Se A = fa1; :::; an g allora la funzione f(ai ) = i
è una iniezione da A ad N. Se A è in…nito (e contabile) allora, per de…nizione,
esiste una biezione g da A ad N.
(2) ) (1). Sia h una iniezione da A ad N. Dunque A è biettivo ad h [A], che
essendo un sottinsieme di N, è contabile. Dunque A è contabile.
(2) ) (3). Sia f l’iniezione da A ad N: Dunque f è una biezione da A a f[A]
11
e f ¡1 è una biezione da f[A] ad A. Si scelga un elemento a 2 A. La funzione
g da N ad A tale che
½ ¡1
f (n) se n 2 f [A]
g(n) =
a se n 2
= f [A]
è suriettiva.
(3) ) (2). Sia g una suriezione da N ad A. La funzione f da A ad N tale
che
f(a) = min fn : g(n) = ag
è iniettiva.
Theorem 13 L’unione di due insiemi contabili è contabile.
Dimostrazione. Siano f : N ! A e g : N ! B funzioni suriettive (la
cui esistenza è data dal Th. precedente). Si consideri la seguente funzione
h : N ! A [ B:
½
f(k) se n = 2k (k 2 N)
h(n) =
g(k) se n = 2k + 1 (k 2 N)
h è suriettiva (per ogni k 2 N, h(2k) = f(k) e h(2k + 1) = g(k)) e quindi
A [ B è contabile.
Corollary 14 Z è numerabile (infatti Z = N+ [ f0g [ f¡n : n 2 Ng :
Theorem 15 L’unione di un insieme numerabile di insiemi contabili è numerabile.
S
Dimostrazione. Sia A = i2N Ai e sia fi : N ! Ai suriettiva. De…niamo
f : N ! A come segue: f(0) = f0(0) mentre, per n > 0, scriviamo n nella
forma n = 2k ¢ 3l ¢ m con m non è divisibile per 2 o per 3. Per l’unicità di
scomposizione in fattori primi k ed l sono univocamente determinati per cui
possiamo univocamente porre f(n) = fk (l): La funzione f è suriettiva. Sia
infatti x 2 A: Allora x 2 Ai per qualche i 2 N: Dunque x = fi(r) per qualche
r 2 N, e quindi x = f(2 i ¢ 3r ):
Theorem 16 Q+ è numerabile.
12
CAPITOLO 1. PRIMI RISULTATI SU CARDINALI E ORDINALI
n
o
Dimostrazione. Dal teorema precedente, ponendo Ai =
:q2N .
+
p
q
Oppure: si consideri f : Q ! N tale che f(x) = 2 ¢ 3 dove x = pq e p; q
sono coprimi. f è iniettiva.
i
q
Corollary 17 Q è numerabile bile (infatti Q = Q+ [ f0g [ Q¡ ):
Theorem 18 Il prodotto cartesiano di un insieme …nito di insiemi contabili
è contabile.
Dimostrazione. Siano f1 : A1 ! N e.... fn : An ! N funzioni iniettive.
Sia h : A1 £ ::: £ An ! N così de…nita:
h(a1; :::; an ) = 2f 1(a1 ) ¢ ::: ¢ pn fn (an )
dove pn è l’n¡esimo numero primo. Dal il Teorema di unicità di scomposizione in fattori primi e dall’iniettività di ogni fi segue che h è iniettiva.
Theorem 19 (Teorema di Cantor). Non esiste una funzione suriettiva da
A a P (A).
Dimostrazione. Supponiamo per assurdo che esista una funzione suriettiva f da A a P (A): De…niamo il seguente insieme X :
X = fa 2 A : a 2
= f(a)g :
X è un sottinsieme di A e quindi appartiene a P(A): Dall’ipotesi che f sia
suriettiva segue che esiste a 2 A tale che f(a) = X: Ci chiediamo se a 2 X e
mostriamo che ciascuna delle due possibili risposte implica la sua negazione.
Se la risposta è positiva, cioè se a 2 X; allora, per de…nizione di X, a 2
= f(a);
ed essendo f(a) = X; segue che a 2
= X; quindi (a 2 X) ! (a 2
= X) :
Se la risposta è negativa, cioè se a 2
= X allora, per de…nizione di X, a 2 f(a);
ed essendo f(a) = X; segue che a 2 X; quindi (a 2
= X) ! (a 2 X) :
Dunque, dall’ipotesi che esista a tale che f(a) = X segue (a 2
= X) $ (a 2 X) ;
che è una contraddizione. Non esiste quindi una funzione suriettiva da A a
P (A):
De…nition 20 Diciamo che un insieme A è più che numerabile (o non
numerabile) se è in…nito e non numerabile, cioè se è in…nito e non A » N:
Lemma 21 Se I è un intervallo limitato di R allora I » R.
1.1. CARDINALI
13
Dimostrazione. Supponiamo dapprima che I sia un intervallo aperto
(a; b): La funzione lineare f tale che f(a) = ¡ ¼2 e f(b) = ¼2 è una biezione da (a; b) a (¡ ¼2 ; ¼2 ) : La funzione tan è una biezione da (¡ ¼2 ; ¼2 ) a R.
Quindi tan(f(x)) è una biezione da (a; b) ad R. Supponiamo ora che I non
sia aperto. Allora contiene un intervallo aperto J. Da J ¹ I e R » J segue
R ¹ I: Ma da I µ R segue I ¹ R. Per il Teorema di Cantor-Bernstein
I » R:
Theorem 22 R » P(N) (dunque R è più che numerabile).
Dimostrazione. Dimostriamo [0; 1) » P (N) (da cui, per il Lemma 21,
segue il risultato). La funzione f : P (N) ! [0; 1) tale che, per ogni X µ N,
f(X) = 0:a0 a1 a2:::
½
0 se i 2
=X
è iniettiva. Quindi P(N) ¹ [0; 1). Viceversa,
1 se i 2 X
sappiamo che ogni x 2 [0; 1) può essere espresso in uno ed un sol modo in
forma decimale x = 0:a0a1a2:::, con 0 · ai · 9, che non termina con una
sequenza in…nita di 9. De…niamo g : [0; 1) ! P (N) come segue:
©
ª
g(x) = ai ¢ 10i : i 2 N :
dove ai =
g è iniettiva e dunque [0; 1) ¹ P (N): Per il Teorema di Cantor-Bernstein,
[0; 1) » P (N):
1.1
Cardinali
De…nition 23 Due insiemi A e B hanno la stessa cardinalità se esiste una
biezione tra loro. In simboli:
Card(A) = Card(B) se A » B:
In tal modo, indirettamente, intendiamo un numero cardinale come ciò
che insiemi di ugual cardinalità hanno in comune. Dal punto di vista intuitivo
possiamo intendere ciascun cardinale come una classe di equivalenza, i.e:
Card(X) = [X]» = fY : Y » Xg :
Tuttavia questa strada non può essere perseguita formalmente in quanto,
come vedremo, conduce a contraddizione.
14
CAPITOLO 1. PRIMI RISULTATI SU CARDINALI E ORDINALI
De…nition 24 Diciamo che la cardinalità di A è minore o uguale alla cardinalità di B se esiste una iniezione da A a B: In simboli:
Card(A) · Card(B) se A ¹ B:
Intendendo ciascun cardinale (intuitivamente) come una classe di equivalenza, allora · è una relazione d’ordine. Ovviamente è ri‡essiva e transitiva. L’antisimmetria è data dal Teorema di Cantor-Bernstein. Infatti se
Card(A) · Card(B) e Card(B) · Card(A) allora A ¹ B e B ¹ A; da cui
segue A » B e quindi Card(A) = Card(B).
Per ora, attribuiamo un simbolo speci…co solo a due tipi di cardinalità
in…nite:
se A » N allora scriviamo Card(A) = @0 ;
se A » P(N) allora scriviamo Card(A) = @:
Alcuni dei teoremi precedenti possono essere riscritti in questo nuovo
linguaggio:
² Card(Z) = Card(Q) =@0:
² Card(A) < Card(P (A)) (Cantor)
² Card(R) =@:
Lemma 25 Siano A; B; C; D insiemi tali che A » C e B » D: Valgono
(1) A £ B » C £ D;
(2) se A \ B = C \ D = ? allora A [ B » C [ D:
Dimostrazione. Siano f : A ! C e g : B ! D biezioni. (1) La funzione
h : A £ B ! C £ D tale che
h(x; y) = (f(x); g(y))
è una biezione. (2) La funzione h : A [ B ! C [ D tale che
½
f(x) se x 2 A
h(x) =
g(x) se x 2 B
è una biezione.
1.1. CARDINALI
15
Il lemma precedente rende ben de…nite le seguenti operazioni:
De…nition 26
Card(A) ¢ Card(B) = Card(A £ B):
Se A \ B = ?allora
Card(A) + Card(B) = Card(A [ B)
Theorem 27 Somma e prodotto sono associativi, commutativi e il prodotto
è distributivo rispetto alla somma.
Dimostrazione. Ci limitiamo alla distributività. Card(A) ¢ (Card(B) +
Card(C)) = Card(A £ (B [ C)): Ma (A £ (B [ C)) = (A £ B) [ (A £ C);
e da B \ C = ; seguono (A £ B) \ (A £ C) = ; e Card((A £ B) [ (A £
C)) = Card(A)Card(B) + Card(A)Card(C): Pertanto Card(A)(Card(B) +
Card(C)) = Card(A)Card(B) + Card(A)Card(C):
Siano A; B due insiemi. Con la scrittura BA intendiamo l’insieme delle
funzioni da A a B.
Lemma 28 Dati A; B; C; D, se A » C e B » D allora BA » DC : (La
dimostrazione è lasciata per esercizio).
Il lemma precedente rende ben de…nita la seguente operazione:
De…nition 29
Card(B)Card(A) = Card(BA ):
Lemma 30 Per ogni A,
P (A) » f0; 1gA :
Dimostrazione. La funzione
f(B) = gB
che associa ad ogni B µ A la sua ½
funzione caratteristica gB , cioè la funzione
1 se x 2 B
gB : A ! f0; 1g tale che gB (x) =
, è una biezione.
0 se x 2
=B
16
CAPITOLO 1. PRIMI RISULTATI SU CARDINALI E ORDINALI
Ponendo Card(f0; 1g) uguale a 2 abbiamo:
Theorem 31 Per ogni A
Card(P (A)) = 2C ard(A) :
A
Dimostrazione. Per il Lemma 30 Card(P (A)) = Card(f0; 1g ) e dunque,
per de…nizione, Card(P(A)) = Card(f0; 1g)Card(A) :
Corollary 32 2@0 = @:
Corollary 33 @0 < 2@0 < 22
1.2
@0
< 22
2@ 0
< ::: :
Ordinali
De…nition 34 Una relazione R su un insieme x è un buon ordine se R
è una relazione d’ordine su x e ogni sottinsieme non vuoto di x ammette
minimo rispetto ad R, i.e., se
8y(y µ x ^ y 6= ? ! 9z(z 2 y ^ 8w(w 2 y ! zRw))):
Nel seguito, indicheremo spesso R con · : L’impiego dei simboli <; ¸; >
sarà standard.
Theorem 35 Un buon ordine è un ordine totale.
Dimostrazione. Siano y; z 2 x: Allora fy; zg µ x e dunque fy; zg ha
minimo.
De…nition 36 Un insieme ben ordinato è una coppia (x; ·) dove · è un
buon ordine su x.
De…nition 37 Una biezione © da un insieme ordinato (x; ·1) a un insieme
ordinato (y; ·2) è un isomor…smo se rispetta l’ordine, i.e. tale che, per
ogni a; b 2 x;
a ·1 b sse ©(a) ·2 ©(b):
(Nel seguito ometteremo gli indici). Naturalmente, se (x; ·) è un buon ordine
e (y; ·) è isomorfo a (x; ·); allora anche (y; ·) è un buon ordine.
1.2. ORDINALI
17
De…nition 38 Sia (x; ·) un insieme ben ordinato e a 2 x: Il segmento
iniziale di x determinato da a è
xa = fy : y 2 x ^ y < ag :
Lemma 39 Sia (x; ·) un insieme ben ordinato.
(1) Sia y µ x tale che, per ogni b 2 y, xb µ y. Allora y = x o y è un
segmento iniziale di x.
(2) Se f : x ! x è iniettiva e rispetta l’ordine (cioè è un isomor…smo da x
ad un suo sottinsieme) allora, per ogni a 2 x, vale a · f(a):
(3) L’unico automor…smo su (x; ·) è l’identità.
(4) (x; ·) non può essere isomorfo ad un suo segmento iniziale.
Dimostrazione. (1) Supponiamo y 6= x e sia u = min(x¡y): Dimostriamo
y = xu: Chiaramente, essendo u = min(x ¡ y); abbiamo xu µ y: Dobbiamo
allora dimostrare y µ xu : Supponiamo per assurdo che esista un b tale che
b 2 y ¡ xu: Essendo · un ordine totale, da b 2
= xu (i.e. :(b < u)) segue o
b = u (ma in tal caso contraddiciamo l’ipotesi u = min(x ¡ y); oppure b > u,
i.e., u 2 xb: Dalle ipotesi su y e da b 2 y segue xb µ y e dunque u 2 y, contro
l’ipotesi. Quindi xu µ y:
(2) Supponiamo per assurdo che a 2 x e :(a · f(a)): Allora, essendo · totale
f(a) < a: Essendo f un isomor…smo, seguono f(a) < f(f(a)), f 2 (a) < f 3 (a)
e così via, generando una catena in…nita discendente, contro l’ipotesi che ·
sia un buon ordine.
(3) Sia f : x ! x un automor…smo. Allora anche f ¡ 1 : x ! x è un
automor…smo. Da (2) segue che per ogni a 2 x abbiamo a · f(a) e f(a) ·
f ¡1 (f(a)), i.e., f(a) · a: Dunque a = f(a) per ogni a:
(4) Supponiamo per assurdo che esistano b 2 x ed un isomor…smo f : x ! xb :
Allora f soddisfa le condizioni del punto (2), per cui b · f(b): Ma f(b) deve
appartenere ad xb e dunque, per de…nione, f(b) < b: contraddizione.
Corollary 40 Se f : x ! y e g : x ! y sono isomor…smi tra (x; ·) e (y; ·),
allora f = g:
Dimostrazione. f ± g¡1 : x ! x è un automor…smo; dunque, per (3), è
l’identità, da cui segue g ¡1 = f ¡1 e f = g:
Theorem 41 Dati due insiemi ben ordinati, essi sono isomor… oppure uno
è isomorfo ad un segmento iniziale dell’altro.
18
CAPITOLO 1. PRIMI RISULTATI SU CARDINALI E ORDINALI
Dimostrazione. Siano (X; ·) e (Y; ·) due insiemi ben ordinati e supponiamo che non siano isomor…. Se uno dei due insiemi è vuoto, allora il
risultato segue dal fatto che ? è segmento iniziale di ogni insieme ordinato.
Supponiamo allora entrambi non vuoti e siano x0 e y0 i rispettivi minimi.
Allora Xx 0 = Yy0 = ? ed in tal modo i due segmenti iniziali sono isomor….
Da ciò segue che l’insieme
A = fa : a 2 X ^ 9b(b 2 Y ^ (Xa ; ·) »
= (Yb; ·))g
non è vuoto, poiché x0 2 A: (Scrivendo (Xa ; ·) intendiamo l’insieme Xa con
la relazione su X ristretta ad Xa , e analogamente per (Yb; ; ·) ). Per il Lemma
39 (4) e la transitività della relazione di isomor…smo, per ogni a 2 X un tale
elemento b 2 Y , se esiste, è unico, ed inoltre uno stesso b non può corrispondere a due distinti elementi di A. Quindi © : A ! Y , dove ©(a) = b; è una
funzione ed è iniettiva.
Domostriamo ora che
(¤)
A = X o A è un segmento iniziale di X.
© [A] = Y o © [A] è un segmento iniziale di Y .
Veri…chiamo che A soddisfa le condizioni del Lemma 39 (1). Sia a 2 A e
x 2 Xa . Per de…nizione di A, esiste un isomor…smo f : Xa ! Yb , e da x 2 Xa
segue f(x) 2 Yb : Inoltre la funzione f=Xx : Xx ! Yf (x) è un isomor…smo,
e dunque x 2 A. Pertanto Xa µ A e dunque A soddisfa le condizioni del
Lemma 39 (1), e pertanto abbiamo che A = X o A è un segmento iniziale
di X. La prova che ©(A) = Y oppure ©(A) è un segmento iniziale di Y è
analoga, e pertanto abbiamo (*) .
Dimostriamo ora che © è rispetta l’ordine. Siano a; c 2 A con a 6= c e
supponiamo a < c; i.e., a 2 Xc: Da c 2 A segue l’esistenza di un isomor…smo
g : Xc ! Y©(c) : Ma Xa ½ Xc ; ed in tal modo g=Xa è un isomor…smo tra Xa
e Yg(a) ; con g(a) 2 Y©(c) ; e dunque g(a) < ©(c): Ma poiché a 2 A, esiste un
isomor…smo h : Xa ! Y©(a) : Vale g(a) = ©(a): Infatti se g(a) < ©(a) allora
h¡1 ±g sarebbe un isomor…smo tra Y©(a) e il suo segmento iniziale Yg(a) ; contro
il Lemma 39 (4). Per lo stesso motivo, è impossibile g(a) > ©(a): A questo
punto da g(a) = ©(a) e da g(a) < ©(c) segue ©(a) < ©(c): Pertanto ©,
essendo iniettiva, è un isomor…smo da A a © [A].
Da ciò e da (*) segue che © e ©¡1 soddisfano il teorema per tre delle quattro
combinazioni possibili (A = X e © [A] = Y , oppure A = X e © [A] segmento
iniziale di Y , oppure A segmento iniziale di X e © [A] = Y ).Dimostriamo che
1.2. ORDINALI
19
la quarta possibilità, cioè A segmento iniziale di X e © [A] segmento iniziale
di Y , è impossibile: Sia c = min(X ¡ A) e d = min(Y ¡ © [A]): Allora, per
(*), A = Xc e © [A] = Yd : In tal modo © è un isomor…smo tra Xc e Yd e così
c 2 A, contro quanto supposto.
De…nition 42 Un insieme ® è un ordinale se è ben ordinato e, per ogni
x 2 ®,
x = ®x :
Theorem 43 (1) Ogni elemento di un ordinale è un ordinale
(1bis) Ogni segmento iniziale di un ordinale è un ordinale.
(2) La relazione d’ordine di un ordinale è µ :
(3) Se due ordinali sono isomor… allora sono uguali.
(4) Se ® e ¯ sono ordinali allora una (ed una sola) delle seguenti vale: ® =
¯; ® 2 ¯; ¯ 2 ®:
(5) Se ® e ¯ sono ordinali ® ½ ¯ , ® 2 ¯:
Dimostrazione. (1) Sia ® un ordinale e sia x 2 ®: Dobbiamo dimostrare
che (a) x è un buon ordine e (b) che, per ogni y 2 x, xy = y:
(a) Da x = ®x µ ® segue che R=x è un buon ordine. (b) Se y 2 x ; essendo
x = ®x ; allora y 2 ®x e dunque y < x: Ma da y 2 ®x segue anche y 2 ® e
dunque y = ®y = (®x )y = xy . (l’uguaglianza ®y = (®x )y è basata sul fatto che
da y < x segue ®y = fz : z 2 ® ^ z < yg = (®x )y = fz : z 2 ®x ^ z < yg =
fz : z 2 ® ^ z < x ^ z < yg : L’uguaglianza (®x )y = xy segue da x = ®x ).
(1bis) Sia ®x il segmento iniziale determinato da x. Per de…nizione di ordinale
®x = x e, per (1), x è un ordinale.
(2) Sia · la relazione su ®: Dimostriamo che, per ogni x; y 2 ®, x · y sse
x µ y: Per de…nizione di ordine, x · y sse ®x µ ®y sse, per de…nizione di
ordinale, x µ y.
(3) Sia f un isomor…smo tra ® e ¯ e supponiamo che f non sia l’identità.
Allora fx : f(x) 6= xg 6= ? e dunque ha minimo elemento y (per (2), rispetto
a µ). Quindi, per ogni z ½ y, f(z) = z, e dunque f è l’identità tra ®y
(= fz : z ½ yg) e ¯f (y) ; cioè ®y = ¯ f(y) . Essendo ® e ¯ ordinali, ®y =
y e ¯f (y) = f(y): Pertanto y = f(y) contro quanto ipotizzato. Dunque
fx : f(x) 6= xg deve essere vuoto e f è l’identità tra ® e ¯.
(4) Dati ® e ¯, per il Teorema 41 essi sono isomor… oppure uno è isomorfo
ad un segmento iniziale dell’altro. Nel primo caso, per (3), sono uguali. Nel
secondo, ad esempio se ® »
= ¯x per x 2 ¯, allora essendo, per (1bis), ¯x un
20
CAPITOLO 1. PRIMI RISULTATI SU CARDINALI E ORDINALI
ordinale, abbiamo, per (3), ® = ¯x . Ma, essendo ¯ un ordinale e x 2 ¯,
¯x = x e dunque ® = x 2 ¯:
(5) (()® 2 ¯ implica, essendo ¯ un ordinale, ® = ¯® ½ ¯: ()) Per (4),
® ½ ¯ ! ® 6= ¯ !(4) ® 2 ¯ _ ¯ 2 ®: Ma, per l’implicazione precedente,
¯ 2 ® implica ¯ ½ ®; che contraddice ® ½ ¯: Resta dunque ® 2 ¯:
Nel seguito, scriveremo ® < ¯ per indicare indi¤erentemente ® ½ ¯ o ® 2
¯; e scriveremo ® · ¯ per indicare indi¤erentemente ® µ ¯ o ® 2 ¯ _ ® = ¯:
De…nition 44 Un insieme X è detto transitivo se x 2 X implica x ½ X;
cioè se y 2 x 2 X implica y 2 X.
Corollary 45 Sia ® un insieme ben ordinato dalla relazione · tale che
x · y : x 2 y _ x = y:
® è un ordinale sse è transitivo.
Dimostrazione. ()) Sia x 2 ®: Da Th.43 (1) e (5) segue x ½ ®: Dunque
® è transitivo.
(() Sia x 2 ®. Devo dimostrare x = ®x : Dalla de…nizione di · segue che
®x = fz : z 2 ® ^ z 2 xg : Ma per la transitività di ®, da z 2 x e x 2 ® segue
z 2 ® e dunque fz : z 2 ® ^ z 2 xg = fz : z 2 xg = x:
Un risultato fondamentale sugli ordinali è il seguente:
Theorem 46 Ogli insieme è isomorfo ad un, ed un solo, ordinale.
La dimostrazione non può esser fatta al di fuori della teoria assiomatica,
per cui dovrà attendere (vedi Th.107).
Ora presentiamo alcuni risultati tramite i quali è possibile costruire ordinali.
De…nition 47 Per ogni insieme x, poniamo S(x) = x [ fxg :
Theorem 48 Se ® è un ordinale allora S(®) è un ordinale ed è il minimo
ordinale ¯ : ® < ¯.
1.2. ORDINALI
21
Dimostrazione. Banalmente, S(®) è totalmente ordinato da µ (infatti, se
x; y 2 ® allora, essendo ® totalmente ordinato da µ; x µ y o y µ x; se invece
x 2 ® e y = ® allora x µ ® = y). Dimostriamo che S(®) è ben ordinato
da µ : Sia X 6= ; e X µ S(®): Se X = f®g allora, essendo jf®gj = 1,
X ha minimo elemento (® stesso). Se invece X \ ® 6= ; allora, essendo
® ben ordinato, X \ ® ha un minimo y che è anche minimo di X: infatti
non può esistere z 2 y e z 2
= ®, dal momento che y 2 ® ed ® è transitivo.
Dunque S(®) è ben ordinato da µ. Dimostriamo in…ne che se x 2 S(®)
allora x = (S(®))x : Se x = ® allora (S(®))® = fy : y 2 S(®) e y 2 ®g =
(essendo ® µ S(®) ) = fy : y 2 ®g = ®: Se x 6= ® allora x 2 ® e quindi
(S(®))x = ®x = x (la prima identità vale in quanto ® 2
= x e quindi, essendo ®
l’unico elemento di S(®)¡®, fy : y 2 S(®) ^ y 2 xg = fy : y 2 ® ^ y 2 xg ; la
seconda identità vale in quanto ® è un ordinale). Quindi S(®) è un ordinale,
e poiché ® 2 S(®) abbiamo ® < S(®): In…ne, non esiste ® < ¯ < S(®) in
quanto ciò signi…cherebbe ® 2 ¯ 2 S(®), e da ¯ 2 S(®) segue ¯ 2 ® o ¯ = ®,
in contraddizione con ® 2 ¯ (Th.43(4)).
Lemma 49 Sia X un insieme di ordinali. Allora X è ben ordinato da µ :
Dimostrazione. Dal Teorema 43 (4)-(5) segue che µ è un ordine totale
su X: Sia ? ½ Y µ X e sia ° 2 Y: Se ° non è min Y allora esiste ± tale che
± 2 Y e ± ½ °: Quindi, essendo ° e ± ordinali, ± 2 ° e dunque Y \ ° 6= ?:
Ma Y \ ° µ ° e ° è un ordinale. Pertanto Y \ ° ha minimo ®: Ma tale ® è
anche minimo di Y ; altrimenti avremmo che esiste ¯ 2 Y ¡ ° tale che ¯ ½ ®
(i.e ¯ 2 ®), il che, essendo ® 2 ° ed essendo ° transitivo, conduce a ¯ 2 °
(in contrasto con ¯ 2 Y ¡ °). Pertanto µ è un buon ordine su X:
S
De…nition 50 Dato un insieme x, de…niamo x = fy : 9z(y 2 z ^ z 2 x)g :
(Si
S osservi come tale de…nizione, che coincide con la ”vecchia” grande unione
ai, ha un senso solo se gli elementi di x sono a loro volta insiemi).
ai 2x
S
Theorem 51 Sia X un insieme di ordinali. Allora X è un ordinale, ed è
il minimo ordinale maggiore o uguale ad ogni ordinale di X:
S
Dimostrazione. Supponiamo x 2 X: Allora x 2 ® 2 X e dunque,
essendo ® un ordinale
S ®; anche x è un ordinale (Teorema 43(1)). Quindi
anche
gli elementi di X sono ordinali e dunque, per
S S
S il Lemma 49 riferito a
X, X è ben ordinato da µ : Per dimostrare che X è un ordinale, resta
22
CAPITOLO 1. PRIMI RISULTATI SU CARDINALI E ORDINALI
S
S
da veri…care
che,
per
ogni
x
2
X;
(
X)x = x:
S
S
S Dimostriamo dapprima che
da x 2 X segue x µ X: Sia y 2 x: Da x 2 X segue
X da cui,
S x 2 ® 2S
per la transitività
S
S di ®; otteniamo
S y 2 ®: Quindi y 2 X e x µ X: Ora,
sia x 2 X: ( X)xS= fz : z 2 X ^ z ½ xg (infatti, per il Lemma 49, la
relazione che
dimostrato che gli
S ordina X è µ) eSquindi, poiché abbiamo
S
elementi di X sono ordinali, ( X)
z 2 X ^ z 2 xg : In tal modo
S x = fz :S
(per de…nizione
di intersezione) ( X)x = X \ x e, avendo dimostrato
S
S
S
che x µ X, ( X)x = x; come volevamo dimostrare. Quindi X è un
ordinale. Inoltre, per de…nizione di unione, è il minimo insieme che include
ogni elemento di X ed è pertanto il minimo ordinale maggiore degli ordinali
contenuti in X:
De…nition 52 Un ordinale ¯ e un ordinale successore se ¯ = S(®) per un
certo ®: Un ordinale ¯ e un ordinale limite se ¯ 6= 0 e ¯ non è successore.
Costruzione di ordinali mediante i Teoremi 48 e 51.
? è un ordinale. Dunque lo sono S (?) = f?g, S (S (?)) = S (f?g) =
f?; f?gg, S(S(S(?))) = S(f?; f?gg) = f?; f?g ; f?; f?ggg ....
In questo contensto, indichiamo ? con 0; S(?) con 1, S(S(?)) con 2, etc.
Dalle de…nizioni segue che n = f0; 1; :::; n ¡ 1g :
Indichiamo poi con ! l’ordinale limite
[
! = fn : n 2 Ng
Come si vede, ! è null’altro che N inteso come un ordinale (ben ordinato
da · e, a questo punto, da µ).
Indichiamo S(S(:::S(!))) con ! + n (attenzione: ”! + n" è un nome e
non il risultato di una operazione che ancora non abbiamo).
S
Indichiamo f! + n : n 2 Ng con !2 (stessa osservazione di prima; sarebbe più eufonico 2!, ma, come vedremo, creerebbe problemi).
Indichiamo
S
f!2 + n : n 2 Ng con !3 etc.
1.2. ORDINALI
Indichiamo
S
23
f!n : n 2 Ng con !2 ; etc.
Sempre per i teoremi 48 e 51, valgono le seguenti disuguaglianze:
0 < 1 < :::! < ! + 1 < :::!2 < :::!3 < :::!2 < :::!3 < :::!! < :::
Osservazione. (1) Per il Teorema 15, tutti gli ordinali elencati sono numerabili.
(2) Procedendo per passaggi al successore e passaggi al limite, non si tralascia
alcun ordinale (minore di quelli che si stanno ottenendo).
1.2.1
Aritmetica ordinale
Somma ordinale. Fissato ®, de…niamo ® + ¯ per ogni ordinale ¯ :
®+0 = ®
® + S(¯)S= S(® + ¯); per ogni ¯;
® + ¯ = f® + ° : ° < ¯g per ogni ordinale limite ¯:
Si osservi che, sui numeri naturali, tale operazione coincide con la somma
usuale.
La somma ordinale è associativa ma non è commutativa:
! + 1 = ! + S(0) = S(! + 0) = S(!) = ! [ f!g ;
1+ ! =
S
f1 + n : n < !g =
S
f1; 2; 3; :::g = ! < ! [ f!g :
! + m = S(S(:::(S(!)):::)) > !
m+ ! =
S
fm + n : n < !g =
In e¤etti:
S
fm; m + 1; m + 2; :::g = !:
Se ¯ < ° allora ® + ¯ < ® + °:
Se ¯ < ° allora ¯ + ® · ° + ®:
24
CAPITOLO 1. PRIMI RISULTATI SU CARDINALI E ORDINALI
Per la somma ordinale possiamo impiegare il seguente modello. Siano
»
® = (A; R), ¯ »
= (B; S) con A \ B = ?: Allora
® +¯ »
= (A [ B; T)
con
T = R [ S [ f(x; y) : x 2 A; y 2 Bg :
Ad esempio: ponendo 2 »
= (A; R), ! »
= (B; S) abbiamo
2+! »
= f0 A; 1 A; 0B ; 1B ; 2B ; 3B ::: g »
=!
mentre
! +2 »
= f0 B ; 1B ; 2B ; 3B ::: 0A; 1Ag 6 »
=!
Prodotto ordinale. Fissato ®, de…niamo ® ¢ ¯ per ogni ordinale ¯ :
®¢ 0= 0
® ¢ S(¯)S= (® ¢ ¯) + ®; per ogni ¯;
® ¢ ¯ = f® ¢ ° : ° < ¯g per ogni ordinale limite ¯.
Il prodotto ordinale è associativo ma non è commutativo. Infatti:
! ¢ 2 = ! ¢ 1 + ! = ((! ¢ 0) + !) + ! = ! + ! =
mentre S
2 ¢ ! = f2 ¢ n : n < !g = !.
S
f! + n : n < !g = !2
Alcune proprietà:
Se ® > 0 e ¯ > 1 allora ® ¢ ¯ > ®:
Se ® > 0 e ¯ > 1 allora ¯ ¢ ® ¸ ® (non vale il minore stretto: 2 ¢ ! = !)
Se ¯ < ° e ® > 0 allora ® ¢ ¯ < ® ¢ °:
Se ¯ < ° e ® > 0 allora ¯ ¢ ® · ° ¢ ® (non vale il minore stretto:
2 ¢ ! = 3 ¢ ! = !).
Vale la proprietà distributiva destra del prodotto rispetto alla somma:
® ¢ (¯ + °) = ® ¢ ¯ + ® ¢ °
Non vale la proprietà distributiva sinistra. Ad esempio:
1.2. ORDINALI
25
(! + 3) ¢ ! 6= (! ¢ !) + (3 ¢ !) in quanto ½
¾
S
S
(! + 3)¢! = f(! + 3) ¢ n : n < !g =
(! + 3) + ::: + (! + 3): n < ! =
n volte
½
¾
½
¾
S
= ! + (3 + !)::: + (3 + !) + 3 : n < ! =
! + ::: + ! + 3: n < ! =
n volte
n v olte
S
f!n + 3 : n < !g
= !2
mentre (! ¢ !) + (3 ¢ !) = !2 + ! > !2:
Anche per il prodotto è possibile aver un modello. Siano ® »
= (A; R) e
»
¯ = (B; S): Allora
® ¢¯ »
= (A £ B; W )
con
W = f((x; y); (z; t)) : (ySt e y 6= t) o (y = t e xRz)g
(ordine lessicogra…co partendo dal fondo). Ad esempio, ponendo 2 »
= (A; R),
»
! = (B; S) abbiamo
2¢! »
= f(0A; 0 B ); (1A; 0B ); (0A; 1B ); (1A; 1B ); (0A; 2B ); (1A ; 2B ); :::g »
=!
mentre
! ¢2 »
= f(0 B ; 0A ); (1B ; 0A ); (2B ; 0A ); :::::(0B ; 1A); (1 B ; 1A ); (2 B ; 1A ); :::g »
=
!+!
Altro esempio: ponendo ! »
= (A; R), ! »
= (B; S) abbiamo
»
!¢!=
f(0A ; 0B ); (1A ; 0B ); (2A ; 0B ); :::::(0A ; 1B ); (1A ; 1B ); (2A ; 1B ); :::::(0A; 2B ); (1A ; 2B ); (2A ; 2B ); :::g
»
= ! + ! + ! + ::::: :
Esponenziazione ordinale. Fissato ® 6= 0 poniamo:
®0 = 1;
®S (¯) =
®¯ ¢ ®; per ogni ordinale ¯;
S
®¯ = f®° : ° < ¯g ; per ogni ordinale limite ¯:
Primi esempi:
26
CAPITOLO 1. PRIMI RISULTATI SU CARDINALI E ORDINALI
!2 = !S (1) = !1 ¢ ! = (!0 ¢ !) ¢ ! = (1 ¢ !) ¢ ! = ! ¢ !:
!! =
2! =
S
S
f!n : n < !g
f2 n : n < !g = !:
Alcune proprietà:
®1 = ®
1® = 1
Se ¯ < ° e ® > 1 allora ®¯ < ®° :
Se ¯ < ° e ® > 1 allora ¯® · °® :
Valgono la prima e seconda legge delle potenze:
®¯+° = ®¯ ¢ ®°
e
®¯¢° = (®¯ )° :
Invece, come mostra il seguente esempio, esistono ®; ¯; ° tali che
(® ¢ ¯)° 6= ®° ¢ ¯° :
S
(2 ¢ 3)! = 6! = f6n : n < !g = !
mentre S
S
2! ¢ 3! = f2n : n < !g ¢ f3n : n < !g = ! ¢ ! > !:
Ulteriori esempi di operazioni:
2! = !:
2!+3 = 2! ¢ 8 = ! ¢ 8 = !8 oppure 2!+2 ¢ 2 = 2!+1 ¢ 2 ¢ 2 = 2! ¢ 2 ¢ 2 ¢ 2:
2!+n = ! ¢ 2n
2
2!2 = (2! ) = !2 oppure
S
f2!+n : n 2 !g =
S
f! ¢ 2n : n 2 !g = ! ¢ !:
1.2. ORDINALI
27
n
2!n = (2! ) = !n
S
S
S
2
n
2! = (2!n : n 2 !) = ((2! ) : n 2 !) = (!n : n 2 !) = !!
3
2
2 !
!
2
2! = 2! ¢! = (2! ) = (!! ) = !!¢! = !! (le parentesi, quando non
indicate, si intendono a destra)
n
!)!:::
n¡1
2! = (:::((!! )
n ¡ 1 volte) = !!
!
22 = 2! = !
!+1
22
= 2!2 = (2 ! )2 = !2
n
n
n
2 !+n
2
= 2!2 = (2! )2 = !2
!2
2
22 = 2! = !!
!¢3
3
2
22 = 2! = !!
!¢n
n
n ¡1
22 = 2 ! = !!
22
2!¢2
!
= 2! =
o
ª S n ! n¡1
S © !n
!
2 :n 2! =
!
: n 2 ! = !!
Particolare rilevo (in logica) ha l’ordinale
"0 = ! !
:
!:
o
!
Sn
!
!!
!!
ottenuto elevando ! alla ! ! volte, cioè come
!; ! ; ! ; ! ; ::: : Dopo
!; "0 è il minimo ordinale ¯ tale che se ® < ¯ allora 2 ® < ¯:
Nel §.6.0.16 uni…cheremo i concetti di numero ordinale e numero cardinale
de…nendo i cardinali come particolari ordinali. Le due aritmetiche rimarranno
però distinte.
28
CAPITOLO 1. PRIMI RISULTATI SU CARDINALI E ORDINALI
Capitolo 2
Il concetto di dimostrazione
2.1
La composizione degli Elementi.
Il primo esempio di teoria assiomatica giunto …no a noi è costituito dagli
Elementi di Euclide (c. 300 a. C.). Come risulta da varie fonti, gli Elementi
non costituiscono la prima opera sistematica di geometria; ma il fatto stesso
che i lavori precedenti siano completamente scomparsi indica la superiorità
dell’opera euclidea, la quale risulta di fatto il maggior ”best seller”del mondo
occidentale, dopo la Bibbia. L’in‡uenza di questa opera è stata enorme, in
quanto per quasi 2000 anni essa è stata il simbolo del rigore, il paradigma
del procedere matematico. La sua novità non consiste tanto nel rigore delle
singole dimostrazioni, né nella loro quantità, ma nel fatto di costituire un
sistema globale in cui le dimostrazioni singole sono disposte in un ordine che
permette a ciascuna di loro di essere utilizzata nelle dimostrazioni successive.
Il risultato é, ad un tempo, logicamente fondato, ”economico” ed elegante.
E’l’attuazione del canone aristotelico di una costruzione che parte da un
piccolo numero di ”de…nizioni”, ”postulati” e ”nozioni comuni”, e sviluppa
le successive ”proposizioni” a partire da questi senza aggiungere (almeno
consapevolmente) ulteriori assunzioni oltre quelle iniziali.
Contenuto dei singoli libri:
Libro 1:
Libro 2:
Libro 3:
Libro 4:
Fondamenti di geometria piana.
La geometria dei rettangoli.
La geometria del cerchio.
Poligoni regolari inscritti in un cerchio.
29
30
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
Libro
Libro
Libro
Libro
Libro
Libro
Libro
Libro
Libro
5: Teoria generale delle proporzioni.
6: La geometria piana di …gure simili.
7: Fondamenti di aritmetica.
8: Numeri in proporzioni continue.
9: Numeri in proporzioni continue. La teoria del pari e dispari.
10: Grandezze incommensurabili.
11: Fondamenti di geometria solida.
12: Aree e volumi.
13. I solidi platonici.
Tradizionalmente, i libri degli Elementi vengono divisi in tre gruppi (con
il libro X che resta isolato):
Geometria piana: 1-6.
Aritmetica: 7-9.
Geometria solida: 11-13. ((01))
2.1.1
L’inizio degli Elementi
Gli Elementi iniziano dalle ”de…nizioni”, seguite dai ”postulati” (gli assiomi
geometrici) e dalle ”nozioni comuni” (gli assiomi non speci…ci).
DEFINIZIONI.
I. Punto è ciò che non ha parti.
II. Linea è lunghezza senza larghezza.
III. Estremi di una linea sono punti.
IV. Linea retta è quella che giace ugualmente rispetto ai suoi punti.
V. Super…cie è ciò che ha soltanto lunghezza e larghezza.
VI. Estremi di una super…cie sono linee.
VII. Super…cie piana è quella che giace ugualmente rispetto alle sue rette.
VIII. Angolo piano è l’inclinazione reciproca di due linee su un piano, le
quali si incontrino fra loro e non giacciano in linea retta.
IX. Quando le linee che comprendono l’angolo sono rette, l’angolo si
chiama rettilineo.
X. Quando una retta innalzata su un’altra retta forma gli angoli adiacenti
uguali tra loro, ciascuno dei due angoli uguali è retto, e la retta innalzata si
chiama perpendicolare a quella su cui è innalzata.
XI. Angolo ottuso è quello maggiore di un retto.
XII. Angolo acuto è quello minore di un retto.
2.1. LA COMPOSIZIONE DEGLI ELEMENTI.
31
XIII. Termine è ciò che è estremo di qualche cosa.
XIV. Figura è ciò che è compreso da uno o più termini.
XV. Cerchio è una …gura piana compresa da un’unica linea tale che tutte
le rette, le quali cadano sulla linea a partire da un punto tra quelli che
giacciono internamente alla …gura, sono uguali fra loro.
XVI. Quel punto si chiama centro del cerchio.
XVII. Diametro del cerchio è una retta condotta per il centro e terminata
da ambedue le parti dalla circonferenza del cerchio, la quale retta taglia anche
il cerchio per metà.
XVIII. Semicerchio è la …gura compresa dal diametro e dalla circonferenza
da esso tagliata. E centro del semicerchio è quello stesso che è anche centro
del cerchio.
XIX. Figure rettilinee sono quelle comprese da rette, vale a dire: …gure trilatere quelle comprese da tre rette, quadrilatere quelle comprese da quattro,
e multilatere quelle comprese da più di quattro rette.
XX. Delle …gure trilatere, è triangolo equilatero quello che ha i tre lati
uguali, isoscele quello che ha soltanto due lati uguali, e scaleno quello che ha
i tre lati disuguali.
XXI. In…ne, delle …gure trilatere, è triangolo rettangolo quello che ha
un angolo retto, ottusangolo quello che ha un angolo ottuso, ed acutangolo
quello che ha i tre angoli acuti.
XXII. Delle …gure quadrilatere, è quadrato quella che è insieme equilatera
ed ha angoli retti, rettangolo quella che ha gli angoli retti, ma non è equilatera, rombo quella che è equilatera, ma non ha gli angoli retti, romboide
quella che ha i lati e gli angoli opposti uguali tra loro, ma non è equilatera né
ha gli angoli retti. E le …gure quadrilatere oltre a queste si chiamino trapezi.
XXIII. Parallele sono quelle rette che, essendo nello stesso piano e venendo
prolungate illimitatamente dall’una e dall’altra parte, non si incontrano tra
loro da nessuna delle due parti.
POSTULATI
I. Risulti postulato: che si possa condurre una linea retta da un qualsiasi
punto ad ogni altro punto.
II. E che una retta terminata si possa prolungare continuamente in linea
retta.
III. E che si possa descrivere un cerchio con qualsiasi centro ed ogni
distanza.
IV. E che tutti gli angoli retti siano uguali fra loro.
32
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
V. E che, se una retta venendo a cadere su due rette forma gli angoli
interni e dalla stessa parte minori di due retti, le due rette prolungate illimitatamente verranno ad incontrarsi da quella parte in cui sono gli angoli
minori di due retti.
NOZIONI COMUNI
I. Cose che sono uguali ad una stessa cosa sono uguali anche fra loro.
II. E se cose uguali sono addizionate a cose uguali, le totalità sono uguali.
III. E se da cose uguali sono sottratte cose uguali, i resti sono uguali.
[IV.] E se cose uguali sono addizionate a cose disuguali, le totalità sono
disuguali.
[V.] E doppi di una stessa cosa sono uguali fra loro.
[VI.] E metà di una stessa cosa sono uguali tra loro.
VII. E cose che coincidono fra loro sono fra loro uguali.
VIII. Ed il tutto è maggiore della parte.”
In modo un po’paradossale, l’enorme in‡uenza degli Elementi è anche in
parte dovuta a quello che fu considerato il più grave dei suoi difetti (naevo,
”neo”, dirà Saccheri nell’intento di emendarlo): la minore evidenza del V
Postulato rispetto agli altri. Infatti, i vani tentativi di dimostrare il V Postulato a partire dagli altri quattro portarono ad un ra¢namento delle tecniche
dimostrative, e comunque ad una maggiore consapevolezza del concetto di
sistema assiomatico.
Se consideriamo che gli assiomi sono ”teoremi primitivi”, e cioè asserti
che si assumono per poter dimostrare altri asserti, si può a¤ermare che lo
stesso dovrebbe essere fatto per i concetti: sarebbe cioè necessario assumere alcuni concetti come primitivi e quindi inde…niti, e tramite loro de…nire
gli altri concetti della teoria. Ed in e¤etti ciò accade nelle moderne teorie
assiomatiche: in tal caso gli assiomi, esprimendo le proprietà primitive di
questiconcetti, li de…niscono indirettamente, implicitamente. Euclide invece,
moderno per quanto riguarda l’assunzione degli assiomi, non lo è altrettanto
per le de…nizioni. Non vi sono concetti primitivi, tutto è de…nito. Si nota
tuttavia il diverso tenore che distingue le prime de…nizioni, ”assolute”, dalle
successive, che de…niscono nuovi concetti tramite le prime.
Le ”nozioni comuni”, in…ne, esprimono proprietà dell’identità in cui sono
coinvolte le 4 operazioni elementari (manca invece ogni accenno all’ordine).
2.2. IL MODELLO DIMOSTRATIVO EUCLIDEO
33
Il loro ruolo formale nelle dimostrazioni è analogo a quello dei postulati (anche esse sono infatti proprietà che si assumono senza dimostrazione), ma
si distinguono da quelli per il fatto che non sono proprietà speci…camente
geometriche, ma più generali. Vedremo come che lo status particolare che
caratterizza le proprietà dell’identità si sia conservato …no ad oggi. Le moderne teorie matematiche formalizzate distinguono gli assiomi in tre classi:
quelli logici (assenti nella trattazione euclidea, così come ogni altro riferimento alla logica), quelli speci…ci (gli assiomi propri della teoria, i postulati
euclidei) e quelli dell’identità (compresi da Euclide nelle nozioni comuni).
((2))
2.2
Il modello dimostrativo euclideo
La seguente de…nizione, che considera la dimostrazione come un trasferimento di verità da assiomi a teoremi, è tradizionale nel pensiero matematico
occidentale, ed ha come modello gli Elementi di Euclide.
De…nition 53 Una dimostrazione è una catena di deduzioni attraverso le
quali la verità della proposizione che deve essere dimostrata viene derivata
dagli assiomi e da proposizioni precedentemente dimostrate.
Una dimostrazione è quindi un fatto linguistico, un insieme di frasi, che si
conclude con una a¤ermazione a cui si vuole dare, mediante il discorso che la
precede, uno status di certezza pari a quello di altre a¤ermazioni già stabilite;
tale discorso si compone di proposizioni, logicamente connesse, che hanno lo
scopo di pervenire all’a¤ermazione …nale. Ciascuna di esse può intervenire
solo in base a rigidi requisiti:
(a) la proposizione appartiene ad un insieme di frasi inizialmente ammesse: gli assiomi. Emerge chiaramente da questo il fatto che la de…nizione
usuale di dimostrazione di un enunciato prevede che l’enunciato stesso non
sia isolato, ma inserito in una teoria assiomatica.
(b) la proposizione è già stata ricavata con un procedimento analogo a
quello che si sta descrivendo, è cioè la conclusione di una dimostrazione
precedente, un teorema già dimostrato;
34
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
(c) la proposizione non è già in nostro possesso come nei casi (a) e (b) ma
viene costruita nel momento in cui compare come risultato della ”trasformazione” di frasi che la precedono nella dimostrazione mediante le cosiddette
”regole logiche”.
Osserviamo che la de…nizione 53 non considera esplicitamente i teoremi in
cui compaiono delle ipotesi speci…che, i quali peraltro sono molto frequenti; in
tal caso tra le proposizioni inizialmente ammesse si trovano, oltre agli assiomi,
anche le ipotesi del teorema. Si può riformulare sinteticamente quanto detto
con la seguente nuova ”de…nizione”, un po’più formale della precedente:
De…nition 54 Una dimostrazione nella teoria T della tesi ¯ dall’insieme di
ipotesi ®1 ; :::; ®n è una sequenza …nita di espressioni che termina con ¯ e tale
che ogni espressione soddisfa una delle seguenti condizioni:
(i) è un assioma di T o una ipotesi del teorema,
(ii) è un teorema di T già dimostrato,
(iii) deriva da espressioni precedenti mediante una regola logica.
I cardini su cui ruota il concetto di dimostrazione sono quindi due: assiomi
della teoria e regole logiche. Cominciamo da queste ultime.
2.3
Le regole logiche
E’un dato di fatto che in matematica, usualmente, non si esplicitino le regole
logiche. E’vero che talvolta alcuni metodi vengono segnalati ed hanno un
nome proprio (assurdo, contronominale, per casi, ...), ma, nello sviluppo di
una dimostrazione, oltre a queste regole con nome ne intervengono molte
altre, che rimangono anonime.
Una regola si con…gura in modo naturale come una particolare relazione
tra proposizioni, esprimibile nella forma
'1
:
:
'n
Ã
2.3. LE REGOLE LOGICHE
35
(o, più comodamente, '1; ::; 'n =Ã) dove le proposizioni '1; ::; 'n vengono
dette premesse e à conclusione della regola.
Dobbiamo ora a¤rontare il problema delle condizioni che una sequenza '1 ; ::; 'n =Ã deve soddisfare per essere una regola logica. Una prima
de…nizione è la seguente:
De…nition 55 Una sequenza '1 ,..,'n /Ã è una regola logica se e solo se
ogniqualvolta le proposizioni '1 ,..,'n e à hanno senso in un universo di
enti ( modello) ed in esso sono vere le premesse '1 ,..,'n , allora anche la
conclusione à è vera.
Il dato che emerge dalla De…nizione 55 è che la funzione delle regole logiche
è quella di trasmettere alla conclusione l’eventuale verità delle premesse, e
di fare ciò in ogni modello, con l’unica condizione che per le proposizioni che
intervengono nella regola sia sensato chiedersi se sono o no vere nel modello.
A parte questa condizione di leggibilità, le regole logiche devono dunque
essere universali, i.e. indipendenti dal contesto.
La richiesta che abbia senso chiedersi se una proposizione è vera o falsa
relativamente a un modello richiederà, come vedremo, un approfondimento
dei concetti di verità e di modello. Di conseguenza, sarà necessario precisare,
a ritroso, anche i concetti di proposizione e di linguaggio.
2.3.1
Il livello proposizionale
Analizziamo ora una serie di dimostrazioni comuni, allo scopo di fare emergere le regole logiche impiegate. Il primo esempio (trovato con una certa
di¢coltà) è stato scelto per le sue caratteristiche elementari dal punto di vista logico. E’tratto dagli Elementi e non costituisce un esempio ”tipo”, nel
senso che la semplicità con cui riusciamo a evidenziarne la struttura logica è
decisamente atipica. La traduzione che riportiamo è fedele, salvo l’omissione,
indicata da asterischi, di due frasi interlocutorie, su cui torneremo.
Proposizione I.25. Se due triangoli ABC e DEF hanno due lati rispettivamente uguali e i terzi lati disuguali, allora al lato maggiore è opposto l’angolo
maggiore.
Dimostrazione. Siano AB=DE e AC=DF e BC>EF. Dimostriamo che
BAC^>EDF^. Se così non fosse sarebbe uguale o minore. Ma se BAC^=EDF^allora
36
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
BC=EF [Proposizone I.4: Due triangoli che hanno rispettivamente uguali due
lati e l’angolo da essi compreso sono uguali], e ciò è contro l’ipotesi. (*) E
se BAC^<EDF^ allora BC<EF [Proposizione I.24: Se due triangoli hanno
due lati rispettivamente uguali e gli angoli compresi disuguali, allora all’angolo maggiore è opposto il lato maggiore (e quindi all’angolo minore il lato
minore)], e ciò è contro l’ipotesi. (*) Pertanto BAC^>EDF^.
Individuiamo ora le proposizioni coinvolte (con il termine proposizione (o
enunciato) intendiamo una frase a senso compiuto, per la quale abbia senso
chiedersi se sia vera o falsa). Assegnamo poi delle lettere alle proposizioni
atomiche, cioè non ulteriormente decomponibili in proposizioni più piccole.
p0
p1
p2
p3
p4
p5
p6
p7
:
:
:
:
:
:
:
:
AB = DE,
AC = DF,
BC > EF,
BAC^> EDF^,
BAC^ = EDF^,
BAC^< EDF^,
BC = EF,
BC < EF,
(si osservi come le relazioni rappresentino, dal punto di vista linguistico,
copula e predicato nominale).
Le ipotesi del teorema sono p0 , p1 e p2, la tesi è p3. La riscrittura della
dimostrazione, con le abbreviazioni succitate, è la seguente:
1)
2)
3)
4)
5)
6)
7)
8)
9)
p0 (Ipotesi)
p1 (Ipotesi)
p2 (Ipotesi)
(:p3) ! (p4 _ p5 ) (Proprietà della relazione ·)
(p0 ^ p1 ^ p4) ! p6 (Elementi I,4) (p0 e p1 nel testo sono nsottintesi)
p6 ! :p2 (Proprietà della relazione ·)
(p0 ^ p1 ^ p5) ! p7 (Elementi I,24)
p7 ! :p2 (Proprietà della relazione ·)
p3
2.3. LE REGOLE LOGICHE
37
A questa schematizzazione della dimostrazione (in cui non non sono ancora indicate le regole logiche impiegate) siamo giunti tramite l’individuazione
degli enunciati ”atomici”. Il vocabolario utilizzato da questi enunciati atomici coinvolge unicamente simboli per denotare enti geometrici (segmenti
ed angoli) e simboli per denotare relazioni (uguaglianza e disuguaglianza).
Possiamo considerare tale linguaggio come il linguaggio speci…co della teoria
(nella fattispecie la geometria del piano). Tali enunciati atomici sono stati
poi composti in enunciati di livello superiore, ottenuti impiegando parentesi e
connettivi logici. Del vocabolario con cui abbiamo riscritto la dimostrazione
fanno dunque parte:
a) un insieme di lettere (da intendesi come enunciati),
b) le parentesi,
c) i connettivi.
Si tratta, come noto, del linguaggio proposizionale.
E veniamo alle regole logiche impiegate nel precedente esempio (che, ripetiamo, è stato scelto ad hoc). Come osservato, una regola logica è una particolare relazione tra proposizioni che assume la forma generale '1 ; '2; ::; 'n=Ã;
ciò che si pretende da essa è che se le premesse sono vere lo sia anche la conclusione. In altri termini, ciò che si chiede è semplicemente che la verità non
diminuisca. Si tratta a questo punto di trovare quelle relazioni tra formule
che soddisfano tale condizione, e il modo più e¢cace per e¤ettuare tale ricerca è di fatto consistito nel convertire tali relazioni in opportune formule.
In questa ottica, la regola
'1 ; '2 ; ::; 'n =Ã
viene tradotta nella formula
('1 ^ '2 ^ ::: ^ 'n ) ! Ã
la quale riproduce la sua lettura intuitiva. Indicheremo tale formula come
formula corrispondente alla regola, e viceversa. La richiesta, per una regola, della conservazione della (eventuale) verità delle premesse corrisponde,
a causa della tavola di verità dell’implicazione, alla richiesta che la formula
corrispondente non sia mai falsa. Questa condizione è certamente veri…cata
se ('1 ^ '2 ^:: ^ 'n ) ! Ã è una tautologia, per cui arriviamo a questa prima
conclusione:
38
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
² Se ('1 ^ '2 ^ :: ^ 'n ) ! Ã è una tautologia allora '1 ; '2; :::; 'n =Ã è una
regola logica.
(Attenzione: la norma precedente non è una equivalenza. Lascia infatti
aperta la possibilità che la formula corrispondente ad una regola logica non
sia una tautologia. Come vedremo nel § 2.3.2, ciò non signi…ca che la tale
formula possa esser falsa; signi…ca soltanto che il linguaggio proposizionale
è spesso insu¢ciente ad esprimere tutti i legami logici tra le proposizioni;
in particolare, il linguaggio proposizionale non è in grado di esprimere quei
legami che impediscono di valutare ciascuna variabile p; q; r::: in modo indipendente dalle altre, come invece avviene per valutare la tautologicità di una
formula proposizionale.)
Data l’estrema semplicità dell’esempio, le prime 8 formule dalla sequenza soddisfano le condizioni di tipo (i) o (ii) della De…nizione 54 (la 4 e la
8 derivano dalla linearità della relazione ·. E’una carenza degli Elementi
l’assenza, tra le nozioni nozioni comuni, di proprietà riguardante l’ordine.
Tuttavia queste proposizioni sono catalogabili come assiomi o teoremi precedenti). Si tratta dunque di formule svincolate l’una dell’altra. La logica
si concentra tutta nel passaggio dalle prime otto righe alla nona, essendo la
formula 9 la prima proposizione introdotta in base alla condizione (iii) della
De…nizione 54.
Volendo rimanere vincolati a questa sequenza di 9 formule, la risposta è
in qualche modo obbligata: è intervenuta un’unica regola logica, quella le
cui premesse sono le 1-8 e la conclusione è la 9. La regola sarebbe insomma
questa, che indichiamo con RG:
®0
®1
®2
(:®3 ) ! (®4 _ ®5 )
(®0 ^ ®1 ^ ®4) ! ®6
®6 ! :®2
(®0 ^ ®1 ^ ®5) ! ®7
®7 ! :®2
®3
2.3. LE REGOLE LOGICHE
39
Il cambio di lettere (da p ad ®) ha lo scopo di evidenziare il fatto che la
validità di RG non deve essere limitata alle formule p0 ¡ p9 , che nell’esempio
hanno un signi…cato preciso, ma deve essere universale. In e¤etti, la formula
corrispondente a RG:
(®0 ^ ®1 ^ ®2 ^ (:®3 ) ! (®4 _ ®5 ) ^ ::: ^ (®7 ! :®2 ))::) ! ®3
è una tautologia e dunque RG è una regola logica. (Essendo presenti 8 variabili proposizionali, la tavola di verità ha 28 = 256 righe. Sono consigliabili
metodi di veri…ca alternativi !). La presenza della riga 9 nella sequenza
dimostrativa può pertanto essere giusti…cata in questo modo:
9) p3 (da 1-8 mediante RG).
Tuttavia non è certo questa la regola che abbiamo applicato a livello
intuitivo quando abbiamo riconosciuto come convincente la precedente dimostrazione. Le regole che applichiamo intuitivamente hanno di rado più di
due-tre premesse (salvo il caso in cui queste siano molto omegonee tra loro)
e coinvolgono non più di tre-quattro variabili. Inoltre, le regole non sono
funzionali ad una speci…ca dimostrazione (come invece è la nostra RG), ma
sono applicabili in modo di¤uso. L’impiego di regole più ”piccole” richiede
però di allungare la dimostrazione nel passaggio tra 8 e 9. Qui di seguito una
possibile proposta:
8a) p0 ^ p1 (da 1 e 2 mediante R0)
8b) p4 ! p6 (Da 8a e 5 mediante R1)
8c) p4 ! :p2 (Da 6 e 8b mediante R2)
8d) p5 ! p7 (Da 8a e 7 mediante R1)
8e) p5 ! :p2 (Da 8 e 8d mediante R2)
8f) (p4 _ p5) ! (:p2) (Da 8c e 8e mediante R3)
8g) (:p3 ) ! (:p2) (Da 4 e 8f mediante R2)
8h) p2 ! p3 (Da 8g mediante R4)
9) p3 (Da 3 e 8h mediante R5)
con:
®
¯
R0
®^¯
®
(® ^ ¯) ! °
R1
¯!°
® !¯
¯ !°
R2
®!°
40
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
®!°
¯ !°
R3
(® _ ¯) ! °
R4
:¯ ! :®
®!¯
®
® !¯
R5
¯
Le formule corrispondenti a R0-R5 sono tutte tautologie, per cui R0R5 sono regole logiche. Presumiamo però che questa volta non sia necessario
veri…care il fatto in quanto la validità di tali regole (come di tutte quelle e¤ettivamente apploicate a livello intuitivo) deve essere percepita intuitivamente
(il concetto di dimostrazione precede di millenni quello di tautologia).
Le nuove proposizioni 8a-8h possono essere inserite tutte, in quell’ordine, tra 8 e 9. Tuttavia possono anche essere inserite non in blocco. Le
proposizioni che compaiono in una dimostrazione posono subire permutazioni; l’unica condizione è che, ovviamente, nell’applicazione di una regola le
premesse precedano la conclusione. Questa libertà (vincolata) viene abitualmente sperimentata quando si espone una dimostrazione: la scelta è tra (a)
trarre subito determinate conclusioni o (b) attendere a farlo quando vengono impiegate. Seguendo (b) all’estremo, le 8a-8h vengono inserite tra 8 e 9.
Seguendo (a) all’estremo, il risultato il seguente:
1) p0 (Ipotesi)
2) p1 (Ipotesi)
8a) p0 ^ p1 (da 1 e 2 mediante R0)
8b) p4 ! p6 (Da 8a e 5 mediante R1)
3) p2 (Ipotesi)
4) (:p3) ! (p4 _ p5 ) (Proprietà della relazione ·)
5) (p0 ^ p1 ^ p4) ! p6 (Elementi I,4)
6) p6 ! :p2 (Proprietà della relazione ·)
8c) p4 ! :p2 (Da 6 e 8b mediante R2)
7) (p0 ^ p1 ^ p5) ! p7 (Elementi I,24)
8d) p5 ! p7 (Da 8a e 7 mediante R1)
8) p7 ! :p2 (Proprietà della relazione ·)
8e) p5 ! :p2 (Da 8 e 8d mediante R2)
8f) (p4 _ p5) ! (:p2 ) (Da 8c e 8e mediante R3)
8g) (:p3) ! (:p2 ) (Da 4 e 8f mediante R2)
2.3. LE REGOLE LOGICHE
41
8h) p2 ! p3 (Da 8g mediante R4)
9) p3 (Da 3 e 8h mediante R5)
Come abbiamo anticipato, il testo euclideo ha però due frasi in più. Il
loro scopo è appunto, conformemente a quanto visto, quello di distribuire
l’intervento della logica, traendo delle conclusioni parziali. Al posto del primo asterisco, compare l’espressione ”Perciò non BAC^= EDF^”, mentre al
posto del secondo asterisco vi è la frase ”perciò non BAC^< EDF^. Ma
fu altresì dimostrato che non BAC^= EDF^”. Le proposizioni ”Perciò non
BAC^= EDF^” e ”perciò non BAC^< EDF^” corrispondono a :p4 and
:p5. Generalmente, nelle formulazioni moderne di una dimostrazione che
non intenda essere particolarmente didascalica, vengono omesse, lasciando
all’intuizione del lettore il compito di fare mentalmente il punto della situazione. Aggiungendole, otteniamo la seguente sequenza dimostrativa, che a
questo punto formalizza fedelmente il testo euclideo, tranne il fatto che non
abbiamo considerato la frase, presente nel testo euclideo: ”Ma fu altresì dimostrato che non BAC^= EDF^”, in quanto si tratta di un promemoria per
:p4, già presente: ripetere le proposizoini è consuetudine durante una esposizione non formale di una dimostrazione, ma ha valore metalinguistico e non
è opportuno, anche se non contravviene la de…nizione, inserire due volte una
stessa formula nella sequenza dimostrativa.
1) p0 (Ipotesi)
2) p1 (Ipotesi)
3) p2 (Ipotesi)
4) (:p3 ) ! (p4 _ p5) (Proprietà della relazione ·)
5) (p0 ^ p1 ^ p4) ! p6 (Elementi I,4)
6) p6 ! :p2 (Proprietà della relazione ·)
6b) :p4
7) (p0 ^ p1 ^ p5) ! p7 (Elementi I,24)
8) p7 ! :p2 (Proprietà della relazione ·)
8b) :p5
9) p3
In questo caso, oltre alla 9, anche le proposizioni 6b e 8b sono ricavate
logicamente dalle precedenti, sono cioè conformi alla condizione (iii) della
De…nizione 54. E’possibile anche in questo caso giusti…care ciascuna delle
42
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
6b, 8b, 9 mediante singole regole ad hoc. Ad esempio, l’introduzione di 6b
può essere considerata il prodotto della regola:
®0
®1
®2
(:®3 ) ! (®4 _ ®5 )
(®0 ^ ®1 ^ ®4) ! ®6
®6 ! :®2
:®4
(è una regola logica in quanto la formula corrispondente è una tautologia).
Ma, come già osservato, a livello intuitivo le regole devono coinvolgere
poche premesse e poche variabili, per cui, anche questa volta, possiamo aggiungere righe alla sequenza in modo da impiegare regole piccole. La seguente
proposta è una delle tante possibili; si può comunque osservare come la presenza delle nuove proposizioni 6b e 8b faccia prendere alla dimostrazione
un’altra strada rispetto a quella precedente.
1) p0 (Ipotesi)
2) p1 (Ipotesi)
3) p2 (Ipotesi)
4) (:p3) ! (p4 _ p5 ) (Proprietà della relazione ·)
5) (p0 ^ p1 ^ p4) ! p6 (Elementi I,4)
5a) p0 ^ p1 (da 1 e 2 per R0
5b) p4 ! p6 (da 5 e 5a per R1)
6) p6 ! :p2 (Proprietà della relazione ·)
6b) p4 ! :p2 (da 5b e 6 per R3)
6c) :p4 (da 3 e 6b per R6 )
7) (p0 ^ p1 ^ p5) ! p7 (Elementi I,24)
7b) p5 ! p7 (da 5a e 7 per R1)
8) p7 ! :p2 (Proprietà della relazione ·)
8b) p5 ! :p2 (da 7b e 8 per R3)
8c) :p5 (da 3 e 8b per R6)
9) p3 (da 4, 6c, 8c per R7)
2.3. LE REGOLE LOGICHE
43
con:
:® ! (¯ _ °)
®!¯
:¯
:¯
:°
R6 (Modus Tollens)
R7
:®
®
(entrambe le formule corrispondenti sono tautologie).
A questo punto è chiaro il signi…cato dell’espressione ”Ma fu altresì dimostrato che non BAC^= EDF^”, che noi abbiamo omessa in quanto ribadisce
un enunciato già ottenuto, e che invece Euclide reinserisce tra 8c e 9. La
sua funzione è chiara: suggerisce la regola logica da applicare, nel senso che
indica che in tale regola deve intervenire la lontana :p4 (la :¯ della regola
R7).
((4))
==BOX: La logica proposizionale stoica ==========
La prima trattazione del livello porposizionale della logica risale alla scuola Stoica, a cui si deve anche il primo tentativo di assiomatizzazione di tale
logica. Secondo gli Storici, ogni regola inferenziale proposizionale avrebbe dovuto essere derivabile da cinque assiomi, chiamati indimostrabili (le variabili
proposizionali erano nominate primo e secondo):
1) Se il primo allora il secondo; ma il primo; dunque il secondo.
2) Se il primo allora il secondo; ma non il secondo ; dunque non il primo.
3) Non: e il primo e il secondo; ma il primo; dunque non il secondo.
4) O il primo o il secondo; ma il primo; dunque non il secondo.
5) O il primo o il secondo; ma non il secondo; dunque il primo.
Alcune osservazioni:
a) La prima di queste regole è il modus ponens, la seconda il modus tollens.
b) Compaiono tutti i connettivi (se.. allora, non, e, o), ma la o è forte,
cioè è veri…cata quando uno e solo uno dei disgiunti è vero.
c) Tutte le regole hanno due premesse. Quando Antipatro, che fu capo
della scuola tra il 160 e il 130 a.C., introdusse regole con una sola premessa (ad
esempio, il primo e il secondo; dunque il primo), questo fatto fu considerato
una novità.
d) Si tratta di tavole di verità dei connettivi rovesciate, nel senso che
44
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
sono attribuiti valori di verità alla espressione composta e ad uno dei suoi
componenti, e viene poi dedotto il valore del secondo componente.
d) Se consideriamo gli indimostrabili come regole di derivazione per ulteriori regole, allora non abbiamo assiomi. Punto di partenza di una derivazione
sono dunque soltanto le premesse della regola che si vuole dimostrare.
==============================
===BOX. Tutte le tautologie sono equivalenti ma ...====
Un fatto, peraltro ovvio, è che nonostante tutte le tautologie siano logicamente equivalenti, non per questo tutte le corrispondenti regole logiche sono
intuitive allo stesso modo. E neppure sono state accettate in blocco (si consideri anche che il concetto di tautologia è dei primi del ’900). Negli Elementi
troviamo esempi di dimostrazioni che sarebbero eliminabili o sempli…cabili
impiegando regole che invece sono state evitate. Nel primo libro, sono numerose le proposizioni che sono contronominali di altre. L’inserzione (inutile?)
di un asserto che è contronominale di un altro si trova anche all’interno di
singoli enunciati, quale ad esempio quello della Proposizione X.9 (i neretti e
le parentesi sono nostri):
[Quadrati di rette commensurabili in lunghezza hanno fra loro il rapporto che un numero quadrato ha con un numero quadrato;] ed [i quadrati che
abbiano fra loro il rapporto che un numero quadrato ha con un numero quadrato, avranno anche i lati commensurabili in lunghezza]. Invece, [i quadrati
di rette incommensurabili in lunghezza non hanno fra loro il rapporto he un
numero quadrato ha con un numero quadrato]; ed [i quadrati che non abbiano fra loro il rapporto che un numero quadrato ha con un numero quadrato,
non avranno anche i lati commensurabili in lunghezza].
Abbiamo ® ! ¯; ¯ ! ®; :® ! :¯; :¯ ! :®: Essendo (® !
¯) $ (:¯ ! :®) una tautologia (i.e., essendo (® ! ¯)=(:¯ ! :®) e
(:¯ ! :®)=(® ! ¯) regole logiche), la seconda metà dell’enunciato è ”super‡ua”. Ciò comporta che parte di dimostrazione euclidea che riguarda la
seconda metà sia puramente logica, totalmente indipendente dal contenuto
degli enunciati coinvolti. Tale dimostrazione, schematizzata, è:
”vogliamo dimostrare :¯ ! :®: Supponiamo :¯ e supponiamo (per
2.3. LE REGOLE LOGICHE
45
assurdo) ®: Ma abbiamo dimostrato ® ! ¯: Dunque abbiamo ¯; in contraddizione con l’ipotesi :¯:"
Come si vede, si tratta di una dimostrazione della regola contronominale per mezzo del modus ponens e dell’assurdo. I signi…cati di ® e ¯ sono
inin‡uenti.
Un secondo esempio di ”ri…uto”di una regola logica riguarda la cosiddetta
Consequentia Mirabilis: :® ! ® = ®, cui corrisponde la tautologia (:® !
®) ! ®. La proposizione degli Elementi in questione è:
Proposizione IX.12. Se i numeri 1; a; a2 ; :::; an costituiscono una progressione geometrica, e un numero primo p divide an , allora p divide a.
Presentiamo dapprima una formulazione moderna della dimostrazione
euclidea.
Dimostrazione. Sia an = m ¢ p e supponiamo che p non divida a; allora
essendo p primo, risulta che p e a sono primi tra loro (VII. 29). Essendo
an = a ¢ an¡1 , risulta a ¢ an¡1 = m ¢ p, cioè a : p = m : an¡1 (VII.19) e quindi,
dato che a e p sono primi tra loro, p divide an¡1 (VII. 20, 21). Ripetendo lo
stesso procedimento si dimostra che p divide an¡2 , e così via, …no ad ottenere
che p divide a. Da questo, per Consequentia Mirabilis, otteniamo l’asserto.
Ecco al riguardo il commento di Clavio (Commentaria in Euclidis Elementa Geometrica, 1574)
E’veramente meravigliosa la prima parte di questa dimostrazione. In essa infatti Euclide dal fatto di a¤ermare che E [il p della
nostra versione] non divide A, fa vedere con una dimostrazione
diretta che E divide proprio A: il che sembra impossibile. Infatti ove qualcuno stabilisca di dimostrare che Socrate è bianco dal
fatto che non lo è, sembrerà che coinvolga qualcosa di paradossale
e di strano. Non dissimile tuttavia è ciò che qui ha fatto Euclide
sui numeri, nonché in altre proposizioni successive. Anche Cardano ha proceduto in modo analogo trattando delle grandezze nel
Libro 5 del De Proportionibus alla proposizione 201, e si gloria
46
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
di avere trovato lui, primo fra tutti, questa regola dimostrativa.
Io credo che non si sarebbe espresso così se si fosse dedicato con
maggior diligenza a questa dimostrazione, o certamente, avendolo fatto, se gli fosse tornata alla mente. Perché anche Euclide ha
impiegato, molto prima di lui, questo procedimento dimostrativo,
come risulta proprio dal Teorema 12 di prima.
Tuttavia la gran parte dei manoscritti degli Elementi non si ferma al
punto della nostra ricostruzione (e da quella riportata nell’edizione di Clavio),
ma procede oltre:
Dunque p ed a non sono primi fra loro; avranno quindi qualche
divisore comune [VII.def.14]. E poiché per ipotesi p è primo, ed
un numero primo non ha altri divisori all’infuori di sè stesso [VII.
def.11], p divide i numeri a. Similmente si dimostra che ogni altro
divisore primo di an è anche divisore di a.
Questa parte …nale della dimostrazione euclidea non compare
nella nostra ricostruzione perché è ”inutile”. La sua funzione
è quella di convertire il ragionamento per Consequentia Mirabilis in una forma più usuale di riduzione all’assurdo. Proprio per
questo alcuni editori e commentatori di Euclide, tra cui Clavio,
omettono questo periodo ritenendolo una aggiunzione successiva. La questione non è di pura …lologia: se la parte conclusiva
della dimostrazione è autentica, risulterebbe che Euclide non ha
riconosciuto, o non ha ritenuto su¢cientemente convincente, il
procedimento dimostrativo della Consequentia Mirabilis; in caso
contrario questo stesso dubbio è stato proprio della maggior parte dei commentatori (ad esempio, l’edizione moderna del testo
euclideo di Heiberg accoglie la versione ampliata).
=====================================
2.3.2
Limiti della congettura proposizionale
Abbiamo visto che se ('1 ^ '2 ^ :: ^ 'n ) ! Ã è una tautologia allora
'1 ; '2 ; :::; 'n =Ã è una regola logica. Vale anche il viceversa? Se '1; '2 ; :::'n =Ã
2.3. LE REGOLE LOGICHE
47
e’una regola logica, ('1 ^ '2 ^ :: ^ 'n ) ! Ã e’una tautologia? Tutti gli
esempi di regole incontrati nella precedente analisi hanno dato luogo a tautologie, suggerendo quindi una risposta a¤ermativa. Se questa previsione
(che chiameremo congettura proposizionale) risultasse vera, la caratterizzazione dell’insieme delle regole logiche si realizzarebbe mediante il concetto di
tautologia e, grazie all’algoritmo delle tavole di verità, avverrebbe in modo
e¤ettivo. Il compito della logica in quanto ricerca di condizioni che assicurano
la validità delle deduzioni sarebbe così concluso.
Le cose sono andate diversamente. Consideriamo le seguenti frasi:
': ”Non tutti i numeri pari sono divisibili per quattro”,
Ã: ”Esiste un numero pari non divisibile per quattro”.
Appare evidente che, nel corso di una qualunque dimostrazione, si può
passare correttamente dall’una all’altra proposizione. Se scriviamo A(x) e
B(x) per indicare rispettivamente ”x è numero pari” ed ”x è divisibile per
quattro”, il passaggio precedente verrà così rappresentato:
(*)
:8x(A(x) ! B(x))
9x(A(x) ^ :B(x))
Gli enunciati minimi che compaiono in (*) sono p = 8x(A(x) ! B(x))
e q = 9x(A(x ^ :B(x)). Infatti A(x) e B(x) non sono enunciati, e neppure
lo sono A(x) ! B(x) e A(x) ^ :B(x), in quanto, …no a che non si pone
una qualche condizione su x; non ha senso chiedersi se è vero che ”x è numero pari” o ”x è divisibile per quattro”. (Se si pensa che A(x) ! B(x)
possa esser un enunciato, è perchè si è, mentalmente, quanti…cata universalmente la x). Quindi, essendo p e q gli enunciati minimi, la regola (*),
espressa nel linguaggio proposizionale, diventa :p
q e la sua trasformazione in
formula proposizionale risulta :p ! q; formula che non è, ovviamente, una
tautologia. Se volessimo salvare a tutti i costi la congettura proposizionale
dovremmo allora accettare che il passaggio da ' (=:p) a à (=q) non esprima
alcuna regola logica. A tal …ne potremmo considerare ' ! Ã un teorema
(o un assioma) dell’aritmetica, cioè relativo ai numeri naturali, ed attuare la
deduzione come segue:
1) :8x(A(x) ! B(x)) (Ipotesi),
48
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
2) (:8x(A(x) ! B(x))) ! (9x(A(x)^ :B(x))) (teorema dell’aritmetica)
3) 9x(A(x) ^ :B(x)) (da (1) e (2) mediante Modus Ponens)
Tale espediente non è però plausibile. Il fatto che, in (*), A signi…chi
”essere numero pari” e B ”essere divisibile per quattro” è irrilevante; ogni
altra interpretazione dei predicati A e B (ad esempio A(x) con ”x è un
triangolo” e B(x) con ”x è equilatero”) non altera la validità del passaggio
da ' a Ã. Tale validità infatti non dipende da ciò che esprimono A e B, ma
dalla combinazione delle parole ”non”,”e”, ”se..allora” (cioè dei connettivi),
con le parole ”per ogni” ed ”esiste” (e questo è il fatto nuovo). La regola
(*) ha quindi quella universalità che abbiamo indicato come la caratteristica
delle regole logiche.
Un altro modo per salvare la congettura proposizionale potrebbe consistere nel dimostrare che le parole ”per ogni” ed ”esiste”, che non compaiono nel linguaggio proposizionale, sono abbreviazioni di espressioni costruite
soltanto con connettivi e sono quindi eliminabili. Un suggerimento in tal
senso deriva dal fatto che il quanti…catore universale ha le caratteristiche di
una congiunzione, e quello esistenziale di una disgiunzione. Se, nell’esempio
precedente, invece di riferirci all’insieme di tutti i numeri naturali, considerassimo soltanto i numeri minori o uguali ad un certo n allora le proposizioni 8x(A(x) ! B(x)) e 9x(A(x) ^ :B(x)) diventerebbero rispettivamente
abbreviazioni di
(A(0) ! B(0)) ^ (A(1) ! B(1)) ^ ::: ^ (A(n) ! B(n))
e
(A(0) ^ :B(0)) _ (A(1) ^ :B(1)) _ ::: _ (A(n) ^ :B(n)):
La regola (*) si ridurrebbe allora a
:((A(0) ! B(0)) ^ (A(1) ! B(1)) ^ ::: ^ (A(n) ! B(n)))
(A(0) ^ :B(0)) _ (A(1) ^ :B(1)) _ ::: _ (A(n) ^ :B(n))
e la formula proposizionale corrispondente sarebbe una tautologia. Ma se
x varia su un dominio in…nito, allora, salvo eccezioni, non è possibile trovare
una formula proposizionale, cioè senza quanti…catori, che sia equivalente a
8xA(x) (o ad 9xA(x) ), a meno che non si rinunci al fatto che una formula sia
una scrittura …nita. Tentativi in tale direzione sono stati comunque compiuti,
ma la rinuncia alla …nitezza nella scrittura delle formule è un pedaggio troppo
2.3. LE REGOLE LOGICHE
49
caro. Dobbiamo pertanto accettare il fatto che la congettura proposizionale
non sia valida.
Un altro esempio che evidenzia i limiti della congettura è il sillogismo.
Consideriamo il seguente esempio (per una volta senza ricordare a Socrate il
suo triste destino):
Se qualche multiplo di 9 è pari e ogni multiplo di 9 è un multiplo di 3
allora qualche multiplo di 3 è pari .
Gli enunciati minimi (atomici) della frase sono:
p : “qualche multiplo di 9 è pari”
q : “ogni multiplo di 9 è un multiplo di 3”
r : “qualche multiplo di 3 è pari”.
La Logica Proposizionale non è quindi in grado di condurre la sua analisi
oltre alla scrittura
(p ^ q) ! r:
Questa formula non è una tautologia; tuttavia la verità del precedente sillogismo non dipende dal particolare contenuto delle proposizioni, ma possiede
quelle caratteristiche di universalità e di indipendenza dal contesto che è proprio delle regole logiche. Il problema è che quelle p; q; r non sono variabili
indipendenti, ma sono legate tra loro, e per scoprire tale legame (e di conseguenza la struttura logica che rende il precedente sillogismo indipendente
dal contesto) non basta isolare gli enunciati atomici, ma bisogna entrare
all’interno di essi.
Indichiamo con R; P; F i predicati “essere una multiplo di 9 ”, “essere
pari” e “essere un multiplo di 3” e impieghiamo i quanti…catori:
p : (qualche multiplo di 9 è pari) 9x (P (x) ^ Q(x))
q : (ogni multiplo di 9 è un multiplo di 3) 8x (P(x) ! S(x)) ;
r : (qualche multiplo di 3 è pari) 9x (S(x) ^ Q(x)) :
50
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
Il sillogismo precedente viene a questo punto espresso nel modo seguente:
(9x (P (x) ^ Q(x)) ^ 8x (P (x) ! S(x))) !9x (S(x) ^ Q(x))
|
{z
} |
{z
}
|
{z
}
p
q
(2.1)
r
Come si può vedere, questa formalizzazione è ben più complessa di quella
attuabile dalla Logica Proposizionale (semplicemente (p ^ q) ! r), ma riesce
nell’intento di mostrare il valore di regola logica del precedente sillogismo. Il
fatto è che l’espressione “valido indipendentemente dal contesto”non signi…ca
più “qualunque signi…cato abbiano le proposizioni p; q; r”, ma “qualunque
signi…cato abbiamo i predicati R; P; F e qualunque tipo di oggetto denoti
x”.
Ora, la formula proposizionale (p ^ q) ! r è falsa in un solo caso: quando
p e q sono vere e r è falsa. Ma questo caso non si può veri…care in (2.1),
in quanto quelle formule p; q; r sono legate dal fatto di coinvolgere oggetti
comuni, i predicati R; P; F; e quindi il valore di verità delle une in‡uenza
il valore di verità delle altre. Infatti, una grande di¤erenza tra la Logica
Proposizionale e quella che stiamo de…nendo sta proprio in questo: nella
Logica Proposizionale la verità di una formula è legata al valore di verità
di un’altra formula solo se è quest’ultima è una sua sottoformula, mentre in
questa nuova logica anche i valori di verità di due formule atomiche, cioè
prive di sottoformule, possono essere legati tra loro.
===BOX: Il sillogismo ==========
La …gura del sillogismo compare per la prima volta nell’Organon di Aristotele (384-322 a.C.) e, per due millenni, è stata la struttura logica per
antonomasia. Le proposizioni coinvolte in un sillogismo possono essere di
quattro tipi:
tipo
tipo
tipo
tipo
A (universali a¤ermative): ogni P è Q.
I (particolari a¤ermative) : qualche P è Q.
E (universali negative): ogni P non è Q.
O (particolari negative) : qualche P non è Q.
Per motivi di simmetria, abbiamo scritto l’universale negativa in questa
forma anzichè nella più usuale, ma equivalente, ”nessun P è Q”. Le lettere A,
I sono le prime vocali di a¢rmo, mentre E ed O lo sono di nego. I sillogismi
vengono divisi in quattro …gurae:
2.3. LE REGOLE LOGICHE
51
P-Q
S-P
—–
S-Q
Q-P
S-P
—–
S-Q
P-Q
P-S
—–
S-Q
Q-P
P-S
—–
S-Q
I …gura
II …gura
III …gura
IV …gura
dove, ad esempio, P-Q indica una proposizione di uno qualunque dei quattro
tipi precedenti espressa nei termini P e Q nell’ordine. Le tre proposizioni di
un sillogismo sono dette premessa maggiore, premessa minore e conclusione. Nella I …gura il termine P (detto termine medio, presente in entrambe
le premesse ed assente nella conclusione) si trova a sinistra nella premessa
maggiore e a destra nella premessa minore (cioè, è il soggetto della prima ed
il predicato nominale della seconda). Nella II …gura P è invece il predicato
nominale di entrambe le premesse, etc. La conclusione ha sempre la forma
S-Q.
Una classi…cazione ulteriore si ottiene in base al tipo di formule coinvolte.
Un sillogismo sarà, ad esempio, di tipo AEE se le premesse sono, nell’ordine,
di tipo A e di tipo E e la conclusione è di tipo E. (Il sillogismo dell’esempio
precedente è del tipo IAI ed è della III …gura). Un sillogismo è corretto, o
conclude in modo valido, se, qualunque sia l’interpretazione dei termini P,Q
ed S, la verità delle premesse comporta la verità della conclusione.
Di estremo interesse, per quanto ci riguarda, è la trattazione che del
sillogismo troviamo nella Logica Demostrativa di Gerolamo Saccheri. I primi
capitoli dell’opera contengono una trattazione dei principali risultati della
logica classica, caratterizzata dal fatto che le usuali regole della sillogistica
sono dedotte, ispirandosi agli Elementi di Euclide, da assiomi e postulati.
Tale impostazione rappresenta, a parte i tentativi inediti di Leibniz, il primo
esempio di un sistema di logica predicativa formulato in modo assiomatico.
Le proposizioni iniziali assunte da Saccheri sono le seguenti:
Assiomi:
Una stessa cosa non può contemporaneamente essere e non essere.
Ogni cosa è o non è.
52
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
Postulato: Si postula che non tutti i termini siano coestensivi, cioè conseguenza l’uno dell’altro, oppure tra loro contraddittori, ma che esistano termini superiori e inferiori e anche termini tra loro indipendenti. La verità di
questo è manifesta; dato tuttavia che non può essere dimostrato, almeno in
logica, per procedere in modo scienti…co lo si deve ammettere come postulato.
I due Assiomi, di chiara derivazione aristotelica, esprimono il principio di
non contraddizione :(p ^ :p) e il terzo escluso p _ :p; il Postulato richiede
che esistano predicati le cui estensioni (cioè gli insiemi degli oggetti che li
soddisfano) stiano tra di loro in tutti i modi possibili. Ciò che il Postulato
a¤erma è, potremmo dire, la varietà del mondo; esso si distingue quindi dai
due assiomi per la sua natura extralogica. La formulazione esplicita di un simile postulato, così ”ovvio”, rivela la sensibilità logica di Saccheri. Ma ancor
più importante è il tentativo che l’autore compie per a¤rancarsi da esso. Il
Capitolo XI della Logica è infatti dedicato non alla dimostrazione di risultati
nuovi ma alla ridimostrazione senza uso del Postulato di alcuni teoremi precedenti. E lo strumento che Saccheri utilizza per eliminare questa assunzione
extralogica è la Consequentia Mirabilis, che egli conosceva attraverso Clavio
e Cardano. Saccheri si propone di trovare nuove dimostrazioni dei teoremi
precedenti percorrendo una via nobilior, cioè puramente logica, che consiste
nell’assumere la negazione delle proposizioni da dimostrare e da essa, ”in
modo chiarissimo e diretto”, ottenere la tesi proposta. Viene impiegato un
lemma:
Lemma. Se da una coppia di premesse, di un certo tipo e disposte in
una certa …gura, non segue correttamente alcuna conclusione, allora da qualunque coppia di premesse dello stesso tipo e nella stessa …gura non segue
correttamente alcuna conclusione.
Il Lemma è semplicemente il Teorema di Sostituzione riferito al sillogismo.
(Nei moderni trattati di logica il Teorema di Sostituzione compare all’inizio,
subito dopo la de…nizione degli elementi del linguaggio, in quanto esso esprime la proprietà fondamentale delle tautologie: la loro natura formale, cioè la
loro invarianza rispetto ai contenuti).
Due esempi.
2.3. LE REGOLE LOGICHE
53
Teorema 1: Ogni sillogismo della prima …gura di tipo AEE non è un
sillogismo valido.
Dimostrazione. Si consideri lo schema AEE della I …gura:
Ogni P è Q
ogni S non è P
____________
ogni S non è Q
e si interpretino P,Q,S nel modo seguente:
P: ”sillogismo della I …gura di tipo EAE” ,
Q: ”sillogismo valido”,
S: ”sillogismo della I …gura di tipo AEE”.
Si ottiene quindi il seguente sillogismo:
Premessa maggiore: Ogni sillogismo della I …gura di tipo EAE è un
sillogismo valido.
Premessa minore: Ogni sillogismo della I …gura di tipo AEE non è un
sillogismo della I …gura di tipo EAE.
Conclusione: Ogni sillogismo della I …gura di tipo AEE non è un sillogismo
valido.
Le premesse di tale sillogismo sono vere: la maggiore per un teorema
dimostrato in precedenza, la minore in quanto conseguenza immediata delle de…nizioni. La conclusione coincide con l’enunciato del teorema. Ora,
supponiamo che tale enunciato sia falso. Da ciò consegue che il precedente
sillogismo non è valido, in quanto ha premesse vere e conclusione falsa. Ma
tale sillogismo è appunto della I …gura di tipo AEE. Quindi, sotto tale ipotesi,
esiste un sillogismo della I …gura di tipo AEE che non è valido, e allora, per
il Lemma, ogni sillogismo della I …gura di tipo AEE non è valido. Pertanto,
dall’ipotesi che l’asserto del teorema sia falso segue che esso è vero, e quindi,
per Consequentia Mirabilis, l’asserto è vero.
In questo primo esempio la tesi dell’enunciato da dimostrare coincide con
la conclusione del sillogismo (si osservi anche come il sillogismo, falso, sia
54
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
formato da tre proposizioni vere). Nell’esempio successivo, invece, la tesi
coincide con la negazione di una delle premesse.
Teorema 2. Ogni sillogismo della I …gura di tipo IAA non è un sillogismo
valido.
Dimostrazione. Si consideri lo schema IAA della I …gura:
Qualche P è Q
ogni S è P
___________
ogni S è Q
e si interpretino P,Q,S nel modo seguente:
P: ”sillogismo valido”,
Q: ”sillogismo con la premessa maggiore universale”,
S: ”sillogismo della I …gura di tipo IAA”.
Si ottiene quindi il seguente sillogismo:
Premessa maggiore: Qualche sillogismo valido è un sillogismo con la
premessa maggiore universale.
Premessa minore: Ogni sillogismo della I …gura di tipo IAA è un sillogismo
valido.
Conclusione: Ogni sillogismo della I …gura di tipo IAA è un sillogismo
con la premessa maggiore universale.
La premessa maggiore di tale sillogismo è vera (è stata dimostrata in
precedenza), mentre la conclusione è ovviamente falsa (le espressioni tipo I
sono particolari). La premessa minore equivale alla negazione dell’enunciato
del teorema; infatti la negazione di ”Ogni sillogismo della I …gura di tipo
IAA è un sillogismo valido” è ”Qualche sillogismo della I …gura di tipo IAA
non è un sillogismo valido” e, per il Lemma, ciò implica che ”Ogni sillogismo
della I …gura di tipo IAA non è un sillogismo valido”. Ora, supponiamo che
tale enunciato sia falso. Allora la premessa minore del sillogismo precedente
è vera, ed essendo vere entrambe le premesse e falsa la conclusione, tale
sillogismo non è valido. E poiché è un sillogismo della I …gura di tipo IAA,
ne consegue, per il Lemma, che ogni sillogismo di questo tipo non è valido.
2.3. LE REGOLE LOGICHE
55
Pertanto, dall’ipotesi che l’asserto del teorema sia falso segue che esso è vero,
ed allora, per Consequentia Mirabilis, l’asserto è vero.
Come abbiamo detto, queste dimostrazioni hanno lo scopo di a¤rancarsi
dall’impiego del Postulato. Impiegandolo, per dimostrare il Teorema 1 sarebbe stato su¢ciente osservare che i predicati P,Q,S, le cui estensioni P; Q; S
stanno tra loro come in Figura 1, soddisfano le premesse dello schema (infatti P µ Q, cioè ”ogni P è Q”, e S \ P = ? cioè ”ogni S non è P”) e non
soddisfano la conclusione (S \ Q 6= ? e quindi ”ogni S non è Q” è falsa).
In modo analogo, la Figura 2 costituisce una ”dimostrazione” del secondo
esempio.
In questo tipo di dimostrazioni, tuttavia, occorre postulare che esistano
predicati la cui estensioni stanno tra di loro in quel determinato rapporto.
Invece, tramite l’autoreferenza, i termini del sillogismo che falsi…ca una determinata forma vengono interpretati su concetti logici, e ciò consente di
dimostrare anzichè postulare che si trovino in un determinato rapporto. Oltre due secoli dopo incontriamo questa stessa caratteristica nella maggior
parte delle dimostrazioni di completezza di sistemi formali: il problema è
ancora quello di determinare un esempio opportuno (un modello), e la via
per ottenerlo consiste ancora nell’interpretare i termini del sistema logico su
oggetti che a loro volta hanno natura logica, in modo da poterli ottenere
senza ricorrere ad assunzioni extralogiche.
============================
2.3.3
Il livello predicativo
Come abbiamo visto nel paragrafo precedente, la congettura proposizionale
è falsa: esistono regole logiche che, tradotte con gli strumenti del linguaggio
proposizionale, non danno luogo a tautologie. Dobbiamo allora arricchire il
linguaggio superando la barriera proposizionale e analizzando la struttura
56
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
interna delle proposizioni, in modo da tener conto dei quanti…catori oltre
che dei connettivi. La quanti…cazione non solo rende più articolato il linguaggio formale, ma impone una sua più stretta connessione con quello che
abbiamo chiamato il ”linguaggio della teoria”. Infatti i quanti…catori, ed a
causa loro i connettivi, entrano negli enunciati ”minimi” della teoria, ed allora non esisterà più, come nel caso proposizionale, una ”base” di enunciati
indi¤erenziati (p0,p1 ,p2 ...) atti ad operare come variabili. Da ciò deriva la
necessità di un concetto più dettagliato di formula, ed anche il concetto di verità dovrà raccordarsi a questa nuova con…gurazione, risultando quindi molto
più articolato. In particolare, l’attribuzione di verità alle formule ”minime”
comporterà un loro confronto con il tipo modello che la teoria matematica
descrive. E’dunque opportuno presentarne una de…nizione.
De…nition 56 Una struttura (o modello) è una quadrupla < A; R; G; D >
in cui:
i) A è un insieme non vuoto che prende il nome di dominio o sostegno
del modello ;
ii) R = fRi : i 2 Ig è un insieme di relazioni su A.
iii) G = fgj : j 2 Jg è un insieme di funzioni su A.
(iv) D µ A. (D contiene gli elementi privilegiati, cioè con proprietà
particolari, della struttura). ((3))
Quando R; G; D sono …niti, una struttura viene indicata mediante
A =< A; R1; R2; :::; g1 ; g2 ; :::; d1 ; d2 ; ::: >
La de…nizione di struttura determina in modo abbastanza naturale le caratteristiche di un linguaggio atto a parlarne: occorrerà avere un insieme
di simboli di relazione e di funzione per denotare le relazioni e le funzioni,
ed un insieme di simboli di costante per denotare gli elementi particolari di
A. Questa parte del linguaggio, che sostanzialmente coincide con quello che
abbiamo precedentemente chiamato il ”linguaggio della teoria”, dipende di
volta in volta dalle strutture di cui si vuole parlare. Oltre ad essa (non essendo più praticabile la separazione netta tra linguaggio della teoria e linguaggio
delle regole ) ogni linguaggio dovrà contenere una parte …ssa, costituita dai
connettivi, dai quanti…catori, dalle parentesi, da un simbolo relazionale binario = esprimente l’identità, e da un insieme X di variabili che, a di¤erenza
2.3. LE REGOLE LOGICHE
57
dal caso proposizionale, non denoteranno enunciati bensì elementi del dominio delle strutture. Un linguaggio di questo tipo è chiamato ”linguaggio dei
predicati al I ordine con identità”.
De…nition 57 L’alfabeto di un linguaggio al I ordine con identità è un
insieme
L = fP; F; C; X; ^; _; :; !; $; (; ); 8; 9; =g
dove
P = fp0 ; p1 :::::g è un insieme di simboli relazionali (o predicativi), avente
ciascuno una …ssata arietà;
F = ff0 ; f1:::::g è un insieme di simboli funzionali, avente ciascuno una
…ssata arietà;
C = fc0; c1 ; :::g è un insieme di costanti individuali;
X = fxi : i 2 Ng e l’insieme delle variabili individuali.
Si osservi che X è un insieme numerabile, ed è l’unico insieme su cui viene
fatta una richiesta di cardinalità. I sottoinsiemi fX; ^; _; :; !; $; (; ); 8; 9; =
g e fP; F; Cg costituiscono rispettivamente la parte logica e la parte speci…ca
(o propria) di L.
Evidentemente per caratterizzare un linguaggio al I ordine basterà indicarne la parte speci…ca fP; F; Cg del suo alfabeto e, nel caso P; F; C siano
…niti, viene abitualmente rappresentato nella forma
L = fp1 ; p2 ; :::; f1 ; f2 ; :::; c1; c2 ; :::g:
Ora, percorrendo a ritroso la strada che ci ha portato dalle strutture ai
linguaggi, diamo la seguente
De…nition 58 Una struttura A =< A; R; G; D > si dice realizzazione (o
modello) di un linguaggio L = fP; F; Cg se esiste una funzione ¼ che associa
ad ogni simbolo relazionale p 2 P una relazione R 2 R avente la stessa
arietà (R è detta interpretazione di p secondo ¼), ad ogni simbolo funzionale
f 2 F una funzione g 2 G avente la stessa arietà, ed ad ogni simbolo di
costante c un elemento d 2 D, e al simbolo = la relazione identica su A (cioè
f(a; a) : a 2 Ag).
58
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
Osserviamo che il concetto di modello di un linguaggio è molto debole
(ben più forte sarà il concetto di modello di una teoria, dove interverranno le
formule di L e dove si parlerà di verità). Lo scopo della de…nizione di modello
di un linguaggio è quello di stabilire in quali contesti ”abbiano senso” le
proposizioni di quel linguaggio. E sono appunto le proposizioni (le formule)
di un linguaggio al I ordine e la loro interpretazione in una struttura che
dobbiamo ora de…nire.
La de…nizione di formula predicativa al I ordine passa attraverso una
tripla induzione: sui termini, sulle formule atomiche e sulle formule tutte.
De…nition 59 L’insieme i T L dei termini di L è quell’insieme che soddisfa
le seguenti condizioni:
i) X µ T L (ogni variabile è un termine),
ii) C µ T L (ogni simbolo di costante è un termine),
iii) se t1; ::; tn 2 T L ed f è un simbolo funzionale n-ario di F , allora
f(t1; ::; tn ) 2 T L,
iv) null’altro appartiene a T L.
De…nition 60 L’insieme AT L delle formule atomiche di L è quell’insieme
che soddisfa le seguenti condizioni:
i) Se t1 ; t2 2 TL allora (t1 = t2 ) 2 AT L,
ii) se t1 ; :::; tn 2 T L e P è un simbolo relazionale di P avente arietà n,
allora P (t1; ::; tn ) 2 ATL:
iii) null’altro appartiene ad ATL.
Osservazione: 99 il diverso ruolo di simboli funzionali e relazionali (gli uni
impiegati per costruire termini, gli altri per costruire formule) può sembrare
in contrasto con il fatto che, in teoria degli insiemi, le funzioni sono trattate
come particolari relazioni. Consideriamo ad esempio la funzione log 2 : Come
relazione su R, è la relazione binaria che contiene tutte le coppie (x; y) tali
che y è in relazione log2 con x; tra le altre, quindi, contiene la coppia (8; 3):
Stante, dato x; l’unicità di y, possiamo indicare l’elemento 3 nella forma
log 2 8: Ora la scrittura log 2 8 è un termine, e, come vedremo non appena
2.3. LE REGOLE LOGICHE
59
avremo chiarito l’interpretazione di un termine, diventa il nome di un oggetto
in quanto esprime uno dei modi con cui il linguaggio denota l’elemento 3 del
modello R; invece, la scrittura 3 = log 2 8 è una espressione, alternativa a
(8; 3) 2 log2 ; che, interpretata nel modello R, è vera. E ancora, scrittura
log 2 x è un termine, che, non appena valutato x, denota un elemento del
modello R; invece, la scrittura y = log2 x è una espressione, alternativa a
(x; y) 2 log2 ; che, una volta interpretate le variabili nel modello R, può
essere vera o falsa.
De…nition 61 L’insieme F L delle formule ben formate di L è quell’insieme
che soddisfa la seguenti condizioni:
(i) ATL µ FL (ogni formula atomica è una formula ben formata),
(ii) se '; à 2 F L allora (:') 2 F L e ('¤Ã) 2 F L, dove ¤ è un qualunque
connettivo binario.
(iii) se ' 2 FL e x 2 X allora (8x)' 2 F L e (9x)' 2 F L (in tal
caso ' viene detta campo di azione del quanti…catore, ed x variabile del
quanti…catore, o di quanti…cazione).
(iv) null’altro appartiene a F L.
Con la de…nizione di formula non siamo ancora arrivati all’analogo proposizionale, cioè agli enunciati.
De…nition 62 Una formula ' in cui ogni variabile è variabile di quanti…cazione o si trova nel campo di azione di un quanti…catore che la ha come
variabile di quanti…cazione si dice formula chiusa, o enunciato; altrimenti '
è detta formula aperta.
Le formule a cui siamo interessati sono quelle che, interpretate, dicono
qualcosa della struttura , e cioè le formule chiuse. Come vedremo, anche
le formule aperte sono importanti in logica, ma tale interesse si manifesta
soprattutto nell’ambito delle de…nizioni. Al momento, essendo il nostro interesse rivolto alle regole logiche, le formule aperte costituiscono solamente
un passaggio verso la de…nizione di formula chiusa. Passaggio non eliminabile: l’insieme delle formule chiuse di un linguaggio al I ordine, infatti,
non si presta ad una de…nizione ricorsiva. Ad esempio, la formula chiusa
60
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
8x(P(x) ! Q(x)) non può essere considerata il risultato di un processo di
costruzione che parta da formule chiuse più piccole, in quanto né P (x) né
Q(x) , né P(x) ! Q(x) lo sono.
Le formule aperte sono un passaggio necessario anche nella de…nizione
di verità di una formula, in quanto anche questa de…nizione avviene per
recursione. Solo una de…nizione informale di verità di una formula può essere
limitata alle formule chiuse:
De…nition 63 (De…nizione informale di verità di una formula chiusa). Una formula chiusa ' di L è vera in un modello A che è una realizzazione di L, in simboli A j= ', se:
(i) interpretando mediante ¼ i simboli relazionali, funzionali e di costante
nelle corrispondenti relazioni, funzioni e nei corrispondenti elementi di A,
(ii) interpretando il simbolo = nell’identità su A,
(iii) facendo operare i connettivi in modo conforme alle rispettive tavole
di verità,
(iv) leggendo 8 ed 9 come ”per ogni” ed ”esiste” ed interpretando le
variabili su generici elementi di A,
ciò che otteniamo è vero nella struttura.
Una ' formula chiusa di L si dirà valida, e si indicherà con j= ', se è vera
in ogni struttura che è una realizzazione di L. In altri termini, j= ' se e solo
se A j= ' per ogni A di L.
Tuttavia, ribadiamo, per rendere rigorosa le precedente de…nizione è necessario passare attraverso le formule aperte, e prima ancora attraverso i
termini:
De…nition 64 (Interpretazione di un termine mediante una sequenza). Sia § l’insieme delle sequenze in…nite (a1 , a2 ,...,an,...) di elementi di
A, e sia ¾ 2 § . De…niamo, in corrispondenza della sequenza ¾ , una funzione ¾¤ da TL ad A, cioè una funzione che associa ad ogni termine t del
linguaggio L un elemento della struttura A nel modo seguente:
2.3. LE REGOLE LOGICHE
61
i) se t è una variabile xi allora ¾¤(xi) = ai
ii) se t è una costante ci , allora ¾¤(ci) = ¼(ci)
iii) se t è un termine della forma f(t1; :::; tn ), allora
¤
¾ (f(t1 ; :::; tn )) = ¼(f)(¾¤(t1 ); :::; ¾¤ (tn ));
Occorre osservare che il fatto di attribuire, mediante la sequenza ¾ , un
signi…cato a tutte le variabili è sicuramente ridondante per quel che riguarda
un singolo termine o un insieme …nito di termini, in quanto in essi compaiono
al più un numero …nito di variabili. In altre parole se con t(x1; x2; :::; xn ) indichiamo il fatto che in t compaiono al più le variabili (x1; x2; :::; xn), (eventualmente quindi non tutte) e ¾1 , ¾2 sono due sequenze di elementi di A
coincidenti sui primi n termini, risulterà ¾¤1 (t) = ¾¤2 (t). Nel seguito scriveremo t[a1; a2 ; :::; an ] per indicare ¾¤(t) relativamente a tutte le ¾ che hanno
a1 ; a2 ; :::; an ai primi n posti.
De…nition 65 (Soddisfazione di una formula mediante una sequenza.) Sia ' una formula di L e ¾ una sequenza. De…niamo, per recursione
sulla costruzione di ', il concetto ”' è soddisfatta dalla coppia < A; ¾ > ”,
che indichiamo con
< A; ¾ >j= ':
i) Sia ' atomica, cioè della forma P (t1; t2; :::; tn ), dove P è un simbolo
relazionale n-ario di L; allora < A; ¾ > j= ' se (¾¤ (t1 ); ¾¤ (t2); :::; ¾¤(tn)) 2
¼(P), cioè se gli n elementi di A associati da ¾¤ a t1; t2; :::; tn stanno tra loro
nella relazione n-aria ¼(P ).
ii) Sia ' della forma (:Ã); < A; ¾ >j= ' se < A; ¾ >2 Ã, cioè se < A; ¾ >
non soddisfa Ã.
iii) < A; ¾ >j= Ã1 ^ Ã2 se < A; ¾ >j= Ã 1 e < A; ¾ >j= Ã2 ;
< A; ¾ >j= Ã1 _ Ã2 se < A; ¾ >j= Ã1 oppure < A; ¾ >j= Ã 2;
< A; ¾ >j= Ã1 ! Ã 2 se < A; ¾ >2 Ã1 oppure < A; ¾ >j= Ã 2;
< A; ¾ >j= Ã1 $ Ã 2 se < A; ¾ >j= Ã 1 e < A; ¾ >j= Ã2 oppure < A; ¾ >2
Ã1 e < A; ¾ >2 Ã2 .
62
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
iv) sia ' della forma (8xi )Ã; < A; ¾ >j= ' se per ogni sequenza ¾0
coincidente con ¾ escluso al più l’i-esimo termine vale < A; ¾0 >j= Ã.
v) sia ' della forma (9xi )Ã; < A; ¾ >j= ' se esiste una sequenza ¾0
coincidente con ¾ escluso al più l’i-esimo termine tale che < A; ¾0 >j= Ã.
Il senso delle de…nizioni precedenti è abbastanza naturale salvo che nel
caso dei quanti…catori: …ssata un’interpretazione speci…ca per le variabili (se
queste compaiono nella formula), il primo passo a¤erma che questa interpretazione soddisfa la formula se gli oggetti in questione stanno realmente nella
relazione che la formula stessa denomina, mentre quelli relativi ai connettivi si limitano a de…nire la soddisfazione secondo le relative tavole di verità.
Riguardo ai quanti…catori, si osservi che nel passaggio in questione il ruolo
della sequenza speci…ca ¾ relativamente alla i-sima componente è vani…cato
dal fatto di far intervenire tutte le sequenze che di¤eriscono proprio per l’elemento ai (nel caso del quanti…catore universale) oppure una di tali sequenze
(nel caso del quanti…catore esistenziale).
Come notazione, se le variabili contenute in ' sono comprese tra x1; x2; :::; xn,
allora si scrive '(x1 ; x2 ; :::; xn ) e si indica con A j= '[a1 ; a2 ; :::; an] il fatto che
valga < A; ¾ > j= ' per tutte le sequenze ¾ aventi a1 ; a2; :::; an ai primi n
posti.
A questo punto, possiamo facilmente dare la de…nizione di verità di una
formula in una struttura.
De…nition 66 (Verità di una formula). ' è vera in A, in simboli
A j= '
se, per ogni ¾ 2 § , < A; ¾ >j= '. In tal caso si dice che A è modello di '.
Un confronto tra le de…nizioni di soddisfazione e di verità mette in luce
due fatti importanti, che hanno notevoli conseguenze sul rapporto tra regole
logiche e formule:
2.3. LE REGOLE LOGICHE
63
Osservazioni. (1) Se una formula ' è chiusa allora < A; ¾ > j= ' se e
solo se A j= ' dove ¾ è una qualunque valutazione.
(2) Se una formula ' è aperta e le sue variabili libere sono comprese tra
x1; x2; :::xn allora A j= ' se e solo se A j= (8x1)(8x2 ):::(8xn)':
La prima osservazione esprime il fatto che la scelta di ¾ è inin‡uente in
presenza di formule chiuse, mentre la seconda mostra l’equivalenza, relativamente alla verità in una struttura , di una formula aperta con la sua chiusura
universale.
Torniamo ora al problema che ci riguarda. Come individuare le regole
logiche nell’ambito dei linguaggi predicativi? Il criterio, naturalmente, è
sempre quello della validità universale (cioè indipendentemente dal contesto)
che in questo caso diventa
Criterio. Una sequenza '1 ; ::; 'n =Ã è una regola logica se ogni modello
di '1 ,..,'n è anche modello di Ã.
Rimane inoltre inalterata, rispetto a quanto osservato nel caso proposizionale, la corrispondenza ”regole logiche - formule valide”, a condizione però
che le formule siano chiuse. Abbiamo cioè che
² se '1 ; ::; 'n ; Ã sono formule chiuse, allora '1 ; ::; 'n =Ã è una regola logica
se e solo se ('1 ^ ::: ^ 'n) ! Ã è valida .
Osservazioni. (1) Abbiamo …nalmente un se e solo se, e non soltanto
un se, come nel caso proposizionale. Al I ordine, infatti, il linguaggio della
teoria è parte del linguaggio logico, e quindi non ci sono livelli linguistici che
entrino maggiormente all’interno delle proposizioni.
(2) In presenza di formule aperte può accadere che '1; ::; 'n =Ã sia una
regola logica (e cioè che à sia vera ogniqualvolta lo sono '1,..,'n ) senza che
('1 ^ :: ^ 'n ) ! Ã sia una formula valida. Ciò è dovuto a cause formali,
che derivano dalla de…nizione di verità per le formule aperte. La de…nizione
infatti è tale per cui '(x) è vera in A se e solo se 8x'(x) è vera in A. Riguardo alla verità in una struttura, quindi, una formula aperta si comporta
esattamente come la sua chiusura universale. Per questo motivo accade ad
esempio che '(x)=8x'(x) soddis… il criterio di validità universale; infatti, per
64
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
ogni A, se A j= '(x) allora A j= 8x'(x)) e quindi '(x)=8x'(x) è una regola
logica (si chiama Generalizzazione); per contro, la corrispondente formula
'(x) ! 8x'(x) non è una formula valida: per falsi…carla è su¢ciente considerare una struttura A che falsi…chi 8(x)'(x) e veri…chi '[a] per un certo
a.
2.3.4
Come individuare le regole predicative valide.
Riepilogo dei passi compiuti …nora:
i) problema dell’individuazione delle regole logiche;
ii) collegamento tra regole logiche e formule valide;
iii) possibilità di individuare queste ultime, a livello di linguaggio proposizionale, mediante un opportuno procedimento (tavole di verità);
iv) congettura proposizionale;
v) sua caduta: insu¢cienza del livello proposizionale per la formulazione
di ragionamenti matematici comuni;
vi) costruzione di un nuovo linguaggio o, più propriamente, di una nuova
famiglia di linguaggi: quelli predicativi;
vii) verità di una formula in un modello;
viii) criterio per individuare le regole logiche predicative.
Ora: mentre il criterio per individuare le regole logiche predicative è stato
sostanzialmente identico a quello per le regole proposizionali (il criterio della
validità universale, dell’indipendenza dal contesto), una notevole di¤erenza
si manifesta nelle modalità (nelle di¢coltà, potremmo dire) di applicazione
del criterio stesso. Infatti, data una formula proposizionale ' in n variabili proposizionali p1 ,...,pn, ogni modello su cui la formula ha senso renderà
vera o falsa ciascuna delle p1 ,...,pn , e ciò potrà avvenire in non più di 2 n
modi. La veri…ca della validità di ' consisterà allora nell’analisi di questi
2n modi, che corrispondono alle diverse valutazioni delle variabili. In altri
termini, i modelli a cui ' si riferisce vengono ripartiti in 2n classi, una per
ogni valutazione, ed i modelli di ciascuna classe si trovano ad avere un comportamento uniforme rispetto a '. Invece, se ' è una formula predicativa in
cui compaiono in modo essenziale i quanti…catori, allora non si può ripetere
l’operazione di suddividere la classe dei modelli in un numero …nito di classi
aventi comportamento equivalente rispetto a '.
2.3. LE REGOLE LOGICHE
65
A questo punto si presenta il problema della eventuale esistenza di un
processo che sostituisca quello delle tavole di verità e che permetta il riconoscimento delle formule predicative valide e quindi delle corrispondenti regole
logiche. Se esistesse un procedimento di questo tipo, il compito della logica
riguardo al chiarimento e alla giusti…cazione delle dimostrazioni matematiche
apparirebbe, nel complesso, assolto nel modo più soddisfacente.
Non a caso David Hilbert, uno dei massimi matematici del ’900 e uno dei
fondatori della forma attuale della logica matematica, giudicava che il problema dell’esistenza di un procedimento per determinare la validità di un’arbitraria formula predicativa chiusa fosse il problema fondamentale della logica
moderna. Gli avvenimenti non hanno corrisposto alle speranze. Negli anni
’30 è stato dimostrato che la precedente richiesta non può essere soddisfatta.
Il risultato in questione, dovuto a Alonzo Church, è così formulabile:
Theorem 67 (Church, 1936). Non esiste alcuna procedura generale mediante la quale sia possibile determinare con un numero …nito di passi se una
data formula chiusa del calcolo dei predicati sia o no valida .
(In altri termini: l’insieme delle formule valide chiuse non è decidibile).
Il fallimento del progetto precedente, così come è stato presentato, è
quindi de…nitivo ed inapellabile.
Possiamo però tentare di attestarci su una linea più arretrata, chiedendoci
se è possibile che l’insieme in questione risulti almeno enumerabile (ricordiamo che un insieme A è enumerabile se esiste un procedimento che permette
di generare, uno dopo l’altro, gli elementi di A. Vale che: A è decidibile sse
A e Ac sono enumerabili).
La risposta, come vedremo alla …ne del paragrafo seguente, è a¤ermativa,
e la enumerabilità delle formule predicative valide costituisce la caratteristica
decisiva della logica al I ordine dei predicati. Le ”macchine”che storicamente
sono state inventate per elencare, enumerare, un insieme di formule sono i
sistemi formali.
66
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
2.3.5
Sistemi formali
Gli elementi che intervengono nella de…nizione di un sistema formale sono
tre:
1) Un insieme LS di simboli. A partire da LS si de…nisce l’insieme FS
delle formule ben formate, il quale costituisce un sottoinsieme dell’insieme di
tutte le sequenze …nite di simboli di LS .
2) Un insieme AS , sottoinsieme di FS . AS è l’insieme degli assiomi di S.
3) Un insieme …nito RS = fRji : i · ng di regole di inferenza, dove, per
ogni i · n, Rji è una funzione j-aria da (FS )j a FS e¤ettivamente computabile. In pratica, Rji è una legge che associa a j formule di FS una ulteriore
formula che si può e¤ettivamente determinare. In luogo di Rji ('1 ; :::; 'j) = Ã
si scrive usualmente '1 ; :::; 'j =Ã mediante Rji ; in tal caso si dice che la formula
à è conseguenza diretta di '1 ; :::'j mediante Rji .
Un sistema formale S è quindi individuato dalla terna
< LS ; AS ; RS > :
Una dimostrazione (o deduzione) in S è una sequenza …nita di formule di
FS tale che ogni formula appartiene ad AS o è conseguenza diretta di formule
che la precedono mediante una regola di RS . Un teorema di S è la formula
…nale ' di una dimostrazione in S, che in tale caso viene detta dimostrazione
di '.
Il fatto che ' sia un teorema di S viene denotato con S ` ' oppure `S '.
Si può osservare che ogni formula che compare in una dimostrazione è un
teorema, la cui dimostrazione è quella parte di sequenza che la precede.
Naturalmente, gli esempi più importanti di sistemi formali sono di carattere logico e matematico (la scelta dei nomi quali formule, regole, dimostrazioni, lo denota chiaramente). Il concetto di sistema formale è però più
generale, nel senso che l’insieme LS può essere un insieme qualunque.
Theorem 68 L’insieme dei teoremi di un sistema formale il cui insieme di
assiomi è decidibile, è un insieme enumerabile.
2.3. LE REGOLE LOGICHE
67
L’idea, piuttosto intuitiva, è quella di elencare, procedendo a zig-zag, tutte le sequenze …nite di formule ben formate vagliando per ognuna se soddis…
le condizioni di essere una dimostrazione e, in caso positivo, selezionando la
formula …nale. Nel BOX a …ne paragrafo diamo un esempio.
L’assenza di un criterio e¤ettivo di decisione per l’insieme delle formule al
I ordine valide ci porta quindi a convertire la logica in teoria formale, dotata
di assiomi (alcune formule valide) da cui si deducono i teoremi (altre formule
valide, possibilmente tutte). Ma con quali strumenti, con quali regole dedurremo i teoremi della logica dagli assiomi? Conformemente alla de…nizione di
sistema formale, la risposta sarà: mediante un opportuno insieme RS di regole di derivazione. Prima della de…nizione di teoria formale però, la risposta
alla domanda ”come derivare i teoremi dagli assiomi” sarebbe stata: ”mediante regole logiche”. Entrambe le risposte sono corrette; infatti le regole
di derivazione saranno alcune regole logiche. Un elemento di possibile confusione nel caso delle teorie formali della logica è rappresentato dal fatto che
gli assiomi e teoremi della teoria sono regole logiche trasformate in formule.
Convertire la logica in un sistema formale vuol dire allora trovarsi in questa
situazione singolare:
da alcune regole logiche trasformate in formule (gli assiomi di S) si derivano altre regole logiche trasformate in formule (i teoremi di S) mediante
alcune …ssate regole logiche (le regole di inferenza di S).
Il vantaggio che si ottiene, naturalmente è quello di rendere ”dominabile”
l’insieme delle regole logiche. Tuttavia il fatto di trasformare la logica stessa
in una particolare teoria, alla stessa
stregua delle teorie matematiche che contribuisce a gestire, è poco intuitiva. Nell’intuizione comune, infatti, la logica svolge il suo compito strumentale ponendosi su un livello distinto da quello delle teorie matematiche cui si
applica.
Da quanto detto segue naturalmente che, dato il linguaggio LS , la scelta
di AS ed RS verrà e¤ettuata con l’intento di soddisfare i seguenti requisiti:
A) tutti i teoremi di S devono essere formule valide di LS (tale criterio
prende il nome di validità di S);
B) i teoremi di S devono esaurire, se possibile, le formule valide di LS
(tale criterio, ben più di¢cile da soddisfare, prende il nome di completezza
di S).
68
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
Quindi, (A) e (B) insieme richiedono che
l’insieme dei teoremi coincida con l’insieme delle formule valide.
Le strade per raggiungere questo obiettivo possono variare. I sistemi formali infatti hanno un parametro di scelta in più rispetto ai classici sistemi
assiomatici della matematica: non si scelgono solo gli assiomi (ed i concetti
primitivi, la cui scelta nel caso dei sistemi formali è rappresentata dalla scelta di LS ), ma anche le regole di inferenza (le quali nei sistemi classici sono
invece assunte in blocco, in modo del tutto intuitivo). Ora, una maggiore
ricchezza di assiomi consentirà generalmente una maggiore parsimonia nelle
regole, e viceversa. Questo è uno dei punti, forse il più appariscente, su cui
si distinguono le due fondamentali ”scuole” di formalizzazione della logica:
la prima, che risale a Frege e Hilbert, riduce al minimo le regole e necessita
quindi di un insieme di assiomi più impegnativo, la seconda, che risale al
logico tedesco Gerhard Gentzen, riduce al minimo gli assiomi ed assume un
maggior numero di regole (i cosiddetti Calcoli naturali).
Il primo esempio di formalizzazione che, di solito, viene presentato riguarda la logica delle proposizioni, la quale è sicuramente molto più semplice da
trattare rispetto alla logica dei predicati al I ordine. Tuttavia, come abbiamo
osservato, è il linguaggio dei predicati, con il suo insieme di formule valide
non decidibile, che rende necessaria la trasformazione della logica in teoria
formale, al …ne di poter almeno enumerare l’insieme stesso. Questo problema non sussiste per la logica proposizionale, dove l’algoritmo delle tavole di
verità permette di decidere se una data formula proposizionale è valida, cioè
se è una tautologia. Poiché però l’insieme delle tautologie proposizionali può
essere considerato un sottoinsieme dell’insieme delle formule predicative valide, ogni formalizzazione della logica proposizionale costituisce una base che
può essere estesa ad una formalizzazione della logica al I ordine. Prendiamo
come esempio un sistema alla Hilbert.
Il sistema M0 =< LM 0 ; AM 0; RM 0 > (Elliot Mendelson) è de…nito come
segue:
1) LM 0 = ffpi : i 2 Ng; :; !; (; )g. Sono presenti solo due connettivi, mediante i quali gli altri vengono introdotti come abbreviazione (infatti f:; !g
è un insieme di connettivi adeguato). L’insieme FM 0 è de…nito ricorsivamente
come segue:
2.3. LE REGOLE LOGICHE
69
(i) 8i 2 N, pi 2 FM 0;
(ii) se '; Ã 2 FM 0 allora (:') 2 FM 0 e (' ! Ã) 2 FM 0 ,
(iii) null’altro appartiene ad FM 0 .
2) AM 0 è composto da tutte e sole le formule aventi uno dei seguenti
schemi:
AM1: (' ! (Ã ! Ã))
AM2: ((' ! (Ã ! »)) ! ((' ! Ã) ! (' ! »)))
AM3 ((:Ã ! :') ! ((:Ã ! ') ! Ã)):
M0 ha quindi un numero in…nito di assiomi, che si ottengono sostituendo
formule del linguaggio in ciascuno degli schemi di assioma AM1-AM3. Il
fatto che il numero degli schemi sia …nito rende decidibile l’insieme AM0
(si ricordi che la decidibilità dell’insieme degli assiomi è necessaria a¢nché
l’insieme dei teoremi sia enumerabile)
3) RM 0 è composto da una sola regola: '; ' ! Ã=Ã (Modus Ponens).
Il sistema M0 soddisfa le condizioni (A) e (B) precedentemente espresse,
cioè è valido e completo. In simboli:
Theorem 69 `M 0 ' se e solo se j= '.
(La dimostrazione, nel caso proposizionale, non è legata ad un nome
speci…co. Con il simbolo j= denotiamo le formule valide, cioè, nel caso
proposizionale, le tautologie)
Il passaggio ad un sistema formale per la logica al I ordine, che denotiamo
con M1; avviene come ampliamento del sistema M0:
1) LM 1 è un qualunque linguaggio al I ordine (v. Def.57), la cui parte
logica primitiva è f:; !; 8; (; ); Xg (cioè LM 0 [ f8; Xg).
L’insieme FM 1 delle formule è costruito secondo le de…nizioni 59, ?? e 61.
2) AM 1 è composto da in…niti assiomi, ottenuti sostituendo formule di
LM 1 alle (meta)variabili dei seguenti schemi:
70
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
AM1 , AM2, AM3 (di M0)
AM4 : 8xi '(xi ) ! '(t), dove t è un termine libero per xi in '(xi ) .
(t è libero per xi in ' se nessuna occorrenza libera di xi in ' si trova nel
campo di un quanti…catore relativo ad una variabile xj che compare in t )
AM5 : 8xi (' ! Ã) ! (' ! 8xi Ã), dove ' è una formula che non
contiene occorrenze libere di xi .
3) RM 1 è composto da due regole: il Modus Ponens e la regola di Gene'
ralizzazione 8x'
Dal fatto che sia gli schemi di assioma sia le regole di M0 appartengono ad M1, segue che i teoremi del primo sistema sono anche teoremi del
secondo. Più precisamente, sia ' è una formula di LM 0, e denotiamo con
'(p1; :::; pn ) il fatto che p1; :::; pn sono le uniche lettere proposizionali che compaiono in ', e con '(Ã1 ; ::; Ãn ) la formula ottenuta da '(p1 ; :::; pn ) sostituendo
uniformemente ogni occorrenza di pi con Ãi . Abbiamo allora:
² se '(p1; :::; pn) è un teorema di M0 e Ã1 ; ::; Ã n sono formule di LM1
allora '(Ã1 ; ::; Ãn ) è un teorema di M1.
Anche da un punto di vista formale quindi, la logica predicativa al I ordine
è una estensione ella logica proposizionale.
Ricordando che i teoremi, e quindi gli assiomi, delle teorie logiche formalizzate devono essere formule valide, e che le formule valide chiuse e in
forma implicativa corrispondono a regole logiche, possiamo chiederci quali
regole logiche siano rappresentate dagli assiomi AM4 ed AM5. L’assioma
AM4 esprime la cosiddetta regola di particolarizzazione (il Dictum de omni
medioevale: se qualcosa vale per ogni oggetto, vale per l’oggetto t). Essa
costituisce una regola logica di frequentissimo impiego nelle dimostrazioni,
anche se la sua immediatezza intuitiva fa sì che l’applicazione sia automatica
e inconscia. L’assioma AM5 esprime semplicemente il fatto che se la formula
' non contiene occorrenze libere della variabile x, allora il quanti…catore 8x
può essere posposto a '. La validità di questo assioma si fonda sul fatto che,
secondo la de…nizione di verità, se una stessa occorrenza di variabile è nel
campo di due suoi quanti…catori, allora l’e¤etto del quanti…catore esterno è
annullato da quello interno. Ad esempio, la formula 8x9xP (x) (che è una ab-
2.3. LE REGOLE LOGICHE
71
breviazione della formula ben formata 8x:8x:P (x) ) è vera (in un modello
secondo una certa interpretazione) se e solo se è vera 9xP (x) ; il quanti…catore esterno è quindi inin‡uente. Anche la natura dell’esempio mostra come
l’assioma AM5 abbia scarso interesse intuitivo, e il suo impiego quindi sia
dovuto essenzialmente a ragioni formali.
Più problematica risulta invece la regola di generalizzazione. Di essa
abbiamo già parlato: costituisce infatti un esempio di regola che, nel caso in
cui le formule coinvolte siano aperte (cioè contengano variabili libere), può
non avere come corrispondente una formula valida. In altri termini: la regola
asserisce che se '(x) è un teorema allora 8x'(x) è un teorema, ma la formula
'(x) ! 8x'(x) può non essere un teorema . Comunque anche tale regola
esiste in funzione delle formule aperte.
Anche il sistema M1 soddisfa le condizioni di validità e completezza.
Theorem 70 ( Teorema di completezza della logica al I ordine, Gödel 1930).
`M 1 ' se e solo se j= '.
Theorem 71 ( Teorema di completezza estesa, Gödel 1930) Un insieme di
formule è consistente sse ha un modello.
Quindi, l’insieme dei teoremi del sistema formale M1 (così come di ogni
altro equivalente sistema di assiomi per la logica al I ordine) coincide con
l’insieme delle formule valide. E poiché i teoremi di un sistema formale sono
enumerabili, risulta che
Corollary 72 L’insieme delle formule al I ordine valide sono enumerabili.
E poiché, ancora, l’insieme di tali formule corrisponde all’insieme delle
regole logiche, otteniamo …nalmente
Corollary 73 L’insieme delle regole logiche è enumerabile.
=== BOX. Enumerazione dei teoremi di M0 ===========
Come esempio, mostriamo come enumerare i teoremi di M0. Essendo M0
decidibile, si tratta di un compito inutile; è più semplice però da descrivere
72
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
rispeto al sistema M1, per il quale, non essendo decidibile, tale enumerazione
è utile.
Cominciamo col de…nire una biezione g che associ ad ogni simbolo di
LM 0 un numero naturale non nullo. Ad esempio: g(:)=1, g(!)=2, g(()=3,
g())=4, e, per ogni n, g(pn )=n+5 (cioè, g(p0)=5, g(p1 )=6 etc.).
A questo punto possiamo immaginare che il lavoro venga svolto da sette
macchine T1-T7 in sequenza, che svolgono le seguenti operazioni:
T1 elenca, in ordine, i numeri naturali, partendo da 2 : (2; 3; 4; 5; 6; 7:::)
e li fornisce a T2.
T2 li scompone in fattori primi scritti in ordine crescente
(21; 31; 22; 5 1; 2 131 ; 71 ; 23 ; 32 ; 21 51 ; 111 ; 22 31; :::):
T3 compie una operazione di selezione: dato un numero scomposto in
fattori primi, se le basi della scomposizione formano un segmento iniziale
dell’insieme dei numeri primi (cioè, iniziano da 2 e procedono senza saltare numeri primi) allora questo numero viene inviato a T4, altrimenti viene
scartato (tra i numeri …no a 12, ad esempio, vengono inviati a T4 i numeri
21; 22; 213 1; 2 3; 2 231 ;, e scartati gli altri).
T4 converte ogni numero 2n1 3n2 ::: che riceve nella sequenza di simboli
di LM 0 < g ¡1(n1 ); g¡1 (n2); :: >. (Si ricordi che g è una biiezione). Queste
sequenze di simboli di LM 0 vengono inviate a T5, cui spetta, insieme a T6,
il compito più elaborato.
T5 seleziona quelle sequenze di simboli che sono formule ben formate o
sequenze di formule ben formate di LM 0 ; queste vengono inviate a T6, le
altre vengono scartate. E’importante osservare questo fatto: il problema di
determinare se una stringa di simboli di LM 0 è una formula ben formata costituisce un problema decidibile e meccanico. Ed è ugualmente decidibile in
modo meccanico se una stringa è una sequenza di formule ben formate. Infatti, mentre nel linguaggio naturale è necessario disporre di una qualche forma
di spaziatura (spazi bianchi, o trattini) per distinguere tra loro, ad esempio,
le espressioni ”oh, primavera primavera” e ”oh, prima vera primavera”, la
2.3. LE REGOLE LOGICHE
73
de…nizione di formula ben formata rende le separazioni formalmente inutili;
non è infatti possibile che la giustapposizione di due formule ben formate sia
ancora una formula ben formata. Ad esempio, è un fatto non ambiguo che
la stringa
(p0 ! p1 )p2 p4 (:p3 )(p2 ! (p1 ! (:p0 )
costituisce una sequenza delle cinque formule
(p0 ! p1); p2; p4; (:p3 ); (p2 ! (p1 ! (:p0):
T6, che riceve da T5 sequenze di formule, seleziona quelle che sono dimostrazioni di M0. Anche questo e’un compito meccanico: infatti sono
problemi decidibili sia quello di stabilire se una data formula è un assioma,
cioè se è stata ottenuta per sostituzione da uno degli schemi di assioma che
il sistema M0 possiede in numero …nito, sia quello di veri…care se una data
formula deriva da formule precedenti mediante una delle regole di inferenza,
poichè anche le regole sono in numero …nito. Le sequenze che sono derivazioni
vengono inviate a T7, le altre scartate.
T7, in…ne, elenca le formule …nali delle deduzioni ricevute.
E’importante osservare che, prima o poi, ogni teorema del sistema uscirà da T7. Sia infatti ' un qualunque teorema e < Ã1 ; Ã2 ; :::; Ãn ; ' > una
sua dimostrazione. Allora à 1Ã2 :::Ãn ' è una stringa di simboli di LM 0 e,
mediante g, diviene una sequenza < n1 ; n2; :::; ns > di numeri naturali non
nulli (s è uguale al numero complessivo dei simboli delle formule della deduzione). Quando da T1 uscirà il numero n = 2n1 3n2 :::pns s , dove ps è l’s-mo
numero primo, T2 lo scomporrà e lo invierà a T3 che, riconoscendolo come
buono (le basi della scomposizione sono numeri primi consecutivi a partire da 2), lo invierà a T4. Questa macchina lo trasformerà nella sequenza
< g¡1 (n1 ); g ¡1(n2 ); :: >; cioè Ã 1Ã2 :::Ã n', da cui, attraverso T5-T7, avremo
'.
Il procedimento è chiaramente generalizzabile. L’insieme dei teoremi di un
sistema formale (che, come M0, soddis… l’ovvia condizione di avere l’insieme
degli assiomi decidibile) è quindi un insieme enumerabile. In un processo
come quello appena descritto la quantità di numeri ”scartati”, cioè emessi
da T1 e non giunti (opportunamente trasformati) a T7, è enorme. Il primo
74
CAPITOLO 2. IL CONCETTO DI DIMOSTRAZIONE
teorema di M0 emesso da T7, che sarà (p0 ! (p0 ! p0 )) e che, essendo un
assioma, ha come dimostrazione una sequenza composta da una sola formula,
corrisponde al numero n = 23 35 5273 115 132 17519423 4 (infatti, le basi sono
numeri primi successivi, e gli esponenti sono, nell’ordine, le controimmagini
mediante g dei simboli della formula). Ciò signi…ca che tutti i numeri da
2 ad n sono stati scartati, in una o nell’altra fase di elaborazione . Poichè
n è circa uguale a 2; 3 ¤ 1031 , abbiamo che, alla velocità di mille numeri al
secondo, il nostro n, che è il primo utile, verrebbe elencato dopo circa 1021
anni, mille miliardi di volte l’attuale vita del nostro universo.
Il metodo presentato, di particolare semplicità espositiva, è una forma
sempli…cata di quel tipo di codi…ca che prende il nome di ”gödelizzazione”, e
non è certo il metodo più e¢ciente. Tuttavia, qualunque tipo di enumerazione
si scelga, la lentezza è comunque esasperante e, come nel caso precedente, uno
stesso teorema compare in…nite volte (infatti questi procedimenti individuano
i teoremi come formule …nali di deduzioni, ed uno stesso teorema ammette
in…nite deduzioni diverse, ad esempio inserendo arbitrariamente assiomi tra
una formule e l’altra di una deduzione data). Occorre ricordare tuttavia
che non siamo alla ricerca di una macchina che produca solo teoremi (in
tal caso sarebbero possibili drastiche sempli…cazioni), ma di una macchina
che produca tutti e soli i teoremi del sistema, nel senso che ognuno di essi,
prima o poi, deve comparire in uscita. Ed è in questo ”tutti” che risiede il
signi…cato del processo: un insieme in…nito, in generale non decidibile, viene
”dominato” con mezzi …niti.
=========================
Capitolo 3
Gli assiomi dell’Aritmetica
Alla …ne del § 2.1.1 abbiamo visto come i cardini su cui ruota il concetto
di dimostrazione siano due: assiomi della teoria e regole logiche. Il capitolo
precedente ha fornito delle risposte riguardo al problema delle regole. Affrontiamo ora alcuni aspetti riguardanti gli assiomi, concentrandoci su quelli
dell’aritmetica.
3.1
La frattura geometria-aritmetica
Torniamo dunque alla Proposizione I.25, trattata all’inizio del §.2.3. Essa è,
anche per quanto riguarda gli assiomi, conforme alla De…nizione 54. Infatti,
ci muoviamo all’interno di una teoria (la geometria del piano), ed anche se
gli assiomi non intervengono direttamente, il ragionamento utilizza teoremi
precedenti che a loro volta si fondano sugli assiomi.
Non sempre tuttavia le cose stanno in questo modo. Si consideri questa
nuova proposizione, sempre dagli Elementi:
Proposizione IX.20. L’insieme dei numeri primi è in…nito.
Dimostrazione. Supponiamo per assurdo che l’insieme X dei numeri primi
sia …nito, e siano p0 ; p1 ; :::; pn i suoi elementi. Consideriamo il numero q
de…nito dalla formula
q = (p0 ¢ p1 ¢ ::: ¢ pn) + 1:
Il numero q non è divisibile per nessuno elemento di X, poiché il resto di
ogni divisione sarà sempre 1. In tal caso o q è primo (e non appartiene ad X)
75
76
CAPITOLO 3. GLI ASSIOMI DELL’ARITMETICA
oppure è divisibile per un numero primo che non compare in X. In entrambi i
casi esiste un numero primo che non appartiene ad X;contro quanto supposto.
Traduzione letterale:
I numeri primi sono in numero maggiore di ogni quantità assegnata.
Siano A,B,C i numeri primi dati: dico che ci sono più numeri primi di
questi. Si prenda il più piccolo numero multiplo di A,B,C e sia K; e si
aggiunga a K l’unità U.Ora il numero K+U è primo oppure non lo è. Consideriamo prima che lo sia. Allora si sono trovati i numeri primi A,B,C,K+U
che sono in numero maggiore di A,B,C. Come secondo caso sia K+U non
primo.Allora è divisibile per un numero primo D [VII.31]. Dico che D non
coincide con alcuno dei numeri A,B,C.Infatti, se possibile, sia uguale a uno
di essi. Ma A, B,C dividono K; quindi anche D dividerebbe K. Ma D divide
anche K+U. Allora D, essendo un numero, dividerebbe l’unità U che rimane di K + U [ossia la di¤erenza tra K e K+U], e questo è assurdo. Quindi
D non coincide con alcuno dei numeri A,B,C e per ipotesi è primo.Allora
si sono trovati i numeri primi A,B,C,D che sono in numero maggiore della
quantità assegnata A,B,C.((5))
Considerando questa dimostrazione per quanto concerne il problema in
esame, cioè la presenza degli assiomi, osserviamo che in essa non ne vengono citati, né compaiono teoremi che ad essi si ricolleghino. Infatti, nessun
assioma (o postulato) riguardante i numeri compare negli Elementi. La dimostrazione quindi, secondo la de…nizione data, manca del punto essenziale.
Essa appare però del tutto convincente, e così è apparsa nei secoli. Tale
dimostrazione lega, mediante una deduzione, l’asserto da dimostrare non già
ad assiomi stabiliti in inizio di teoria, ma a varie proprietà ”evidenti” dei
numeri naturali (ad esempio: il fatto che il prodotto di due o più numeri sia
un numero, che il successore di un numero sia un numero, etc.). Anche se la
prima assiomatizzazione dei numeri naturali risale a tempi recenti (1889), le
proprietà più complesse dei numeri non sono state, …no ad allora, semplicemente formulate, ma ”dimostrate” (nel senso appena visto) sulla base di una
serie di a¤ermazioni semplici volta a volta riconosciute vere.
Questo fenomeno non è isolato: la grande maggioranza delle usuali dimostrazioni matematiche non fa riferimento ad assiomi e si fonda su un insieme
di proprietà evidenti, individuate ogni volta in funzione della tesi. Appare
chiaro quindi che la De…nizione 54 non descrive in generale la realtà e¤ettiva. Tuttavia, lo sviluppo storico della matematica mostra la tendenza al
3.2. L’INDUZIONE MATEMATICA.
77
passaggio da uno stato non assiomatico ad uno assiomatico, e pertanto le
dimostrazioni tendono ad adeguarsi, almeno in linea di principio, a tale de…nizione. Infatti, se in un primo momento le dimostrazioni sono riservate
esclusivamente a proprietà non immediatamente percepibili e si fondano su
proposizioni evidenti scelte di volta in volta, in una fase più evoluta sorge la
necessità di organizzare l’insieme delle dimostrazioni in modo da uniformare
e ridurre il ricorso all’evidenza. Ciò porta da un lato a …ssare dei punti di
partenza (assiomi), dall’altro alla necessità di dimostrare anche asserti banali (la dimostrazione di asserti ovvi è una della caratteristiche più visibili dei
sistemi assiomatici).
3.1.1
Gli assiomi di Peano.
Abbiamo dunque visto come l’aritmetica sia rimasta priva di assiomi …no al
1889. A tale data risale infatti l’assiomatizzazione di Giuseppe Peano (Cuneo
1858, Torino 1932). Essa rappresenta anche il primo esempio di applicazione
di un linguaggio completamente simbolico alla matematica. Data la diversità del simbolismo di Peano da quello attuale, riportiamo i suoi assiomi in
linguaggio naturale:
P1 : 0 è un numero naturale.
P2 : Se x è un numero naturale, esiste un altro numero naturale denotato
da S(x) e chiamato successore di x.
P3 : 0 6= S(x) per ogni numero naturale x (cioè, 0 non è successore di
alcun numero).
P4 : Se S(x) = S(y) allora x = y.
P5 : Se P è una proprietà relativa ai numeri naturali tale che vale per 0 e
tale che se vale per x allora vale per S(x), allora P vale per tutti i naturali.
3.2
L’induzione matematica.
L’assioma P5 rappresenta il
² Principio di induzione.
78
CAPITOLO 3. GLI ASSIOMI DELL’ARITMETICA
PI :
da
e
segue
P (0)
8k(P(k) ! P(k + 1))
8nP (n):
(3.1)
P (0) viene de…nita base di induzione; la condizione 8k(P (k) ! P (k + 1))
è il passo induttivo; l’antecedente P(k) è l’ipotesi induttiva.
Chiaramente, non è necessario che la proprietà P valga, o sia de…nita,
a partire dal numero 0. Dato un qualunque numero naturale n0 possiamo
prendere P (n0) come base di induzione e dedurre una dimostrazione di P (n)
per ogni n ¸ n0 (ad esempio, la proprietà 2n < n! si dimostra per induzione
per n > 4. Volendo rispettare la de…nizione, si può trasformare nella forma
2n+4 < (n + 4)!, che vale a partire da 0.)
Nella de…nizione precedente abbiamo detto che la proprietà P è “relativa
ai numeri naturali”; se così non fosse le scritture P (0) e P (n) non avrebbero
senso. Tuttavia, almeno in apparenza, ciò contrasta con il fatto che si trovano dimostrazioni per induzione nei più svariati campi della matematica,
della logica e dell’informatica, che sono esterni all’aritmetica. Preciseremo in
seguito questo problema.
Una variante di PI è data dal Principio di induzione completa (o sull’ordine).
PIC :
da ® : 8k [8x((x < k) ! P(x)) ! P (k)]
segue ¯ : 8nP (n):
(3.2)
A parole: sia P una proprietà tale che, per ogni k 2 N, se è soddisfatta
da tutti gli x < k allora è soddisfatta anche da k. Allora P è soddisfatta da
ogni numero naturale n:
Apparentemente sparisce la base di induzione. Si osservi però che se k = 0
allora, essendo fx : x < kg = ;, l’implicazione 8x((x < k) ! P(x)) è sempre
soddisfatta (a vuoto, come si suol dire) e quindi ® diventa P (0). L’altra
novità rispetto a PI consiste nel fatto che l’ipotesi induttiva non si limita al
passo precedente (k per avere k + 1), ma considera tutti i passi precedenti
(tutti i minori di k per avere k). In tal modo l’ipotesi induttiva si ra¤orza, il
passo induttivo (che ha l’ipotesi induttiva come antecedente) si indebolisce,
e la regola tutta (avendo ipotesi più deboli e stessa tesi) apparentemente si
3.2. L’INDUZIONE MATEMATICA.
79
ra¤orza. In e¤etti, la regola diventa talvolta più facilmente applicabile ma
non più forte: le forme PI e PIC sono equivalenti. E’infatti su¢ciente
applicare k volte l’implicazione P(n) ! P(n + 1) per ottenere P (0); P (1); :::
P(k ¡ 1).
3.2.1
La natura del pricipio di induzione matematica.
Perché l’impiego del termine induzione? Il nome induzione è onnipresente
nella storia del pensiero scienti…co e …loso…co, essendo il “problema dell’induzione” l’argomento centrale dell’epistemologia. Secondo una distinzione
ben radicata nella teoria della conoscenza, questa procede “per induzione” e
“per deduzione” . Ecco come S.Mill presenta i termini della dicotomia:
Il ragionamento, nel senso in cui il termine è sinonimo di inferenza, si dice comunemente che è di due generi: il ragionamento che va
dai particolari al generale e il ragionamento che va dal generale ai
particolari; il primo si chiama induzione, il secondo argomentazione o
sillogismo [deduzione]; (...) più propriamente, si ha induzione quando dall’osservazione di un numero di casi individuali saliamo ad una
proposizione generale o quando, combinando più proposizioni generali, concludiamo ad un’altra proposizione ancor più generale; (...) si
ha invece argomentazione quando da una proposizione generale combinata con altre proposizioni inferiamo una proposizione dello stesso
grado di generalità, o una proposizione meno generale, o anche una
proposizione individuale.
Il metodo induttivo è dunque lo strumento che caratterizza la fase euristica ed empirica della conoscenza e, secondo l’epistemologia tradizionale,
è incapace di fornire alle conclusioni lo stesso grado di certezza delle premesse. Il Problema dell’induzione, che è la versione moderna del medioevale
Problema degli universali, consiste appunto in questo: come giusti…care una
quanti…cazione universale, cioè un per ogni, dopo un insieme limitato e non
esaustivo di esperimenti. In ciò, tale metodo è ben distinto dal metodo deduttivo, caratteristico delle scienze matematiche, il quale interviene soprattutto
nella fase di sistematica della conoscenza e a cui è stata sempre riconosciuta la
capacità di fornire alle conclusioni lo stesso grado di certezza delle premesse.
Essendo questi i termini della distinzione, appare evidente che, nella dicotomia induttivo-deduttivo, l’induzione matematica appartiene all’ambito
80
CAPITOLO 3. GLI ASSIOMI DELL’ARITMETICA
deduttivo; essa infatti interviene nelle dimostrazioni matematiche e fornisce
conclusioni tanto certe quanto le premesse. E’però chiaro che la relazione
tra metodo induttivo e induzione matematica non si riduce ad un mero caso
di omonimia. Vi è un …lo che lega tra loro l’accezione epistemologica e quella
matematica del termine induttivo. In e¤etti, la conclusione della regola di
induzione matematica è sempre espressa da una formula universale 8nP (n)
che sembra ottenuta da tanti risultati particolari. Ora, se con ottenuta intendiamo dimostrata, allora la sensazione è falsa: quando si dimostra 8nP (n)
per induzione, non è da asserti particolari che lo si deduce, ma da un asserto
altrettanto universale (cioè 8k(P (k) ! P (k + 1)) coadiuvato da un asserto
particolare (P (0)). Viceversa, se con ottenuta si intende ipotizzata, arguita,
se, insomma, ci si riferisce alla formulazione di una congettura, allora la sensazione è vera, e rende conto del fatto che, molto spesso, si giunge a formulare
un asserto per tutti i numeri naturali dopo averne constatato la validità per
alcuni di essi.
Perché l’impiego della parola principio? Questo termine, più frequente
in …sica che in matematica (dal Principio di Archimede a quello di Heisemberg), è di regola associato a leggi fondamentali; nel nostro caso, dunque,
esprime una legge fondamentale dei numeri naturali, quasi si trattasse di
una proprietà empiricamente veri…cata.
Perché tra gli assiomi? Gli assiomi posti da Euclide a fondamento della
geometria sono cinque, e il quinto, quello “delle parallele”, è il meno intuitivo
e il più travagliato. A questo riguardo, la situazione nell’assiomatizzazione
di Peano è analoga. I primi quattro assiomi, a parole, dicono che 0 è un
numero naturale, che ogni numero ha un successore, che 0 non è successore
di alcuno, che se due numeri hanno lo stesso successore allora sono uguali; il
quinto assioma, il Principio di induzione, è di gran lunga il meno immediato.
Non sembra inoltre di di¢cile dimostrarlo:
Dimostrazione del Principio di induzione. Supponiamo per assurdo che le ipotesi P(0) e 8k(P (k) ! P (k + 1)) siano vere e che
la tesi 8nP (n) sia falsa. Allora l’insieme X costituito dai numeri naturali che non soddisfano P è non vuoto. Sia ¹n il minimo
elemento di X. Da P (0) si deduce che ¹n 6= 0; quindi n
¹ ¡ 1 è un
numero naturale. Inoltre, dal fatto che ¹n è il minimo elemento
3.2. L’INDUZIONE MATEMATICA.
81
di X si deduce che n
¹¡1 2
= X, e quindi soddisfa P . Ma questo,
unitamente all’ipotesi 8k(P(k) ! P (k + 1)), implica che anche n
¹
soddis… P, in contraddizione con la sua appartenenza ad X.
Questa dimostrazione risulta convincente. Perché allora inserire l’Induzione tra gli assiomi? Se passiamo in rassegna le proprietà impiegate nella
precedente dimostrazione, vediamo che una è meno immediata delle altre:
l’assunzione che l’insieme X, il quale è un generico insieme non vuoto di
numeri naturali, abbia minimo. Questa proprietà:
²ogni insieme non vuoto di numeri naturali ammette minimo
prende il nome di Principio del minimo numero, ed equivale ad a¤ermare che
N è ben ordinato da ·. Nonostante la sua maggiore evidenza, tale principio
è aritmeticamente equivalente al Principio di induzione. Ciascuno dei due
principi può quindi essere posto come assioma e impiegato per dimostrare
l’altro. Che la scelta di Peano sia caduta sulla proprietà meno intuitiva
delle due è conseguenza del fatto che, mentre il Principio del minimo numero
è espresso mediante la relazione d’ordine · (assente dagli altri assiomi), il
Principio di induzione è espresso mediante la funzione S di passaggio al
successore (già presente). Tale scelta è quindi più economica.
Per contro, nella teoria (ingenua) degli insiemi, che già dispone di una
relazione d’ordine, il Principio di induzione viene dimostrato mediante il
Principio del minimo numero, nel modo appena visto (per una dimostrazione nella teoria formalizzata si veda Th. 103. Nel §. 3.2.4 vedremo anche
una dimostrazione del principio di induzione esteso ad un numero ordinale
qualunque).
3.2.2
Induzione e recursione
Spesso, al di fuori dell’aritmetica (ad esempio in logica), si incontrano delle
dimostrazioni, dette ”per induzione”, dove non compare alcun riferimento
ai numeri naturali. Consideriamo, ad esempio, l’insieme F bf delle formule
della logica proposizionale:
1) ogni variabile proposizionale pi , con i 2 N; è una formula;
2) se ® è una formula allora anche (:®) è una formula;
82
CAPITOLO 3. GLI ASSIOMI DELL’ARITMETICA
20 ) se ® e ¯ sono formule allora anche (® ^ ¯); (®_ ¯); (® ! ¯) e (® $ ¯)
sono formule;
3) nient’altro è una formula.
e dimostriamo il seguente banalissimo fatto: il numero f(®) delle parentesi di una qualunque formula proposizionale ® è pari.
Dimostrazione. Se ® è una variabile proposizionale, allora f(®) = 0 ed
è quindi pari (base). Se f(®) è pari (ipotesi di induzione), allora f(:(®)) è
pari, in quanto uguale a f(®) + 2. Analogamente, se f(®) ed f(¯) sono pari
e ¤ è uno qualunque tra ^; _; !; $, allora f((®¤ ¯)) è pari, in quanto uguale
a f(®) + f(¯) + 2. Quindi ogni formula del linguaggio proposizionale ha un
numero pari di parentesi.
Questa dimostrazione ha chiaramente le caratteristiche di una dimostrazione per induzione, ma in essa i numeri servono solo per descrivere una
proprietà delle formule e non riguardano a¤atto il processo induttivo, che
invece avviene seguendo la costruzione delle formule. Lo schema applicato in
questo esempio non è quindi PI (né PIC).
La precedente dimostrazione si fonda sul modo in cui è stato de…nito
l’insieme delle formule. Questo tipo di de…nizione è detto per recursione ed
ha la seguente forma:
De…nition 74 Siano U un insieme, H un sottinsieme non vuoto di U e
K = fg1; :::; gs g un insieme …nito di funzioni di qualunque arietà da una
potenza di U ad U. La de…nizione ricorsiva dell’insieme A; con A µ U, a
partire da H mediante le funzioni di K è la seguente:
1) H µ A;
2i ) se gi è una funzione n-aria di K e x1; :::; xn 2 A allora g(x1 ; :::; xn ) 2 A;
3) null’altro appartiene ad A.
Gli elementi di H e quelli di K vengono detti rispettivamente elementi di
base e funzioni di costruzione.
3.2. L’INDUZIONE MATEMATICA.
83
A questo punto, una dimostrazione per induzione del fatto che una proprietà P vale per ogni elemento di A può seguire i passi mediante i quali A
è stato costruito a partire da H e K, e la forma che assume è la seguente:
PGI :
da
e
segue
8x (x 2 H ! P (x))
8g8x1:::8xn (((g 2 K) ^ (x1 ; :::; xn 2 A) ^ P (x1) ^ :::
::: ^ P(xn )) ! P (g(x1 ; :::; xn )))
8x(x 2 A ! P (x)):
A parole: dal fatto che ogni elemento della base H soddisfa P e dal fatto
che, per ogni n-pla x1; :::; xn di A e per ogni funzione g di K, se x1 ; :::; xn
soddisfano P allora g(x1 ; :::; xn ) soddisfa P , segue che ogni elemento di A
soddisfa P . La sigla PGI stà per Principio generale di Induzione.
Adattare la precedente costruzione dell’insieme Fbf a questa de…nizione
generale non è di¢cile: U è in questo caso l’insieme delle sequenze …nite di
simboli dell’alfabeto proposizionale; H è l’insieme delle variabili proposizionali; K è costituito da una funzione unaria g1 tale che per ogni sequenza
di simboli ® 2 U, g1(®) = (:®); e da quattro funzioni binarie g2 ; :::; g5 tali
che, per ogni coppia di sequenze di simboli ®; ¯ 2 U, g2 (®; ¯) = (® ^ ¯),
g3 (®; ¯) = (® _ ¯), g4(®; ¯) = (® ! ¯), g5 (®; ¯) = (® $ ¯).
Dunque, la regola PGI presuppone la de…nizione ricorsiva dell’insieme su
cui si applica. In altri termini, il “metodo per induzione matematica” è qui
costituito dalla coppia
hdefinizione ricorsiva; dimostrazione induttivai:
L’induzione sui numeri naturali non fa eccezione, in quanto i numeri naturali
stessi sono de…nibili per recursione (in modo esplicito nell’ambito generale
della teoria degli insiemi, in modo implicito mediante gli assiomi P1 e P2).
Per come le regole PI e PGI sono state formulate, la prima è un caso
speci…co della seconda. E’tuttavia possibile, anche se a costo di una perdita
di immediatezza, ricondurre una qualunque forma di dimostrazione per induzione che impieghi PGI alla forma PI, cioè riferirla ai numeri naturali e
alla sola funzione di successore S. In tal modo PI ritrova la sua centralità
nell’ambito delle dimostrazioni per induzione. Per mostrare come ciò avvenga, consideriamo una dimostrazione per induzione sulla costruzione degli
84
CAPITOLO 3. GLI ASSIOMI DELL’ARITMETICA
elementi di un insieme A; diverso da N; de…nito per recursione secondo la
De…nizione 74. La costruzione di tali elementi avviene per passi successivi a
partire dalla base H e, in virtù delle condizioni (2) e (3), ogni elemento è ottenibile a partire dalla base mediante un numero …nito di passi. E’possibile
allora de…nire una funzione rango ½ da A a N; dove ½(x) dipende dal numero
dei passi con cui x è stato costruito. Mediante ½, una dimostrazione per
induzione sulla costruzione di A può essere trasformata in una dimostrazione
per induzione sui numeri naturali. Per mostrare come ciò possa avvenire,
consideriamo di nuovo l’esempio precedente, ma questa volta lo dimostriamo
per induzione sui numeri naturali (nella forma PIC), anziché mediante PGI.
(nuova dimostrazione) Data ® 2 F bf, poniamo ½(®) uguale al numero n
dei connettivi che compaiono nella formula stessa. A questo punto la dimostrazione si svolge per induzione su n. Sia P (n) la proprietà “ogni formula ®
tale che ½(®) = n ha un numero pari di parentesi”. Se ½(®) = 0 allora ® 2 H
ed ha 0 parentesi. Supponiamo k > 0 e P (x) per ogni x < k, e sia ® una
formula tale che ½(®) = k. Se ® = (:¯) allora ½(¯) = k ¡ 1 e quindi, per
ipotesi induttiva, ¯ ha un numero pari s di parentesi e ®, che ne ha s + 2,
ha anch’essa un numero pari di parentesi. Se ® = (®1 ¤ ®2 ); dove ¤ è uno tra
^; _; !; $, allora ½(®1 ) < k e ½(®2 ) < k. Per ipotesi induttiva ciascuna di
esse ha un numero pari (che indichiamo con s1 ed s2) di parentesi, ed allora
anche il numero di parentesi di ®, che è s1 + s2 + 2; è pari.
3.2.3
De…zione ricorsiva di funzioni
Oltre che un insieme, anche una funzione f può essere de…nita per recursione.
Il caso generale verrà trattato nel paragrafo successivo. Per ora ci limitiamo
a casi particolari ma signi…cativi.
Una funzine può esser de…nita …ssando il suo valore a su 0 mediante la
condizione
1) f(0) = a
(3.3)
e formulando una legge del tipo
2) f(n + 1) = g(n; f(n))
(3.4)
3.2. L’INDUZIONE MATEMATICA.
85
dove g è una funzione nota in due variabili che consente di passare da f(n)
a f(n + 1).
Il fatto che ci debba essere una ed una sola funzione f che soddisfa questi
requisiti è intuitivo: il valore iniziale f(0) = a è univocamente determinato
e, tramite la legge f(n + 1) = g(n; f(n)); ricaviamo univocamente f(1) =
g(0; f(0)), f(2) = g(1; f(1)), f(3) = g(2; f(2)) e così via per ogni numero
naturale n. Questo risultato di esistenza ed unicità va comunque sotto il
nome di Teorema di Recursione, e verrà dimostrato nel paragrafo successivo
(Th. 77) con riferimento ad un ordinale qualunque.
Un esempio di questo tipo è la de…nizione ricorsiva della funzione fattoriale
1) 0! = 1;
2) (n + 1)! = (n + 1) ¢ n!
la quale si riconduce alle (3.3) e (3.4) ponendo f(0) = 1 e g(n; f(n)) =
(n + 1) ¢ f(n):
Un caso un po’diverso si ha quando la funzione g è in una sola variabile,
e quindi la (3.4) diventa
2) f(n + 1) = g(f(n)):
Ad esempio, la de…nizione ricorsiva della funzione esponenziale an ad esponente naturale
1) a0 = 1;
2) an+ 1 = a ¢ an :
è di questo tipo, ponendo f(0) = 1 e g(f(n)) = a ¢ f(n).
La funzione g mediante la quale viene de…nita la funzione f può esser più
complessa,m in quanto non sempre per il computo di f(n + 1) ci si riferisce
soltanto a f(n):. Ad esempio, la seguente de…nizione di f :
f(0) = 2
f(n + 1) =
X
0·k <n+1
(n + 1 ¡ k)f(k)
è ricorsiva, a non rientra nei casi precedenti in quanto ogni volta si considerano tutti i valori precedenti, che ogni volta aumentano di numero. Vedremo
nel paragrafo successivo come de…nire una funzione g da cui ottenere f.
86
CAPITOLO 3. GLI ASSIOMI DELL’ARITMETICA
Anche operazioni binarie quali la somma e il prodotto si prestano ad
essere de…nite ricorsivamente. Solitamente, trattandosi di funzioni in due
variabili, si considera una variabile per volta, parametrizzando l’altra:
1) per ogni n 2 N; f(n; 0) = n;
2) f(n; S(m)) = S(f(n; m)):
(f è la funzione somma, S è la funzione successore). In tal caso abbiamo
che una operazione corrisponde ad in…nite funzioni in una variabile. Ma è
possibile de…nire la somma direttamente come funzione in due variabili:
1) f(0; 0) = 0;
2) f(n; S(m)) = S(f(n; m));
20 ) f(S(n); m) = S(f(n; m)).
Nel primo caso, la de…nizione corrisponde alla costruzione ricorsiva del dominio N2 a partire da N :
1D ) per ogni n 2 N; (n; 0) 2 N2 ;
2D ) se (n; m) 2 N2 allora (n; S(m)) 2 N2 ;
3D ) null’altro appartiene ad N2 .
Nel secondo caso invece il dominio viene costruito partendo dalla sola coppia
(0; 0):
1D ) (0; 0) 2 N2;
2D ) se (n; m) 2 N2 allora (n; S(m)) 2 N2 ;
20D ) se (n; m) 2 N2 allora (S(n); m) 2 N2 ;
3D ) null’altro appartiene ad N2 .
(Per il prodotto valgono considerazioni sostanzialmente analoghe a quelle
fatte per la somma).
3.2.4
Induzione trans…nita
In questa sezione dimostriamo i Teoremi di Induzione e di Recursioni relativamente ad un qualunque ordinale ®, anziché riferirli, come di consueto, ad
! (N).
Theorem 75 ( Teorema di Induzione trans…nita) Sia ® un ordinale non
nullo e sia A µ ®:
3.2. L’INDUZIONE MATEMATICA.
da
segue
87
8°((° < ® ^ ° µ A) ! ° 2 A)
A=®
(a parole: se per ogni ordinale ° < ® vale che da ° µ A segue ° 2 A; allora
A = ®. Si osservi come, a causa della de…nizione insiemistica degli ordinali,
si preferisca usare, al posto di una proprietà P, l’insieme A; che può essere
inteso come estensione di P).
Dimostrazione (nella teoria ingenua degli insiemi). Supponiamo per assurdo ® ¡ A 6= ?: Allora, essendo ® un buon ordine, ® ¡ A contiene un
minimo elemento °. Tutti i predecessori di ° sono dunque contenuti in A,
cioè ° µ A: Ma allora, per le ipotesi fatte, ° 2 A:
Nel caso ® = !; il precedente enunciato corrisponde a PIC e la precedente
dimostrazione coincide con quella vista nel § 3.2.1. Il principio può anche
essere espresso in forma analoga a PI :
Theorem 76 Sia ® un ordinale non nullo e A µ ®.
da
e
e
segue
02A
8°((° < ® ^ ° 2 A) ! S(°) 2 A)
8°((° < ® ^ Lim(°) ^ 8¯(¯ < ° ! ¯ 2 A)) ! ° 2 A)
A= ®
La dimostrazione è analoga alla precedente.
De…niamo ora, con riferimento ad un qualunque ordinale ®, il concetto
di de…nizione ricorsiva di una funzione f mediante una funzione g (concetto
di cui nel pargarafo precedente abbiamo visto alcuni esempi, con ® = !).
Theorem 77 ( Recursione trans…nita) Sia ® un ordinale, X un insieme, e
sia
§® = fh : h è una funzione da ¯ ad X; con ¯ < ®g :
Possiamo identi…care §® con l’insieme di tutte le sequenze (successioni) di
elementi di X di lunghezza minore di ®: In §® c’è anche la funzione h = ;;
cioè la sequenza nulla, avente per dominio 0). Data una funzione
g : §® ! X
88
CAPITOLO 3. GLI ASSIOMI DELL’ARITMETICA
esiste una ed una sola funzione
f :®!X
tale che, per ogni ° < ®
f(°) = g(f=°)
(si osservi che f=° è una funzione h di §® : Ad esempio, f(4) = g(f(0); f(1); f(2); f(3)):)
Dimostrazione. Cominciamo dall’unicità. Supponiamo che f e f 0 soddis…no le condizioni richieste. Dimostriamo, per induzione trans…nita, che
f = f 0 : Sia
A = f° : ° < ® ^ f 0 (°) = f(°)g :
Innanzitutto, A µ ®: Osserviamo poi che da ? 2 §® segue A 6= ?; in quanto
f(0) = g(f=0) = g(?) = g(f 0 =0) = f 0 (0)
Supponiamo ora ° < ® e ° µ A: Allora, per de…nizione di A, per ogni
± < ° vale f(±) = f 0 (±), cioè f=° = f 0 =°: Allora, per le ipotesi su f e
f 0, f(°) = g(f=°) = g(f 0 =°) = f 0 (°); e quindi ° 2 A: Per il Teorema di
induzione trans…nita (Th.75), A = ®, cioè f(°) = f 0 (°) per ogni ° < ®, e
quindi f = f 0 : A questo punto possiamo indicare con f® la funzione f:
Dimostriamo ora l’esistenza di f® procedendo per assurdo. Supponiamo, dati
g ed X, che f® non esista e sia
B = f¯ : ¯ · ® e non esiste f¯ g :
B 6= ? (contiene, per ipotesi assurda, almeno ®) e B µ ®: Dunque ammette
minimo. Sia ¯0 il minimo di B: Allora, per ogni (eventuale) ± < ¯0 ; esiste
(ed è unica) f± : ± ! X tale che, per ogni ° < ±;
f± (°) = g(f± =°):
Ora, ¯0 6= 0, in quanto la funzione
f0 = ?
è una funzione da 0 ad X e soddisfa, a vuoto, la condizione f(°) = g(f=°)
per ogni (inesistente) ° < 0.
3.2. L’INDUZIONE MATEMATICA.
89
Ma ¯0 non è nemmeno un ordinale successore. Infatti, da ¯0 = S(±) segue
l’esistenza di f± : ± ! X tale che, per ogni ° < ±;
f± (°) = g(f± =°)
Ma f± 2 §® e quindi appartiene al dominio di g: Possiamo in tal modo
estendere f± ad una funzione f : S(±) ! X così de…nita:
f = f± [ (±; g(f ± )) :
In tal modo, per i valori ° < ± abbiamo
f(°) = f± (°) = g(f± =°) = g(f=°)
ed inoltre, essendo f± = f=±,
f(±) = g(f± ) = g(f=±):
Pertanto f(°) = g(f=°) per ogni ° < S(±), cioè ¯0; dunque f è f¯ 0 ; contro
l’ipotesi ¯0 2 B:
Dimostriamo in…ne che ¯0 non può essere un ordinale limite. Supponiamo
per assurdo che lo sia. Supponiamo ± < ´ < ¯0 e dimostriamo che
(¤) f± = f´ =±
Infatti, per ogni ° < ±,
(f´ =±) (°) = f´ (°) = g(f´ =°) = g((f´ =±) =°):
(f´ =±) e quindi una funzione da ± ad X che soddisfa la condizione (f´ =±) (°) =
g((f´ =±) =°): Per la già dimostrata unicità, otteniamo allora f± = f´ =±:
Ora de…niamo f : ¯0 ! X come segue:
per ogni ± < ¯ 0; f(±) = fS (±) (±)
(essendo ¯0 limite, se ± < ¯ allora S(±) < ¯0 ). Da (¤) segue che f estende
ogni funzione f± (infatti f(°) = fS (°) (°) = f± (°) per ° < ± < ¯ 0): Pertanto
f(°) = f± (°) = g(f± =°) = g(f=°):
Dunque f è f¯ 0 ; contro l’ipotesi ¯0 2 B:
90
CAPITOLO 3. GLI ASSIOMI DELL’ARITMETICA
Capitolo 4
Formalizazione di una teoria
matematica
Dimostrazioni ”senza assiomi”, cioè all’interno di teorie non assiomatizzate,
sono frequenti non solo in aritmetica, ma anche in analisi e in vasti settori
della geometria. Queste teorie hanno una importante caratteristica comune:
ciascuna di esse fa riferimento ad un unico universo di enti. Sono cioè teorie che descrivono un ”modello naturale” (o ”modello inteso”, come talvolta
viene chiamato), e che si sono sviluppate in base alla familiarità che abbiamo
con esso. Ad esempio, nel caso della geometria c’è, nell’intuizione geometrica
usuale, un solo universo di punti, rette e piani; di quello parlano le proposizioni della teoria, e ad esso ci si riferisce per determinare la loro verità.
Punto, retta, piano vengono assunti come concetti primitivi (o ”de…niti”,
come nel caso degli Elementi), e gli assiomi (quando ci sono) individuano
un insieme di proprietà su¢ciente allo sviluppo delle dimostrazioni. Così, se
da un punto di vista logico gli assiomi rappresentano (come ogni insieme di
assiomi) un punto di partenza, di fatto la loro funzione è quella di costituire
un punto di arrivo, un arresto a quel processo dal complicato al semplice
che caratterizza le dimostrazioni su tali enti. In modo analogo, anche l’aritmetica fa riferimento ad un unico universo; anzi, in questo caso, l’unicità
del modello dei numeri naturali è talmente presente e le sue caratteristiche
elementari sono così fondamentali che la ricerca degli assiomi è iniziata oltre
due millenni dopo quelli della geometria. In…ne, anche l’analisi matematica
ha la caratteristica di far riferimento ad un sistema di enti unico: il campo dei
numeri reali. Ora se consideriamo che aritmetica, geometria elementare ed
analisi costituiscono il corpus più noto della matematica, appare chiaro come
91
92CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA
la caratteristica di riferirsi ad un solo modello possa passare inosservata e venire considerata universale. Chiameremo le teorie con questa caratteristica
”teorie a modello unico” .
E’con la nascita dell’algebra astratta (cioè con lo studio di strutture
algebriche quali gruppi, anelli, campi etc.) che tale caratteristica perde la
sua valenza universale. Lo scopo delle teorie dell’algebra astratta non è la
descrizione il più possibile completa di un’unica struttura, ma, all’opposto, la
descrizione di proprietà comuni ad una molteplicità di strutture, che vengono
in tal modo descritte in forma necessariamente e volutamente incompleta.
Anzi, l’eterogeneità delle strutture che rientrano nell’ambito di un’ unica
de…nizione costituisce uno dei principali motivi di interesse di questo tipo di
teorie. Chiameremo queste teorie ”teorie a più modelli ”.
La descrizione delle condizioni, delle proprietà da soddisfare per essere
un modello della teoria vengono elencate in modo esplicito, ed hanno un
ruolo iniziale. Che rapporto hanno queste proprietà, queste condizioni, con
gli assiomi delle teorie a modello unico? Raramente la parola ”assioma” è
impiegata per queste proprietà, ma il loro ruolo è proprio quello degli assiomi.
Sarà il concetto di teoria formalizzata che mostrerà al meglio l’identità dei
due ruoli. Ma già l’esempio successivo è in questa direzione.
Example 78 Il teorema che segue riguarda gli anelli, di cui elenchiamo le
proprietà da soddisfare:
(R1) a+b = b+a
(R2) (a+b)+c = a+(b+c)
(R3) (ab)c = a(bc)
(R4) esiste un elemento, indicato con 0 e detto elemento neutro rispetto
alla somma, tale che, per ogni a, a+0=a.
(R5) esiste un elemento, indicato con 1 e detto elemento neutro rispetto
al prodotto, tale che, per ogni a, a¢1=a.
(R6) per ogni a esiste un b, detto inverso di a rispetto alla somma, tale
che a+b=0.
(R7) a(b+c) = ab+ ac (distributività del prodotto rispetto alla somma).
Dimostrare una asserzione sugli anelli, cioè dimostrare che vale per tutti
gli anelli, signi…ca farla discendere da R1-R7, che si comportano quindi come
4.1. LE TEORIE MATEMATICHE FORMALIZZATE
93
gli assiomi della teoria. Come esempio presentiamo un teorema che, nell’anello dei numeri reali (o razionali, o interi), esprime la ben nota ”regola dei
segni”.
Teorema: In ogni anello A e per ogni coppia a e b di elementi di A
valgono le seguenti proprietà:
(i) (-a)b = -(ab) e (ii) (-a)(-b) = ab.
Schema rapido di dimostrazione. (i):
(1) 0¢b=(a+(-a))b (per R6)
(2) (a+(-a))b=(ab)+((-a)b) (per R7)
(3) 0=0¢b (teorema precedente della teoria))
(4) (ab)+((-a)b)=0 (dalle precedenti (1)-(3) per la transitività dell’uguaglianza)
(5) -(ab)=(-a)b (da (4) per il teorema, precedente nella teoria, dell’unicità
dell’opposto)
Si dimostra analogamente che (i’): (a)(-b) = -(a b).
(ii):
(1) (-a)(-b) = -(a(-b)) = -(-(ab)) (da (i) e (i’) )
(2) -(- (ab))=ab (dal teorema, precedentemente nella teoria, dell’unicità
dell’opposto)
(3) (-a)(-b) = ab (da (1) e (2) per la transitività dell’uguaglianza)
Il ruolo delle proprietà R1-R7 nella precedente dimostrazione è stata in
tutto e per tutto analogo a quello degli assiomi; il concetto di teoria formale
sancisce questa analogia.
4.1
Le teorie matematiche formalizzate
Con la formalizzazione della logica (cioè la conversione della logica in un sistema formale, dotato di assiomi e regole di derivazione) siamo passati dalla
situazione (euclidea) in cui le regole logiche costituiscono un insieme non organizzato, ad una nuova situazione in cui ci si muove su tre livelli distinti:
mediante le regole di inferenza (Modus Ponens e Generalizzazione) si deducono i teoremi logici dagli assiomi logici, ed a loro volta i teoremi logici,
trasformati nelle corrispondenti regole logiche, consentono la deduzione dei
94CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA
teoremi della teoria matematica dagli assiomi della teoria stessa. Questa
situazione transitoria prelude ad una terza sistemazione, che si ottiene inglobando in un unico sistema formale sia la teoria matematica in oggetto, sia la
logica. Nascono così i sistemi formali delle teorie matematiche, comunenente
detti teorie matematiche formalizzate.
Per ottenere una teoria matematica formalizzata si procede dunque in
questo modo. Come primo passo si individua il linguaggio L (predicativo
al I ordine) idoneo a descrivere la teoria (v. § 2.3.3). Si considera quindi
la teoria formale della logica al I ordine (ad esempio il sistema M1 trattato
nel § 2.3.5) interpretando le metavariabili dei suoi assiomi nel linguaggio L.
Agli assiomi logici viene aggiunto un insieme di assiomi relativi all’identità.
In…ne, si aggiungono gli assiomi speci…ci della teoria matematica in oggetto
(ovviamente espressi in L).
De…nition 79 Se T è una teoria espressa nel linguaggio L ed A è un modello
di L, si dirà che A è modello di T (in simboli A j= T) se A rende veri gli
assiomi di T .
Poichè il Modus Ponens e la Generalizzazione conservano la validità delle
formule coinvolte, se A è modello di T allora A renderà veri anche tutti i
teoremi di T .
(Si osservi la di¤erenza tra i concetti ”essere modello di un linguaggio L”
(v. Def. 58) ed ”essere modello di una teoria T ” (def. 79). Nel primo caso
viene soddisfatto un semplice requisito di sensatezza: se A è modello di L
sono allora le formule di L sono interpretabili, e quindi vere o false, in A. Nel
secondo caso invece le formule di L che sono teoremi di T sono vere in A.)
Come esempi di sistema formale di una teoria matematica presentiamo
la teoria formalizzata dell’aritmetica e la teoria formalizzata degli anelli (entrambe presentate precedentemente in modo assiomatico non formalizzato).
Example 80 La teoria formale al I ordine dell’aritmetica.
Il linguaggio in cui esprimiamo questa teoria, che indichiamo con T A,
è LA = f+; ¢; S; 0g, dove S è un simbolo funzionale unario (che esprime la
funzione di passaggio al successore). L’insieme di assiomi di TA è il seguente:
4.1. LE TEORIE MATEMATICHE FORMALIZZATE
95
AM1-AM5 (v. § 2.3.5)
AI1 (8x)(x = x)
AI2 (8x)(8y)((x = y) ! ('(x; x) ! '(x; y)), dove '(x,y) è ottenuta da
'(x,x) sostituendo y ad alcune (non necessariamente tutte) occorrenze di x
libere per y.
AA1 8x(0 6= S(x))
AA2 8x8y(S(x) = S(y) ! (x = y))
AA3 8x(x + 0 = x)
AA4 8x8y(x + S(y) = S(x + y))
AA5 8x(x ¢ 0 = 0)
AA6 8x8y(x ¢ S(y) = (x ¢ y) + x)
AA7 '(0) ! ((8x('(x) ! '(S(x))) ! (8x'(x)) (dove '(x) è una
qualunque formula di LA avente x libera)
Gli schemi AM1-AM5 sono detti assiomi logici (si tratta di schemi di
assiomi, come anche AI2 e AA7, le cui metavariabili '; Ã; ::: devono essere
sostituite con formule di LA: Ciascuno schema sta quindi per in…niti assiomi. Ovviamente AM1-AM5 possono essere sostituiti da qualunque altro
sistema per la logica al I ordine che sia completo). Gli schemi AI1-AI2 sono
detti assiomi dell’identità AI1-AI2; gli assiomi AA1-AA7, che formalizzano
i precedenti A1-A7 scostituiscono assiomi speci…ci (o propri) della teoria.
Poichè ogni modello rende veri sia gli assiomi logici AM1-AM5 sia gli assiomi
dell’identità AI1-AI2, per determinare se una data struttura è modello di
una teoria è su¢ciente controllare se veri…ca gli assiomi speci…ci della teoria
stessa.
Gli assiomi dell’identità sono messi in un gruppo a parte in quanto esi
non sono assiomi logici in senso stretto, ma sarebbe fuorviante considerarli
assiomi speci…ci delle singole teorie, dal momento che descrivono proprietà
valide in ogni struttura. AI1 ed AI2 in e¤etti appartengono ad ogni teoria
formalizzata al I ordine, così come il simbolo relazionale ”=” appartiene ad
ogni linguaggio formale al I ordine. Questa situazione colloca l’identità in
una posizione intermedia tra i concetti logici e quelli matematici: dei primi
ha infatti l’universalità ma non la natura puramente linguistica. Questo particolarità è stata del resto riconosciuto …n dall’antichità; si ricorderanno al
riguardo le ”nozioni comuni” degli Elementi, che sono in parte assiomi dell’identità e che Euclide ha separato dai postulati geometrici (v. § 2.1.1). E’
importante però osservare che la distinzione tra assiomi logici, assiomi dell’i-
96CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA
dentità ed assiomi speci…ci (cosi come la distinzione tra parte logica e parte
speci…ca di un linguaggio, v. Def. 57) è esterna alla teoria. Da un punto di
vista formale infatti, nulla distingue i vari tipi di assiomi, e nulla quindi separa, nell’insieme dei teoremi della teoria formalizzata, i teoremi speci…ci della
teoria dai teoremi puramente logici o dai teoremi che riguardano soltanto
l’identità .
Tra gli assiomi speci…ci, non vi sono i corrispondenti di P1 e P2, in quanto
0 ed S sono elementi del linguaggio, e quindi l’esistenza in ogni modello di
un elemento corrispondente alla costante 0 e di una funzione corrispondente
al simbolo funzionale S è garantita dal concetto di modello di un linguaggio. Gli assiomi AA1 e AA2 corrispondono a P3 e P4 : Gli assiomi AA3-AA6
costituiscono la de…nizione ricorsiva di somma e prodotto. L’assioma AA7
esprime il Principio di induzione. Tuttavia, tra l’assioma P5 di Peano e AA7
vi è una sostanziale di¤erenza. Il primo costituisce una singola espressione
con una quanti…cazione sui predicati (”Se P è una proprietà ....). Il secondo
rappresenta uno schema di assioma, ed esprime quindi in…nite formule al I
ordine, una per ciascuna formula '(x) di LA. Ogni '(x), contenendo una variabile libera, esprime una proprietà dei numeri naturali de…nibile attraverso
il linguaggio della teoria. Ma le proprietà così formulabili sono numerabili
(dal momento che l’intero insieme delle formule di LA è numerabile), e dunque non esauriscono tutte le proprietà dei naturali, che hanno la potenza del
continuo. AA7 è quindi più debole di P5 .
Example 81 La teoria formale al I ordine degli anelli.
Il linguaggio in cui tale sistema formale, che indichiamo con T R; è LR =
f+; ¢; 0; 1g. TR ha ancora gli schemi AM1-AM5 e AI1-AI2 ma, naturalmente, questa volta le metavariabili '; Ã::: che in essi compaiono devono essere
sostituite con formule del linguaggio LR: Gli assiomi speci…ci sono ottenuti
formalizzando i precedenti R1-R7 dell’es.78
AR1
AR2
AR3
AR4
AR5
(8x)(8y)(x + y = y + x)
(8x)(8y)(8z)((x + y) + z = x + (y + z))
(8x)(8y)(8z)((xy)z = x(yz))
(8x)(x + 0 = x)
(8x)(x ¢ 1 = x)
4.1. LE TEORIE MATEMATICHE FORMALIZZATE
97
AR6 (8x)(9y)(x + y = 0)
AR7 (8x)(8y)(8z)(x(y + z) = xy + xz)
I modelli del linguaggio LR che rendono veri gli assiomi di TR saranno i
modelli di T R, e cioè gli anelli con unità.
A rendere la trasformazione delle teorie in teorie formalizzate non un semplice arti…cio linguistico ma un potente strumento di indagine matematica è
la possibilità di estendere a tali teorie il Teorema di Completezza di Gödel
(1930) relativo al sistema formale della logica al I ordine. (Th.70). Occorre
de…nire un nuovo concetto:
De…nition 82 Sia ' una formule di L. ' è conseguenza logica di T (in
simboli T j= ') se ogni modello di T è modello di ', cioè se A j= T implica
A j= '.
Il precedente Th.71 può essere qui riscritto in questo modo:
Theorem 83 ( Teorema di Completezza Estesa, Gödel 1930). T ` ' se e
solo se T j= '.
Questo risultato dimostra la piena corrispondenza tra il concetto sintattico ”essere teorema di T ” e quello semantico di ”essere conseguenza logica
di T ”. Il verso ovvio del teorema (quello della validità: T ` ' ) T j= ')
asserisce che se un modello rende veri gli assiomi di una teoria allora rende
veri tutti i suoi teoremi. Il verso opposto (T j= ' ) T ` ') dimostra che se
una formula è vera in tutti i modelli di una teoria, allora è dimostrabile nella
teoria. I livelli sintattico e semantico si trovano dunque a coincidere.
===BOX La riconversione delle formule in regole: il Modus
Ponens ===
L’insieme delle regole di inferenza di una teoria matematica formalizzata è
quello della teoria logica su cui si innesta. Questo fatto mostra che la speci…cità di una teoria si rivela nel linguaggio e negli assiomi, non nella deduzione,
la quale rimane una competenza speci…catamente logica ed è uniforme per
tutte le teorie. Pertanto, la macchina che enumera tutti i teoremi della teoria
è mossa solo dal Modus Ponens con l’aiuto della Generalizzazione (la quale è
98CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA
signi…cativa limitatamente alle formule aperte e quindi ha un ruolo abbastanza secondario). Tutto il peso deduttivo è quindi sostanzialmente concentrato
su una regola sola. Il modo in cui essa è in grado di sostituire, all’interno
delle teorie matematiche formalizzate, tutti i ”vecchi” metodi dimostrativi,
lo si può vedere con un esempio:
'!Ã
la regola contronominale :Ã!:'
non è una regola di inferenza dei nostri
sistemi. Supponiamo ora che ' ! Ã sia un teorema di una teoria formalizzata
S, assumiamo cioè S ` ' ! Ã. Tra i teoremi di S vi è anche la formula
(' ! Ã) ! (:Ã ! :') (infatti (' ! Ã) ! (:Ã ! :') è una tautologia,
quindi è valida, quindi, per il Teorema di completezza, è un teorema logico
e quindi un teorema della teoria S ). Ora, da S ` ' ! Ã e S ` (' ! Ã) !
(:Ã ! :') si ottiene S ` :Ã ! :' mediante Modus Ponens.
L’esempio precedente infatti si può generalizzare. Se
'1 ; :::; 'n
Ã
è una regola logica (composta di formule chiuse) allora
'1 ! ('2 ! (:::'n ! Ã)::)
(che è equivalente a ('1 ^::: ^'n ) ! Ã) è valida e quindi è un teorema logico
e, conseguentemente, è un teorema di ogni teoria matematica formalizzata
S. Ed allora, da
S ` '1 ; :::; S ` 'n
e
S ` '1 ! ('2 ! (:::'n ! Ã)::)
otteniamo
S`Ã
mediante n applicazioni del Modus Ponens. In virtù di quest’unica regola
(con la Generalizzazione e gli assiomi logici) è quindi come se la teoria disponesse di tutte le regole logiche . Del resto, il Modus Ponens formalizza la riga
della tavola di verità che interessa più direttamente le dimostrazioni: l’eventuale verità delle ipotesi deve passare alla tesi (se v(A) = 1 e v(A ! B) = 1
allora v(B) = 1:): In tal modo l’implicazione linguistica ('1 ^ ::: ^ 'n ) ! Ã è
trasformata in una implicazione metalinguistica: se S ` '1; :::; S ` 'n allora
S ` Ã:
=================================
4.1. LE TEORIE MATEMATICHE FORMALIZZATE
4.1.1
99
Le de…nizioni
Il primo atto che si compie nel processo di formalizzazione di una teoria
matematica consiste, come abbiamo osservato, nella scelta del linguaggio
formale in cui esprimerla. Tale scelta è, a sua volta, determinata dall’insieme dei concetti che si decide di assumere come primitivi. E’nello spirito di
ogni impostazione assiomatica, di cui le teorie formalizzate sono l’espressione evoluta, il tentare di ridurre quanto più possibile il numero dei concetti
primitivi (così come il numero degli assiomi, che di questi esprimono le proprietà iniziali). Ad esempio, le dimostrazioni di geometria elementare parlano
correntemente di triangoli particolari (isosceli, rettangoli,..), di bisettrici, di
altezze; è tuttavia estremamente improbabile che una geometria formalizzata
(o anche una geometria assiomatizzata come quella degli Elementi) assuma
tutti questi enti come primitivi e doti il linguaggio di opportuni predicati per
esprimerli.
Nel caso dell’Aritmetica abbiamo scelto come concetti primitivi f+; ¢; S; 0g:
Nel caso della assiomatizzazione della geometria elementare di Hilbert, ad
esempio, i concetti primitivi sono sei: punto, retta, piano, ”stare tra”, incidenza e congruenza (quindi, tre relazioni unarie (predicati), una relazione
ternaria e due relazioni binarie). Tutto il resto è de…nito.
Un procedimento essenziale ed ineliminabile nello sviluppo delle teorie
matematiche consiste dunque nel de…nire nuovi concetti. Dimostrazioni e
de…nizioni costituiscono infatti i due poli nello sviluppo naturale delle teorie.
Se l’attenzione della logica è esplicitamente concentrata sul primo di essi,
cioè sui teoremi, è perché le de…nizioni sono, da un punto di vista logico,
eliminabili. Ma questa è soltanto una parte della storia, quella a posteriori;
da un punto di vista euristico, le de…nizioni non sono eliminabili e senza di
esse non esisterebbe la matematica così come noi la conosciamo (il Teorema
di Pitagora non è pensabile in termini di soli punti e rette, nonostante che
triangoli e quadrati siano de…nibili a partire da essi).
La gestione delle nuove de…nizioni all’interno di una teoria formale è a¢data alle formule aperte. Consideriamo ad esempio la teoria T A dell’aritmetica. Il linguaggio in cui è espressa è LA = f+; ¢; S; 0g. Dovendo de…nire la
relazione x · y impiegheremo la formula aperta 9z(x + z = y), che, avendo
libere x ed y, indicheremo con '(x; y). Dovendo de…nire la relazione D(x; y)
(x è divisore di y) ricorreremo alla formula aperta Ã(x; y) = 9z(x ¢ z = y):
I due esempi precedenti si generalizzano a relazioni qualunque. Infatti,
una formula aperta con n variabili libere, che indichiamo con '(x1 ; ::; xn ),
100CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA
individua una relazione n-aria R su ogni modello A del linguaggio in cui ' è
espressa:
R = f(a1 ; :::; an ) : A j= ' [a1; :::; an ]g :
I predicati, intesi come relazioni unarie, verranno de…niti da formule in una
variabile libera.
Il problema della de…nizione di nuove funzioni è un po’più complesso rispetto a quello delle relazioni. Poiché una funzione n-aria f su un insieme A
è una particolare relazione n + 1-aria R , essa verrà in prima istanza rappresentata da una formula aperta in n + 1 variabili. Le proprietà di ”esistenza
ed unicità”, cioè il fatto che per ogni n-pla a1 ,..,an esiste uno ed un solo b
tale che (a1 ; ::; an ; b) 2 R, verrà espressa da una ulteriore formula chiusa.
Ad esempio, considerando ancora TA, la funzione binaria MCD(x; y) = z è
de…nita come relazione ternaria P (x; y; z) dalla formula aperta
'(x; y; z) = D(z; x) ^ D(z; y) ^ 8t((D(t; x) ^ D(t; y)) ! D(t; z)):
dove D(x; y) esprime la erlazione ”esser divisore di” ed è formalizzata da lla
formula
Ã(x; y) = (x 6= 0 ^ y 6= 0 ^ 9t(x ¢ t = y):
La richiesta che la relazione R sia una funzione è data poi dalla formula
chiusa
à = 8x8y9z('(x; y; z) ^ 8w('(x; y; w)) ! (z = w)):
La congiunzione '(x; y; z)^Ã esprime il MCD: Lo scrivere MCD(x; y) = z al
posto di P (x; y; z) si riduce, a questo punto, a una pura questione notazionale.
4.1.2
Tornando alle teorie a modello unico e a più
modelli
Se consideriamo gli esempi 80 e 81 di teoria formale che abbiamo presentato
(aritmetica, anelli) appare evidente come il concetto di teoria formalizzata
abbia completamente uniformato il ruolo degli assiomi (postulati) in quelle
che abbiamo chiamato teorie a modello unico (come l’aritmetica) e il ruolo
degli assiomi (proprietà- condizioni) nelle teorie a più modelli (come la Teoria
degli anelli).
Questa uniformità di ruolo non signi…ca che le problematiche relative agli
assiomi nelle teorie relative agli assiomi nelle teorie a modello unico siano
analoghe a quelle relative agli assiomi nelle teorie a più modelli. Anzi. I
4.1. LE TEORIE MATEMATICHE FORMALIZZATE
101
criteri che determinano la scelta degli assiomi nelle une e nelle altre sono
radicalmente diversi. Nelle prime gli assiomi intervengono a posteriori per
uniformare e ridurre il ricorso all’evidenza; è desiderabile quindi che questo
intervento sia attuato ad un livello di massima plausibilità, minima complessità e con la più grande economia. In altri termini, queste esigenze ri‡ettono
rispettivamente i classici problemi della verità, della intuitività e, in molti
casi, della indipendenza degli assiomi. Nelle teorie a più modelli, invece, le
richieste di evidenza e verità perdono addirittura di signi…cato, in quanto
l’assioma ”precede” la struttura, poiché determina l’appartenenza o meno di
questa all’insieme dei modelli della teoria. Il problema dell’indipendenza, pur
non perdendo di signi…cato, è molto meno importante: infatti mentre nelle
teorie a modello unico gli assiomi hanno lo status (negativo) di ciò che viene assunto senza dimostrazione, nelle teorie a più modelli essi costituiscono
delle descrizioni, e quindi una eventuale ridondanza è sì inelegante ma può
risultare utile (si pensi alle assiomi delle Algebre di Boole).
Tutto questo, ripetiamo, scompare nella formalizazione delle teorie. Non
solo. Il concetto di teoria formalizzata si spinge oltre, riducendo la caratteristica saliente di quelle che abbiamo chiamato teorie a modello unico (appunto
l’unicità del modello) ad una caratteristica del nostro atteggiamento verso di
esse piuttosto che una loro proprietà intrinseca.
Naturalmente, parlando di modello unico intendiamo unico a meno di
isomor…smi, essendo quello di isomor…smo il concetto più appropriato di
”uguaglianza matematica” tra due modelli. Il concetto logico che esprime la
proprietà di aver un unico modello a meno di isomor…smo prende il nome di
categoricità.
De…nition 84 Una teoria al I ordine T è categorica se da A j= T e A0 j= T
segue A »
= A0 .
Il seguente teorema chiude subito il discorso:
Theorem 85 (Löwenheim-Skolem 1915, 1919). Se una teoria formalizzata
al I ordine T ha un modello in…nito, allora non è categorica.
La categoricità è quindi eventuale appannaggio di teorie che non hanno
modelli in…niti. Poiché tutte le teorie ”storiche” della matematica (aritmetica, geometria, analisi) hanno modelli in…niti, nessuna formalizzazione al I
102CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA
ordine di queste teorie può essere categorica, cioè a modello unico. Il teorema
precedente rappresenta quindi un risultato ”negativo”: il tipo di linguaggi che
abbiamo impiegato per formalizzare la logica e le teorie matematiche (cioè
i linguaggi predicativi al I ordine) non sono su¢cientemente ”espressivi” da
descrivere i modelli con una precisione tale da evitare modelli indesiderati.
Né vi sono soluzioni migliori: 99aumentando la potenza del linguaggio al …ne
di poter avere teorie categoriche anche con modelli in…niti, passando cioè ad
ordini predicativi superiori, si perde l’enumerabilità dei teoremi logici, ed in
tal modo il controllo della teoria (v. Box a …ne capitolo).
La Teoria T A dell’aritmetica, che abbiamo preso come esempio di teoria
(nelle nostre intenzioni) a modello unico, ammette modelli non isomor… ad
N (in conseguenza di ciò, N prende il nome di modello standard).
E non di tratta soltanto di modelli di cardinalità superiore ad N: Infatti,
in risposta al Teorema di Loweneim-Skolem, è stato introdotto un nuovo
concetto, più debole:
De…nition 86 Sia ® un cardinale e T una teoria al I ordine. T è categorica
nella potenza ® se tutti i modelli di T di cardinalità ® sono isomor….
E’stato dimostrato che i casi possibili sono pochi, in quanto vale che
Theorem 87 (Morley, 1965). Se una teoria al I ordine T è ® categorica
per un cardinale non numerabile ®, allora è ® categorica per ogni cardinale
non numerabile.
(Un esempio di teoria di questo tipo è la teoria dei campi algebricamente
chiusi di …ssata caratteristica)
La teoria T A dell’aritmetica non è neppure ® categorica. Ma non è ancora questo il risultato che mostra appieno l’incapacità di TA a descrivere
compiutamente N.
Un modo ben più drastico di indebolire il concetto di catagoricità passa
attraverso il concetto di equivalenza elementare:
De…nition 88 Due modelli A è B di un linguaggio al I ordine L sono elementarmente equivalenti (in simboli A ´ B) se per ogni formula ' di L, si
ha A j= ' sse B j= '.
4.1. LE TEORIE MATEMATICHE FORMALIZZATE
103
Dunque, due modelli sono equivalenti se non possono essere distinti mediante formule del linguaggio. Potremmo quindi intendere come teorie a
modello unico quelle teorie che hanno un solo modello a meno di equivalenza, anziché a meno di isomor…smo. Che questo passaggio costituisca un
indebolimento della richiesta è una conseguenza del fatto che
Theorem 89 Se A »
= B allora A ´ B: Il viceversa vale solo se A è …nito.
Diamo dunque la seguente
De…nition 90 Una teoria al I ordine T in un linguaggio L è ( sintatticamente)
completa se, per ogni formula ' di L, si ha T ` ' o T ` :'.
Theorem 91 Una teoria T è completa sse tutti i suoi modelli sono elementarmente equivalenti.
A questo punto, le ”teorie a modello unico a meno di equivalenza” sono
le teorie complete. Ma, come dimostrato nel teorema logico più famoso del
XX secolo, la teoria T A dell’aritmetica non è tra queste.
Theorem 92 ( Teorema di incompletezza, Gödel, 1931). La teoria T A non
è completa.
Da questo risultato segue l’esistenza di una formula ' tale che T A 0'
e T A 0:'; e poiché una tra ' e :' è vera nel modello N (una formula è
falsa in un modello se e solo se la sua negazione è vera), il teorema dimostra
l’esistenza di una formula vera in N e non dimostrabile in TA . Inoltre, da
TA 0' e TA 0:' segue che T A[ f'g e TA [f:'g sono teorie consistenti, e
quindi, per il Teorema di Completezza estesa (v.Th.71), ciascuna di loro ha
un modello. Questi due modelli, soddifacendo un insieme diverso di formule,
non saranno equivalenti tra loro.
Il teorema di incompletezza, nella forma sopra esposta (che è quella usuale), non sembra essere però tale da giusti…care la risonanza che ha avuto anche
fuori dall’ambiente matematico. Infatti, mentre il Teorema di LöwenheimSkolem è generale e comporta l’impossibilità per qualunque teoria al I ordine
dell’aritmetica di essere categorica (una si¤atta teoria dovrà avere N come
104CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA
modello, ed N é in…nito), il Teorema di incompletezza, come espresso precedentemente, asserisce l’inadeguatezza degli assiomi di T A. In altri termini,
se la non categoricità di T A è la conseguenza di una ”de…cienza” intrinseca
dell’intera costruzione della logica al I ordine e non ha quindi possibilità di
soluzione, l’incompletezza di T A sembra un fatto locale, una inadeguatezza
speci…ca di T A. Tuttavia, una conseguenza della dimostrazione del Teorema
di Incompletezza di Gödel è la seguente:
Corollary 93 Non esiste una teoria dell’aritmetica che sia non contraddittoria , completa e il cui insieme di assiomi sia decidibile.
L’incompletezza quindi non è una caratteristica della teoria T A, ma di
ogni teoria formale dell’aritmetica in cui si possa decidere, data una formula
', se essa è o no un assioma. Ciò comporta che qualunque tentativo si faccia
per caratterizzare con un sistema di assiomi i numeri naturali, esisteranno
sempre delle proprietà dei numeri vere ma indimostrabili. (La parola decidibile, che compare nell’enunciato, è essenziale. Se noi considerassimo come
insieme di assiomi l’insieme T h(N) delle formule vere nel modello N, allora
avremmo una teoria dell’aritmetica completa, anche se non categorica. Il
fatto è che l’insieme T h(N) non è decidibile).
Quanto detto riguardo all’aritmetica vale a fortiori per quelle teorie, come
la geometria, o l’analisi, che estendono l’aritmetica. Non esistono quindi
teorie storiche a modello unico, né nel senso forte della categoricità, né in
quello più debole della completezza. La distinzione fatta in precedenza tra
teorie a modello unico e teorie a più modelli è dunque relativa nel nostro
atteggiamento verso di esse.
Tale atteggiamento si manifesta già dalla nomenclatura. Da un lato,
ad esempio, i modelli della teoria TA diversi da N sono chiamati modelli
non standard, a marcarne la di¤erenza da quello che avremmo voluto esser
l’unico modello. Viceversa, nel caso delle teoria a più modelli, la pluralità
di modelli è per esse un punto di forza e non una debolezzale. Tali teorie
sono dunque non solo volutamente non categoriche, ma anche volutamente
incomplete. Inoltre, il Teorema di completezza estesa di Gödel (v.Th.83:
se una formula è vera in tutti i modelli di T allora è un teorema di T ),
pur essendo valido per tutte le teorie al I ordine, risulta ”naturale solo per
quelle teorie che formalizzano teorie a più modelli. Nel caso della Teoria degli
4.1. LE TEORIE MATEMATICHE FORMALIZZATE
105
anelli, ad esempio, il Teorema di completezza asserisce che i teoremi di T R
sono tutte e sole le formule vere in tutti gli anelli , ed è esattamente quello
che ci aspettavamo dalla teoria; nel caso della Teoria dell’aritmetica asserisce
che i teoremi di T A sono tutte e sole le formule vere in tutte le aritmetiche:
ma di aritmetica, in mente, ne abbiamo una sola.
4.1.3
Teoremi e metateoremi
Nelle teorie non formalizzate a più modelli, con lo stesso nome di ”teorema”
si denotano due diversi tipi di enunciati i quali, pur non sembrando diversi a
livello intuitivo, appartengono a due classi che la formalizazione mostra essere
ben distinte. Innanzitutto, con ”teorema di T” si intende una proprietà
che discende in modo assiomatico-deduttivo dagli assiomi (ad esempio, la
proprietà dei segni nella Teoria degli anelli, v. Esempio 78), e che per questo
vale in tutti i modelli della teoria. Ma la pluralità dei modelli fa sì che
siano oggetto di investigazione anche i rapporti tra i modelli (ad esempio il
Teorema di omomor…smo tra anelli), ed i risultati a cui si perviene in tale
ambito vengono ancora chiamati ”teoremi di T”. In questi casi però non ci
si muove a partire dagli assiomi, bensì gli assiomi servono a caratterizare gli
oggetti tra cui ci si muove, che non sono più soltanto elementi di un generico
modello, ma anche modelli.
Con la formalizzazione, questa distinzione emerge con chiarezza. Considerando ancora l’esempio degli anelli, abbiamo che i teoremi di T R, che
sono formule di L = f+; ¢; 0; 1g, esprimono quelle proprietà che sono vere
in ogni modello di T R, cioè sono soddisfatte dagli elementi di ogni modello.
Teoremi di questo tipo sono, ad esempio, l’unicità dell’elemento neutro, il
fatto che se un elemento è neutro per un altro elemento allora è l’elemento
neutro, l’unicità dell’opposto per un dato elemento, e, appunto, la regola dei
segni; essi sono espressi rispettivamente dalle seguenti formule di LR, dove
le variabili individuali stanno per elementi di un modello:
8x(8y(y + x = y) ! (x = 0)),
8x(9y(y + x = y) ! (x = 0)),
8x8y8z((x + y = 0 ^ x + z = 0) ! (y = z),
8x8y((¡x) ¢ y = ¡(x ¢ y)):
Tuttavia, scorrendo i teoremi sugli anelli di qualunque testo di algebra
astratta, ci rendiamo conto che solo una piccola parte di tali teoremi esprime
proprietà degli anelli nel senso precedente. Molto più spesso essi esprimono
proprietà di rapporti tra anelli, o condizioni di esistenza di anelli, o, ancora,
106CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA
proprietà di particolari anelli. E questi enunciati non sono esprimibili come
teoremi di T R. Ad esempio, ogniqualvolta nell’enunciato di un teorema
compaiono le parole ”sottoanello”, o ”isomor…smo”, o ”omomor…smo”, ciò
signi…ca che stiamo parlando di proprietà di coppie di anelli, e quindi ci
troviamo irrimediabilmente fuori T R. Lo stesso avviene quando si dimostra
che, per ogni n, esiste un anello di n elementi, o ancora quando si dimostra
che l’anello delle matrici ”n per n” non è commutativo. Trasformando una
teoria naturale a più modelli in teoria formalizzata, accade dunque che quasi
tutti i teoremi della prima non sono teoremi della seconda, ma teoremi sui
modelli della seconda, cioè suoi metateoremi.
La distinzione tra teoremi e metateoremi, tra teoremi degli anelli e teoremi sugli anelli, che può passare inosservata a livello naturale, si manifesta
a livello formale in modo inequivocabile. Anche per le teorie a modello unico ci sono metateoremi di questo tipo, ma rappresentano una indesiderata
anomalia (e, soprattutto, sono studiati dai logici e non dagli aritmetici, o dai
geometri o dagli analisti).
Si pone allora il seguente problema: i metateoremi (ad esempio, il Teorema di omomor…smo sugli anelli) di quale teoria sono teoremi? Dalle considerazioni fatte segue che una tale teoria
1) non deve avere gli anelli come suoi modelli, ma come elementi dei suoi
modelli;
2) ma anche gli elementi degli anelli devono essere elementi dei suoi
modelli;
3) deve inoltre essere dotata di una relazione (l’appartenenza) che leghi
gli elementi che sono elementi-di-un-anello agli elementi che sono anelli.
Insomma: la teoria in questione è la Teoria degli insiemi. Gli assiomi
di anello diventano, in questo grande ambiente, la de…nizione di anello, in
quanto ci dicono quali elementi del modello standard della teoria degli insiemi
sono anelli. E sia i teoremi degli, sia quelli sugli anelli, e cioè sia i teoremi
che i metateoremi di T R, risultano ugualmente teoremi in questo contesto.
Un fatto forse ovvio, ma comunque da tener presente, è che la Teoria
”naturale” degli insiemi, in cui troviamo come teoremi sia i metateoremi sia
i teoremi delle altre teorie (a più modelli e no) é, nelle intenzioni, una teoria
a modello unico, il più unico di tutti. Alla sua formalizzazione sarà dedicato
il Capitolo seguente.
4.1. LE TEORIE MATEMATICHE FORMALIZZATE
107
===BOX. Perché fermarsi al I ordine? =======
L’analisi che ha condotto alla de…nizione dei linguaggi predicativi al I
ordine, assume che l’entità minima del discorso sia formata da una relazione
e dagli individui in essa coinvolti; le formule atomiche hanno infatti la forma P(x1; :::; xn ) (nel caso di relazioni unarie, otteniamo la forma P (x) che
esprime la coppia predicato-soggetto dell’analisi aristotelica).
Su questa scelta tuttavia si è inserita una precisa limitazione, segnalata dalla quali…cazione ”al I ordine”. Tali linguaggi possono nominare sia
individui speci…ci (attraverso le costanti individuali) sia individui generici
(attraverso le variabili individuali), e queste ultime possono venire quanti…cate. Invece, le proprietà e le relazioni possono invece esser nominate solo in
modo speci…co, tramite costanti. I linguaggi al I ordine non dispongono di
variabili per relazioni o funzioni, ed è dunque impossibile parlare di relazioni
o funzioni generiche nello stesso modo in cui si parla di individui generici; di
conseguenza, è impossibile imporre loro delle quanti…cazioni. Questo limite
è poco avvertibile per il fatto che le frasi al I ordine sono di gran lunga le più
comuni. Tuttavia non è di¢cile mettere in luce i limiti dei linguaggi al I ordine. Consideriamo i seguenti enunciati, che, tra l’altro, sono di importanza
cruciale nelle teorie in cui vengono formulati:
a) Principio di induzione matematica. Sia P una proprietà relativa ai
numeri naturali, e sia a un naturale …ssato. Se etc. .
b) Principio del minimo numero. Se una proprietà P è soddisfatta da un
numero naturale n, allora esiste il più piccolo naturale m che soddisfa P.
c) Assioma di completezza per i numeri reali. Ogni sottoinsieme non
vuoto di R ammette estremo superiore.
Osserviamo che tutte e tre le frasi hanno quanti…cazioni (universali) su
proprietà od insiemi, in modo esplicito o con l’uso dell’articolo indeterminativo. Una trascrizione ”formale”, ad esempio, di (b), sarebbe:
8P (9xP (x) ! 9y(P y ^ 8z(P (z) ! (y · z)))):
Questa formula non è una espressione al I ordine di un linguaggio formale
nato per descrivere N. P è infatti una ”variabile per proprietà” e la scrittura
8P non appartiene alla morfologia dei linguaggi che abbiamo considerato.
108CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA
Tutto questo suggerirebbe di considerare i linguaggi al I ordine non come
la conclusione, ma come una tappa di un processo da estendere ulteriormente, de…nendo linguaggi più potenti, del II, III ordine etc., in cui oltre a poter
parlare di individui generici e poterli quanti…care, si possano quanti…care
anche proprietà e relazioni generiche, proprietà di proprietà e così via. Del
resto, non è di¢cile de…nire rigorosamente linguaggi di ordine superiore, ampliando l’alfabeto, la morfologia e conseguentemente la semantica di quelli
del I ordine. Emerge però una di¢coltà di fondo. Per i linguaggi al II ordine,
ed a fortiori per quelli di ordine superiore, vale infatti il seguente risultato :
Theorem 94 ( Teorema di incompletezza per il II ordine). L’insieme delle
formule valide al II ordine non è enumerabile .
Risulta evidente la portata negativa del precedente risultato. Ogni tentativo di trasformare in sistema formale la logica del II ordine, sulla scia di
quanto fatto per il I ordine, è a priori destinato al fallimento: qualunque
insieme di assiomi e di regole di inferenza si propongano, esisteranno sempre
delle formule valide che non sono teoremi del sistema. Questi problemi, che
sono intrinseci, hanno portato di fatto alla progressiva scomparsa dalla logica
matematica degli ordini successivi al I. Ad ovviare le limitazioni di questi ultimi ha provveduto una tendenza generale della matematica che ha contribuito
a rendere surrogabili, e quindi ”inutili”, le espressioni di ordine superiore al
I. Nel paragrafo precedente, il principio di induzione e quello del minimo numero, erano stati formulati in relazione a proprietà, mentre la completezza
dei reali è stata presentata, come è usuale, in forma insiemistica. Passando
dalle proprietà alle loro estensioni, tutte e tre le formule possono diventare
frasi al I ordine di un linguaggio in grado di parlare, contemporaneamente, di
elementi e di insiemi di elementi: questo linguaggio è quello della Teoria degli
insiemi. La Teoria degli insiemi al I ordine rappresenta infatti un ambiente
sostanzialmente simile ai linguaggi di ordine superiore (comprese ovviamente
le limitazioni). L’impostazione estensionale della teoria degli insiemi ha, a
questo riguardo, avuto la meglio sulla versione linguistica della logica.
4.1. LE TEORIE MATEMATICHE FORMALIZZATE
4.1.4
109
Costruzioni nel passaggio dalle teorie non formalizzate alle teorie formalizzate.
Prima 99 di passare alla teoria degli insiemi99 dobbiamo terminare la ricostruzione del concetto di dimostrazione nel passaggio dalle teorie naturali a
quelle formalizzate, a¤rontando un problema non ancora considerato: quello
delle costruzioni.
Facciamo il punto. Finora, i problemi a¤rontati sono stati quelli delle
regole logiche e degli assiomi. Il primo è stato ”risolto” con la costruzione
dei sistemi formali della logica al I ordine; il secondo con la costatazione
che, progressivamente, tutte le teorie tendono comunque (pur se con modalità molto diverse) ad uno stato assiomatico, preludio necessario alla loro
formalizzazione.
Tuttavia, una parte generalmente cospicua della maggioranza delle dimostrazioni naturali non consta di passaggi logici a partire da assiomi (dichiarati
o meno), ma è costituita da costruzioni e da nuove de…nizioni. Questi processi, a prima vista, sembrano non riconducibili in un ambito di ordinate
concatenazioni logiche tra espressioni. Consideriamo questo passo, preso da
una proposizione proprio all’inizio degli Elementi (Proposizione I.5):
[...] Sia ABC un triangolo isoscele avente il lato AB uguale
al lato AC, e si prolunghino per diritto i lati AB, AC in BD,
CE; dico che l’angolo ABC è uguale all’angolo ACB e l’angolo
CBD uguale all’angolo BCE. Infatti, si prenda su BD un punto
a piacere F, dalla retta maggiore AE si sottragga la retta AG
uguale alla minore AF e si traccino le congiungenti FC, GB.[...]”
Se proviamo a formalizzare questa dimostrazione, ci arrestiamo subito; il
linguaggio impiegato, così carico di imperativi (”si prolunghino..”, ”si prenda..”) non appare a¤atto assimilabile ad un impianto deduttivo. Eppure ciò
è possibile: gli ordini, le costruzioni e le de…nizioni contenuti in una dimostrazione possono essere tradotti in forma deduttiva. Vediamo brevemente
come ciò avvenga.
Poiché gli ordini e le costruzioni sono in genere accompagnati da imposizioni di nomi (lettere dell’alfabeto) ad oggetti, il primo problema da a¤rontare
è quello delle cosiddette costanti provvisorie.
110CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA
Le costanti provvisorie. La dimostrazione del precedente teorema euclideo coinvolge vari nomi di oggetti (i vertici A, B, C del triangolo, gli estremi
D ed E dei prolungamenti, il punto a piacere F, etc.). Tali nomi non compaiono nell’enunciato del teorema, il quale è un asserto universale sui triangoli
isosceli. Le lettere A, B,..., F non svolgono il ruolo che i linguaggi formali
riservano alle costanti, in quanto queste ultime hanno una interpretazione
…ssa in ogni modello del linguaggio; e neppure sono assimilabili alle variabili
dei linguaggi formali, perché le lettere A, B, C etc. denotano oggetti che, pur
se generici, rimangono immutati nel corso di tutta la dimostrazione. Esse
costituiscono una sorta di costanti provvisorie, e sono frequentissime nelle
dimostrazioni naturali (soprattutto in geometria, dove gli oggetti minimi,
i punti, sono davvero indi¤erenziati l’uno dall’altro). Vi è un importante
teorema logico il quale asserisce:
se, di un asserto, esiste una dimostrazione che fa uso di costanti provvisorie, allora dello stesso asserto esiste una dimostrazione in cui esse non
intervengono (e quindi la deduzione avviene nel linguaggio originale della
teoria).
Tale teorema si sviluppa in due tempi: nel primo viene de…nita una regola
aggiuntiva, detta Regola S,
9x'(x)
¡ ¡¡
'(b)
che permette l’introduzione di nuove costanti, e poi si dimostra come ogni
applicazione di tale regola possa essere eliminata. E’ super‡uo osservare come la perdita delle costanti provvisorie, fondamentali in fase euristica, sia assolutamente negativa per quanto concerne la comprensibilità della
dimostrazione.
Gli ordini e le costruzioni. Nel trattare il problema della formalizzazione di quelle espressioni del linguaggio naturale che impongono di considerare o costruire un certo oggetto matematico (o comunque di eseguire
una certa ”operazione” nel corso di una dimostrazione), possiamo assumere
4.1. LE TEORIE MATEMATICHE FORMALIZZATE
111
di fare uso di costanti provvisorie, sapendo dal risultato precedente che, una
volta raggiunta una formalizzazione anomala in cui compaiono questi elementi estranei al linguaggio formale originario, è meccanicamente ottenibile
una formalizzazione in cui esse non …gurano più. Esempli…chiamo la nostra
analisi su una frase del frammento precedente: ”si prenda su BD un punto
a piacere F ”. Innanzitutto, si tratta di eseguire un ordine. Ma ciò che in
questa frase del linguaggio naturale è sottinteso e che invece nella traduzione
formale deve essere esplicitato, è il fatto che tale ordine sia eseguibile; e a¢nché ciò accada, deve esistere un punto F con queste proprietà. Che un ordine
di costruzione comporti una assunzione di esistenza è un dato costante: in
espressioni come ”si congiungano i due punti...”, ”si tracci la parallela a...”
etc., si sottintende sempre che rette con le proprietà richieste esistano. La
formalizzazione di ciò che il linguaggio naturale esprime con un ordine deve
allora iniziare con la dimostrazione di un teorema generale di esistenza (ed
eventualmente unicità, se si assume che tale oggetto debba essere unico). Nel
nostra caso la formula sarà
8x18x2('(x1; x2) ! 9y(Ã(y; x1 ; x2 )))
(1)
dove '(x1 ; x2) esprime l’asserto ”x1 e x2 sono punti distinti” e Ã(y; x1 ; x2 )
esprime ”y è un punto ed è compreso tra x1 e x2 ”.
Il secondo passo consiste in una espressione particolare asserente che B e
D sono punti distinti, cioè soddisfano '(x1; x2 ):
(2)
'(B; D):
(Le costanti provvisorie B e D devono sono state introdotte in precedenza
mediante la Regola S da una espressione 919x2'(x1 ; x2) ).
Il terzo momento è costituito da due istanze dell’assioma di particolarizzazione (lo schema AM4, v. § 2.3.5), necessarie per passare da x1; x2 a B e
D.
(3)
8x18x2('(x1; x2 ) ! 9yÃ(y; x1 ; x2)) !
(8x2'(B; x2 ) ! 9yÃ(y; B; x2 ))
(4)
8x2 '(B; x2 ) ! 9yÃ(y; B; x2 )) !
('(B; D) ! 9yÃ(y; B; D))
112CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA
Quindi otteniamo:
(5)
8x2 '(B; x2) ! 9yÃ(y; B; x2 ))
(da (1) e (3) per MP);
(6)
'(B; D) ! 9yÃ(y; B; D)
(da (4) e (5) per MP);
(7)
9yÃ(y; B; D)
(da (2) e (6) per MP).
L’espressione (7) asserisce l’esistenza di un punto compreso tra B e D.
In…ne, mediante una applicazione della Regola S denominiamo F questo
punto, ottenendo …nalmente
(8)
Ã(F; B; D):
Le costruzioni presenti nelle dimostrazioni naturali danno dunque luogo,
quando vengono formalizzate, ad una lunga catena di enunciati, di cui uno
esistenziale. Se si considera inoltre che le applicazioni della Regola S comportano ogni volta un gran numero di righe di deduzione (le quali, insieme
alla dimostrazione di (1), devono essere aggiunte alle otto righe che costituiscono la deduzione precedente) appare chiara la notevole lunghezza che viene
ad assumere la traduzione dell’originaria frase ”si prenda su BD un punto a
piacere F ”, la cui immediatezza è completamente perduta.
4.1.5
Un commento …nale sulla formalizzazione delle
teorie
La trasformazione di una teoria matematica in sistema formale consente una
de…nizione formale di dimostrazione all’interno di tale teoria, e questo fatto
comporta la possibilità di enumerare meccanicamente tutti i suoi teoremi.
La formalizzazione delle teorie matematiche porta così a compimento il processo di rigorizzazione della de…nizione di dimostrazione. Ma in che rapporto
stanno le dimostrazioni naturali e le loro formalizzazioni?
Primo problema: se siamo in possesso della dimostrazione ”naturale”
di un asserto in una certa teoria, possiamo asserire che del corrispondente
4.1. LE TEORIE MATEMATICHE FORMALIZZATE
113
asserto formalizzato esisterà una dimostrazione nella corrispondente teoria
formalizzata? Se leggiamo questa domanda nel modo seguente : ”Esiste
un teorema che dimostra che per ogni dimostrazione naturale ne esiste la
versione formalizzata?”, allora la domanda è priva di senso. Si richiederebbe infatti di dimostrare l’equivalenza tra un concetto rigorosamente de…nito
(quello di dimostrazione all’interno di un sistema formale) ed un concetto
intuitivo (quello di dimostrazione matematica non formalizzata, ”naturale”).
Ma a¢nché sia possibile dimostrare l’equivalenza tra due concetti, è necessario che entrambi siano de…niti in modo rigoroso: nel nostro caso però uno dei
due è nato proprio per essere la de…nizione rigorosa dell’altro. La domanda
precedente deve essere allora intesa come una sorta di esame di coscienza
collettivo: crediamo, con la de…nizione di sistema formale, di aver centrato
l’obiettivo? La risposta a¤ermativa prende il nome di ”Tesi di Hilbert ”, dove
la parola ”tesi” ha il signi…cato etimologico di ”posizione assunta”:
La nozione matematica informale di dimostrazione, cioè la nozione applicata implicitamente quando si a¤erma di ricavare un teorema dagli assiomi
di una qualche branca della matematica, è correttamente formalizzata dalla
logica del I ordine.
Questa tesi non potrà mai essere ”dimostrata”, ma semplicemente suffragata dal successo di molti casi particolari e dalla fecondità del concetto
formalizzato . A suo favore si può portare tuttavia un’altra argomentazione:
se interpretiamo una dimostrazione informale non come la versione sintetica
della eventuale dimostrazione formalizzata, ma come un evento di portata
essenzialmente semantica, che assicura che l’asserto ricavato vale in tutti i
modelli della teoria, allora il Teorema di completezza estesa di Gödel dimostra
l’esistenza appunto di una dimostrazione formale.
Un secondo problema è il seguente: quanto sono lontane le dimostrazioni
naturali dalle corrispondenti versioni formalizzate? Che queste ultime siano
più lunghe, meno immediate e poco ”a misura d’uomo”, è un fatto che ognuno
può facilmente prevedere. Tutto il movimento logico è sostenuto dal Modus
Ponens (con l’ausilio della Generalizzazione), ed è quindi necessario che il
numero dei passi dimostrativi cresca. Ma non è solo il problema dello sviluppo
delle ”vecchie” regole logiche a dilatare la lunghezza della deduzione. La
formalizzazione di ogni de…nizione ed ogni costruzione porta poi ad una totale
perdita di immediatezza , elevando il numero dei passi necessari a valori tali
114CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA
da rendere umanamente impraticabile il controllo delle traduzioni formali di
dimostrazioni naturali anche molto brevi.
Una teoria formale non può quindi essere riguardata come una macchina da metter in modo per produrre teoremi al posto nostro. Il concetto di
teoria formale in prima istanza è il punto di arrivo di un processo volto a
chiarire il concetto di dimostrazione. Il fatto che l’esplicitazione completa
dei passaggi dimostrativi faccia esplodere la più innocua della dimostrazioni
naturali è segno della ricchezza concettuale che tali dimostrazioni racchiudono. Ma il concetto di teoria formalizzata è anche un punto di partenza della
logica moderna la quale, risulto il compito di determinare le regole logiche
(cioè teoremi della logica), si volge a scoprire metateoremi. Tutti i principali
”teoremi” enunciati in questo capitolo, a cominciare dal più famoso di tutti
(il Teorema di incompletezza di Gödel) non sono teoremi di teorie formali
ma metateoremi su terie folrmali. Non a caso, tra i nomi con cui nel secolo
scorso la nascente logica matematica è stata chiamata (nome poi caduto in
disuso), c’è stato quello di metamatematica.
4.1. LE TEORIE MATEMATICHE FORMALIZZATE
115
116CAPITOLO 4. FORMALIZAZIONE DI UNA TEORIA MATEMATICA
Capitolo 5
La teoria assiomatica degli
insiemi.
La teoria ”ingenua” degli insiemi si basa sul seguente
Principio di comprensione: Data una proprietà P, esiste l’insieme fx : P (x)g :
Il principio di comprensione conduce a contraddizione:
Paradosso di Russell (1902): Sia P (x) = :(x 2 x) e sia A = fx : P (x)g =
fx : :(x 2 x)g :
A 2 A? Si ! No; No ! Si.
(Attenzione: non è una dimostrazione per assurdo o per CM, cioè una
dimostrazione di contradditorietà di un certo asserto. E’una prova di contradditorietà della teoria di cui l’asserto è parte).
Il precedente paradosso rappresenta il casus belli, l’evento assunto ad emblema di un processo che, all’inizio del secolo scorso, ha portato all’assiomatizzazione della teoria degli insiemi. Bertrand Russell comunicò la sua scoperta a Frege in una lettera che, anche per il tenore della risposta, rappresenta
un documento davvero singolare:
”Caro collega,
Da un anno e mezzo sono venuto a conoscenza dei suoi Grundgesetze der Arithmetik, ma solo ora mi è stato possibile trovare il
tempo per uno studio completo dell’opera come avevo intenzione
117
118
CAPITOLO 5. LA TEORIA ASSIOMATICA DEGLI INSIEMI.
di fare. Mi trovo completamente d’accordo con lei su tutti i punti essenziali, in modo particolare col suo ri…uto di ogni elemento
psicologico nella logica e col fatto di attribuire un grande valore
all’ideogra…a per quel che riguarda i fondamenti della matematica
e della logica formale, che, per inciso, si distinguono di¢cilmente
tra loro. Riguardo a molti problemi particolari trovo nella sua
opera discussioni, distinzioni e de…nizioni che si cercano invano
nelle opere di altri logici. Specialmente per quel che riguarda le
funzioni (cap. 9 del suo Begri¤sschrift), sono giunto per mio conto a concezioni identiche, per…no nei dettagli. C’è solo un punto
in cui ho trovato una di¢coltà. Lei a¤erma (p.17) che anche una
funzione può comportarsi come l’elemento indeterminato. Questo
è ciò che io credevo prima, ma ora tale opinione mi pare dubbia
a causa della seguente contraddizione. Sia w il predicato ”essere
un predicato che non può predicarsi di se stesso”. w può essere predicato di se stesso? Da ciascuna risposta segue l’opposto.
Quindi dobbiamo concludere che w non è un predicato. Analogamente non esiste alcuna classe (concepita come totalità) formata
da quelle classi che, pensate ognuna come totalità , non appartengono a se stesse. Concludo da questo che in certe situazioni
una collezione de…nibile non costituisce una totalità. Sto …nendo
un libro sui principi della matematica e in esso vorrei discutere
la sua opera in tutti i dettagli. Ho già i suoi libri o li acquisterò
presto, ma Le sarei molto grato se mi potesse inviare gli estratti
degli articoli usciti su riviste. Nel caso non sia possibile, comunque, potrò averli da una biblioteca. La trattazione rigorosa della
logica nelle questioni fondamentali, dove i simboli non sono suf…cienti, è rimasta molto indietro; nella sua opera ho trovato la
migliore elaborazione del nostro tempo, e mi sono quindi permesso di esprimerle il mio profondo rispetto. Sono spiacente che Lei
non abbia ancora pubblicato il secondo volume dei suoi Grundgesetze: spero tuttavia che ciò avvenga. Molto rispettosamente
suo Bertrand Russell
(Ho scritto a Peano di questo fatto, ma non ho ancora ricevuto
risposta.)”
Frege, che vide in tale antinomia il crollo del suo programma di riduzione della aritmetica alla logica, riduzione che passava attraverso un uso
119
sistematico dell”’estensione” dei concetti, espresse in questo modo la sua
desolazione:
”A uno scrittore di scienza ben poco può giungere più sgradito
del fatto che, dopo aver completato un lavoro, venga scosso uno
dei fondamenti della sua costruzione. Sono stato messo in questa
situazione da una lettera del signor Bertrand Russell, quando la
stampa di questo volume stava per essere …nita. [...] Ma veniamo
al fatto! Il signor Russell ha scoperto una contraddizione che ora
esporrò. Nessuno vorrà asserire, della classe degli uomini, che
essa è un uomo. Abbiamo qui una classe che non appartiene a se
stessa. Dico infatti che qualcosa appartiene a una classe se questo qualcosa cade sotto un concetto, la cui estensione è proprio
la classe stessa. Fissiamo ora il concetto: classe che non appartiene a se stessa! L’estensione di questo concetto, ammesso che
se ne possa parlare, è, per quanto detto, la classe delle classi che
non appartengono a se stesse. Vogliamo chiamarla brevemente
la classe K. Chiediamoci ora se questa classe K appartenga a
se stessa! Supponiamo in primo luogo che essa appartenga a se
stessa. Se qualcosa appartiene a una classe, cade sotto il concetto la cui estensione è la classe in esame, di conseguenza, se la
nostra classe appartiene a se stessa, allora é una classe che non
appartiene a se stessa. La nostra prima supposizione conduce
quindi a una contraddizione. Supponiamo, in secondo luogo, che
la nostra classe K non appartenga a se stessa: in questo caso
essa cade sotto il concetto di cui essa stessa rappresenta l’estensione, quindi appartiene a se stessa: qui di nuovo abbiamo una
contraddizione!”
5.0.6
Assiomi di ZF
Stante la contraddittorietà del concetto intuitivo di insieme legato al principio
di comprensione, le teorie assiomatiche provvedono a de…nire implicitamente,
mediante assiomi, ciò che è un insieme. La teoria di Zermelo-Fraenkel procede stabilendo, a partire dal vuoto, quali operazioni permettono di ottenere
insiemi da insiemi.
120
CAPITOLO 5. LA TEORIA ASSIOMATICA DEGLI INSIEMI.
Tali assiomi sono dei tentativi. Nessuno sa se sono consistenti o se invece
da loro può esser ottenuta una contraddizione. Gli assiomi inizialmente posti
da Zermelo nel 1908 sono stati via via modi…cati ed integrati, in primis
da Skolem e Fraenkel nel 1922. Ad altri sistemi accenneremo in seguito.
Bisogna comunque rimarcare che l’assiomatizzazione della teoria degli insiemi
è qualcosa di dinamico, in quanto costituisce il punto di collegamento tra la
matematica formalizzata e le idee intuitive, che sono comunque ‡uide.
Linguaggio: LZF = f2g :
Si osservi che non esistono, come simboli primari, le parentesi f e g : Le
variabili indicano sempre insiemi: non esiste la proprietà ”essere elemento”
ma la relazione ”essere elemento di”.
Si osservi anche come gran parte degli assiomi (in particolare ZF2-ZF5),
asserrendo l’esistenza di nuovi insiemi a partire da vecchi insiemi, di fatto
predisponga le de…nizione di nuove operazioni (quelle tramite le quali si ottengono i nuovi insiemi) e nuove costanti. Ciò avviene, come descritto in §
4.1.4, mediante formule aperte.
Si consideri la formula aperta '(x; y) = 8z(z 2 x ! z 2 y): Tale
espressione esprime un simbolo relazionale binario e viene abbreviata con
x µ y:
Mentre per i simboli relazionali è su¢ciente una formula aperta, per i
simboli funzionali bisogna anche dimostrare esistenza ed unicità (v. § 4.1.4).
Alle dimostrazioni di unicità provvede il primo assioma:
(ZF1) (Estensionalità) Due insiemi sono uguali sse hanno gli stessi elementi.
8x8y(8z(z 2 x $ z 2 y) ! x = y)
Alle dimostrazioni di esistenza provvedono, volta per volta, assiomi speci…ci. Iniziamo, ovviamente, dal basso.
(ZF2) (Insieme vuoto) Esiste un insieme privo di elementi.
9x8y:(y 2 x)
121
Si consideri la formula aperta '(x) = 8y:(y 2 x): Da ZF2 otteniamo 9x'(x)
e, per ZF1, 8x8z('(x)^'(z) ! x = z): Abbiamo dunque esistenza ed unicità
e dunque la '(x) esprime una funzione 0-aria, cioè una costante (si ricordi
che una relazione n + 1 esprime una funzione n-aria). L’espressione '(x)
viene abbreviata con ?:
(ZF3) (Coppia) Dati due insiemi x ed y, esiste un insieme i cui unici
elementi sono x ed y
8x8y9z8w(w 2 z $ (w = x _ w = y)))
La formula de…nitoria è '(x; y; z) = 8w(w 2 z $ (w = x _ w = y))):
Da ZF3 e ZF1 segue, dati x e y, l’esistenza e l’unicità di tale insieme z;
e pertanto si giusti…ca l’introduzione di un simbolo funzionale f(x; y), che
viene indicato con fx; yg : Se x = y la scrittura fx; xg viene abbreviata con
fxg :
(ZF4) (Unione) Dato un insieme x esiste un insieme i cui elementi sono
elementi di elementi di x.
8x9y8z(z 2 y $ 9w(z 2 w ^ w 2 x)
Considerazioni
analoghe alle precedenti giusti…cano l’introduzione del simS
bolo x:
S
(Attenzione: il simbolo
indica una funzione unaria, ed non coincide
S
con l’usuale simbolo di grande unione
come
operazione
n-aria:
in
e¤etti,
x
S
corrisponde alla grande unione
yi). A questo punto, l’usuale scrittura
y i 2x S
y [ z diventa una abbreviazione per fy; zg : Le usuali scritture di insiemi
…niti tra parentesi gra¤e vengono poi ottenute in questo modo:
fy; z; tg =def
S
fy1 ; :::; yn g =def
ffy; zg ; ftgg e, ricorsivamente,
S
ffy1 ; :::; yn¡1g ; fyn gg :
(ZF5) (Insieme potenza) Dato un insieme x esiste un insieme i cui elementi
sono i sottinsiemi di x.
8x9y8z(z 2 y $ z µ x))
122
CAPITOLO 5. LA TEORIA ASSIOMATICA DEGLI INSIEMI.
Considerazioni analoghe alle precedenti giusti…cano l’introduzione del simbolo P(x):
Vale che
[
P(x) = x:
S
Infatti a 2 P(x) sse a 2 b 2 P(x) sse a 2 b µ x sse a 2 x. Invece abbiamo
[
x µ P( x):
S
S
Infatti a 2 x ! a µ x ! a 2 P( x): In questo caso nonSvale l’uguaglianza,
S come mostra il seguente esempio: se x = ff?gg allora x = f?g e
P( x) = f?; f?gg :
(ZF6) (Separazione) Non è un assioma ma uno schema d’assioma (abbiamo un assioma per ogni formula '). Data una formula ben formata '(z)
e dato un insieme x, esiste un insieme costituito dagli elementi di x che
soddisfano ':
8x9y8z(z 2 y $ (z 2 x ^ '(z)))
Tale insieme viene denotato con y = fz : z 2 x ^ '(z)g (si noti come tale
principio costituisca un indebolimento del principio di comprensione, per il
quale si avrebbe semplicemente y = fz : '(z)g ).
In virtù degli assiomi ZF4 e ZF6 possiamo introdurre l’intersezione tra
insiemi, de…nendola come un sottinsieme dell’unione. De…niamo dapprima
l’operazione unaria
n
o
\
[
x =def y : y 2 x ^ 8u(u 2 x ! y 2 u)
(che, per gli assiomi citati, denota un insieme). Quindi poniamo
\
y \ z =def
fy; zg :
Per quanto riguarda l’operazione di di¤erenza insiemistica abbiamo
y ¡ z =def fw : w 2 y ^ :(w 2 z)g :
(Come si ricorderà, nell’usuale linguaggio insiemistico il complementare di
un insieme è riferito all’insieme universo U, spesso sottinteso, per cui zc =def
U ¡ z: Tale operazione non ha senso nella teoria generale degli insiemi.)
123
Per poter de…nire il prodotto cartesiano abbiamo bisogno del concetto
di coppia ordinata. Non disponiamo però di alcuna relazione d’ordine. Il
problema è superato tramite il seguente
Lemma 95 Se ffcg ; fc; dgg = ffag ; fa; bgg allora c = a e d = b:
Dimostrazione. (Per comodità usiamo simboli linguistici nel metalinguaggio). Da ZF1 segue che
ffcg ; fc; dgg = ffag ; fa; bgg ! (fcg = fag o fcg = fa; bg) e (fc; dg = fag o fc; dg = fa; bg)
Ma (fcg = fag ! c = a) e (fcg = fa; bg ! c = a = b): Quindi, in ogni
caso, c = a:
Nel caso fc; dg = fag abbiamo fc; dg = fag ! c = d = a e quindi,
in questo caso, ffcg ; fc; dgg = ffcgg e poiché fa; bg 2 ffcg ; fc; dgg segue
fa; bg = fcg da cui risulta c = d = a = b:
Rimane il caso fc; dg = fa; bg con c 6= d: Da d 2 fa; bg) segue d = a o
d = b: Ma ((d = a _ d = b) ^ (c = a) ^ (c 6= d)) ! d = b:
Dal lemma segue che l’insieme ffag ; fa; bgg si comporta come una coppia
ordinata (a; b) (infatti, nella teoria ingenua, (c; d) = (a; b) sse c = a e d = b).
Poniamo dunque
(a; b) =def ffag ; fa; bgg :
A questo punto possiamo de…nire il prodotto x£y. Supponiamo che a 2 x
e b 2 y: Da (a; b) µ P(fa; bg) e da fa; bg µ x [ y segue (a; b) µ P(x [ y) e
dunque (a; b) 2 P(P(x [ y)): Ed è su P(P(x [ y)) che applichiamo l’assioma
ZF6:
x £ y =def fz : z 2 P(P(x [ y)) ^ 9a9b(a 2 x ^ b 2 y ^ z = (a; b)g :
(ZF7) (Rimpiazzamento. Anche in questo caso si tratta di uno schema
d’assioma) Data una formula ben formata '(x; y) e dato un insieme w esiste
un insieme v = fy : '(x; y) per un x 2 wg : Più precisamente:
8w9u8y(y 2 u $ (9x(x 2 w ^ '(x; y))
124
CAPITOLO 5. LA TEORIA ASSIOMATICA DEGLI INSIEMI.
Lo schema ZF7 è riferito a generiche formule in due variabili libere. Tuttavia basta limitarsi a quelle formule '(x; y) che de…niscono una funzione,
cioè formule per cui, dato x vale l’esistenza e l’unicità di y (v. § 4.1.4). La
lettura più intuitiva di ZF7 è dunque: l’immagine di un insieme mediante
una funzione è a sua volta un insieme.
ZF7 fu aggiunto da Fraenkel nel 1922, quando fu chiaro che ZF6 non era
in grado di provvedere a costruzioni insiemistiche intuitivamente accettabili.
ZF7 implica ZF6 (ponendo '(x; y) = ((x = y) ^ '(y)) ). Tuttavia l’assioma
Z6 viene usualmente lasciato tra gli assiomi per la sua praticità di impiego.
Si osservi ancora che ZF7 non implica che, data una formula '(x; y);
tutte le coppie (x; y) che la soddisfano sia un insieme; implica solo che tutte
le coppie (x; y) che soddisfano ' con x appartenente ad un dato insieme w
sia un insieme. Di conseguenza, una formula che de…nisce una funzione non
de…nisce una funzione tout court, ma de…nisce una funzione per ogni insieme
w scelto come dominio.
(ZF8) (In…nito) Esiste un insieme x tale che ; 2 x e tale che se y 2 x
allora y [fyg 2 x: Il LZF , impiegando i concetti …nora de…niti, la formula è
9x(? 2 x ^ 8y(y 2 x ! y [ fyg 2 x))
(si noti come, tramite le nuove de…nizioni, il linguaggio sia divenuto più
espressivo).
(ZF9) (Fondatezza) Ogni insieme non vuoto x contiene un elemento y
tale che x \ y = ;.
8x(9y(y 2 x) ! 9y(y 2 x ^ :9z(z 2 x ^ z 2 y)))
Da questo assioma deriva l’inesistenza di catene di appartenenza in…nite discendenti. Supponiamo infatti che x contenga una catena discendente e sia z
l’insieme degli elementi della catena. Tale z non soddisfa l’assioma, in quanto
non esiste y 2 z tale che y \z = ?. Dall’assenza di catene discendenti deriva
poi che, per ogni x, x 2
= x.
5.0.7
Assiomi di VNB
Il sistema VNB (Von Neumann-Bernays) fu originariamente sviluppato da
Von Neumann nel 1925 e in seguito modi…cato da Bernays e Goedel. La
125
maggiore di¤erenza da ZF consiste nel fatto che il Principio di comprensione,
che permane, e denota classi. Ad evitare paradossi provvede la restizione che
impedisce a certe classi (quelle troppo grandi) di appartenere ad altre classi.
Si inserisce in tal modo una distinzione tra le classi: quelle che possono essere
elementi di altre classi (chiamate insiemi) e quelle che non possono esserlo
(chiamate classi proprie).
LV NB = f2g
Dunque LV NB = LZF: Le variabili sono intese denotare classi e, tradizoinalmente sono indicate con lettere maiuscole. Il concetto ”X è un insieme”,
indicato con M(X) viene de…nito nel modo seguente:
M(X) =def 9Y (X 2 Y ):
I quanti…catori variano su classi, per cui l’espressione ”per ogni insieme
X vale '” diventa
8X(M(X) ! '(X))
Il principio di comprensione viene espresso in questa forma (attenzione
all’uso delle parole ’classe’e ’insieme’):
Assioma di comprensione. Sia '(X) una formula in cui i quanti…catori sono riferiti ad insiemi. Allora esiste una classe fX : M(X) ^ '(X)g composta
da tutti gli insiemi che soddisfano ':
Gli altri assiomi sono simili a quelli di ZF. L’assioma di estensionalità
(corrispondente a ZF1) e quello di fondazione (corrispondente a ZF9) sono
riferiti a classi, mentre gli assiomi del vuoto, della coppia, dell’unione, della
potenza e dell’in…nito (corrispondenti a ZF2-5 e ZF8) sono riferiti ad insiemi.
L’assioma di rimpiazzamento (corrispondente a ZF7) ha questa forma:
dato un insieme u ed una funzione f (intesa come una classe di coppie
ordinate tali che...) esiste un insieme v consistente in tutti gli y per i quali
esiste x 2 u per cui (x; y) 2 f:
Mostriamo ora come il Paradosso di Russel non si presenti più:
Sia A = fX : M(X) ^ :(X 2 X)g : Ci domandiamo se A 2 A:
Se A 2 A, allora A è un insieme e A 2
= A: Quindi (Consequentia Mirabilis)
126
CAPITOLO 5. LA TEORIA ASSIOMATICA DEGLI INSIEMI.
A2
= A: (Ci dovremmo fermare qui. Ma proseguiamo perchè è la teoria che
è in dubbio). Se A 2
= A, allora A non soddisfa una delle seguenti condizioni:
(1) A è un insieme; (2) A 2
= A: Poiché quest’ultima vale per ipotesi, segue
che A non è un insieme ed è dunque una classe propria. Abbiamo quindi
accertato che A non è un insieme e A 2
= A:
Nonostante la diversità di impostazione dei sistemi ZF e VNB, le due
teorie sono equiconsistenti:
Theorem 96 (Rosser-Wang, 1950) ZF è consistente sse lo è VNB.
5.0.8
L’Assioma di scelta
Alcuni risultati nella teoria ingenua degli insiemi dipendono da quello che
abbiamo chiamato Principio di scelta. Data la sua criticità, questo assioma
viene considerato a parte e, eventualmente, aggiunto alle teorie. In ZF ha le
seguenti versioni:
(AC) Dato un insieme non vuoto x i cui elementi sono insiemi non vuoti a
due a due disgiunti, esiste un insieme y che contiene uno ed un solo elemento
per ciascuno degli elementi di x. (y è chiamato insieme di scelta per x).
ZF + AC viene denotato con ZFC. Il fatto che si tratti di una aggiunta
e¤ettiva è dimostrato dal seguente teorema:
Theorem 97 Se ZF è consistente, allora ZF0AC.
Versione per VNB:
(AC) Data una classe non vuota X i cui elementi sono insiemi non vuoti a
due a due disgiunti, esiste una classe y che contiene uno ed un solo elemento
per ciascuno degli elementi di X.
Theorem 98 Se VNB è consistente, allora VNB0AC.
127
² Forme equivalenti alla scelta
Si dimostra (relativamente ad entrambi i sistemi) che l’Assioma di scelta
è equivalente a ciascuna delle seguenti proprietà:
(AC’) Dato un insieme non vuoto x i cui elementi sono insiemi non vuoti
esiste una funzione f tale che, per ogni a 2 x, f(a) 2 a:
Lemma di Zorn: Se x è un insieme ordinato non vuoto tale che ogni
catena in x ha un con…ne superiore, allora x contiene almeno un elemento
massimale.
Principio del Buon ordinamento. Dato un insieme x esiste una
relazione R tale che (x; R) è un buon ordine.
Tricotomia. Dati due insiemi x; y allora x ¹ y o y ¹ x:
5.0.9
Aritmetica in ZF
La teoria T A dell’aritmetica può essere inglobata dalla teoria degli insiemi,
che provvede a de…nirne i concetti primitivi e a dimostrarne gli assiomi. Ci
riferiamo a ZF (un’analoga riduzione è possibile anche in VNB).
La de…nizione dei numeri (postulata da P1 e P2), si basa sul fatto che ;
e un insieme (ZF2) e, se x è un insieme, anche x [ fxg è un insieme (ZF3-4)
e, per ZF9, è diverso da x. Possiamo quindi porre
De…nition 99 0 =def ; e S(x) =def x [ fxg.
Per ottenere l’insieme N (…nora abbiamo ottenuto soltanto i suoi elementi), si procede in questo modo:
De…nition 100 Un insieme x è induttivo se soddisfa la seguente formula:
Ind(x) =def (? 2 x) ^ (y 2 x ! S(y) 2 x):
128
CAPITOLO 5. LA TEORIA ASSIOMATICA DEGLI INSIEMI.
Per l’Assioma dell’in…nito, esiste un insieme induttivo e, per de…nizione,
ogni insieme induttivo include tutti i numeri naturali. Problema: esiste un
insieme costituito da tutti e soli i numeri naturali?
Lemma
101 Se v è un insieme i cui elementi sono insiemi induttivi allora
T
v è un insieme induttivo.
T
Dimostrazione.
Ogni
y
di
v
contiene
il
;:
Quindi
?
2
v: Inoltre, se
T
z 2 v alloraT8y(y 2 v ! z 2 y), da cui segue 8y(y 2 v ! S(z) 2 y) e
quindi S(z) 2 v:
Theorem 102 Esiste un insieme induttivo che è sottinsieme di ogni insieme
induttivo.
Dimostrazione. Sia x un qualunque insieme induttivo (ZF8). Per ZF5 e
ZF6 esiste l’insieme
v = fu : u 2 P(x) ^ Ind(u))g :
T
Per il Lemma 101, v è induttivo. Dimostriamo che è il minimo insieme
induttivo.
101,
T Sia z un qualunque insieme induttivo. Allora, per il Lemma
T
x\z ( = Tfx; zg) è induttivo.
T Ma x\z 2 P(x): Dunque x\z 2 v; v µ x\z
e quindi v µ z: Pertanto v è l’insieme cercato. Lo indichiamo con !:
Dunque:
!= f0; 1; 2; :::g
Theorem 103 Gli assiomi di Peano sono dimostrabili in ZF relativamente
ad !:
Dimostrazione.
(P1 ) 0 2 !: (0 = ? e ! è induttivo)
(P2 ) x 2 ! ! S(x) 2 !: (! è induttivo)
(P3 ) x 2 ! ! S(x) 6= 0 (per ogni x, x 2 S(x). Quindi S(x) 6= ?; cioè 0)
129
(P4) (x 2 ! ^ y 2 ! ^ S(x) = S(y)) ! x = y
( (S(x) = S(y) ^ x 2 S(x)) ! x 2 S(y): Quindi o x 2 fyg (cioè x = y, …ne)
o x 2 y. In modo analogo o y 2 fxg (cioè y = x, …ne) o y 2 x: Ma x 2 y e
y 2 x insieme contraddicono ZF9. Quindi x = y:
(P5) (y µ ! ^ ? 2 y ^ (x 2 y ! S(x) 2 y)) ! y = !:
(? 2 y ^ (x 2 y ! S(x) 2 y implica Ind(y). Quindi, per Th. 102,
! µ y, che, insieme all’ipotesi y µ !, implica y = !:
Si osservi che il Principio di Induzione viene dimostrato proprio nella
forma P5, cioè riferendosi ad un generico sottinsieme y di !, e non nella
forma AA7.
In ZF è dimostrabile anche il Principio di Recursione.
Theorem 104 ( Teorema di recursione su !). Sia '(x; y) una formula di
ZF che de…nisce una funzione, cioè tale che 8x91 y'(x; y). Allora, per ogni
insieme a, esiste una unica funzione f di dominio ! tale che f(0) = a e
'(f(n); f(S(n))) vale per ogni n:
Essendo ' una formula che determina una funzione, possiamo scrivere
'(x; y) come g(x) = y ed avere la recursione nella forma canonica
f(0) = a
f(S(n)) = g(f(n)):
Mediante tale teorema, possiamo ad esempio dimostrare che, dato un
insieme a, la scrittura fa; P(a); P(P(a)); :::g è un insieme. Prendendo '(x; y)
come y = S(x), otteniamo che esiste una funzione f di dominio ! tale che
f(0) = ! e f(S(n)) = P(f(n)) vale per ogni n: L’immagine di questa funzione
è fa; P(a); P(P(a)); :::g che, per ZF7, è un insieme.
5.0.10
Ancora ordinali e cardinali
Ottenuto l’insieme ! possiamo, tramite ZF3-4, ottenere gli insiemi S(!),
S(S(!)), ..., cioè tutti gli ordinali ! + n: Più in generale, se ® è un insieme
130
CAPITOLO 5. LA TEORIA ASSIOMATICA DEGLI INSIEMI.
S(®) è un insieme. Per gli ordinali limiti dobbiamo impiegare il teorema di
recursione su !:
Theorem 105 !2 è un insieme.
Dimostrazione. Sia '(x; y) la formula y = S(x): Allora esiste una funzione
f di dominio ! tale che f(0) = ! e f(S(n)) = S(f(n)) vale per ogni n:
L’immagine di questa
S funzione è f!; S(!); S(S(!)); :::g che, per ZF7, è un
insieme. Per ZF4, f!; S(!); S(S(!)); :::g, cioè !2, è un insieme.
In modo analogo si dimostra che ogni ordinale limite (di ordinali che
abbiamo già dimostrato esser insiemi) è un insieme. Il contenuto dei §. 1.2 e
3.2.4 può essere dunque trasferito in ZF.
Theorem 106 Non esiste l’insieme di tutti gli ordinali.
Dimostrazione.
S Supponiamo che X sia l’insieme di tutti gli ordinali. Allora, per ZF3,
X è un insieme e, per il Teorema 51(2), è anche un ordinale.
S
Sia ® = S( X), i.e.,
n[ o
[
®= X[
X :
S
Dunque, anche ® è un ordinale. Sia ° 2 X: Allora ° µ XS e dunque,
essendo
S entrambi ordinali, dal Teorema 43(5) segue che
S ° 2 X oppure
° = X: Nel primo caso ° è un segmento iniziale
di
X e dunque di ®;
S
nel secondo caso è un segmento iniziale di S( X); cioè, di nuovo, di ®: In
entrambi i casi dunque ° 6= ®: Poiché ciò accade per ogni ° 2 X, abbiamo
che ® 2
= X, contro l’ipotesi che X fosse l’insieme di tutti gli ordinali.
Pertanto, in ZF non esiste l’insieme di tutti gli ordinali. In VNB esiste la
classe di tutti gli ordinali (indicata on On). E’de…nita mediante l’Assioma di
comprensione. Non è un insieme (come dimostrato dal teorema precedente).
E’dunque una classe propria.
Siamo ora in grado di dimostrare il risultato fondamentale che abbiamo
enunciato all’inizio del corso.
Theorem 107 Sia (X; R) un insieme ben ordinato. Esiste (ed è unico) un
ordinale ® isomorfo ad (X; R): Tale ordinale viene indicato con ord(X; R):
131
Dimostrazione. L’unicità deriva dal Teorema 43(3). Dimostriamo l’esistenza. Sia X in insieme ben ordinato e ® un ordinale. Per il Teorema 41,
oX»
=®,oX »
= ®y , per un certo y 2 ® , o ® »
= Xz per un certo z 2 X:
Nel primo caso il teorema è dimostrato. Così pure nel secondo, considerato il
Teorema 43(1bis). Supponiamo quindi che, per ogni ®, non valgano i primi
due casi. Allora, per ogni ordinale ® esiste z 2 X tale che ® »
= Xz : Sia D
l’insieme dei segmenti iniziali di X isomor… ad un ordinale e sia '(x; y) la
formula che esprime il seguente concetto: x 2 D e y è l’ordinale isomorfo ad
x. Per ZF7, f® : 9x'(x; ®)g è un insieme, ed è l’insieme di tutti gli ordinali.
Ciò contraddice il teorema precedente.
Nella teoria ingenua degli insiemi non abbiamo de…nito rigorosamente i
numeri cardinali, ma solo la relazione avere uguale (o maggiore) cardinalità, lasciando il concetto di cardinale nella forma vaga di ”ciò che hanno in
comune insiemi equinumerosi”. Ora, nella teoria assiomatazzata, possiamo
de…nire i cardinali come particolari ordinali.
De…nition 108 Un ordinale in…nito ® è detto ordinale iniziale (oppure un
aleph) se non è equinumeroso a nessun ordinale minore.
De…nition 109 Un ordinale ® è un cardinale se è …nito oppure è un ordinale
iniziale.
! è il minimo ordinale iniziale e, come cardinale, viene denotato con @0:
Il teorema successivo mostra l’esistenza (in ZF) di insiemi cardinalità non
numerabile.
Theorem 110 Per ogni ordinale ® esiste un cardinale ¯ tale che ® < ¯:
Dimostrazione. Se ® è un ordinale …nito, S(®) e …nito, dunque cardinale,
e ® < S(®): Supponiamo che ® sia in…nito. Dimostriamo prima che la classe
degli ordinali ° tali che ° ¹ ® è un insieme. Sia '(R) la formula di ZF che
esprime la proprietà
”R è un b.o. su un insieme X µ ®”.
132
CAPITOLO 5. LA TEORIA ASSIOMATICA DEGLI INSIEMI.
Per l’assioma di isolamento (ZF6) esiste l’insieme
W = fR : R 2 P(® £ ®) ^ '(R)g :
(5.1)
Sia Ã(R; °) la formula di ZF che esprime la seguente relazione:
”'(R) e (° è un ordinale) e (ord(X; R) = °).
Allora, per ZF7, l’immagine di W mediante la funzione determinata da
'(R; °) è un insieme, ed è l’insieme cercato; lo indichiamo con D: Dunque
D = f° : ° è un ordinale e ° ¹ ®g :
S
S
Per il Teorema 51, D è un ordinale, e per il Teorema 48 ± = S( D) è
un ordinale maggiore di ogni ordinale in D: Quindi ± 2
= D e non ± » ®:
Pertanto f° : ® < ° < S(±) ^ :(° » ®)g 6= ; e dunque ammette minimo ¯:
¯ è un cardinale (in quanto se fosse biettivo ad un ordinale minore di lui,
dovrebbe essere biettivo ad ®) e ® < ¯:
Theorem 111 Ad ogni ordinale ® può essere associato un cardinale @® tale
che ° < ® < ¯ implica @° < @® < @¯ :
Dimostrazione. Per induzione trans…nita:
@0 = !
@S (° ) =
S il minimo cardinale maggiore di @° ;
S
@¸ = f@° : ° < ¸g, per ogni ordinale limite ¸:( f@° : ° < ¸g e un cardinale, in quanto è il minimo ordinale maggiore ad @° : ° < ¸:)
Il seguente risultato impiega l’assioma di scelta.
Theorem 112 Dato un insieme X, esiste un numero cardinale biettivo ad
X.
Dimostrazione. Sia X un insieme. Per l’assioma di scelta (nella forma
del buon ordinamento), esiste una relazione R tale che (X; R) è un insieme
ben ordinato. Per il Teorema 107, esiste un ordinale ® isomorfo a (X; R):
Pertanto l’insieme (perché tale è) degli ordinali biettivi ad X e minori od
uguali ad ® non è vuoto. Per il Lemma 49, tale insieme è ben ordinato da µ
133
(cioè ·) e quindi ammette minimo. Questo minimo ordinale è un cardinale.
Viene indicato con
Card(X)
A questo punto possiamo tradurre formalmente le operazioni cardinali,
che ripetiamo, considerando però i cardinali come particolari ordinali e quindi come insiemi:
® +c ¯ = Card((® £ f0g) [ (¯ £ f1g)
® ¢c ¯ = Card(® £ ¯)
¯® = Card(¯® )
dove fuori parentesi intendiamo l’esponenziazione cardinale e dentro parentesi l’insieme delle funzioni da ® a ¯ (per evitare possibili equivoci, talvolta
l’esponenziazione cardinale si indica con exp(¯; ®):
Supponendo la tricotomia (e quindi AC), abbiamo:
Theorem 113 Se ® e ¯ sono cardinali non nulli di cui almeno uno in…nito
allora
® +c ¯ = ® ¢c ¯ = max(®; ¯)
Essendo ciascun cardinale un ordinale, tra di essi si possono eseguire sia le
operazioni ordinali che quelle cardinali. I risultati, in genere, non coincidono.
Ad esempio:
® +c ® = ® mentre ® +o ® = ®2 6= ®: Chiaramente, ®2 non è un
cardinale, il che mostra che l’insieme dei cardinali non è chiuso rispetto alla
somma ordinale. Lo stesso accade per il prodotto: ® ¢c ® = ® mentre
® ¢o ® = ®2 6= ®:
In entrambi i casi, tuttavia, i due ordinali ottenuti come risultato sono
biettivi tra loro (hanno lo stesso cardinale). Nel caso dell’esponenziazione non
accade più neppure questo. Infatti, ad esempio, l’esponenziazione ordinale
!! è numerabile, mentre quella cardinale è più che numerabile.
134
CAPITOLO 5. LA TEORIA ASSIOMATICA DEGLI INSIEMI.
5.0.11
Ipotesi del continuo
Sappiamo (Corollario 32) che 2@0 = @ e (Th. di Cantor) che @0 < @: Il
problema è: quale indice ha il cardinale @:
CH (Ipotesi del continuo): 2@0 = @1
GCH (Ipotesi del continuo generalizzato): per ogni ordinale ®; 2@® =
@®+ 1:
Theorem 114 (Goedel 1938) Se ZF è consistente allora ZF+GCH è consistente.
Theorem 115 ZF+GCH`AC. (99 la tricotomia richiede la scelta, mentre
la GCH la implica99)
Theorem 116 (Cohen 1963) Se ZF è consistente, allora ZFC0CH (e quindi
ZFC0GCH).
Per il Teorema di Cohen, se vogliamo posizionare @ dobbiamo aggiungere
quindi un assioma (è frustrante, in una teoria desiderabilmente a modello
unico, dover aggiungere un assioma su una questione simile). Inoltre è consistente con ZF ipotizzare 2 @0 = @® , dove @® è un cardinale che non ha
sottinsiemi co…nali contabili (dato un buon ordine (X; R) e y µ X, y è co…nale se 8x9y(x 2 X ^ y 2 y ^ xRy):) Ad esempio, @! ha un insieme co…nale
contabile:
fmin(@n+1 ¡ @n ) : n 2 !g
Pertanto ZF + (2@0 = @! ) non è consistente. Invece, per ogni n, @n non ha
sottinsiemi co…nali contabili, e dunque (2@ 0 = @n ) è consistente con ZF.
Capitolo 6
La teoria assiomatica degli
insiemi.
La teoria ”ingenua” degli insiemi si basa sul seguente
Principio di comprensione: Data una proprietà P, esiste l’insieme fx : P (x)g :
Il principio di comprensione conduce a contraddizione:
Paradosso di Russell (1902): Sia P (x) = :(x 2 x) e sia A = fx : P (x)g =
fx : :(x 2 x)g :
A 2 A? Si ! No; No ! Si.
(Attenzione: non è una dimostrazione per assurdo o per CM, cioè una
dimostrazione di contradditorietà di un certo asserto. E’una prova di contradditorietà della teoria di cui l’asserto è parte).
Il precedente paradosso rappresenta il casus belli, l’evento assunto ad emblema di un processo che, all’inizio del secolo scorso, ha portato all’assiomatizzazione della teoria degli insiemi. Bertrand Russell comunicò la sua scoperta a Frege in una lettera che, anche per il tenore della risposta, rappresenta
un documento davvero singolare:
”Caro collega,
Da un anno e mezzo sono venuto a conoscenza dei suoi Grundgesetze der Arithmetik, ma solo ora mi è stato possibile trovare il
tempo per uno studio completo dell’opera come avevo intenzione
135
136
CAPITOLO 6. LA TEORIA ASSIOMATICA DEGLI INSIEMI.
di fare. Mi trovo completamente d’accordo con lei su tutti i punti essenziali, in modo particolare col suo ri…uto di ogni elemento
psicologico nella logica e col fatto di attribuire un grande valore
all’ideogra…a per quel che riguarda i fondamenti della matematica
e della logica formale, che, per inciso, si distinguono di¢cilmente
tra loro. Riguardo a molti problemi particolari trovo nella sua
opera discussioni, distinzioni e de…nizioni che si cercano invano
nelle opere di altri logici. Specialmente per quel che riguarda le
funzioni (cap. 9 del suo Begri¤sschrift), sono giunto per mio conto a concezioni identiche, per…no nei dettagli. C’è solo un punto
in cui ho trovato una di¢coltà. Lei a¤erma (p.17) che anche una
funzione può comportarsi come l’elemento indeterminato. Questo
è ciò che io credevo prima, ma ora tale opinione mi pare dubbia
a causa della seguente contraddizione. Sia w il predicato ”essere
un predicato che non può predicarsi di se stesso”. w può essere predicato di se stesso? Da ciascuna risposta segue l’opposto.
Quindi dobbiamo concludere che w non è un predicato. Analogamente non esiste alcuna classe (concepita come totalità) formata
da quelle classi che, pensate ognuna come totalità , non appartengono a se stesse. Concludo da questo che in certe situazioni
una collezione de…nibile non costituisce una totalità. Sto …nendo
un libro sui principi della matematica e in esso vorrei discutere
la sua opera in tutti i dettagli. Ho già i suoi libri o li acquisterò
presto, ma Le sarei molto grato se mi potesse inviare gli estratti
degli articoli usciti su riviste. Nel caso non sia possibile, comunque, potrò averli da una biblioteca. La trattazione rigorosa della
logica nelle questioni fondamentali, dove i simboli non sono suf…cienti, è rimasta molto indietro; nella sua opera ho trovato la
migliore elaborazione del nostro tempo, e mi sono quindi permesso di esprimerle il mio profondo rispetto. Sono spiacente che Lei
non abbia ancora pubblicato il secondo volume dei suoi Grundgesetze: spero tuttavia che ciò avvenga. Molto rispettosamente
suo Bertrand Russell
(Ho scritto a Peano di questo fatto, ma non ho ancora ricevuto
risposta.)”
Frege, che vide in tale antinomia il crollo del suo programma di riduzione della aritmetica alla logica, riduzione che passava attraverso un uso
137
sistematico dell”’estensione” dei concetti, espresse in questo modo la sua
desolazione:
”A uno scrittore di scienza ben poco può giungere più sgradito
del fatto che, dopo aver completato un lavoro, venga scosso uno
dei fondamenti della sua costruzione. Sono stato messo in questa
situazione da una lettera del signor Bertrand Russell, quando la
stampa di questo volume stava per essere …nita. [...] Ma veniamo
al fatto! Il signor Russell ha scoperto una contraddizione che ora
esporrò. Nessuno vorrà asserire, della classe degli uomini, che
essa è un uomo. Abbiamo qui una classe che non appartiene a se
stessa. Dico infatti che qualcosa appartiene a una classe se questo qualcosa cade sotto un concetto, la cui estensione è proprio
la classe stessa. Fissiamo ora il concetto: classe che non appartiene a se stessa! L’estensione di questo concetto, ammesso che
se ne possa parlare, è, per quanto detto, la classe delle classi che
non appartengono a se stesse. Vogliamo chiamarla brevemente
la classe K. Chiediamoci ora se questa classe K appartenga a
se stessa! Supponiamo in primo luogo che essa appartenga a se
stessa. Se qualcosa appartiene a una classe, cade sotto il concetto la cui estensione è la classe in esame, di conseguenza, se la
nostra classe appartiene a se stessa, allora é una classe che non
appartiene a se stessa. La nostra prima supposizione conduce
quindi a una contraddizione. Supponiamo, in secondo luogo, che
la nostra classe K non appartenga a se stessa: in questo caso
essa cade sotto il concetto di cui essa stessa rappresenta l’estensione, quindi appartiene a se stessa: qui di nuovo abbiamo una
contraddizione!”
6.0.12
Assiomi di ZF
Stante la contraddittorietà del concetto intuitivo di insieme legato al principio
di comprensione, le teorie assiomatiche provvedono a de…nire implicitamente,
mediante assiomi, ciò che è un insieme. La teoria di Zermelo-Fraenkel procede stabilendo, a partire dal vuoto, quali operazioni permettono di ottenere
insiemi da insiemi.
138
CAPITOLO 6. LA TEORIA ASSIOMATICA DEGLI INSIEMI.
Tali assiomi sono dei tentativi. Nessuno sa se sono consistenti o se invece
da loro può esser ottenuta una contraddizione. Gli assiomi inizialmente posti
da Zermelo nel 1908 sono stati via via modi…cati ed integrati, in primis
da Skolem e Fraenkel nel 1922. Ad altri sistemi accenneremo in seguito.
Bisogna comunque rimarcare che l’assiomatizzazione della teoria degli insiemi
è qualcosa di dinamico, in quanto costituisce il punto di collegamento tra la
matematica formalizzata e le idee intuitive, che sono comunque ‡uide.
Linguaggio: LZF = f2g :
Si osservi che non esistono, come simboli primari, le parentesi f e g : Le
variabili indicano sempre insiemi: non esiste la proprietà ”essere elemento”
ma la relazione ”essere elemento di”.
Si osservi anche come gran parte degli assiomi (in particolare ZF2-ZF5),
asserrendo l’esistenza di nuovi insiemi a partire da vecchi insiemi, di fatto
predisponga le de…nizione di nuove operazioni (quelle tramite le quali si ottengono i nuovi insiemi) e nuove costanti. Ciò avviene, come descritto in §
4.1.4, mediante formule aperte.
Si consideri la formula aperta '(x; y) = 8z(z 2 x ! z 2 y): Tale
espressione esprime un simbolo relazionale binario e viene abbreviata con
x µ y:
Mentre per i simboli relazionali è su¢ciente una formula aperta, per i
simboli funzionali bisogna anche dimostrare esistenza ed unicità (v. § 4.1.4).
Alle dimostrazioni di unicità provvede il primo assioma:
(ZF1) (Estensionalità) Due insiemi sono uguali sse hanno gli stessi elementi.
8x8y(8z(z 2 x $ z 2 y) ! x = y)
Alle dimostrazioni di esistenza provvedono, volta per volta, assiomi speci…ci. Iniziamo, ovviamente, dal basso.
(ZF2) (Insieme vuoto) Esiste un insieme privo di elementi.
9x8y:(y 2 x)
139
Si consideri la formula aperta '(x) = 8y:(y 2 x): Da ZF2 otteniamo 9x'(x)
e, per ZF1, 8x8z('(x)^'(z) ! x = z): Abbiamo dunque esistenza ed unicità
e dunque la '(x) esprime una funzione 0-aria, cioè una costante (si ricordi
che una relazione n + 1 esprime una funzione n-aria). L’espressione '(x)
viene abbreviata con ?:
(ZF3) (Coppia) Dati due insiemi x ed y, esiste un insieme i cui unici
elementi sono x ed y
8x8y9z8w(w 2 z $ (w = x _ w = y)))
La formula de…nitoria è '(x; y; z) = 8w(w 2 z $ (w = x _ w = y))):
Da ZF3 e ZF1 segue, dati x e y, l’esistenza e l’unicità di tale insieme z;
e pertanto si giusti…ca l’introduzione di un simbolo funzionale f(x; y), che
viene indicato con fx; yg : Se x = y la scrittura fx; xg viene abbreviata con
fxg :
(ZF4) (Unione) Dato un insieme x esiste un insieme i cui elementi sono
elementi di elementi di x.
8x9y8z(z 2 y $ 9w(z 2 w ^ w 2 x)
Considerazioni
analoghe alle precedenti giusti…cano l’introduzione del simS
bolo x:
S
(Attenzione: il simbolo
indica una funzione unaria, ed non coincide
S
con l’usuale simbolo di grande unione
come
operazione
n-aria:
in
e¤etti,
x
S
corrisponde alla grande unione
yi). A questo punto, l’usuale scrittura
y i 2x S
y [ z diventa una abbreviazione per fy; zg : Le usuali scritture di insiemi
…niti tra parentesi gra¤e vengono poi ottenute in questo modo:
fy; z; tg =def
S
fy1 ; :::; yn g =def
ffy; zg ; ftgg e, ricorsivamente,
S
ffy1 ; :::; yn¡1g ; fyn gg :
(ZF5) (Insieme potenza) Dato un insieme x esiste un insieme i cui elementi
sono i sottinsiemi di x.
8x9y8z(z 2 y $ z µ x))
140
CAPITOLO 6. LA TEORIA ASSIOMATICA DEGLI INSIEMI.
Considerazioni analoghe alle precedenti giusti…cano l’introduzione del simbolo P(x):
Vale che
[
P(x) = x:
S
Infatti a 2 P(x) sse a 2 b 2 P(x) sse a 2 b µ x sse a 2 x. Invece abbiamo
[
x µ P( x):
S
S
Infatti a 2 x ! a µ x ! a 2 P( x): In questo caso nonSvale l’uguaglianza,
S come mostra il seguente esempio: se x = ff?gg allora x = f?g e
P( x) = f?; f?gg :
(ZF6) (Separazione) Non è un assioma ma uno schema d’assioma (abbiamo un assioma per ogni formula '). Data una formula ben formata '(z)
e dato un insieme x, esiste un insieme costituito dagli elementi di x che
soddisfano ':
8x9y8z(z 2 y $ (z 2 x ^ '(z)))
Tale insieme viene denotato con y = fz : z 2 x ^ '(z)g (si noti come tale
principio costituisca un indebolimento del principio di comprensione, per il
quale si avrebbe semplicemente y = fz : '(z)g ).
In virtù degli assiomi ZF4 e ZF6 possiamo introdurre l’intersezione tra
insiemi, de…nendola come un sottinsieme dell’unione. De…niamo dapprima
l’operazione unaria
n
o
\
[
x =def y : y 2 x ^ 8u(u 2 x ! y 2 u)
(che, per gli assiomi citati, denota un insieme). Quindi poniamo
\
y \ z =def
fy; zg :
Per quanto riguarda l’operazione di di¤erenza insiemistica abbiamo
y ¡ z =def fw : w 2 y ^ :(w 2 z)g :
(Come si ricorderà, nell’usuale linguaggio insiemistico il complementare di
un insieme è riferito all’insieme universo U, spesso sottinteso, per cui zc =def
U ¡ z: Tale operazione non ha senso nella teoria generale degli insiemi.)
141
Per poter de…nire il prodotto cartesiano abbiamo bisogno del concetto
di coppia ordinata. Non disponiamo però di alcuna relazione d’ordine. Il
problema è superato tramite il seguente
Lemma 117 Se ffcg ; fc; dgg = ffag ; fa; bgg allora c = a e d = b:
Dimostrazione. (Per comodità usiamo simboli linguistici nel metalinguaggio). Da ZF1 segue che
ffcg ; fc; dgg = ffag ; fa; bgg !
! (fcg = fag o fcg = fa; bg) e (fc; dg = fag o fc; dg = fa; bg)
Ma (fcg = fag ! c = a) e (fcg = fa; bg ! c = a = b): Quindi, in ogni
caso, c = a:
Se fc; dg = fag allora fc; dg = fag ! c = d = a e quindi, in questo caso,
ffcg ; fc; dgg = ffcgg ; e poiché fa; bg 2 ffcg ; fc; dgg, otteniamo fa; bg = fcg
da cui risulta c = d = a = b:
Rimane il caso fc; dg = fa; bg con c 6= d: Da d 2 fa; bg) segue d = a o
d = b: Ma ((d = a _ d = b) ^ (c = a) ^ (c 6= d)) ! d = b:
Dal lemma segue che l’insieme ffag ; fa; bgg si comporta come una coppia
ordinata (a; b) (infatti, nella teoria ingenua, (c; d) = (a; b) sse c = a e d = b).
Poniamo dunque
(a; b) =def ffag ; fa; bgg :
A questo punto possiamo de…nire il prodotto x£y. Supponiamo che a 2 x
e b 2 y: Da (a; b) µ P(fa; bg) e da fa; bg µ x [ y segue (a; b) µ P(x [ y) e
dunque (a; b) 2 P(P(x [ y)): Ed è su P(P(x [ y)) che applichiamo l’assioma
ZF6:
x £ y =def fz : z 2 P(P(x [ y)) ^ 9a9b(a 2 x ^ b 2 y ^ z = (a; b)g :
(ZF7) (Rimpiazzamento. Anche in questo caso si tratta di uno schema
d’assioma) Data una formula ben formata '(x; y) e dato un insieme w esiste
un insieme v = fy : '(x; y) per un x 2 wg : Più precisamente:
8w9u8y(y 2 u $ (9x(x 2 w ^ '(x; y))
142
CAPITOLO 6. LA TEORIA ASSIOMATICA DEGLI INSIEMI.
Lo schema ZF7 è riferito a generiche formule in due variabili libere. Tuttavia basta limitarsi a quelle formule '(x; y) che de…niscono una funzione,
cioè formule per cui, dato x vale l’esistenza e l’unicità di y (v. § 4.1.4). La
lettura più intuitiva di ZF7 è dunque: l’immagine di un insieme mediante
una funzione è a sua volta un insieme.
ZF7 fu aggiunto da Fraenkel nel 1922, quando fu chiaro che ZF6 non era
in grado di provvedere a costruzioni insiemistiche intuitivamente accettabili.
ZF7 implica ZF6 (ponendo '(x; y) = ((x = y) ^ '(y)) ). Tuttavia l’assioma
Z6 viene usualmente lasciato tra gli assiomi per la sua praticità di impiego.
Si osservi ancora che ZF7 non implica che, data una formula '(x; y);
tutte le coppie (x; y) che la soddisfano sia un insieme; implica solo che tutte
le coppie (x; y) che soddisfano ' con x appartenente ad un dato insieme w
sia un insieme. Di conseguenza, una formula che de…nisce una funzione non
de…nisce una funzione tout court, ma de…nisce una funzione per ogni insieme
w scelto come dominio.
(ZF8) (In…nito) Esiste un insieme x tale che ; 2 x e tale che se y 2 x
allora y [fyg 2 x: Il LZF , impiegando i concetti …nora de…niti, la formula è
9x(? 2 x ^ 8y(y 2 x ! y [ fyg 2 x))
(si noti come, tramite le nuove de…nizioni, il linguaggio sia divenuto più
espressivo).
(ZF9) (Fondatezza) Ogni insieme non vuoto x contiene un elemento y
tale che x \ y = ;.
8x(9y(y 2 x) ! 9y(y 2 x ^ :9z(z 2 x ^ z 2 y)))
Da questo assioma deriva l’inesistenza di catene di appartenenza in…nite discendenti. Supponiamo infatti che x contenga una catena discendente e sia z
l’insieme degli elementi della catena. Tale z non soddisfa l’assioma, in quanto
non esiste y 2 z tale che y \z = ?. Dall’assenza di catene discendenti deriva
poi che, per ogni x, x 2
= x.
6.0.13
Assiomi di VNB
Il sistema VNB (Von Neumann-Bernays) fu originariamente sviluppato da
Von Neumann nel 1925 e in seguito modi…cato da Bernays e Goedel. La
143
maggiore di¤erenza da ZF consiste nel fatto che il Principio di comprensione,
che permane, e denota classi. Ad evitare paradossi provvede la restizione che
impedisce a certe classi (quelle troppo grandi) di appartenere ad altre classi.
Si inserisce in tal modo una distinzione tra le classi: quelle che possono essere
elementi di altre classi (chiamate insiemi) e quelle che non possono esserlo
(chiamate classi proprie).
LV NB = f2g :
Dunque LV NB = LZF: Le variabili sono intese denotare classi e, tradizoinalmente sono indicate con lettere maiuscole. Il concetto ”X è un insieme”,
indicato con M(X) viene de…nito nel modo seguente:
M(X) =def 9Y (X 2 Y ):
I quanti…catori variano su classi, per cui l’espressione ”per ogni insieme
X vale '” diventa
8X(M(X) ! '(X))
Il principio di comprensione viene espresso in questa forma (attenzione
all’uso delle parole ’classe’e ’insieme’):
Assioma di comprensione. Sia '(x) una formula in cui i quanti…catori sono riferiti ad insiemi. Allora esiste una classe fX : M(X) ^ '(X)g composta
da tutti gli insiemi che soddisfano ':
Gli altri assiomi sono simili a quelli di ZF. L’assioma di estensionalità
(corrispondente a ZF1) e quello di fondazione (corrispondente a ZF9) sono
riferiti a classi, mentre gli assiomi del vuoto, della coppia, dell’unione, della
potenza e dell’in…nito (corrispondenti a ZF2-5 e ZF8) sono riferiti ad insiemi.
L’assioma di rimpiazzamento (corrispondente a ZF7) ha questa forma:
dato un insieme u ed una funzione f (intesa come una classe di coppie
ordinate tali che...) esiste un insieme v consistente in tutti gli y per i quali
esiste x 2 u per cui (x; y) 2 f:
Mostriamo ora come il Paradosso di Russel non si presenti più:
Sia A = fX : M(X) ^ :(x 2 x)g : Ci domandiamo se A 2 A:
Se A 2 A, allora A è un insieme e A 2
= A: Quindi (Consequentia Mirabilis)
144
CAPITOLO 6. LA TEORIA ASSIOMATICA DEGLI INSIEMI.
A2
= A: (Ci dovremmo fermare qui. Ma proseguiamo perchè è la teoria che
è in dubbio). Se A 2
= A, allora A non soddisfa una delle seguenti condizioni:
(1) A è un insieme; (2) A 2
= A: Poiché quest’ultima vale per ipotesi, segue
che A non è un insieme ed è dunque una classe propria. Abbiamo quindi
accertato che A non è un insieme e A 2
= A:
Nonostante la diversità di impostazione dei sistemi ZF e VNB, le due
teorie sono equiconsistenti:
Theorem 118 (Rosser-Wang, 1950) ZF è consistente sse lo è VNB.
6.0.14
L’Assioma di scelta
Alcuni risultati nella teoria ingenua degli insiemi dipendono da quello che
abbiamo chiamato Principio di scelta. Data la sua criticità, questo assioma
viene considerato a parte e, eventualmente, aggiunto alle teorie. Tra parentesi
quadre le modi…che per VNB
(AC) Dato un insieme [classe] non vuoto x i cui elementi sono insiemi
non vuoti a due a due disgiunti, esiste un insieme [clase] y che contiene uno
ed un solo elemento per ciascuno degli elementi di x. (y è chiamato insieme
[classe] di scelta per x).
ZF + AC viene denotato con ZFC. Il fatto che si tratti di una aggiunta
e¤ettiva è dimostrato dal seguente teorema:
Theorem 119 Se ZF è consistente, allora ZF0AC. (Lo steso vale per VNB).
² Forme equivalenti alla scelta
Si dimostra (relativamente ad entrambi i sistemi) che l’Assioma di scelta
è equivalente a ciascuna delle seguenti proprietà:
(AC’) Dato un insieme [classe] non vuoto x i cui elementi sono insiemi
non vuoti esiste una funzione f tale che, per ogni a 2 x, f(a) 2 a: (f è
de…nita funzione di scelta).
145
Lemma di Zorn: Se x è un insieme [classe] ordinato non vuoto tale
che ogni catena in x ha un con…ne superiore, allora x contiene almeno un
elemento massimale.
Principio del Buon ordinamento. Dato un insieme [classe] x esiste
una relazione R tale che (x; R) è un buon ordine.
² Alcuni risultati che richiedono l’assioma di scelta.
Theorem 120 Se x è in…nito allora x è Dedekind in…nito.
(La dimostrazione che abbiamo dato in Th. 11 impiega il Lemma 10 e
dunque il Principio di Scelta. Si può dimostrare che tale impiego è necessario).
Theorem 121 ( tricotomia) Dati due insiemi x; y, x ¹ y o y ¹ x:
6.0.15
Aritmetica in ZF
La teoria T A dell’aritmetica può essere inglobata dalla teoria degli insiemi,
che provvede a de…nirne i concetti primitivi e a dimostrarne gli assiomi. Ci
riferiamo a ZF (un’analoga riduzione è possibile anche in VNB).
La de…nizione dei numeri (postulata da P1 e P2), si basa sul fatto che ;
e un insieme (ZF2) e, se x è un insieme, anche x [ fxg è un insieme (ZF3-4)
e, per ZF9, è diverso da x. Possiamo quindi porre
De…nition 122 0 =def ; e S(x) =def x [ fxg.
Per ottenere l’insieme N (…nora abbiamo ottenuto soltanto i suoi elementi), si procede in questo modo:
De…nition 123 Un insieme x è induttivo se soddisfa la seguente formula:
Ind(x) =def (? 2 x ^ (y 2 x ! S(y) 2 x)):
146
CAPITOLO 6. LA TEORIA ASSIOMATICA DEGLI INSIEMI.
Per l’Assioma dell’in…nito, esiste un insieme induttivo e, per de…nizione,
ogni insieme induttivo include tutti i numeri naturali. Problema: esiste un
insieme costituito da tutti e soli i numeri naturali?
Lemma
124 Se v è un insieme i cui elementi sono insiemi induttivi allora
T
v è un insieme induttivo.
T
Dimostrazione.
Ogni
y
di
v
contiene
il
;:
Quindi
?
2
v: Inoltre, se
T
z 2 v alloraT8y(y 2 v ! z 2 y), da cui segue 8y(y 2 v ! S(z) 2 y) e
quindi S(z) 2 v:
Theorem 125 Esiste un insieme induttivo che è sottinsieme di ogni insieme
induttivo.
Dimostrazione. Sia x un qualnque insieme induttivo (per ZF8 un tale x
esiste). Per ZF5 e ZF6 esiste
v = fu : u 2 P(x) ^ Ind(u))g
T
e, ancora per ZF8,
non
è
vuoto.
Per
il
Lemma
101,
v è induttivo. DiT
mostriamo che v è l’insieme cercato. Sia z un qualunque
insieme induttiT
vo. Allora, ancora per il Lemma 101, x \ z ( = T
fx; zg) è induttivo.
Ma
T
x \ z 2 P(x):
Dunque x \ z 2 v; da cui seguono v µ x \ z e v µ z:
T
Pertanto v è contenuto in ogni insieme induttivo. Indichiamo tale insieme
con !:
Dunque:
!= f0; 1; 2; :::g :
Theorem 126 Gli assiomi di Peano sono dimostrabili in ZF relativamente
all’insieme !:
Dimostrazione.
(P1 ) 0 2 !: (Infatti, 0 = ? e ! è induttivo.)
(P2 ) x 2 ! ! S(x) 2 !: (Infatti, ! è induttivo.)
147
(P3) x 2 ! ! S(x) 6= 0: (Infatti, per ogni x, x 2 S(x). Quindi S(x) 6= ?;
cioè 0.)
(P4) (x 2 ! ^ y 2 ! ^ S(x) = S(y)) ! x = y:
(Infatti, (S(x) = S(y) ^ x 2 S(x)) ! x 2 S(y): Quindi x 2 y o x = y. In
modo analogo y 2 x o y = x. Ma x 2 y e y 2 x insieme contraddicono ZF9.
Quindi x = y (e dunque, sempre per ZF9, non valgono né x 2 y né y 2 x).
(P5) (y µ ! ^ ? 2 y ^ (x 2 y ! S(x) 2 y)) ! y = !:
(Infatti, ? 2 y ^ (x 2 y ! S(x) 2 y) implica Ind(y). Quindi, per Th. 102,
! µ y, che, insieme all’ipotesi y µ !, implica y = !:
Si osservi che il Principio di Induzione viene dimostrato proprio nella
forma P5, cioè riferendosi ad un generico sottinsieme y di !, e non nella
forma AA7.
In ZF è dimostrabile anche il Principio di Recursione che, riferito ad !,
assume questa forma:
Theorem 127 ( Teorema di recursione su !). Sia '(x; y) una formula di
ZF che de…nisce una funzione, cioè tale che 8x91 y'(x; y). Allora, per ogni
insieme a, esiste una unica funzione f di dominio ! tale che f(0) = a e
'(f(n); f(S(n))) vale per ogni n:
Si osservi che, essendo ' una formula che determina una funzione, possiamo scrivere '(x; y) come y = g(x) ed avere la recursione nella forma
canonica
f(0) = a
f(S(n)) = g(f(n)):
Tra i motivi che hanno portato all’introduzione dell’assioma di rimpiazzamento ZF7 al posto dell’assioma di isolamento ZF6, vi è stata l’impossibilità
di considerare come insiemi scritture del tipo
fa; P(a); P(P(a)); :::g
148
CAPITOLO 6. LA TEORIA ASSIOMATICA DEGLI INSIEMI.
dove a è un insieme. Mediante il Teorema di recursione e ZF7 ciò diventa
possibile. Infatti, prendendo '(x; y) come y = P(x), otteniamo che esiste
una funzione f di dominio ! tale che f(0) = ! e f(S(n)) = P(f(n)) vale per
ogni n: L’immagine di questa funzione è fa; P(a); P(P(a)); :::g e, per ZF7,
tale immagine è un insieme.
6.0.16
Ancora ordinali e cardinali
Ottenuto l’insieme ! possiamo, tramite ZF3-4, ottenere gli insiemi S(!),
S(S(!)), ..., cioè tutti gli ordinali ! + n: Per gli ordinali limiti dobbiamo
impiegare il Teorema di recursione su !:
Theorem 128 !2 è un insieme.
Dimostrazione. Sia '(x; y) la formula y = S(x): Allora, per il Teorema
di redursione du !, esiste una funzione f di dominio ! tale che f(0) =
a e, per ogni mn; f(S(n)) = S(f(n)): L’immagine di questa
funzione è
S
f!; S(!); S(S(!)); :::g che, per ZF7, è un insieme. Per ZF4, f!; S(!); S(S(!)); :::g,
cioè !2, è un insieme.
In modo analogo si dimostra che ogni ordinale successore (di un ordinale
che abbiamo già dimostrato essere un insieme) e ogni ordinale limite (di
ordinali che abbiamo già dimostrato essere insiemi) sono insiemi. Il contenuto
dei §. 1.2 e 3.2.4 può essere dunque trasferito in ZF. In ZF vale inoltre che
Theorem 129 Non esiste l’insieme di tutti gli ordinali.
Dimostrazione. Supponiamo
S per assurdo che esista l’insieme X di tutti
gli ordinali. Allora, per ZF3,
X è un insieme e, per il Teorema 51, è anche
S
un ordinale. Sia ® = S( X), i.e.,
n[ o
[
®= X[
X :
Dunque,
anche ® è un insieme ed un ordinale e dunque ® 2 X: Allora ® µ
S
entrambi ordinali, dal Teorema 43(5) segue che ® 2
S X e dunque, essendo
S
X oppure ® = X: In entrambi i casi ® 2 ®, contro ZF9.
149
Pertanto, in ZF non esiste l’insieme di tutti gli ordinali. In VNB esiste la
classe di tutti gli ordinali (indicata on On). E’de…nita mediante l’Assioma di
comprensione. Non è un insieme (come dimostrato dal teorema precedente).
E’dunque una classe propria.
Siamo ora in grado di dimostrare il risultato fondamentale che abbiamo
enunciato all’inizio del corso.
Theorem 130 Sia (X; R) un insieme ben ordinato. Esiste (ed è unico) un
ordinale ® isomorfo ad (X; R): Tale ordinale viene indicato con ord(X; R):
Dimostrazione. L’unicità deriva dal Teorema 43(3). Dimostriamo l’esistenza. Sia X in insieme ben ordinato e ® un ordinale. Per il Teorema 41,
oX»
=®,oX »
= ®y , per un certo y 2 ® , o ® »
= Xz per un certo z 2 X:
Nel primo caso il teorema è dimostrato. Così pure nel secondo, considerato
il Teorema 43(1bis). Supponiamo per assurdo che, per ogni ®, non valgano i
primi due casi. Allora, per ogni ordinale ® esiste z 2 X tale che ® »
= Xz : Sia
Z l’insieme (tale è per ZF6) degli elementi z 2 X tali che Xz è isomorfo ad
un ordinale e sia '(x; y) la formula che esprime il seguente concetto: x 2 Z e
y l’ordinale isomorfo ad x. Per ZF7, f® : 9z(z 2 Z ^ '(z; ®)g è un insieme,
ed è l’insieme di tutti gli ordinali. Ciò contraddice il teorema precedente.
Nella teoria ingenua degli insiemi non abbiamo de…nito rigorosamente i
numeri cardinali, ma solo la relazione avere uguale (o maggiore) cardinalità, lasciando il concetto di cardinale nella forma vaga di ”ciò che hanno in
comune insiemi equinumerosi”. Ora, nella teoria assiomatazzata, possiamo
de…nire i cardinali come particolari ordinali.
De…nition 131 Un ordinale in…nito ® è detto ordinale iniziale (oppure un
aleph) se non è equinumeroso a nessun ordinale minore.
De…nition 132 Un ordinale ® è un cardinale se è …nito oppure è un ordinale
iniziale.
! è il minimo ordinale iniziale e, come cardinale, viene denotato con @0:
Il teorema successivo mostra l’esistenza (in ZF) di insiemi cardinalità non
numerabile.
150
CAPITOLO 6. LA TEORIA ASSIOMATICA DEGLI INSIEMI.
Theorem 133 Per ogni ordinale ® esiste un cardinale ¯ tale che ® < ¯:
Dimostrazione. Se ® è un ordinale …nito, S(®) e …nito, dunque cardinale,
e ® < S(®): Supponiamo che ® sia in…nito. Dimostriamo prima che la classe
degli ordinali ° tali che ° ¹ ® è un insieme. Sia '(R) la formula di ZF che
esprime la proprietà
”R è un b.o. su un insieme X µ ®”.
Per l’assioma di isolamento (ZF6) esiste l’insieme
W = fR : R 2 P(® £ ®) ^ '(R)g :
(6.1)
Sia Ã(R; °) la formula di ZF che esprime la seguente relazione:
”'(R) e (° è un ordinale) e (ord(X; R) = °).
Allora, per ZF7, l’immagine di W mediante la funzione determinata da
'(R; °) è un insieme, ed è l’insieme cercato; lo indichiamo con D: Dunque
D = f° : ° è un ordinale e ° ¹ ®g :
S
S
Per il Teorema 51, D è un ordinale, e per il Teorema 48 ± = S( D) è
un ordinale maggiore di ogni ordinale in D: Quindi ± 2
= D e non ± » ®:
Pertanto f° : ® < ° < S(±) ^ :(° » ®)g 6= ; e dunque ammette minimo ¯:
¯ è un cardinale (in quanto se fosse biettivo ad un ordinale minore di lui,
dovrebbe essere biettivo ad ®) e ® < ¯:
Theorem 134 Ad ogni ordinale ® può essere associato un cardinale @® tale
che ° < ® < ¯ implica @° < @® < @¯ :
Dimostrazione. Per induzione trans…nita:
@0 = !
@S (° ) =
S il minimo cardinale maggiore di @° ;
S
@¸ = f@° : ° < ¸g, per ogni ordinale limite ¸:( f@° : ° < ¸g e un cardinale, in quanto è il minimo ordinale maggiore ad @° : ° < ¸:)
Il seguente risultato impiega l’assioma di scelta.
151
Theorem 135 Dato un insieme X, esiste un numero cardinale biettivo ad
X.
Dimostrazione. Sia X un insieme. Per l’assioma di scelta (nella forma
del buon ordinamento), esiste una relazione R tale che (X; R) è un insieme
ben ordinato. Per il Teorema 107, esiste un ordinale ® isomorfo a (X; R):
Pertanto l’insieme (perché tale è) degli ordinali biettivi ad X e minori od
uguali ad ® non è vuoto. Per il Lemma 49, tale insieme è ben ordinato da µ
(cioè ·) e quindi ammette minimo. Questo minimo ordinale è un cardinale.
Viene indicato con
Card(X)
A questo punto possiamo tradurre formalmente le operazioni cardinali,
che ripetiamo, considerando però i cardinali come particolari ordinali e quindi come insiemi:
® +c ¯ = Card((® £ f0g) [ (¯ £ f1g)
® ¢c ¯ = Card(® £ ¯)
¯® = Card(¯® )
dove fuori parentesi intendiamo l’esponenziazione cardinale e dentro parentesi l’insieme delle funzioni da ® a ¯ (per evitare possibili equivoci, talvolta
l’esponenziazione cardinale si indica con exp(¯; ®):
Supponendo la tricotomia (e quindi AC), abbiamo:
Theorem 136 Se ® e ¯ sono cardinali non nulli di cui almeno uno in…nito
allora
® +c ¯ = ® ¢c ¯ = max(®; ¯)
Essendo ciascun cardinale un ordinale, tra di essi si possono eseguire sia le
operazioni ordinali che quelle cardinali. I risultati, in genere, non coincidono.
Ad esempio:
® +c ® = ® mentre ® +o ® = ®2 6= ®: Chiaramente, ®2 non è un
cardinale, il che mostra che l’insieme dei cardinali non è chiuso rispetto alla
152
CAPITOLO 6. LA TEORIA ASSIOMATICA DEGLI INSIEMI.
somma ordinale. Lo stesso accade per il prodotto: ® ¢c ® = ® mentre
® ¢o ® = ®2 6= ®:
In entrambi i casi, tuttavia, i due ordinali ottenuti come risultato sono
biettivi tra loro (hanno lo stesso cardinale). Nel caso dell’esponenziazione non
accade più neppure questo. Infatti, ad esempio, l’esponenziazione ordinale
!! è numerabile, mentre quella cardinale è più che numerabile.
6.0.17
Ipotesi del continuo
Sappiamo (Corollario 32) che 2@0 = @ e (Th. di Cantor) che @0 < @: Il
problema è: quale indice ha il cardinale @:
CH (Ipotesi del continuo): 2@0 = @1
GCH (Ipotesi del continuo generalizzato): per ogni ordinale ®; 2@® =
@®+ 1:
Theorem 137 (Goedel 1938) Se ZF è consistente allora ZF+GCH è consistente.
Theorem 138 ZF+GCH`AC. (99 la tricotomia richiede la scelta, mentre
la GCH la implica99)
Theorem 139 (Cohen 1963) Se ZF è consistente, allora ZFC0CH (e quindi
ZFC0GCH).
Per il Teorema di Cohen, se vogliamo posizionare @ dobbiamo aggiungere
quindi un assioma (è frustrante, in una teoria desiderabilmente a modello
unico, dover aggiungere un assioma su una questione simile). Inoltre è consistente con ZF ipotizzare 2 @0 = @® , dove @® è un cardinale che non ha
sottinsiemi co…nali contabili (dato un buon ordine (X; R) e y µ X, y è co…nale se 8x9y(x 2 X ^ y 2 y ^ xRy):) Ad esempio, @! ha un insieme co…nale
contabile:
fmin(@n+1 ¡ @n ) : n 2 !g
Pertanto ZF + (2@0 = @! ) non è consistente. Invece, per ogni n, @n non ha
sottinsiemi co…nali contabili, e dunque (2@ 0 = @n ) è consistente con ZF.