La teoria dei tipi

La teoria dei tipi
Viva il Cantorismo, abbasso il Russellismo.
A. Schoenflies, 1911
La teoria dei tipi è l’alternativa logica alla teoria degli insiemi, ma è
soprattutto una logica e una teoria logica, sia pure con l’obbligo morale
di coprire il contenuto matematico della teoria degli insiemi (in verità di
tutta la matematica, pensata tuttavia racchiusa nella teoria degli insiemi), e
costituisce l’impianto dei Principia mathematica 1 e la sostanza del logicismo.
Benché negli anni venti si delinei, a opera di Skolem e di Hilbert, la moderna
logica del primo ordine, la teoria dei tipi dei Principia sarà per più di venti
anni il quadro di riferimento per le ricerche logiche e fondazionali2 . Fino al
consolidamento della teoria ZF, anche alcuni matematici preferivano riferirsi
a una teoria, informale, con i tipi che escludessero le antinomie3 . La maggior
parte tuttavia, soprattutto di coloro che lavoravano attivamente allo sviluppo
della teoria, viveva come una rivalità il sistema logico dei tipi, come si vede
dall’epigrafe.
Non prenderemo in considerazione i Principia; la teoria dei tipi di Russell
si trova esposta in un lavoro del 1907 apparso significativamente nello stesso
fatidico 1908 delle “Untersuchungen” di Zermelo4 , e in un articolo del 1910
che si sovrappone in parte con l’Introduzione ai Principia, almeno per quanto
riguarda motivazioni e quadro teorico5 .
1
B. Russell e A. N. Whitehead, Principia mathematica, 3 voll., Cambridge Univ. Press,
Cambridge, 1910, 1912, 1913.
2
Gödel formulerà i teoremi di incompletezza per il sistema dei Principia; trarrà anche
ispirazione dalla teoria dei tipi ramificati per la sua prima definizione degli insiemi costruibili; ma dalla fine degli anni trenta, per le ricerche di teoria degli insiemi, farà riferimento
o alla sua teoria delle classi GB elaborata modificando quella di Paul Bernays, o a ZF.
3
Ad esempio B. L. van der Waerden, in Moderne Algebra, Springer, Berlin, 1930, il
primo testo di algebra moderna, nell’introduzione accenna al principio di comprensione e
alla necessità di una stratificazione in tipi (citato da Ferreirós, cit.).
4
B. Russell, “Mathematical Logic as based on the Theory of Types”, American Journal
of Mathematics, 30 (1908), pp. 222-62, ristampato in B. Russell, Logic and Knowledge (a
cura di R. C. Marsh), George Allen&Unwin, London, 1956, pp. 57-102, e in van Heijenoort,
cit., pp. 152-82.
5
B. Russell, “La Théorie des types logiques”, Revue de Métaphysique et de Morale, 18
(1910), pp. 263-301, ristampato in inglese in Essays in Analysis, cit. pp. 215-52.
247
La teoria dei tipi nasce dal tentativo di Russell di costruire una logica
esente dalle antinomie6 . Si tratta tuttavia di un parto laborioso e non lineare, per apprezzare il quale occorre avere presente lo sviluppo della riflessione
di Russell nei primi dieci anni del secolo, nella quale appunto ha un ruolo
decisivo il problema delle antinomie, la cui scoperta Russell tendeva ad attribuire a sé, o comunque a enfatizzare il proprio ruolo; mentre tra i matematici
la discussione delle antinomie non è né vivace né originale, è Russell soprattutto che vi si dedica a pieno tempo, quasi raccogliendo lui l’invito di Hilbert.
Occorre altresı̀ seguire le dispute nelle quali Russell fu coinvolto, in particolare con Poincaré, che contribuirono a plasmare le soluzioni provvisorie e quelle
finali.
Trascuriamo le prime fasi del pensiero di Russell, caratterizzate dall’influenza neo-hegeliana di F. H. Bradley (1846-1924) e da un interesse per la
geometria e la filosofia dello spazio, se non per segnalare un primo scontro
con Poincaré a proposito del carattere convenzionale degli assiomi della geometria7 . Nel 1898, grazie all’influenza del filosofo e amico G. E. Moore (18731958), Russell si liberò dell’idealismo e di ogni traccia di mentalismo nella
concezione della conoscenza. Nel 1900 l’incontro con Peano e i peaniani a
Parigi rappresentò la sua illuminazione sulla strada di Damasco. Subito Russell incominciò a riflettere sui rapporti tra matematica e logica, optando per
l’inclusione della prima nella seconda, a differenza di Peano, e a raccogliere
gli elementi per una definizione della logica stessa.
Negli ultimi anni del secolo diciannovesimo Russell aveva concepito con
fertile fantasia, entusiasmo e fecondità almeno quattro libri sulla matematica;
uno di questi, The principles of mathematics, sopravviverà alla conversione,
6
Qualche anticipazione della idea di diversi tipi volendo si trova, come sempre; ad
esempio in F. W. K. E. Schröder, Vorlesungen über die Algebra del Logik 1 , Teubner,
Leipzig, 1890; si veda Grattan-Guiness, The Search for Mathematical Roots, cit. pp. 1656. Anche König in “Sur la théorie des ensembles”, Comptes r. Acad. Sci., 143 (1906),
pp. 110-2, accenna in modo fumoso a una gerarchia transfinita di tipi (lo cita Poincaré
nel 1909).
7
Nel 1898 e 1899 ci fu uno scambio a tre, tra Couturat, Russell e Poincaré, in seguito
alla recensione di Couturat del libro di Russell, An essay on the foundations of geometry,
Cambridge Univ. Press, Cambridge, 1897 (trad. it. I fondamenti della geometria, Club
del Libro, La Spezia, 1981); stizzito per la sbrigativa negazione del carattere convenzionale
degli assiomi da parte di Russell, Poincaré intervenne pesantemente con molte critiche al
contenuto matematico del libro, che Russell accettò, restando tuttavia fermo nella sua
convinzione dei carattere empirico degli assiomi. Si veda Grattan-Guiness, The Search for
Mathematical Roots, cit., pp. 278-80.
248
ma al prezzo di una radicale e prolungata revisione, riordino e riscrittura
di parti, sicché l’analisi dei vari strati e la datazione dei diversi contributi è
impresa da archeologia8 .
Nelle varie stesure e manoscritti preparatori si può seguire il consolidamento del suo logicismo, che è diverso da quello di Frege. D’altra parte
Russell legge Frege solo a partire dal 1902, e la sua formazione è basata, per
sua ammissione, su Cantor e Peano. Si forma la convinzione che la matematica si derivi dalla logica, o ne sia parte, ma questa non pare univocamente
determinata; la scelta degli indefinibili, come li chiamerà nei Principles, è
frutto di una lunga ricerca e quasi di una sperimentazione.
Nel 1901 Russell mette per iscritto che tutta la matematica si può ottenere dalla logica come una grande implicazione, come la geometria9 , cioè un
“soggetto nel quale le asserzioni affermano che certe conseguenze seguono da
certe premesse, non che le entità descritte dalle premesse esistono in realtà”.
Al tempo stesso gli ingredienti della logica sembrano anche abbastanza definiti: il calcolo proposizionale e predicativo, incluse le relazioni, la variabile,
i quantificatori, e come contributo della teoria degli insiemi individui, classi,
relazioni, eventualmente di classi e relazioni, e cosı̀ via.
Nel 1901 l’entusiasmo di Russell lo portò a scrivere uno dei saggi più
felici, dal punto di vista stilistico, e più fortunati per la caratterizzazione
del logicismo, ma forse anche dei più dannosi, a causa delle sue drastiche e
provocatorie semplificazioni10 . In esso la matematica veniva definita come
il soggetto nel quale noi non sappiamo mai di cosa stiamo parlando, né se quello che diciamo è vero,
veniva attribuita a Boole la scoperta della matematica pura, veniva dichiarato che “la logica formale [. . . ] alla fine si è mostrata essere identica alla
matematica”.
In una bozza del 1901 per The principles stendeva in modo meno fiorito
la sua definizione della matematica:
8
L’ha compiuta I. Grattan-Guiness, e si può vedere in The Search for Mathematical
Roots, cit., capp. VI e VII, pp. 268-410, per la parte dedicata a Russell.
9
Russell nella prefazione alla seconda edizione dei Principles, nel 1937, ammetterà
di essere stato portato a enfatizzare il carattere implicazionale della matematica dalla
considerazione della geometria. Si intende ovviamente il carattere dei teoremi, non degli
assiomi.
10
Si tratta di “Recent work on the principles of mathematics”, cit., ristampato come “Mathematics and the Metaphysicians” in Mysticism and Logic, Longmans, Green,
London, 1918; trad. it. Misticismo e logica, Longanesi, Milano, 1964.
249
La matematica pura è la classe di tutte le proposizioni della forma
“a implica b”, dove a e b sono proposizioni le quali contengono
ciascuna almeno una variabile, e nessuna costante ad eccezione di
quelle che possono essere definite in termini delle costanti logiche.
Seguiva una precisazione dei mattoni che saranno presenze costanti nelle varie formulazioni della sua logica: la variabile, le costanti logiche, le classi e
relazioni. Le costanti logiche non definibili sono elencate come: implicazione,
appartenenza, “tale che”, relazione, funzione proposizionale, classe, denotazione, “tutti [all ]” e “qualsiasi [any]”. Una funzione proposizionale è una
espressione nella quale occorrono una o più variabili, “e per tutti i valori
delle variabili l’espressione che se ne ricava è una proposizione”.
Non c’è e non ci sarà mai una netta distinzione tra la sintassi e qualche
forma di semantica.
In seguito come vedremo avrà dei dubbi e un temporaneo ripensamento
sul concetto di classe, poi superato.
Nello stesso periodo Russell preparava i suoi due articoli per la rivista di
Peano, nei quali raffinava il suo nascente logicismo anticipando la definizione
dei numeri come classi di classi, senza enfasi, perché a Peano non piaceva,
esplicitandola invece nel contributo al lavoro di Whitehead del 1902.
Sempre nel 1901, come abbiamo già raccontato, arrivava alla sua antinomia.
A metà del 1902 Russell cessò la rielaborazione dei Principles, salvo per
alcune note a piè di pagina e due appendici aggiunte in bozze, una su Frege
e l’altra sulla teoria dei tipi, che apparvero nella stampa del 1903. L’autore, consapevole dei difetti e delle imprecisioni, si dichiarava scontento (se
non addirittura disgustato) della sua opera, che non ebbe neppure recensioni
significative11 . Si direbbe che Russell dopo il faticoso tentativo di riaggiustamento del suo lavoro, un lavoro di Sisifo, avesse deciso di abbandonarlo,
per dedicarsi, come infatti fece nell’immediato seguito, a una riflessione più
approfondita sulle antinomie. Per lui la contraddizione non è dovuta a particolari filosofie, ma “scaturisce direttamente dal senso comune, e può venir
11
Hardy lo trovò difficile e troppo conciso rispetto al peso degli argomenti trattati, apprezzando un pregio piuttosto secondario, l’opportunità di conoscere attraverso di esso
lo sconosciuto Frege; Hausdorff fu sarcastico sul “gratuito atletismo intellettuale” che si
manifesta in “un’orgia di sottigliezze”. In generale i matematici (come F. Engel) confessavano di non avere tempo per tali e tante sottili speculazioni filosofiche. Peirce preparò una
lunga recensione, ma pubblicò solo una breve notizia. Couturat si concentrò soprattutto
sugli argomenti riguardanti Cantor, ma ne prese lo spunto per una serie di suoi articoli.
250
risolta soltanto abbandonando qualche ammissione del senso comune”12 . Tra
queste ammissioni, quella che si dichiara più restio ad abbandonare è quella
della classe universale. Invece ritiene inevitabile una modifica del principio
di comprensione.
Come Cantor con l’ipotesi del continuo, anche Russell oscilla tra la convinzione di avercela fatta e la delusione; nel maggio 1903 scrive nel diario
“Quattro giorni fa ho risolto la Contraddizione, il sollievo è indicibile”, per
aggiungere qualche tempo dopo “ma la soluzione era sbagliata”13 , e le docce
gelate si ripetono. Nell’autobiografia racconta dei giorni passati sedendosi
al mattino alla scrivania davanti a un foglio bianco, che alla sera spesso era
ancora tale.
La prima teoria semplice dei tipi
La prima risposta di Russell ai paradossi pare essere l’abbozzo di una
teoria dei tipi sviluppata nell’Appendice ai Principles of Mathematics. Le
contraddizioni presentate nell’opera sono: la sua nel capitolo X, “La contraddizione”, §100 sgg., quella di Burali-Forti nel §301 e quella di Cantor nei
§344 sgg.
Nel corso dell’opera tuttavia Russell aveva anche accennato ad altre possibili soluzioni. Ad esempio, nel §344 commentando l’antinomia del massimo
cardinale aveva ipotizzato che si potesse negare la classe universale:
La difficoltà sorge tutte le volte che cerchiamo di trattare con la
classe di tutte le entità in senso assoluto, o con una qualunque
altra classe parimenti numerosa; se non fosse della difficoltà di
un tale punto di vista, si sarebbe tentati di dire che la concezione
della totalità di tutte le cose, o dell’intero universo di entità e
di esistenti, risulta in qualche modo illegittima ed essenzialmente
contraria alla logica. Ma non è auspicabile adottare una misura
cosı̀ draconiana, finché resta la speranza di trovare una soluzione
un po’ meno eroica.
Nei §§103, 484 aveva supposto che si potesse provare a negare che una
proposizione della forma ϕ[f (ϕ)], dove f è costante e ϕ variabile, abbia
significato.
12
The principles, cit., §105.
A. Garciadiego, Bertrand Russell and the origin of set-theoretical paradoxes,
Birkhäuser, Basel, 1992, p. 187.
13
251
Alla fine del §104 aveva anticipato in mezza pagina la trattazione che sarà
ampliata nell’Appendice.
Una classe intesa come uno è [. . . ] un oggetto dello stesso tipo dei
suoi termini [. . . ] una classe come molti può sı̀ essere un soggetto
logico, ma in proposizioni di una specie differente da quelle in cui
i suoi termini compaiono come soggetti [. . . ] La chiave di tutto il
mistero sta nella distinzione dei tipi logici.
Nell’Appendice, la teoria dei tipi viene presentata “in via d’esperimento”
[tentatively] per la possibile soluzione della contraddizione del §100; sarà però
necessario “con ogni probabilità, arricchirla di maggiori sottigliezze prima che
riesca a dare risposta a tutte le difficoltà da noi incontrate”.
Ogni funzione proposizionale ϕ(x) possiede, oltre al suo sistema [range] di
valori di verità, un sistema di valori di significatività, ossia un sistema entro cui
deve cadere x se vogliamo che ϕ(x) risulti comunque una proposizione, vera o falsa
che sia. Questo costituisce il primo punto della teoria dei tipi. Il secondo è che i
sistemi di valori di significatività formano dei tipi , ossia se x appartiene al sistema
di valori di significatività di ϕ(x), allora esiste tutta una classe di oggetti (il tipo
di x) i quali devono appartenere essi pure al sistema di valori di significatività di
ϕ(x) [. . . ]; tale sistema di valori è sempre un tipo singolo o una somma di diversi
tipi completi. Il secondo punto è meno preciso del primo, e il caso dei numeri
introduce delle difficoltà [. . . ].
Qualsiasi oggetto che non sia un sistema di valori è un termine o individuo.
Questo forma il tipo più basso di oggetti [. . . ] Ciò che abbiamo chiamato nel
capitolo VI la classe come uno è un individuo, purché i suoi elementi siano individui;
gli oggetti della vita quotidiana come: persone, tavoli, sedie, mele, ecc., sono
classi come uno [. . . ] Questi oggetti pertanto sono dello stesso tipo degli individui
semplici. [. . . ]
Il tipo successivo consiste dei sistemi [range] o classi di individui. (Non va
associata alcuna idea ordinale con la parola sistema.) Cosı̀ “Tizio e Caio” è un
oggetto di questo tipo, e non produrrà in generale una proposizione fornita di
significato se lo sostituiamo a “Tizio” in una qualsiasi proposizione vera o falsa di
cui Tizio sia un costituente. (Ciò costituisce, in un certo modo, una giustificazione
per la distinzione grammaticale fra singolare e plurale; ma non vi è stretta analogia
[. . . ].) Se u è un sistema di valori determinato da una funzione proposizionale
ϕ(x), non-u consisterà di tutti gli oggetti per cui ϕ(x) è falsa, in modo che non-u è
contenuto nel sistema di valori di significatività di ϕ(x), e contiene soltanto oggetti
252
dello stesso tipo degli elementi di u [. . . ]14 . Rispetto alla nota contraddizione,
questo punto di vista sembra essere il migliore; infatti non-u deve essere il sistema
di valori di falsità di “x è un u”, e invece “x è un x” deve essere in generale privo
di significato; di conseguenza “x è un u” deve esigere che x ed u siano di tipi
differenti.
Russell discute quindi la difficoltà delle classi miste, cioè le classi i cui
elementi non appartengono tutti allo stesso tipo minimo, ad esempio “Heine
e i francesi”, e conclude che se esistono classi siffatte devono avere un tipo
differente sia dalle classi di individui sia dalle classi di classi di individui.
Quindi descrive il tipo che segue alle classi di individui, e che consiste
di classi di classi di individui, che esemplifica con le federazioni di società.
Conviene di parlare di classi sono per classi di individui, e di classi di classi
solo per classi di classi di individui, e cosı̀ via. Per la nozione generale userà
il termine sistema. “Vi è tutta una progressione di tipi siffatti, poiché un
sistema può essere formato di oggetti di un tipo dato qualsiasi, e ne risulta
un sistema di tipo superiore ai suoi elementi”.
“Una nuova serie di tipi ha inizio dalla coppia con verso”. Con questo
intende la coppia ordinata. Le relazioni, secondo il punto di vista estensionale
della logica simbolica sono sistemi appartenenti a questa serie di tipi. Ma
possiamo formare anche le terne, e le coppie formate da una terna e un
individuo, e cosı̀ via. “Tutte queste producono nuovi tipi. Otteniamo cosı̀
un’immensa gerarchia di tipi, ed è difficile sapere con certezza quanti essi
possano essere [. . . ] ma il numero totale sarà soltanto α0 ”15 .
Altre serie di tipi sorgono dalle proposizioni e dai numeri, che Russell
considerava differenti specie di oggetti, sicché non si ha una semplice gerarchia
su una base, ma un albero di tipi.
Anche i numeri sono un tipo che sta al di fuori delle serie anzidette, e che
presenta certe difficoltà per il fatto che ogni numero da ogni altro tipo di sistemi
trae fuori certi oggetti, e precisamente quei sistemi che hanno il dato numero di
14
[Russell osserva ora che due funzioni proposizionali possono avere lo stesso sistema di
valori di verità ma diversi sistemi di valori di significatività, per cui non-u diventa ambiguo.
Ma esiste sempre un tipo minimo entro il quale è contenuto u e non-u può essere definito
come il resto di questo tipo. Un tipo minimo è un tipo che non è la somma di due tipi.
Dopo la frase successiva Russell osserva che è dubbio che possa venir garantito il risultato
ivi auspicato se non ci si limita ai tipi minimi.]
15
Russell aggiunge che è solo una congettura, basata sul fatto che le serie cosı̀ ottenute
assomigliano alla serie dei razionali.
253
elementi. Ciò rende erronea l’ovvia definizione dello 0; ogni tipo di sistema avrà
infatti il proprio sistema nullo, che sarà un elemento dello 0 considerato come un
sistema di sistemi, in modo che non possiamo dire che 0 sia il sistema il cui unico
elemento è il sistema nullo. [. . . ]
Poiché tutti i sistemi hanno dei numeri, i sistemi formano un sistema; di conseguenza x ∈ x è talvolta fornito di significato, ed in questi casi la sua negazione
è pure fornita di significato: Esiste di conseguenza un sistema w di sistemi, per
cui x ∈ x è falso; la contraddizione del capitolo X dimostra che questo sistema w
non appartiene al sistema di valori di significatività di x ∈ x. Si può osservare che
x ∈ x può soltanto essere fornita di significato quando x è di un tipo di ordine
infinito, giacché in x ∈ u, u deve sempre essere di un tipo superiore di uno a x;
ma il sistema di tutti i sistemi è naturalmente di un tipo di ordine infinito.
Le proposizioni sono quelle che sollevano più problemi, ma d’altra parte
“che le proposizioni costituiscano un tipo risulta dal fatto, se è un fatto,
che soltanto di esse si può dire con significato che sono vere o false”16 . Il
numero di proposizioni deve essere altrettanto grande di quello di tutti gli
oggetti, perché “x è identico a x” è in relazione uno-uno con x. Peraltro
non dovrebbero esistere più proposizioni che individui, perché il concetto
proposizionale (definito in precedenza da Russell) è un individuo. Quindi il
numero di proposizioni è uguale a quello degli oggetti17 . Invece per il teorema
di Cantor devono esistere più sistemi di proposizioni che proposizioni, mentre
tali sistemi sono solo alcuni degli oggetti.
Proviamoci ad applicare la dimostrazionem [del teorema di Cantor] assumendo
una particolare relazione uno-uno, la quale associ ogni proposizione p, che non sia
un prodotto logico, al sistema il cui unico elemento è p, mentre associa il prodotto
di tutte le proposizioni al sistema nullo di proposizioni, e associa ogni altro prodotto
logico di proposizioni al sistema dei suoi propri fattori. Allora il sistema w che,
per il principio generale della dimostrazione di Cantor, non è correlato ad alcuna
proposizione, è il sistema delle proposizioni che sono prodotti logici, ma non fattori
di se stesse. Tuttavia, per la definizione stessa che stabilisce la corrispondenza in
esame, w dovrebbe venir posto in correlazione con il prodotto logico di w. Si
troverà cosı̀ che la vecchia contraddizione spunta fuori di nuovo; noi possiamo
infatti provare che il prodotto logico di w è un elemento di w, e insieme che non
16
Russell vuol forse dire che le proposizioni sono l’ambito di significatività di “essere
vero o falso”, ma la spiegazione sembra circolare, perché non verrebbe in mente di parlare
di “vero” e “falso” se non si avesse già il concetto di proposizione.
17
Applicazione informale del teorema di Cantor-Schröder-Bernstein.
254
lo è. Questo sembra dimostrare che non esiste un tale sistema w; la teoria dei tipi
però non ci dimostra perché un tale sistema non esista. Sembra dunque derivarne
che la nota contraddizione richiede ulteriori sottigliezze per la sua soluzione, ma
io non riesco a immaginare quali esse siano.
Enunciamo per esteso questa nuova contraddizione. Se m è una classe di
proposizioni, la proposizione “ogni m è vera” può essere o non essere essa stessa
un m. Ma esiste una relazione uno-uno di questa proposizione con m: infatti, se n
è differente da m, “ogni m è vera” non è la stessa proposizione di “ogni n è vera”.
Consideriamo ora l’intera classe di proposizioni della forma “ogni m è vera”, e
aventi la proprietà di non essere elementi dei rispettivi m. Sia w questa classe, e
sia p la proposizione “ogni w è vera”. Se p è un w, essa deve possedere la proprietà
definiente di w; ma questa proprietà richiede che p non sia un w. D’altro canto,
se p non è un w, allora p possiede per l’appunto la proprietà definiente di w, e
pertanto è un w. La contraddizione sembra cosı̀ inevitabile.
V
Russell considera una possibile via d’uscita, V
basata sul
fatto
che
se
m
V
è la
V congiunzione delle proposizioni in m, allora (m ∪ { m}) è equivalente
V
a m, per cui se identifichiamo tra loro proposizioni equivalenti allora m
risulta il prodotto logico tanto di una classe di cui essa è un elemento quanto
di una di cui essa non lo è, e potrebbe essere il w di sopra. Tuttavia Russell
scarta tale scappatoia, perché funzioni proposizionali equivalenti possono e
sono spesso diverse, e lo sono anche nell’esempio trattato.
L’Appendice termina con le seguenti parole:
La stretta analogia di questa contraddizione con quella discussa nel capitolo
X fa supporre fortemente che le due debbano avere la stessa soluzione, o almeno
soluzioni molto simili. [. . . ]
Per riassumere: la speciale contraddizione di cui al capitolo X appare, sı̀, risolta
dalla teoria dei tipi, ma esiste almeno una contraddizione strettamente analoga ad
essa che probabilmente non è risolvibile in base a questa teoria. La totalità di tutti
gli oggetti logici, o di tutte le proposizioni, comporta, a quanto pare, una difficoltà
logica fondamentale. Non sono riuscito a scoprire quale possa essere la completa
soluzione di tale difficoltà; ma poiché essa interessa proprio i fondamenti del ragionare, io ne raccomando caldamente lo studio a tutti coloro che si interessano di
logica.
Potrebbe essere la nuova antinomia ad aver scoraggiato Russell dall’approfondire il progetto della teoria dei tipi.
È curioso che Russell non torni più su questa contraddizione nel seguito,
255
anche quando elabora di nuovo la teoria dei tipi in modo sistematico18 .
Tre teorie
Probabilmente le difficoltà intraviste consigliano a Russell sul momento
di abbandonare la teoria dei tipi. Riesuma allora le alternative che aveva
adombrato nei Principles cercando di dare loro una forma più definita e
sviluppata. Lo fa in un articolo elaborato nel 190519 .
Intanto cerca una formulazione logica uniforme delle contraddizioni. Aveva già trovato, e comunicato a Frege nel 1902, una versione della propria
contraddizione in termini di relazioni: Si consideri la relazione che intercorre
tra due relazioni R ed S se R ed S sono identiche e R non sussiste tra R ed
S. Si indichi tale relazione con (R)T (S). Prendendo R = T si ottiene una
contraddizione20 .
Nel lavoro del 1905 espone una formulazione unitaria per le tre antinomie,
sua, di Cantor e di Burali-Forti.
Data una proprietà ϕ e una funzione f tali che, se ϕ appartiene
a tutti gli elementi di u, f ‘u esiste, ha la proprietà ϕ e non appartiene a u; allora l’assunzione che esista una classe w di tutti
i termini che hanno la proprietà ϕ, e che f ‘w esista porta alla
conclusione che f ‘w ha e non ha al contempo la proprietà ϕ.
L’antinomia di Russell si ottiene prendendo cone ϕ la proprietà di non appartenere a se stesso, e come f la funzione identica: quella di Burali-Forti
prendendo la proprietà di essere un ordinale e f ‘w = ordinale di w; quella
di Cantor prendendo la proprietà di essere un cardinale e f ‘w = cardinale di
P(w).
Vista cosı̀ “la natura delle contraddizioni che infestano la teoria del transfinito”, constatato che non solo isolate ma prodotte quasi con una ricetta
uniforme, che non sono matematiche ma appartengono alla logica, e quindi
richiedono qualche modifica nelle assunzioni logiche correnti, Russell individua la modifica necessaria nella affermazione che “Una funzione proposizionale di una variabile non determina sempre una classe”, come aveva già
18
Tra i possibili motivi si può congetturare che o non considerasse più le proposizioni
come enti reali, oppure eliminasse la contraddizione con un ovvio appello al carattere
impredicativo della definizione di w, si veda oltre.
19
“On some difficulties in the Theory of Transfinite Numbers and Order Types”, 1906,
cit.
20
Lettera di Russell a Frege dell’8 agosto 1902, in G. Frege, Alle origini della logica
moderna, Boringhieri, Torino, 1983, p. 198.
256
sospettato nei Principles a proposito delle credenze del senso comune. Negli stessi Principles d’altra parte, nella presentazione degli indefinibili, aveva
invece dichiarato che “lo studio delle funzioni proposizionali sembra essere
rigorosamente equivalente a quello delle classi”.
Russell chiama ora predicativa una funzione proposizionale quando essa
determina una classe.
Per la realizzazione della modifica indica tre diverse direzioni, dichiarando di non prendere posizione per ora e di limitarsi a segnalare vantaggi e
svantaggi di ciascuna.
La teoria zigzag parte21 dal suggerimento che le funzioni proposizionali
determinano classi quando sono abbastanza semplici, e non lo fanno quando
sono complicate e recondite. In questo caso non è la grandezza di una classe
che provoca difficoltà, perché ad esempio “x non è umano” è semplice, ma
è soddisfatta da tutte le entità meno un numero finito di esse. Nella teoria
zigzag la negazione di una funzione predicativa è anch’essa predicativa.
Se ϕ non è predicativa, per ogni classe u o esistono elementi di u che non
soddisfano ϕ o esistono elementi di non-u per cui ϕ è vera. Una funzione
che non è predicativa lo è sia dal punto di vista dei termini che non include
sia da quello dei termini che include; da qui una caratteristica di zigzag che
ha ispirato il nome, particolarmente evidente nel teorema di Cantor. La sua
dimostrazione “costruisce una ipotetica classe w con la norma22 ‘x non è un
elemento della classe con la quale è correlato dalla relazione R’, dove R è
la relazione che correla individui e classi. Tali ipotetiche classi sono quasi
predestinate a non essere classi, e hanno una certa qualità zigzag, nel fatto
che x è un w quando x non è un elemento del suo correlato, e non è un w
quando è un elemento del suo correlato”.
Per costruire tale teoria occorrono assiomi che fissino quali sono le funzioni
predicative; il vantaggio sarebbe che sono ammesse solo funzioni semplici; lo
svantaggio è che gli assiomi potrebbero essere molto complicati e privi di
intrinseca plausibilità23 .
21
O dovrebbe partire; benché Russell le chiami “teorie” sono piuttosto indicazioni di
lavoro, cosa che Poincaré come vedremo non coglie, considerandole teorie sistemate.
22
[“Norma” sta per funzione proposizionale, o per definizione; Russell discute in questo
lavoro le posizioni di E. W. Hobson (in “On the general theory of transfinite numbers
and order types”, Proceed. London Mathematical Society, (2) 5 (1905), pp. 170-88) che
usava tale terminologia. Non esaminiamo la discussione con Hobson perché di interesse
secondario, in gran parte una ripetizione di argomenti già esaminati in riferimento ad altri
autori.]
23
In effetti dovrebbero delimitare soprattutto la forma sintattica delle funzioni proposi-
257
Secondo Russell, la teoria era stata anticipata nei Principles dalla osservazione di provare a negare che una proposizione della forma ϕ[f (ϕ)], dove
f è costante e ϕ variabile, abbia significato.
La teoria della limitazione della grandezza vuole realizzare che ogni classe
propria possa essere ordinata in modo simile a un segmento degli ordinali, sı̀
da eliminare in particolare l’antinomia di Burali-Forti. Il criterio della predicatività in questa teoria non è la semplicità della forma ma una limitazione
sulla grandezza della classe definita; se u è una classe, “x non è un elemento
di u” è sempre non predicativa.
La motivazione è che, siccome esistono processi che sembrano essenzialmente impossibilitati a terminare, mentre la classe dei termini generati dal
processo dovrebbe essere il completamento del processo, viene naturale supporre che i termini generati da tali procedimenti non formino una classe.
L’esistenza di processi auto-riproduttivi di questo genere sembra rendere
impossibile il concetto di una totalità di tutte le entità.
“Questa teoria24 ha, a prima vista, una grande plausibilità e semplicità,
e non sono pronto a negare che non sia la vera soluzione. Ma la plausibilità
e la semplicità tendono a sparire ad un esame attento.” In riferimento alla
sua formulazione generale della ricetta per le antinomia, vista sopra, la teoria
della limitazione della grandezza trascura nella conclusione (che afferma che
o ϕ è non predicativa, o che se ϕ determina una classe allora f ‘w non esiste)
l’alternativa che f ‘w non esista. Salvo il caso in cui f è l’identità (quello
dell’antinomia di Russell), tale alternativa sembra sempre possibile.
Una difficoltà della teoria secondo Russell è che essa non prescrive in
modo preciso di quanto la successione degli ordinali è legittimata a salire, ad
esempio solo fino a ω 2 o a ω ω o ω1 . “Coloro che sostengono questa teoria
zionali ammesse. Una realizzazione fedele allo spirito della teoria zigzag è ritenuta da molti
(Fraenkel, Bar-Hillel, Wang) la teoria NF di W. Quine, in “New Foundations for Mathematical Logic”, Amer. Math. Monthly, 44 (1937), pp. 70-80, incorporato in From a Logical
Point of View , Harvard Univ. Press, Cambridge Mass., 1953. Le formule predicative sono
le cosiddette formule stratificate, le uniche che si possono usare per definire insiemi: le
formule stratificate senza quantificatori sono quelle nelle quali è possibile assegnare indici
alle variabili, stesso indice alla stessa variabile, in modo che in ogni sottoformula x ∈ y
l’indice di y sia maggiore di uno di quello di x; con un operatore di astrazione che ingloba
i quantificatori, occorre poi che anche per ogni termine t ed s, in t ∈ s l’indice di t sia
minore di uno di quello di s. La teoria risultante NF è sotto molti aspetti divergente da
ZF: esiste la classe universale V , viene meno il teorema di Cantor, V = P(V ), l’assioma
di scelta è inconsistente, e l’assioma dell’infinito derivabile.
24
[Nei Principles l’aveva dichiarata ispirata da una scelta troppo drastica.]
258
senza dubbio intendono che debbano essere ammessi tutti gli ordinali che
possono essere definiti, per cosı̀ dire, dal basso, cioè senza introdurre l’intera
successione degli ordinali. Cosı̀ ammetterebbero tutti gli ordinali di Cantor,
escludendo solo il massimo. Ma non è facile enunciare in modo preciso questa
limitazione; almeno, io non ci sono riuscito.”
Secondo una opinione diffusa ci sarebbe riuscito Zermelo; la sua teoria
sarebbe ispirata e realizzerebbe il principio della limitazione di grandezza.
Si può accettare tale interpretazione solo in relazione alla forma restrittiva
del principio descritta da Russell, per la quale solo le classi grandi come
l’universo, o la totalità degli ordinali, non esisterebbero, o non sarebbero
insiemi. Ma, in ZF in realtà, più che in Z, esistono insiemi grandi quanto si
vuole25 .
L’eliminazione delle classi
Nella terza proposta, la teoria senza classi [no classes theory], “le classi
sono eliminate del tutto”. Non nel senso di assumere che nessuna funzione
determini una classe o relazione, ma semplicemente astenendosi dall’assumere il contrario. Il punto forte della teoria sta proprio nella astensione da
assunzioni dubbie, sicché tutta la matematica che permette di ottenere è
esente da tutti i dubbi che coinvolgono le classi e relazioni.
Russell dichiara di aver anticipato questo progetto nei Principles; il rimando è tuttavia solo a una dichiarazione di insoddisfazione con le classi:
“Non sono riuscito a percepire alcun concetto che soddisfi le condizioni richieste per la nozione di classe. La contraddizione [. . . ] dimostra che c’è
qualcosa che manca, ma finora non sono riuscito a scoprirla”.
La teoria contrasta con il senso comune che ritiene ovvio che le classi
esistano; molta della teoria di Cantor, anche quella che sembra non afflitta
25
In particolare, esistono ordinali arbitrariamente grandi, senza una limitazione superiore definibile. Non è chiaro cosa intenda Russell quando ipotizza che la successione degli
ordinali potrebbe salire solo fino a ω1 (ovviamente “ω1 escluso”, ché se ci fosse ω1 ci sarebbe anche ω1 + 1); forse vuol dire che non si potrebbe dimostrare che esiste un insieme
bene ordinato di cardinalità più che numerabile, perché gli ordinali sono i tipi degli insiemi
bene ordinati. Ma con l’assioma di scelta ogni insieme è bene ordinabile, e l’esistenza di
un insieme più che numerabile si dimostra con il teorema di Cantor. Russell ha ragione a
ritenere che si vogliono avere a disposizione tutti gli ordinali, e non c’è bisogno di scervellarsi a come enunciarlo. “Tutti” sono quelli dimostrabili in una teoria, e dipendono dalla
forza della teoria. Solo nella metateoria si può vedere che ce ne sono di più in una teoria
rispetto a un’altra. Ad esempio il primo ordinale regolare e con indice limite, cioè il primo
debolmente inaccessibile, ha una definizione, ma non esiste in ZF.
259
dalle antinomie, dovrebbe certamente essere abbandonata (e a prezzo di una
fatica non necessaria, se poi le classi dovessero esistere); infine l’articolazione
della teoria appare molto difficile.
Le difficoltà di realizzazione sono molte. La maggior parte delle definizioni
devono essere riformulate per adeguarsi al nuovo punto di vista, e i teoremi di
esistenza diventano più ardui: occorre ad esempio per ogni ordinale trovare
proposizioni che siano equivalenti alla esistenza di quell’ordinale; Russell vi
è riuscito per ω ma non è ancora in grado di farlo per ω1 .
Russell dà comunque uno schizzo di come potrebbe procedere. Per una
proposizione p che contenga a come suo costituente, p(x/a) denoti quello che
diventa p quando x si sostituisca ad a in tutti i posti in cui occorre. a si
può intendere in senso lato come il soggetto di p. Gli enunciati che hanno
funzioni proposizionali come argomenti vengono sostituiti da affermazioni del
tipo “p(x/a) è vera per determinati valori di x”. Ad esempio invece di dire
“la classe u è una classe che ha un solo elemento” si dirà “esiste una entità
b tale che p(x/a) è vera se e solo se x è uguale a b”. I valori di x per cui
p(x/a) è vera rimpiazzano la classe u, ma “non si assume che questi valori
collettivamente formino una singola entità che è la classe composta da essi”.
Non è chiaro perché Russell introduca una nuova notazione, tanto più che
osserva che se b non occorre in p e si pone q = p(b/a), allora “q(x/b) è vera
per ogni x” se e solo se “p(x/a) è vera per ogni x”, cioè la verità di p(x/a) per
ogni x è indipendente dal soggetto a, e quindi dipende solo dalla forma di p.
Potrebbe allora usare le funzioni proposizionali solite, con la notazione ϕ(x),
se non fosse che – è l’unica spiegazione offerta – “la notazione inevitabilmente
suggerisce l’esistenza di qualcosa denotata da ‘ϕ’ ”26 .
In un poscritto finale aggiunto in stampa il 5 febbraio 1906 Russell si dice
ora sicuro che la teoria senza classi è la soluzione adeguata e opta per essa.
Può darsi che fosse ispirato da Maxime Bôcher (1867-1918), un matematico americano con il quale ha una breve corrispondenza e che gli scrive ad
esempio27 :
Il punto decisivo è la vostra “classe come uno” [. . . ] Io non posso
ammettere che una classe sia in sé una entità; per me è sempre
molte entità (la vostra “classe come molti”). Quando parliamo di
26
In seguito dirà che con p(x/a) voleva indicare una affermazione su di un soggetto
a, come se questo garantisse una delimitazione naturale, ma presto abbandonerà questa
nuova notazione sperimentale.
27
Citato da Lackey, cit., p. 131.
260
essa come di una singola entità, noi stiamo considerando un altro
oggetto che associamo alla classe, ma non la classe in sé. Cioè,
la “classe come uno” è semplicemente un simbolo o un nome che
possiamo scegliere a piacere.
Russell presenta un lavoro alla London Mathematical Society dove la
eliminazione delle classi è portata più avanti, ad esempio alle classi di classi28 .
In questo lavoro mette a frutto lo studio che aveva nel frattempo condotto
sulla denotazione29 . Come nell’asserzione “l’attuale re di Francia è calvo” la
frase “l’attuale re di Francia” non sta per alcunché e tuttavia l’affermazione
ha un senso perfettamente definito, cosı̀ le classi, i numeri e quasi tutto ciò
di cui parla la matematica sono false astrazioni. Non si deve chiedere “cosa
è il numero uno?”, ma “quale è il significato di un enunciato in cui occorre
la parola uno?”.
Russell chiama p/a una matrice, presentandolo come un simbolo incompleto e privo di significato, un simbolo per la frase “il risultato della sostituzione in p di a con”: “questo simbolo spettrale [shadowy] rappresenta una
classe”.
Dire che x è un elemento della classe α significa ora dire che per
qualche valore di p e a, α è la matrice p/a e p(x/a) è vera”. Invece
della funzione variabile ϕ, che non poteva essere staccata dal suo
argomento30 , abbiamo le due variabili p ed a che sono entità, e
possono variare. Ma ora “x è un x” diventa privo di significato,
perché “x è un α” richiede che α sia della forma p/a, e cosı̀ non
è una entità.
In quanto è un simbolo incompleto cioè, p/a non può essere sostituito ad a
in p/a.
L’eliminazione delle classi di classi è illustrata con i numeri. Per 0, si parte
dall’affermazione “per tutti i valori di x, p(x/a) è falso”; chiamata q questa
28
B. Russell, “On the Substitutional Theory of Classes and Relations”, in Lackey, Essays
in Analysis, cit. pp. 165-89.
29
In particolare “On denoting”, Mind , 14 (1905), pp, 479-93, ristampato in Essays in
Analysis, cit. pp. 103-19.
30
[Facendo un riassunto della teoria di Frege, Russell afferma che “x è un elemento di
u” è definito da “esiste una funzione ϕ che definisce la classe u e è soddisfatta da x”.
Assumendo che la classe sia un’entità, si apre la strada alle contraddizioni. L’errore sta
nel parlare di “una funzione ϕ” nel ruolo di variabile, e fare affermazioni del tipo “esiste
una ϕ” o “per tutte le ϕ”.]
261
affermazione, si considera la matrice q/(p, a): se p0 e a0 hanno la relazione
q/(p, a), cioè {q/(p, a)}(p0 , a0 ) è vera, allora svolgendo le abbreviazioni si ha
“per tutti i valori di x, p0 (x/a0 ) è falsa”, che afferma che p0 /a0 è una classe
senza elementi. Lo 0 è una “relazione tra una proposizione e un’entità, la
relazione che, qualunque cosa si sostituisca all’entità, il risultato è sempre
falso”.
In generale, la definizione formale è la seguente: “La matrice q/(p, a) è
detta una classe di classi, se, per tutti i valori di r, c, r0 , c0 , se r/c = r0 /c0
allora {q/(p, a)}/(r, c) è equivalente a {q/(p, a)}/(r0 , c0 ) [. . . ] In tale caso,
diciamo che la classe r/c è un elemento della classe di classi q/(p, a) quando
{q/(p, a)}/(r, c) è vera”31 .
Quando una formula contiene matrici, il criterio di significatività è che
possa essere enunciata esclusivamente in termini di entità.
Russell ammette che lo sviluppo tecnico dei principi della matematica
diventa molto più complicato con la teoria sostituzionale; il vantaggio è che si
ha una vera semplificazione nelle assunzioni fondamentali e nelle proposizioni
primitive. Il lavoro resterebbe valido se anche esistessero classi e relazioni;
ma Russell vuole assumere solo che esistano proposizioni, e non crede che
tale assunzione sia pericolosa.
Il carattere sintattico della eliminazione suggerisce una distinzione di tipi.
Le matrici si dividono in tipi, come illustrato sopra da quelle per classi e per
classi di classi. Sono in verità i tipi che impediscono ad esempio l’antinomia
di Cantor: se α è il numero totale di entità, 2α sarà il numero totale delle
classi di entità, e 2α > α, ma non ci sarà alcuna classe di entità avente 2α
elementi.
Il lavoro sulla teoria sostituzionale ha giudizi controversi e Russell lo ritira.
Tuttavia difende in modo convinto la teoria in uno scambio con Poincaré,
sempre nel 1906.
Il circolo vizioso
Poincaré aveva attaccato i logicisti32 , dedicando ampio spazio a Russell, il
quale risponde nel settembre 190633 con un articolo che rappresenta una tap31
La condizione r/c = r0 /c0 serve a garantire che {q/(p, a)}/(r, c) non dipenda
separatamente da r e c ma dalla matrice r/c.
32
H. Poincaré, “Les mathématiques et la logique”, Revue de Métaphysique et de Morale,
14 (1906), pp. 294-317.
33
B. Russell, “Les paradoxes de la logique”, Revue de Métaphysique et de Morale,
14 (1906), pp. 627-50, pubblicato in inglese col titolo del manoscritto originale “On
262
pa importante nello sviluppo del pensiero di Russell sulle antinomie, perché
in questa occasione Russell accetta e fa proprio un suggerimento di Poincaré,
nonostante il disaccordo quasi totale sul resto.
I temi della disputa sono numerosi, in corrispondenza ai vari argomenti
usati da Poincaré contro la categoria dei logicisti nella quale faceva confluire
Peano, Couturat, Russell, Cantor e Zermelo. In particolare Poincaré osservava divertito che la proposta di Russell di non considerare le classi come entità
indipendenti rappresentava o richiedeva una ricostruzione radicale della logistica, mettendo in imbarazzo i logici che parlano soltanto di classi e di classi
di classi.
Russell precisa che i cambiamenti richiesti non sono dopo tutto molto
grandi. Usa un paragone con il calcolo infinitesimale che ora non assume più
e non usa gli infinitesimi, avendo cosı̀ eliminato alcune contraddizioni, ma
senza modificare alcuna formula del calcolo.
Quindi difende il lavoro dei logicisti dilungandosi sul “soggetto della
‘intuizione’ e la natura dell’evidenza per la verità delle proposizioni nella
logistica”.
Il metodo della logistica è sostanzialmente lo stesso di qualsiasi
altra scienza. Vi è la stessa fallibilità, la stessa incertezza, la stessa mescolanza di induzione e deduzione, e la stessa necessità di
fare appello, per la conferma dei principi all’accordo ampio con
l’osservazione dei risultati calcolati. L’obiettivo non è quello di
bandire l’“intuizione”, ma di controllare e sistematizzare la sua
utilizzazione, eliminare gli errori a cui conduce il suo uso non
consapevole, e scoprire leggi generali da cui, per deduzione, possiamo ottenere risultati veri e che non sono contraddetti mai, e
in casi cruciali confermati, dall’intuizione. Le “proposizioni primitive” da cui iniziano le deduzioni della logistica dovrebbero, se
possibile, essere evidenti all’intuizione; ma non è indispensabile,
e comunque non è questa la vera ragione per la loro accettazione.
La ragione è induttiva, vale a dire che, tra le loro conseguenze note (incluse esse stesse) molte appaiono essere vere all’intuizione, e
nessuna falsa, e quelle che appaiono vere all’intuizione non sono,
per quel che si può vedere, deducibili da qualsiasi sistema di proposizioni indimostrabili inconsistente con il sistema in oggetto.
[. . . ]
‘Insolubilia’ and their Solution by Symbolic Logic” in Essays in Analysis, cit., pp. 190-214.
263
Ma, come è mostrato dalle contraddizioni, l’intuizione non è infallibile. Quindi resterà sempre un elemento di incertezza [. . . ].
Noi dovremmo essere costantemente sull’allerta per scoprire casi
cruciali dove [le regole logiche] possono portare all’errore, se mai
lo fanno. A questo fine, abbiamo bisogno di una facoltà veloce di
dedurre conseguenze, e di una capacità immaginativa per il genere di conseguenze che possono essere false. Se, alla fine, arriviamo
a un insieme di principi che si raccomandano all’intuizione, e che
mostrano esattamente perché prima cadavamo in errore, possiamo avere una ragionevole assicurazione che i nuovi principi sono
comunque più vicini alla verità dei precedenti.
Quindi espone in dettaglio la teoria senza classi che aveva elaborato nel
lavoro ritirato34 . L’eliminazione delle classi comporta anche il riconoscimento
della distinzione di tipi, come già rilevato nel precedente lavoro. Anzi, “La
teoria dell’Appendice B [dei Principles] tecnicamente differisce poco dalla
teoria senza classi”. Infatti, la nozione di una classe che è elemento di se
stessa diventa priva di significato, come si è visto sopra, mentre è facile
definire cosa intendiamo quando diciamo che una classe è un elemento di una
classe di classi.
In questo modo, otteniamo una serie di tipi, cosı̀ che, laddove prima sarebbe potuto emergere un paradosso, ora abbiamo
una differenza di tipi che rende l’enunciato paradossale privo di
significato.
I vari tipi che emergono in questo processo: classi, classi di classi,
classi di classi di classi, relazioni binarie, classi di relazioni binarie,
relazioni binarie di classi di entità, relazioni ternarie e cosı̀ via,
sono tutte semplicemente frasi incomplete come “il risultato di
rimpiazzare a in p con . . . ”.
Non esiste quindi qualcosa come la serie completa di ordinali di ogni tipo:
“c’è una formula che dà il numero ordinale di tutti gli ordinali di un dato
34
Forse aveva deciso di cogliere l’occasione di questa forma di pubblicazione della teoria,
e che non fosse il caso di ripetersi.
264
tipo; questo non è del tipo dato, ed è il primo ordinale maggiore di quelli del
tipo dato”35 .
La novità del lavoro sta tuttavia in questa frase:
Poincaré sostiene che i paradossi sorgono tutti da qualche genere
di circolo vizioso. Sono d’accordo con lui.
Per confermare la presenza costante del circolo vizioso Poincaré allarga il
panorama delle contraddizioni prese in esame, includendo quelle della definibilità e addirittura quella del mentitore. Poincaré in questo modo tuttavia
smentisce se stesso, e la sua affermazione che “i Cantoriani si sono dimenticati [che non esiste l’infinito attuale] e sono caduti in contraddizione”. Il
paradosso del mentitore infatti non ha nulla a che fare con l’infinito. Inoltre
l’unico senso in cui Cantor e i logicisti devono ammettere l’infinito attuale
è quello per cui è possibile fare affermazioni su tutti o alcuni dei termini
che hanno una certa proprietà, anche quando il numero di tali termini non è
finito.
Tuttavia Russell riconosce che la chiave dei paradossi va cercata nel circolo
vizioso, e in particolare nel suggerimento di Poincaré “che ciò che in un modo
qualunque concerne tutti di qualsiasi o alcuni (indeterminati) degli elementi
di una classe, non deve essere esso stesso uno degli elementi della classe”.
Il principio che Russell vuole assumere, “nel linguaggio di Peano”, è
Ciò che coinvolge una variabile apparente [vincolata36 ] non deve
essere uno dei possibili valori di quella variabile.
35
Russell si limita ad affermare l’esistenza di questa e altre formule, senza scriverle.
Ad esempio afferma che alcuni dei principali teoremi di esistenza sono ottenuti in un
modo indiretto. Si assume che per ogni proposizione esista almeno una entità che non è
menzionata nella proposizione. Ammesso poi che esista una entità a, se si considera la
proposizione a = a si conclude che esiste una entità diversa da a, quindi ne esistono almeno
due; continuando cosı̀ per ogni n si dimostra che esistono almeno n entità, quindi ne esiste
una infinità numerabile. Ma se l’affermazione che esistono almeno due elementi può essere
resa da ∃a∃b(a 6= b), e cosı̀ per ogni n, forse solo la loro congiunzione infinita può essere
presa come affermazione che le entità sono almeno numerabili, che invece Russell ritiene
scontata. I buoni ordini di questa infinità di entità sono gli ordinali della seconda classe,
che sono ordinali di entità. Il buon ordine degli ordinali della seconda classe è ω1 che è un
ordinale di ordinali, non un ordinale di entità, ed è di un tipo superiore; si continua cosı̀,
anche se Russell confessa che non è in grado di arrivare a ωω .
36
Nel linguaggio di Peano sono chiamate variabili reali e apparenti quelle che altrimenti
sono dette rispettivamente libere e vincolate.
265
“Ma [Poincaré] non si rende conto della difficoltà di evitare circoli viziosi
di questo genere”. La difficoltà è che può diventare necessario “costruire
una [originale] teoria delle espressioni contenenti variabili apparenti che dia
il principio come suo esito”. Il principio del circolo vizioso non è in sé la
soluzione, ma il risultato che deve conseguire dal modo come è costruita la
teoria.
In particolare per Epimenide non basta la no classes theory; il tutti deve
riguardare le proposizioni stesse. Una affermazione su tutte le proposizioni
deve essere o priva di significato o l’affermazione di qualcosa che non è una
proposizione; c’è quindi bisogno di un significato di proposizione per il quale
nessuna proposizione contiene una variabile vincolata37 .
Nel paradosso del mentitore, “io sto mentendo” significa “esiste una proposizione p che sto affermando e che è falsa”. Quindi non è una proposizione.
L’affermazione è falsa non perché egli stia enunciando una proposizione vera ma perché benché stia facendo un’affermazione non sta enunciando una
proposizione.
Lo stesso argomento dispone dell’antinomia di Richard e di quella di
Berry.
Ma la difficoltà di costruire una logica che incorpori tali requisiti può
essere illustrata dal destino delle leggi logiche. Il principio del terzo escluso
ad esempio afferma che “ogni proposizione è vera o falsa”, e la maggior parte
delle persone pensa che il principio si applichi a se stesso e quindi che si
affermi che il principio del terzo escluso è vero o falso. Invece la legge del
terzo escluso non è una proposizione; è tuttavia una affermazione vera, ma
nel senso che tutti i suoi casi particolari sono veri.
Poincaré direbbe, pensa Russell, che il principio del terzo escluso è “tutte
le proposizioni sono vere o false, esclusa la proposizione che tutte sono o
vere o false”. Ma in questo modo non sfugge alla contraddizione. Bisogna
trovare un modo di esporre la legge del terzo escluso in modo che non si
applichi a se stessa, anche senza dire che non si applica a se stessa. Possiamo
farlo restringendola alle proposizioni che non contengono variabili vincolate,
purché lo facciamo senza dire che non contengono variabili vincolate. Allora
si avrà una gerarchia, la legge per enunciati privi di variabili vincolate (benché
non sia chiaro come possa non dire che non contengono variabili vincolate),
37
La restrizione sembra un po’ forte, dal momento che prima parlava delle affermazioni
su tutte le proposizioni; ma forse va messa in relazione anche con l’esclusione di tutti per
le classi.
266
che ha una variabile vincolata (“ogni enunciato . . . ”), la legge per enunciati
con una variabile vincolata, che conterrà due variabili vincolate, e cosı̀ via
senza mai esaurirle tutte.
Un’altra difficoltà è illustrata dal principio di induzione. La presenza di un
circolo vizioso denunciata da Poincaré è formalmente corretta, e bisognerebbe
restringersi a proprietà che si possano esprimere senza variabili vincolate.
Pure ci sono molti casi in cui sembra inevitabile applicare l’induzione a una
variabile di una formula che contiene una quantificazione su un’altra variabile:
la confrontabilità n < m∨n = m∨m < n è un esempio, in quanto si dimostra
di solito dimostrando per induzione su n la formula ∀m(n < m∨n = m∨m <
n).
Una scappatoia potrebbe essere suggerita secondo Russell dal paradosso
di Epimenide, nella variante in cui Epimenide dice “tutte le proposizioni
della forma ϕx affermate da Epimenide sono false”; se questa affermazione
fosse della forma ψ(Epimenide) si avrebbe una contraddizione. Quindi un
enunciato che contiene una variabile funzionale vincolata non deve essere
della forma ϕx anche quando contiene x38 ; ed è naturale estendere la richiesta
a enunciati che contengono variabili individuali vincolate.
Ma questa variante di Epimenide mostra solo una affermazione contenente una variabile libera x e una variabile vincolata non è identica a una
affermazione della forma ϕx; non esclude che non possa essere equivalente.
Nel caso di Epimenide in affetti la sua asserzione è equivalente a una della
forma ϕ(Epimenide).
Sostituendo asserzioni equivalenti si aggirerebbe la restrizione sull’induzione; ma Russell non dà nessun esempio matematico, in particolare non
discute il caso da lui stesso citato, per mostrare quale formula equivalente
usare.
Dall’esposizione di Russell, non si capisce se a questo stadio della sua
riflessione egli sia convinto di poter presentare una soluzione alle difficoltà
enunciate, oppure non sappia ancora come risolverle. Non si capisce cioè se
la realizzazione del principio del circolo vizioso sia considerata una strada
obbligata, ma oscura, oppure se egli vede la strada che porta alla luce.
Per quel che riguarda la no classes theory, il collaboratore di Russell,
Alfred North Whitehead, era per parte sua contrario a “fondare tutta la matematica su un artificio tipografico”, e sosteneva che il loro [di Whitehead e
Russell] obiettivo era quello di sistematizzare il ragionamento in matematica,
38
Russell intende probabilmente che x non deve essere il soggetto.
267
e per questo bisognava mantenere le classi: “Il rigore estremo deve essere temperato da considerazioni pratiche [. . . ] Le classi possono essere mantenute in
base alla considerazione che [. . . ] il ragionamento effettivo della matematica
usa abitualmente le classi anche quando non ce ne sarebbe bisogno. Cosı̀ il
nostro compito è di sistematizzare il ragionamento relativo alle classi, anche
se fosse un’idea primitiva che potrebbe essere evitata”39 .
Alla fine nel 1906 Russell scrivendo a Jourdain gli racconterà che tutto funziona con la sua no classes theory fino a che non “non considero la
funzione W , dove W (ϕ). ≡ .ϕ ∼ ϕ(ϕ), e allora [. . . ] non ho guadagnato
nulla rifiutando le classi”40 ; tornerà perciò a un atteggiamento realista. La
eliminazione delle classi lo aveva portato a mettere di nuovo in evidenza i
vantaggi, o la necessità, della distinzione dei tipi, e forse si era convinto che
la natura delle classi era meno importante della struttura dei tipi in vista
della esclusione di ogni circolo vizioso.
La teoria dei tipi
Nel 1907 Russell elabora la sua nuova teoria dei tipi41 . Il lavoro inizia con
un elenco delle contraddizioni da risolvere, che servono come banco di prova
della teoria42 , e rappresentano “solo una selezione tra un numero indefinito”
di analoghe.
La più vecchia contraddizione è quella di Epimenide il cretese, che dice
“sto mentendo”; quindi viene messa quella di Russell sia nella forma della
classe di tutte le classi che non appartengono a se stesse, sia nella forma
relazionale vista sopra. Seguono quella di Berry e quella di König sull’ordinale
definito come il primo ordinale non definibile. Infine è presentato il paradosso
di Richard e ultima l’antinomia di Burali-Forti.
Tutte le contraddizioni elencate hanno una caratteristica comune “che
possiamo descrivere come auto-riferimento o riflessività”. In tutte le contraddizioni si dice qualcosa su tutti i casi di qualche genere, e da quello che
39
Lettere di Whitehead a Russell del febbraio 1906, citate da Lackey, in Essays in
Analysis, cit. pp. 131-2.
40
Cit. da Grattan-Guiness, “Bertrand Russell on his paradox and the multiplicative
axiom”, cit. Russell sembra dimenticare qui o non dare penso alla sua osservazione che
la teoria senza classi deve anche essere una teoria dei tipi, e coerentemente non dovrebbe
scrivere la W .
41
“Mathematical Logic as based on the Theory of Types” (1908), cit.
42
Il suo merito non è solo quello di risolvere le contraddizioni, spiega Russell, ma anche
“una certa consonanza” con il buon senso, benché questo non sia un merito su cui insistere,
dal momento che il buon senso è meno affidabile di quanto comunemente si crede.
268
si dice un nuovo caso sembra essere generato, che è e nello stesso tempo non
è dello stesso genere dei casi che tutti sono stati considerati.
Russell passa in rassegna tutte le contraddizioni per far vedere il fenomeno dell’auto-riferimento. Conclude cosı̀ che la nozione “tutte le proposizioni”,
come anche “tutti gli ordinali” sono illegittime. “Tutte le nostre contraddizioni hanno in comune l’assunzione di una totalità che, se fosse legittima,
sarebbe immediatamente ampliata da nuovi elementi definiti in termini di
quella totalità”.
Questo conduce alla regola: “Ciò che presuppone [involves] il tutti
di una collezione non deve essere uno della collezione”, o al contrario: “Se, assumendo che una collezione avesse un totale, essa
avrebbe elementi definibili solo in termini di quel totale, allora
tale collezione non ha totale”.
La regola è tuttavia puramente negativa, e non mostra come evitare o correggere gli errori che derivano dal suo mancato rispetto. Non si può dire
“quando parlo di tutte le proposizioni intendo tutte salvo quelle nelle quali
‘tutte le proposizioni’ sono menzionate”, perché cosı̀ abbiamo proprio menzionato le proposizioni nelle quali “tutte le proposizioni” sono menzionate.
“È impossibile evitare di menzionare qualcosa dicendo che non la menzioneremo”. Quindi è necessario “costruire una logica senza menzionare cose
come ‘tutte le proposizioni’ o ‘tutte le proprietà’, e senza anche dover dire
che le escludiamo. L’esclusione deve risultare naturalmente ed inevitabilmente dalle nostre dottrine positive, che devono rendere chiaro che ‘tutte le
proposizioni’ e ‘tutte le proprietà’ sono frasi prive di senso”.
Le prime difficoltà che vengono in mente sono quelle già notate da Russell,
cioè le leggi logiche e il principio di induzione. Una prima soluzione consiste
nella differenza tra “tutti” e “qualsiasi”. La distinzione, già discussa nei
Principles, assume ora un ruolo decisivo.
Si tratta, nella terminologia logica moderna, della distinzione tra una
variabile quantificata universalmente e una variabile libera. Entrambe sono
necessarie e presenti nella matematica. Nelle dimostrazioni geometriche che
iniziano con “Sia ABC un triangolo . . . ”, ABC è un triangolo qualsiasi. In
una definizione come “f è continua in x0 se per ogni ε e ogni δ . . . ”, la f e
x0 sono qualsiasi, mentre gli ε e i δ sono tutti. Asserire qualsiasi valore di
una funzione proposizionale significa asserire la funzione proposizionale.
269
La differenza tra asserire ϕx e asserire ∀xϕx è stata segnalata e sottolineata per primo da Frege43 . Le variabili libere sono essenziali per il pensiero
deduttivo: per dedurre ad esempio ∀xψx da ∀xϕx e ∀x(ϕx → ψx) occorre
particolareggiare a un x qualsiasi ϕx e ϕx → ψx, per usare il modus ponens 44 .
Quando le variabili sono proposizioni o proprietà, la quantificazione deve
essere vietata, e si potranno fare solo affermazioni per un qualsiasi valore
della variabile. Le leggi fondamentali della logica non riguardano cosı̀ tutte le
proposizioni (di una certa forma), sono schemi (nella terminologia moderna)
costituiti dall’insieme di tutti i possibili singoli casi.
Anche il principio di induzione diventa uno schema, perfettamente adeguato a tutti i suoi usi. Non è invece possibile usare l’induzione per definire i
numeri, dicendo che un numero naturale è tale se possiede ogni proprietà che
sia goduta da 0 e da ogni successore di uno che la possiede. Russell accetta
cosı̀ la critica predicativista di Poincaré alla definizione di Dedekind.
Segue una lunga discussione del quantificatore universale. La maggior
parte delle affermazioni usano quantificatori ristretti a una proprietà, ad
esempio “Tutti i tedeschi sono biondi”. Ma non esistono simili quantificatori
in logica, nell’analisi logica di Frege accettata anche dalla logica moderna.
La giustificazione di Russell è che “tutti i tedeschi” è una frase denotante, e
incompleta; non può essere il soggetto di una proposizione. L’affermazione
espansa e corretta è
∀x(Tedesco(x) → Biondo(x))
con il quantificatore universale ∀x non ristretto.
Tuttavia non si potrebbe fare un’affermazione del genere, perché tra tutti
i valori di x ricadrebbero anche tutte le proposizioni e tutte le totalità illecite.
D’altra parte non lo si può restringere con una proprietà o una classe, perché
si riproporrebbe con queste la situazione qui esemplificata da “Tedesco(x)”.
La restrizione deve venire dall’interno dalla proposizione quantificata. La
funzione proposizionale Tedesco(x) → Biondo(x) “deve avere un certo ambito
di significatività che non coincide con tutti i valori di x, ma che eccede” quelli
di “Tedesco(x)”.
43
G. Frege, Grundgesetze der Arithmetik , 1893, cit., vol. I, §17.
L’esempio va bene per illustrare il ruolo delle variabili libere, ma come inferenza logica
è controproducente per l’argomento di Russell; infatti quando si è concluso ψx per un x
qualsiasi , si passa a ∀xψx, cioè si afferma “per tutti gli x, ψx”. Invece, vedi sopra il
seguito.
44
270
“Se la funzione cessa di avere significato quando la variabile esce da un
certo ambito, allora la variabile è ipso facto confinata a quell’ambito, senza
che sia necessario dichiararlo esplicitamente”.
Russell giustifica cosı̀ i sistemi di significatività delle funzioni proposizionali che aveva asserito esistere nell’Appendice dei Principles.
Si può dunque affermare che “ogni proposizione che contiene tutti asserisce che una certa funzione proposizionale è sempre vera; questo significa
che tutti i valori di detta funzione sono veri, non che la funzione è vera per
tutti gli argomenti, perché ci sono argomenti per i quali la funzione è priva
di significato, cioè non ha alcun valore”.
Il lavoro preparatorio per la teoria dei tipi è terminato. Nella attuale
versione della teoria appare, insieme ai tipi, un altro concetto, quello di
ordine.
Un tipo è definito come il sistema di significatività di una funzione proposizionale [. . . ]. Quando una variabile apparente [vincolata] occorre in una proposizione,
il sistema dei valori della variabile apparente è un tipo, il tipo fissato dalla funzione
a cui “tutti i valori” [della variabile] si riferiscono. [. . . ]
Il principio [del circolo vizioso], nel nostro linguaggio tecnico, diventa: “Ciò che
contiene una variabile apparente non deve essere un possibile valore di quella variabile”. Cosı̀ ciò che contiene una variabile apparente deve essere di un tipo diverso
da quello dei possibili valori di quella variabile; diremo che è di un tipo superiore.
Cosı̀ sono le variabili apparenti contenute in una espressione che determinano il
suo tipo. Questo è il principio guida per quel che segue.
Russell chiama elementari le proposizioni che non contengono variabili
vincolate, e generalizzate quelle che contengono variabili vincolate. Nelle
proposizioni elementari, i termini sono il soggetto, quelli di cui sono asseriti
i predicati e le relazioni.
I termini delle proposizioni elementari li chiameremo individui ; essi formano il
primo tipo, o il più basso.
Non è necessario, in pratica, sapere quali oggetti appartengono al tipo più
basso, o anche se il tipo più basso di una variabile che occorre in un dato contesto
è quello degli individui o qualcun altro. Perché in pratica solo i tipi relativi delle
variabili sono rilevanti; cosı̀ il tipo più basso che occorre in un dato contesto può
essere chiamato il tipo degli individui, per quel che riguarda quel contesto. [. . . ]
quello che è essenziale è il modo come gli altri tipi sono generati dagli individui,
271
comunque sia costituito il tipo degli individui. [. . . ]45
Le proposizione elementari, insieme a quelle che contengono solo individui come
variabili apparenti, le chiameremo proposizioni del primo ordine. Queste formano
il secondo tipo logico.
Abbiamo cosı̀ una nuova totalità, quella delle proposizioni del primo ordine.
Possiamo allora formare nuove proposizioni nelle quali occorrono come variabili
apparenti proposizioni del primo ordine. Queste le chiameremo proposizioni del
secondo ordine; esse formano il terzo tipo logico. Cosı̀ ad esempio, se Epimenide
asserisce “tutte le proposizioni del primo ordine da me affermate sono false”, egli
asserisce una proposizione del secondo ordine; la può affermare in modo veritiero,
senza al contempo asserire in modo veritiero alcuna proposizione del primo ordine,
e cosı̀ non sorge alcuna contraddizione.
Il processo descritto può essere continuato indefinitamente. L’(n+1)-esimo tipo
logico consisterà delle proposizioni di ordine n, che saranno quelle che contengono
come variabili apparenti proposizioni di ordine n − 1, ma non superiore. I tipi sono
mutuamente esclusivi, quindi non è possibile alcuna fallacia riflessiva, fintanto che
ricordiamo che una variabile apparente deve essere sempre ristretta a qualche tipo.
In parallelo con la gerarchia delle proposizioni c’è una gerarchia di funzioni proposizionali. Russell discute la possibilità di utilizzare per la loro
definizione le matrici p/a e la notazione p(x/a), afferma che se ne avrebbero certi vantaggi, forse per salvare il lavoro fatto nei precedenti articoli, ma
conclude che è meglio rimpiazzare p con ϕa e p(x/a) con ϕx,
Una funzione il cui argomento è un individuo e il cui valore è sempre una
proposizione del primo ordine sarà chiamata una funzione del primo ordine. Una
funzione che coinvolge una funzione o una proposizione del primo ordine come
variabile apparente sarà detta una funzione del secondo ordine, e cosı̀ via. Una
funzione di una variabile che è dell’ordine immediatamente superiore a quello del
suo argomento sarà chiamata funzione predicativa. [. . . ]
La gerarchia delle funzioni può essere ulteriormente spiegata come segue. Una
funzione del primo ordine di un individuo x sarà denotata da ϕ!x [. . . ]. Nessuna
funzione del primo ordine contiene una funzione come variabile apparente; quindi
tali funzioni formano una totalità ben definita, e la ϕ in ϕ!x può essere trasformata in una variabile apparente. Qualunque proposizione in cui ϕ compare come
variabile apparente, e in cui non c’è alcuna variabile apparente di tipo superiore
a ϕ, è una proposizione del secondo ordine. Se una tale proposizione contiene un
45
[Ora Russell veramente, contraddicendo quanto appena detto, cerca di definire gli individui, come quelli che sono privi di ogni complessità, per differenziarli dalle proposizioni,
che sono complesse.]
272
individuo x, non è una funzione predicativa di x; ma se contiene una funzione del
primo ordine ϕ, è una funzione predicativa di ϕ, e sarà scritta f !(ϕ!ẑ )46 . Allora
f è una funzione del secondo ordine predicativa; i possibili valori di f di nuovo
formano una totalità ben definita, e possiamo usare f come variabile apparente.
[. . . ]
Adotteremo le seguenti convenzioni. Variabili del tipo più basso che occorrono
in un dato contesto saranno denotate da lettere latine minuscole (eccetto f e g che
sono riservate per funzioni); una funzione predicativa di un argomento x (dove x
può essere di qualsiasi tipo) sarà denotata da ϕ!x [. . . ]; una funzione generale di
x sarà denotata da ϕx [. . . ]. In ϕx, ϕ non può essere trasformata in una variabile
apparente, perché il suo tipo è indeterminato; ma in ϕ!x, dove ϕ è una funzione
predicativa il cui argomento è di un qualche tipo dato, ϕ può diventare una variabile
apparente47 .
Alcune delle contraddizioni sono risolte dalla teoria dei tipi, cioè dalla restrizione che le frasi contenenti le parole “tutte le proposizioni” e simili sono
prima facie prive di significato, perché la generalizzazione può essere applicata solo all’interno di un tipo. Russell lo fa vedere per il mentitore, Berry
e il minimo ordinale indefinibile. Per le altre, come Burali-Forti, occorrono
ulteriori approfondimenti.
È assolutamente necessario, se la matematica deve essere possibile, che abbiamo qualche metodo per fare affermazioni che normalmente siano equivalenti a
quello che abbiamo in mente quando (in modo impreciso) parliamo di “tutte le
proprietà di x”.
[Ad esempio per l’induzione.]
[. . . ] parlare di tutti i valori di [una] funzione [. . . ] richiede che essa sia di
un qualche ordine assegnato; ma qualunque ordine assegnato non ci permetterà di
dedurre molte proposizioni della matematica elementare.
Quindi dobbiamo trovare qualche metodo per ridurre l’ordine di una funzione
proposizionale senza influire sulla verità o falsità dei suoi valori. Questo sembra
ciò che il senso comune realizza con l’ammissione delle classi . Data una qualunque
funzione proposizionale ϕx, di qualunque ordine, si assume che essa sia equivalente,
per tutti i valori di x, a una affermazione della forma “x appartiene alla classe α”.
[. . . ] Io credo che lo scopo principale a cui servono le classi, e la principale ragione
che le rende linguisticamente convenienti, è che esse forniscono un metodo per
ridurre l’ordine di una funzione proposizionale. Io perciò, non assumerò nulla di
46
[Nel testo è scritto f !(ψ! ẑ ), ma deve trattarsi di un refuso.]
[Queste convenzioni anticipano quello che sarà lo stile sistematicamente ambiguo dei
Principia, senza indicazione esplicita dei tipi delle variabili.]
47
273
quello che sembra essere implicito nell’ammissione del senso comune delle classi,
se non questo: che ogni funzione proposizionale è equivalente, per tutti i suoi
valori, a qualche funzione predicativa [degli stessi argomenti]. Questa assunzione
[. . . ] mantiene delle classi tanto quanto serve, ma abbastanza poco da evitare le
contraddizioni [. . . ]. Chiamerò questa assunzione assioma delle classi , o assioma
di riducibilità.
L’induzione matematica può ora essere enunciata solo per tutte le funzioni
predicative di numeri.
Il timore che con l’assioma di riducibilità possano tornare ad affacciarsi i
paradossi non è giustificato, perché in essi interviene o qualcosa d’altro oltre
alla verità o falsità dei valori delle funzioni, oppure compaiono espressioni
che restano prive di significato anche applicando l’assioma di riducibilità. Ad
esempio “Epimenide asserisce ψx” non è equivalente a “Epimenide asserisce
ϕ!x”, anche se ψx e ϕ!x sono equivalenti.
Esaurite le motivazioni e le spiegazioni delle caratteristiche della teoria
dei tipi, Russell espone formalmente nel capitolo VI il sistema di logica che
ne risulta.
La teoria sarà chiamata teoria ramificata dei tipi , perché il tipo di una funzione dipende sia dal tipo degli argomenti sia dal tipo delle variabili vincolate
che occorrono in essa.
Il sistema è basato su sette idee primitive che sono: funzione proposizionale; negazione; disgiunzione; la verità di un qualunque valore di una funzione
proposizionale; la verità di tutti i valori di una funzione proposizionale (diremmo: il quantificatore universale); funzione predicativa di un argomento
di qualsiasi tipo; l’asserzione (che qualche proposizione è vera), indicata dal
segno `.
L’idea di variabile è probabilmente implicita in quella di funzione proposizionale. Russell non è molto rigoroso nella formalizzazione; ad esempio non
definisce “proposizione”, anche se stipula, ad esempio per la negazione, che
“se p è una proposizione, anche ∼ p è una proposizione”. Non enuncia una
regola di sostituzione.
Seguono alcune definizioni, tra le quali gli altri connettivi, precisamente ⊃
per l’implicazione, il puntino per la congiunzione, ≡ per la biimplicazione, il
quantificatore esistenziale, la notazione ϕx̂ per la funzione, in quanto distinta
dai singoli valori. Quindi è presentato un elenco di 14 assiomi e regole:
274
(1)
(2)
(3)
(4)
(5)
(6)
(7)
Una proposizione implicata da una premessa vera è vera.
`: p ∨ p. ⊃ .p.
`: q. ⊃ .p ∨ q.
`: p ∨ q. ⊃ .q ∨ p.
`: p ∨ (q ∨ r). ⊃ .q ∨ (p ∨ r).
`: .q ⊃ r. ⊃: p ∨ q. ⊃ .p ∨ r.
`: (x).ϕx. ⊃ .ϕy.
L’ottava proposizione primitiva mette in difficoltà Russell, in quanto non
è una formula, “non può essere espressa coi nostri simboli”, ma una sorta di
metaregola:
(8) Se ϕy è vera, dove ϕy è un valore qualsiasi di ϕx̂, allora (x).ϕx è
vera.
(9) `: (x).ϕx. ⊃ .ϕa, per ogni a costante.
(10) `: .(x).p ∨ ϕx. ⊃: p. ∨ .(x).ϕx.
(11) Se f (ϕx) è vera qualsiasi sia il valore di x e F (ϕy) è vera qualsiasi
sia il valore di y, allora f (ϕx).F (ϕx) è vera qualunque sia il valore di x.
(12) Se ϕx.ϕx ⊃ ψx è vera per ogni possibile valore di x, allora ψ è
vera per ogni possibile valore di x.
(13) `: .(∃f ) : .(x) : ϕx. ≡ .f !x, che è l’assioma di riducibilità, come
anche il prossimo, per due variabili.
(14) `: .(∃f ) : .(x, y) : ϕ(x, y). ≡ .f !(x, y)
L’unico caso in cui interviene la teoria dei tipi è (11), che implicitamente
permette di identificare variabili reali solo se sono dello stesso tipo; il sistema
si presenta con una ambiguità formale che è utile: “non è mai necessario nel
corso di una qualsiasi deduzione considerare il tipo assoluto di una variabile; è solo necessario vedere che le differenti variabili che occorrono in una
proposizione siano dei tipi relativi appropriati”. Questo esclude ad esempio
la quarta contraddizione perché “una relazione tra R ed S è sempre di un
tipo superiore ad entrambe” e quindi “la relazione R tra R ed S” è priva di
significato.
L’uguaglianza è definita da
x = y. =: (ϕ) : ϕ!x. ⊃ .ϕ!y.
275
Le classi sono introdotte nel seguente modo. Per ogni funzione f di
funzioni predicative ϕ!ẑ si considera una associata funzione estensionale48
ponendo
f {ẑ (ψz)}. =: (∃ϕ) : ϕ!x. ≡x .ψx : f {ϕ!ẑ }.
La funzione f {ẑ (ψz)} è in realtà una funzione di ψẑ , anche se non la stessa
di f (ψẑ ), ma “è conveniente trattare f {ẑ (ψz)} tecnicamente come se avesse
come argomento ẑ (ψz), che chiameremo ‘la classe definita da ψ’ ”.
Se due funzioni sono equivalenti, le classi definite da esse sono uguali,
che è “la proprietà caratteristica delle classi”, quindi “siamo giustificati nel
trattare ẑ (ϕ) come la classe definita da ϕ”.
Secondo Quine49 , Russell riduce sı̀ in questo modo le classi alle funzioni
proposizionali, ma siccome le funzioni proposizionali occorrono come variabili nella quantificazione, la logica dei Principia è impegnata alle funzioni
proposizionali in re, e l’eliminazione delle classi ammonta a una riduzione
delle classi a proprietà o attributi. Siccome Russell non distingueva uso e
menzione, egli credeva di aver ridotto le classi a entità linguistiche, mentre
di fatto le aveva ridotte solo a proprietà platoniche.
Russell in una nota a “On some difficulties . . . ” aveva anticipato che,
siccome le obiezioni alla esistenza delle classi valgono anche per l’esistenza
delle funzioni proposizionali come entità separabili distinte da tutti i loro
valori, nella teoria ogni volta che si parla di una funzione proposizionale si
intende una abbreviazione per parlare di alcuni o tutti i suoi valori; questo
quando sembrava orientato alla no classes theory. Non si può dire che tale
principio sia rispettato nella teoria dei tipi, ma d’altra parte non è detto che
debba esserlo.
Non è credibile che Russell non fosse consapevole dell’impegno ontologico
del suo sistema; peraltro in una serie di note non pubblicate del 1906 scriveva
proprio che “qualunque cosa sia una variabile apparente [vincolata] deve avere
qualche specie di essere”, quasi anticipando lo slogan di Quine che “essere è
essere il valore di una variabile vincolata”.
Dopo le classi, Russell introduce l’operatore descrittivo “l’x tale che ϕ”
per poter definire le usuali funzioni matematiche, che hanno come valori
48
Brevemente, significa che se gli argomenti sono equivalenti, come funzioni, anche i
valori lo sono.
49
Willard v. O. Quine, “Whitehead and the rise of modern logic”, in The Philosophy
of Alfred North Whitehead (a cura di P. A. Schilpp), The Library of Living Philosophers,
Open Court, La Salle, 1941, pp. 125-64.
276
dei termini, e che chiama descrittive. Quindi definisce i cardinali, e discute
l’assioma dell’infinito, nella forma che nessun classe finita contiene tutti gli
individui, e che può essere assunto oppure no. Se lo si assume, si possono
definire anche operazioni infinitarie sui cardinali, si ottiene ℵ0 e cardinali
maggiori ma non ℵω , neanche dopo aver introdotto gli ordinali50 .
Nell’occasione Russell osserva che l’assioma moltiplicativo è equivalente
a quello di Zermelo, dimostrando in nota la direzione che finora gli mancava;
preferisce non aggiungerlo agli assiomi, ma segnalarlo ogni volta che si usa.
Osserva che se pure i cardinali sono ambigui, nel senso che hanno un
significato diverso a seconda del tipo al quale si riferiscono, tuttavia si possono
confrontare le cardinalità delle classi anche se esse hanno tipo diverso; infatti
una relazione biunivoca può sussistere tra gli elementi di due classi anche se
queste hanno tipo diverso – avrà un tipo superiore al massimo dei due.
Infine definisce gli ordinali, e spiega di nuovo come la teoria dei tipi eviti
la contraddizione di Burali-Forti: “Tutti gli ordinali di un tipo possono essere
ordinati per grandezza in una serie bene ordinata, che ha un numero ordinale
di un tipo superiore a quello degli ordinali che compongono la serie”.
La teoria dei tipi sarà ridotta di nuovo a una teoria semplice, non ramificata, da Frank P. Ramsey (1903-1930), il quale osserverà che la gerarchia
degli ordini è usata da Russell solo per le antinomie epistemologiche, e forse sarebbe meglio trascurarle in quanto dipendono da fattori linguistici non
logici né matematici51 .
50
Manca evidentemente qualcosa di equivalente al rimpiazzamento (Fraenkel e Skolem
furono condotti ad esso proprio dalla considerazione di ℵω ), ma non è chiaro quanto Russell
fosse consapevole di cosa mancasse.
51
F. P. Ramsey, “The foundations of mathematics”, Proceed. London Mathematical
Society, (2) 25, 1925, pp. 338-84, ristampato in F. P. Ramsey, The foundations of mathematics and other logical essays, Paul, Trench, Trubner, London, 1931, pp. 1-61; trad. it. I
fondamenti della matematica e altri scritti logici , Feltrinelli, Milano, 1964. Secondo Quine
invece, nella nota introduttiva a “Mathematical Logic as based on the Theory of Types”
in van Heijenoort, cit., pp. 150-2, la costruzione di Russell è inutilmente complicata per
la sua incapacità di distinguere tra le funzioni proposizionali come notazioni e le funzioni
proposizionali come attributi e relazioni: “Se per ogni funzione proposizionale ne esiste
una predicativa coestensiva, allora i simboli per le funzioni proposizionali sarebbero potuti
dall’inizio essere concepiti come i corrispondenti predicativi. In breve, i tipi delle funzioni
proposizionali sarebbero potuti essere descritti subito come dipendenti solo dai tipi degli
argomenti”. Se l’assioma di riducibilità è vero, la ramificazione era inutile in partenza.
Questa critica era stata anticipata da Leon Chwistek, “Antynomje Logiki Formalnej”,
Przeg. Filoz., 24 (1921), pp. 164-71.
277
Nell’immediato, la teoria dei tipi è discussa da Poincarè52 nel 1909, e
Russell gli risponde53 nel 1910.
Poincaré apprezza il riconoscimento del principio del circolo vizioso da
parte di Russell, anche se ora Poincaré stesso lo formula in un modo leggermente diverso, ponendo l’accento sul fatto che gli insiemi devono avere
una definizione stabile, che non sia modificata dalla introduzione di nuovi
elementi; gli insiemi infiniti sono generati progressivamente, e quando si aggiungono nuovi elementi si modifica la relazione tra l’insieme e gli elementi
già introdotti, e magari alcuni di essi debbono essere espulsi. Questo succede
ad esempio quando gli elementi sono quelli definibili con una frase finita; man
mano che si aggiungono elementi e l’insieme si modifica, il senso delle frasi
cambia, elementi che non erano definibili lo diventano e al contrario elementi
che erano definiti ora non lo sono più dalla stessa frase.
Le definizioni per cui questo non succede le chiama predicative, e non le
ritrova in modo palese nella impostazione di Russell, che peraltro interpreta
in modo approssimativo, confondendo tipi e ordini. Afferma nel suo riassunto che una proposizione non sarà sempre dello stesso ordine qualunque
sia x, perché il suo ordine dipende dall’ordine di x; la funzione sarà detta
predicativa se essa è di ordine k + 1 quando x è di ordine k. Lamenta che
Russell non abbia dato esempi, e che non abbia spiegato bene la funzione
dell’assioma di riducibilità, che dovrebbe servire a dimostrare il principio di
induzione. Poincaré ne sarebbe lieto, dal momento che sospetta che non sia
che un’altra forma dello stesso principio; i tentativi di dimostrare il principio
di induzione gli ricordano quelli di dimostrare il quinto postulato di Euclide
assumendo una delle sue conseguenze come una verità evidente.
Per quel che riguarda la gerarchia, Poincaré osserva che Russell non ha
chiarito se oltre alle proposizioni di ordine n, per ogni n, le quali si possono
definire in modo naturale, esistano anche proposizioni di ordine α, dove α
è un ordinale transfinito, in particolare ω. In caso affermativo, si dovrebbe spiegare che cosa sono tali proposizioni, in caso di risposta negativa, si
presuppone di avere già la distinzione tra finito e infinito.
Poincaré prova a proporre una sua applicazione dell’assioma: la definizione dei numeri naturali come quelli che appartengono a tutte le classi ricorrenti
non ha senso se non si precisa l’ordine delle classi ricorrenti; cosı̀ si hanno
52
H. Poincaré, “La logique de l’infini”, Revue de Métaphysique et de Morale, 17 (1909),
pp. 451-82.
53
“La Théorie des types logiques”, cit.
278
numeri di vario ordine; ma se un numero è di ordine n, è anche di ordine
n − 1, sicché si determina una successione di insiemi via via più ristretta, e
si potrebbero chiamare di ordine ω quei numeri che appartengono a tutti gli
ordini n, e ottenere cosı̀ una definizione.
Russell prende atto del tono non polemico dell’interlocutore, e siccome
questi ha chiesto maggiori spiegazioni, coglie l’occasione per esporre in modo
più diffuso le motivazioni e le interpretazioni filosofiche del proprio sistema,
sulle quali nel lavoro pubblicato su una rivista di matematica non aveva potuto dilungarsi. L’esposizione è in effetti più ampia e minuziosa di quella del
1908, ma Russell non risponde ad alcuna delle domande poste da Poincaré.
279
appendice
La teoria dei tipi54
La teoria dei tipi è un sistema di logica, più che di teoria degli insiemi.
la teoria predicativa dei tipi PT
Definizione induttiva di simbolo di tipo:
(i) “o” è un simbolo di tipo;
(ii) se t1 , . . . , tn sono tutti simboli di tipo, (t1 , . . . , tn ) è un simbolo di tipo;
(iii) null’altro è un simbolo di tipo.
Intuitivamente: gli individui sono le cose di tipo o; un insieme di individui ha
tipo (o); una relazione binaria tra individui ha tipo (o, o); una relazione binaria
tra individui e relazioni binarie tra individui ha tipo (o, (o, o)), e cosı̀ via.
Una gerarchia di tipi basata sull’insieme non vuoto D è la collezione di tutte
le relazioni tipate su D. Le relazioni tipate su D sono individuate dalla seguente
definizione induttiva:
(i) un elemento di D è una relazione di tipo o;
(ii) un insieme di n-uple di elementi di D è una relazione di tipo (o, o, . . . , o);
| {z }
n
(iii) una relazione di tipo t = (t1 , . . . , tn ) è un insieme di n-uple hr1 , . . . , rn i,
dove ogni ri è di tipo ti , per 1 ≤ i ≤ n.
Se D e D0 sono due insiemi non vuoti della stessa cardinalità, le gerarchie di
tipi basate su D e rispettivamente D0 sono isomorfe.
Alfabeto di PT, la teoria predicativa dei tipi:
per ogni tipo t, una lista infinita di variabili {xtn }1≤n di tipo t;
per ogni tipo t, una lista infinita di costanti {atn }1≤n di tipo t;
parentesi, virgola, negazione, disgiunzione, accento circonflesso, ∀, ∃.
Definizione induttiva simultanea dei termini e delle formule:
(i) una variabile o una costante di un dato tipo sono termini di quel tipo;
(ii) Se A è un termine di tipo (t1 , . . . , tn ) e se y1 , . . . , yn sono termini rispettivamente di tipo t1 , . . . , tn , allora A(y1 , . . . , yn ) è una formula;
54
Da W. S. Hatcher, Foundations of Mathematics, W. B. Saunders, Philadelphia, 1968;
trad. it. Fondamenti della matematica, Boringhieri, Torino, 1973, cap. 4. I sistemi
presentati in questa appendice sono quelli classici che risalgono al lavoro di Russell; una
nuova teoria, che ha influenzato la costruzione di linguaggi di programmazione tipati, è
stata elaborata negli ultimi anni da Martin-Löf: si veda Per Martin-Löf, Intuitionistic
Type Theory, Bibliopolis, Napoli, 1984.
280
(iii) se A e B sono formule, anche (¬A) e (A ∨ B) sono formule;
(iv) se A è una formula e y una variabile, anche (∀y)A e (∃y)A sono formule;
(v) se A è una formula e y1 , . . . , yn (n > 0) sono variabili libere distinte nell’ordine della loro prima occorrenza in A da sinistra a destra, e sono rispettivamente
di tipo t1 , . . . , tn , l’espressione che si ottiene da A mettendo un accento circonflesso su tutte le occorrenze delle variabili libere della lista y1 , . . . , yn e chiudendo il
risultato in parentesi è un termine di tipo (t1 , . . . , tn ), che si chiama astratto. Le
variabili y1 , . . . , yn sono vincolate nel termine cosı̀ formato.
Se in A ci sono due o più variabili dello stesso tipo, almeno una delle quali viene
a essere vincolata nella formazione dell’astratto, allora le variabili di quel tipo che
vengono circonflesse devono essere scritte a pedice del termine, nell’ordine della
prima occorrenza da sinistra a destra.
Una notazione più usuale per gli astratti, per chi è abituato alla teoria degli
insiemi, è quella di {y | A(y)} per A(ŷ), per y libera in A.
Ovviamente anche l’interpretazione insiemistica di x(t) (xt ) è (xt ∈ x(t) ).
Definizione di ordine di un simbolo di tipo:
(i) l’ordine del simbolo di tipo “o” è 0;
(ii) un simbolo di tipo della forma (o, . . . , o) ha ordine 1;
(iii) un simbolo di tipo della forma (t1 , . . . , tn ) è di ordine n + 1 se il massimo
ordine dei simboli di tipo ti è n.
Definizione di ordine di un termine:
(i) l’ordine di una variabile o di una costante è l’ordine del simbolo di tipo che
occorre come indice nella variabile;
(ii) se A è un astratto, sia n il massimo ordine di tutte le sue variabili (vincolate
e libere) e delle costanti. Se esiste una variabile vincolata y di ordine n in A, A è
di ordine n + 1; se no, A è di ordine n.
Esempio Il termine
(o)
(o)
((∀x1 )x1 (x̂01 ))
è un termine di tipo (o). Questo simbolo di tipo ha ordine 1, ma il termine ha
ordine 2 perché contiene una variabile quantificata di ordine 1.
L’ordine di un astratto è sempre maggiore o uguale dell’ordine del suo tipo.
Definizione Un astratto è predicativo se e solo se l’astratto ha lo stesso ordine
come l’ordine del suo tipo. Altrimenti è detto impredicativo.
Esempio di una costruzione non predicativa nella dimostrazione che ogni insieme
di numeri reali limitato superiormente ha un estremo superiore.
281
Sia G un tale insieme e consideriamo l’insieme dei razionali, di tipo t, che sono
elementi di elementi di G, formalmente
((∃x)(G(x) ∧ x(ŷ)).
Sia y di tipo t ed n l’ordine di t. Allora perché l’astratto sia ben formato, deve
essere x di tipo (t) e G di tipo ((t)). L’astratto ha tipo (t) e quindi dovrebbe avere
ordine n + 1 per essere predicativo. Ma l’astratto contiene la variabile libera G di
ordine n + 2 ed è di ordine n + 2, quindi non è predicativo.
La spiegazione intuitiva delle precedenti definizioni è la seguente: le relazioni e
gli insiemi di una gerarchia di tipi sono pensati come costruiti dal basso, in modo
che una relazione il cui tipo è di un dato ordine n > 0 è formata solo da relazioni
il cui tipo è di ordine è minore di n. Gli individui, il cui tipo ha ordine 0 sono
alla base. Le variabili di un dato tipo prendono valori delle relazioni di quel tipo
in ogni gerarchia di tipi. Un astratto chiuso definisce o nomina una entità del
suo tipo. Se un astratto chiuso A di tipo t non ha l’ordine del suo tipo, deve
contenere variabili vincolate il cui tipo ha ordine maggiore o uguale a quello del
tipo di A, oppure costanti il cui tipo ha ordine maggiore del tipo di A. In ogni
caso, l’astratto definisce una entità facendo riferimento a entità la cui esistenza
dipende dalla esistenza di entità del tipo di quella che stiamo definendo.
L’ordine di una formula che abbia almeno una variabile libera è definita come
l’ordine dell’astratto che si ottiene circonflettendo tutte le variabili libere della
formula, e si dice predicativa se il suo ordine è uguale all’ordine del tipo dell’astratto
cosı̀ ottenuto.
Le variabili hanno ordine uguale all’ordine del loro tipo, per cui in realtà non
stanno per entità arbitrarie del loro tipo ma solo per entità definite predicativamente. Questo si realizza con una restrizione sulle regole dei quantificatori. Ad
esempio nella particolarizzazione del quantificatore universale il termine sostituito
alla variabile deve essere dello stesso tipo e ordine della variabile a cui è sostituito,
e quindi predicativo.
Definizione dell’uguaglianza.
x = y. ≡ .(∀z (t) )(z (t) (x) ≡ z (t) (y)),
dove x e y sono due termine di tipo t in cui z (t) non occorre.
Assiomi di PT.
PT.1
(A(ŷ1 , . . . , ŷn ))(z1 , . . . , zn ) ≡ A(z1 , . . . , zn ),
282
dove le yi sono variabili libere distinte della formula A(y1 , . . . , yn ) nell’ordine della
prima occorrenza da sinistra a destra, e l’astratto è predicativo e per ogni i zi ha
lo stesso tipo di yi ed è libera per yi in A(y1 , . . . , yn ).
PT.2
(∀z1 ) . . . (∀zn )(x(t1 ,...,tn ) (z1 , . . . , zn ) ≡ y (t1 ,...,tn ) (z1 , . . . , zn )) ⊃ x(t1 ,...,tn ) = y (t1 ,...,tn ) ,
dove le zi sono di tipo ti e sono tutte variabili distinte che non occorrono nei
termini x(t1 ,...,tn ) e y (t1 ,...,tn ) .
Si assume inoltre un sistema di logica, come la deduzione naturale, con le ovvie
restrizioni ad esempio sulle sostituzioni che devono rispettare i tipi.
Teorema Per ogni formula A(xt ) predicativa rispetto a xt ,
` (∃x(t) )(∀xt )(x(t) (xt ) ≡ A(xt )).
Dimostrazione Si parte dalla tautologia (x(t) (xt ) ≡ x(t) (xt )) quindi si passa a
(∀xt )(x(t) (xt ) ≡ x(t) (xt )), a (∃y (t) )(∀xt )(y (t) (xt ) ≡ x(t) (xt )), e infine a
(∀x(t) )(∃y (t) )(∀xt )(y (t) (xt ) ≡ x(t) (xt )).
Si applica quindi la particolarizzazione con il termine (A(x̂t )), che è predicativo
perché A(xt ) lo è, e si usa PT.1. 2
Da PT.1 si ha come caso particolare
` (∀xt )((A(ŷ t ))(xt ) ≡ A(xt )),
con le dovute restrizioni sintattiche: A(y t ) contiene y t libera ed è predicativa
rispetto a y t , xt è libera per y t in A(y t ), e A(xt ) risulta dalla sostituzione di xt a
tutte le occorrenze libere di y t .
Non si può tuttavia derivare dal teorema la contraddizione di Russell perché
(¬ŷ(ŷ)), che dovrebbe essere presa al posto di (A(ŷ t )), non può essere espressa in
PT.
PT.2 è l’assioma di estensionalità, che insieme alla definizione di uguaglianza
permette di dimostrare
` x(t) = y (t) ≡ (∀z t )(x(t) (z t ) ≡ y (t) (z t )),
ma solo per i termini55 di tipo diverso da o.
55
Le variabili metalinguistiche per i termini sono x, y, . . ., perché i ti sono riservati ai
tipi.
283
La parte destra dell’equivalenza è predicativa rispetto a x(t) , mentre la definizione di uguaglianza non lo è.
(o)
(o)
Si definisce V ((o)) per (x̂1 = x̂1 ), come classe universale per il tipo (0), ma
la definizione è proposta solo come esempio, si potrebbe dare anche per gli altri
tipi superiori. Per V (o) si usa una formula logicamente valida che dia luogo a un
astratto predicativo, ad esempio (x(o) (ŷ 0 ) ≡ x(o) (ŷ 0 ).
Si dimostra
(o)
(o)
` (∀x1 )V ((o)) (x1 ),
e più in generale
(t)
(t)
` (∀x1 )V ((t)) (x1 ),
come pure
` (∀xo1 )V (o) (xo1 ).
Si definisce Λ(t) per (x̂t1 6= x̂t1 ), come classe vuota per il tipo t, e si dimostra
` (∀xt1 )(¬Λ(t) (xt1 )).
Si possono quindi dare le definizioni di singoletto, complemento, intersezione e
unione ponendo
{x(t) }((t)) per (ŷ (t) = x(t) ), con y (t) non occorrente in x(t) (questa precisazione
sarà omessa nei casi successivi),
(t)
(x(t) ) per (¬x(t) (x̂t )),
(x(t) ∩ y (t) )(t) per (x(t) (ẑ t ) ∧ y (t) (ẑ t )),
(x(t) ∪ y (t) )(t) per (x(t) (ẑ t ) ∨ y (t) (ẑ t )).
La definizione dello 0, per il tipo minimo per cui ha senso la classe vuota, è
0((o)) =def {Λ(o) }((o)) ,
quella di successore
(t)
S(x((t)) )((t)) =def (∃z t )(ŷ (t) (z t ) ∧ x((t)) (ŷ (t) ∩ {z t }(t) )).
La definizione naturale dei numeri, N ((((o)))) è impredicativa:
(((o)))
((∀x1
(((o)))
)(x1
((o))
(0((o)) ) ∧ (∀x2
(((o)))
)(x1
(((o)))
⊃ x1
((o))
(x2
((o))
(x̂3
284
(((o)))
) ⊃ x1
))).
((o)) ((o))
)
))
(S(x2
⊃
Non si può quindi usare PT.1 per ottenere un astratto e relativamente ad esso
dimostrare gli assiomi di Peano.
Come assioma dell’infinito si può assumere
PT.3
(o,o)
(∃x1
(o,o)
)((∀xo1 )(¬x1
(o,o)
∧(∀xo1 )(∀xo2 )(∀xo3 )(x1
(o,o)
(xo1 , xo1 )) ∧ (∀xo1 )(∃xo2 )(x1
(o.o)
(xo1 , xo2 ) ∧ x1
(xo1 , xo2 ))∧
(o,o)
(xo2 , xo3 ) ⊃ x1
(xo1 , xo3 ))).
la teoria dei tipi TT
La teoria dei tipi TT ha lo stesso linguaggio e assiomi e regole di inferenza come
PT ma senza la restrizione predicativa. Il sistema si chiama anche teoria semplice
dei tipi, a meno di non riservare questo nome a una ulteriore semplificazione che
vedremo in seguito.
la teoria ramificata dei tipi RT
Nei Principia mathematica Russell ha usato una diversa presentazione formale.
Le variabili erano differenziate non solo per tipo ma anche per ordine, sı̀ che si
((o),(o,o))/5/(3,2)
dovrebbe scrivere x1
per indicare una variabile di tipo ((o), (o, o)) e
ordine 5, il cui primo argomento è di tipo (o) e ordine 3 e il secondo di tipo (o, o)
e ordine 2.
Il sistema RT della teoria ramificata dei tipi ha infatti come variabili e costanti
lettere con pedice un numero naturale > 0 e apice espressioni della forma “o/0” o
“(t1 , . . . , tn )/k/(y1 , . . . , yn )” dove i ti sono simboli di tipo, k e gli yi sono numeri
naturali con la restrizione che per ogni i il numero yi è maggiore o uguale dell’ordine
del corrispondente tipo ti , e k è maggiore del massimo dei valori degli yi ; e se ti è
o, allora yi deve essere 0 (i numeri che seguono immediatamente il simbolo di tipo
sono l’ordine; l’espressione completa è il tipo-ordine).
Definizione delle formule:
(i) variabili e costanti sono termini con il tipo-ordine indicato;
(ii) se x è un termine di tipo-ordine (t1 , . . . , tn )/k/(y1 , . . . , yn ), e z1 , . . . , zn
sono termini di tipo rispettivamente ti , e di ordine minore o uguale agli yi , allora
x(z1 , . . . , zn ) è una formula;
(iii) espressioni ottenute combinando formule con connettivi e quantificatori
sono formule;
(iv) se A(z1 , . . . , zn ) è una formula nella quale le variabili libere zi occorrono
nell’ordine della prima occorrenza, sono di tipo ti e di ordine yi , e k è il massimo
ordine di tutte le variabili e le costanti nella formula, allora (A(ẑ1 , . . . , ẑn )) è un
termine di tipo-ordine (t1 , . . . , tn )/r/(y1 , . . . , yn ), dove r è k se la formula non ha
variabili vincolate di ordine k, e k + 1 altrimenti.
285
Gli assiomi RT.1, RT.2 e RT.3 di RT sono gli stessi che per PT, dove la
definizione di predicatività ora diventa:
Un termine di tipo-ordine (t1 , . . . , tn )/k/(y1 , . . . , yn ) è predicativo se e solo se
k è y + 1, dove y è il massimo degli ordini y1 , . . . , yn . Le variabili e le costanti di
tipo-ordine o/0 sono predicative.
Se si escludono dal linguaggio di RT tutti i termini eccetto quelli di tipo-ordine
o/0 e (t1 , . . . , tn )/k/(y1 , . . . , yn ), dove gli yi sono gli ordini di ti e k è l’ordine di
(t1 , . . . , tn ), allora le formule di RT corrispondono in modo naturale a quelle di
PT, e gli assiomi e le regole ristrette a queste formule costituiscono un sistema
equivalente a PT.
Scriviamo le formule indicando a latere il tipo-ordine delle variabili, invece di
scriverlo come apice.
Il sistema PM si ottiene da RT aggiungendo
Assioma di predicatività
(∀x)(∃w)(∀z1 ) . . . (∀zn )(w(z1 , . . . , zn ) ≡ x(z1 , . . . , zn )),
dove x è di tipo-ordine (t1 , . . . , tn )/k/(y1 , . . . , yn ) e w è predicativa di tipo-ordine
(t1 , . . . , tn )/r/(y1 , . . . , yn ), r ≤ k.
Nella notazione di Russell:
(∃y)(∀x)(y!(x) ≡ A(x)).
la teoria semplice dei tipi ST
Il sistema ST dei tipi semplici, o semplificati, si ottiene riducendo le relazioni a
insiemi, con la definizione insiemistica della coppia ordinata. Una relazione tra
termini di tipo n ed m diventa, con la definizione di sotto, un insieme di tipo
max(n, m) + 3.
Formalmente i tipi sono ora “o” e “(. . . (o) . . .)” con n coppie di parentesi, o
più semplicemente 0 e n.
Le gerarchie di tipi sopra un insieme D dato sono gli insiemi della gerarchia
T0
= D
Tn+1 = P(Tn ).
Gli assiomi sono gli stessi di TT, numerati nello stesso modo, salvo le ovvie
modifiche di scrittura.
286
Assiomi di SP
SP.1
(A(ŷ))(x) ≡ A(x),
con x libera per y in A(y).
SP.2
(∀z n )(xn+1 (z n ) ≡ y n+1 (zn )) ⊃ xn+1 = y n+1 ,
dove x = y è definita da (∀z)(z(x) ≡ z(y)) per x e y di tipo n e z di tipo n + 1.
ST.3
(∃x31 )((∀x01 )¬x31 (hx01 , x01 i) ∧ (∀x01 )(∃x02 )(x31 (hx01 , x02 i)∧
∧(∀x01 )(∀x02 )(∀x03 )(x31 (hx01 , x02 i) ∧ x31 (hx02 , x03 i) ⊃ x31 (hx01 , x03 i))).
287