La teoria dei tipi Viva il Cantorismo, abbasso il Russellismo. A. Schoenflies, 1911 La teoria dei tipi è l’alternativa logica alla teoria degli insiemi, ma è soprattutto una logica e una teoria logica, sia pure con l’obbligo morale di coprire il contenuto matematico della teoria degli insiemi (in verità di tutta la matematica, pensata tuttavia racchiusa nella teoria degli insiemi), e costituisce l’impianto dei Principia mathematica 1 e la sostanza del logicismo. Benché negli anni venti si delinei, a opera di Skolem e di Hilbert, la moderna logica del primo ordine, la teoria dei tipi dei Principia sarà per più di venti anni il quadro di riferimento per le ricerche logiche e fondazionali2 . Fino al consolidamento della teoria ZF, anche alcuni matematici preferivano riferirsi a una teoria, informale, con i tipi che escludessero le antinomie3 . La maggior parte tuttavia, soprattutto di coloro che lavoravano attivamente allo sviluppo della teoria, viveva come una rivalità il sistema logico dei tipi, come si vede dall’epigrafe. Non prenderemo in considerazione i Principia; la teoria dei tipi di Russell si trova esposta in un lavoro del 1907 apparso significativamente nello stesso fatidico 1908 delle “Untersuchungen” di Zermelo4 , e in un articolo del 1910 che si sovrappone in parte con l’Introduzione ai Principia, almeno per quanto riguarda motivazioni e quadro teorico5 . 1 B. Russell e A. N. Whitehead, Principia mathematica, 3 voll., Cambridge Univ. Press, Cambridge, 1910, 1912, 1913. 2 Gödel formulerà i teoremi di incompletezza per il sistema dei Principia; trarrà anche ispirazione dalla teoria dei tipi ramificati per la sua prima definizione degli insiemi costruibili; ma dalla fine degli anni trenta, per le ricerche di teoria degli insiemi, farà riferimento o alla sua teoria delle classi GB elaborata modificando quella di Paul Bernays, o a ZF. 3 Ad esempio B. L. van der Waerden, in Moderne Algebra, Springer, Berlin, 1930, il primo testo di algebra moderna, nell’introduzione accenna al principio di comprensione e alla necessità di una stratificazione in tipi (citato da Ferreirós, cit.). 4 B. Russell, “Mathematical Logic as based on the Theory of Types”, American Journal of Mathematics, 30 (1908), pp. 222-62, ristampato in B. Russell, Logic and Knowledge (a cura di R. C. Marsh), George Allen&Unwin, London, 1956, pp. 57-102, e in van Heijenoort, cit., pp. 152-82. 5 B. Russell, “La Théorie des types logiques”, Revue de Métaphysique et de Morale, 18 (1910), pp. 263-301, ristampato in inglese in Essays in Analysis, cit. pp. 215-52. 247 La teoria dei tipi nasce dal tentativo di Russell di costruire una logica esente dalle antinomie6 . Si tratta tuttavia di un parto laborioso e non lineare, per apprezzare il quale occorre avere presente lo sviluppo della riflessione di Russell nei primi dieci anni del secolo, nella quale appunto ha un ruolo decisivo il problema delle antinomie, la cui scoperta Russell tendeva ad attribuire a sé, o comunque a enfatizzare il proprio ruolo; mentre tra i matematici la discussione delle antinomie non è né vivace né originale, è Russell soprattutto che vi si dedica a pieno tempo, quasi raccogliendo lui l’invito di Hilbert. Occorre altresı̀ seguire le dispute nelle quali Russell fu coinvolto, in particolare con Poincaré, che contribuirono a plasmare le soluzioni provvisorie e quelle finali. Trascuriamo le prime fasi del pensiero di Russell, caratterizzate dall’influenza neo-hegeliana di F. H. Bradley (1846-1924) e da un interesse per la geometria e la filosofia dello spazio, se non per segnalare un primo scontro con Poincaré a proposito del carattere convenzionale degli assiomi della geometria7 . Nel 1898, grazie all’influenza del filosofo e amico G. E. Moore (18731958), Russell si liberò dell’idealismo e di ogni traccia di mentalismo nella concezione della conoscenza. Nel 1900 l’incontro con Peano e i peaniani a Parigi rappresentò la sua illuminazione sulla strada di Damasco. Subito Russell incominciò a riflettere sui rapporti tra matematica e logica, optando per l’inclusione della prima nella seconda, a differenza di Peano, e a raccogliere gli elementi per una definizione della logica stessa. Negli ultimi anni del secolo diciannovesimo Russell aveva concepito con fertile fantasia, entusiasmo e fecondità almeno quattro libri sulla matematica; uno di questi, The principles of mathematics, sopravviverà alla conversione, 6 Qualche anticipazione della idea di diversi tipi volendo si trova, come sempre; ad esempio in F. W. K. E. Schröder, Vorlesungen über die Algebra del Logik 1 , Teubner, Leipzig, 1890; si veda Grattan-Guiness, The Search for Mathematical Roots, cit. pp. 1656. Anche König in “Sur la théorie des ensembles”, Comptes r. Acad. Sci., 143 (1906), pp. 110-2, accenna in modo fumoso a una gerarchia transfinita di tipi (lo cita Poincaré nel 1909). 7 Nel 1898 e 1899 ci fu uno scambio a tre, tra Couturat, Russell e Poincaré, in seguito alla recensione di Couturat del libro di Russell, An essay on the foundations of geometry, Cambridge Univ. Press, Cambridge, 1897 (trad. it. I fondamenti della geometria, Club del Libro, La Spezia, 1981); stizzito per la sbrigativa negazione del carattere convenzionale degli assiomi da parte di Russell, Poincaré intervenne pesantemente con molte critiche al contenuto matematico del libro, che Russell accettò, restando tuttavia fermo nella sua convinzione dei carattere empirico degli assiomi. Si veda Grattan-Guiness, The Search for Mathematical Roots, cit., pp. 278-80. 248 ma al prezzo di una radicale e prolungata revisione, riordino e riscrittura di parti, sicché l’analisi dei vari strati e la datazione dei diversi contributi è impresa da archeologia8 . Nelle varie stesure e manoscritti preparatori si può seguire il consolidamento del suo logicismo, che è diverso da quello di Frege. D’altra parte Russell legge Frege solo a partire dal 1902, e la sua formazione è basata, per sua ammissione, su Cantor e Peano. Si forma la convinzione che la matematica si derivi dalla logica, o ne sia parte, ma questa non pare univocamente determinata; la scelta degli indefinibili, come li chiamerà nei Principles, è frutto di una lunga ricerca e quasi di una sperimentazione. Nel 1901 Russell mette per iscritto che tutta la matematica si può ottenere dalla logica come una grande implicazione, come la geometria9 , cioè un “soggetto nel quale le asserzioni affermano che certe conseguenze seguono da certe premesse, non che le entità descritte dalle premesse esistono in realtà”. Al tempo stesso gli ingredienti della logica sembrano anche abbastanza definiti: il calcolo proposizionale e predicativo, incluse le relazioni, la variabile, i quantificatori, e come contributo della teoria degli insiemi individui, classi, relazioni, eventualmente di classi e relazioni, e cosı̀ via. Nel 1901 l’entusiasmo di Russell lo portò a scrivere uno dei saggi più felici, dal punto di vista stilistico, e più fortunati per la caratterizzazione del logicismo, ma forse anche dei più dannosi, a causa delle sue drastiche e provocatorie semplificazioni10 . In esso la matematica veniva definita come il soggetto nel quale noi non sappiamo mai di cosa stiamo parlando, né se quello che diciamo è vero, veniva attribuita a Boole la scoperta della matematica pura, veniva dichiarato che “la logica formale [. . . ] alla fine si è mostrata essere identica alla matematica”. In una bozza del 1901 per The principles stendeva in modo meno fiorito la sua definizione della matematica: 8 L’ha compiuta I. Grattan-Guiness, e si può vedere in The Search for Mathematical Roots, cit., capp. VI e VII, pp. 268-410, per la parte dedicata a Russell. 9 Russell nella prefazione alla seconda edizione dei Principles, nel 1937, ammetterà di essere stato portato a enfatizzare il carattere implicazionale della matematica dalla considerazione della geometria. Si intende ovviamente il carattere dei teoremi, non degli assiomi. 10 Si tratta di “Recent work on the principles of mathematics”, cit., ristampato come “Mathematics and the Metaphysicians” in Mysticism and Logic, Longmans, Green, London, 1918; trad. it. Misticismo e logica, Longanesi, Milano, 1964. 249 La matematica pura è la classe di tutte le proposizioni della forma “a implica b”, dove a e b sono proposizioni le quali contengono ciascuna almeno una variabile, e nessuna costante ad eccezione di quelle che possono essere definite in termini delle costanti logiche. Seguiva una precisazione dei mattoni che saranno presenze costanti nelle varie formulazioni della sua logica: la variabile, le costanti logiche, le classi e relazioni. Le costanti logiche non definibili sono elencate come: implicazione, appartenenza, “tale che”, relazione, funzione proposizionale, classe, denotazione, “tutti [all ]” e “qualsiasi [any]”. Una funzione proposizionale è una espressione nella quale occorrono una o più variabili, “e per tutti i valori delle variabili l’espressione che se ne ricava è una proposizione”. Non c’è e non ci sarà mai una netta distinzione tra la sintassi e qualche forma di semantica. In seguito come vedremo avrà dei dubbi e un temporaneo ripensamento sul concetto di classe, poi superato. Nello stesso periodo Russell preparava i suoi due articoli per la rivista di Peano, nei quali raffinava il suo nascente logicismo anticipando la definizione dei numeri come classi di classi, senza enfasi, perché a Peano non piaceva, esplicitandola invece nel contributo al lavoro di Whitehead del 1902. Sempre nel 1901, come abbiamo già raccontato, arrivava alla sua antinomia. A metà del 1902 Russell cessò la rielaborazione dei Principles, salvo per alcune note a piè di pagina e due appendici aggiunte in bozze, una su Frege e l’altra sulla teoria dei tipi, che apparvero nella stampa del 1903. L’autore, consapevole dei difetti e delle imprecisioni, si dichiarava scontento (se non addirittura disgustato) della sua opera, che non ebbe neppure recensioni significative11 . Si direbbe che Russell dopo il faticoso tentativo di riaggiustamento del suo lavoro, un lavoro di Sisifo, avesse deciso di abbandonarlo, per dedicarsi, come infatti fece nell’immediato seguito, a una riflessione più approfondita sulle antinomie. Per lui la contraddizione non è dovuta a particolari filosofie, ma “scaturisce direttamente dal senso comune, e può venir 11 Hardy lo trovò difficile e troppo conciso rispetto al peso degli argomenti trattati, apprezzando un pregio piuttosto secondario, l’opportunità di conoscere attraverso di esso lo sconosciuto Frege; Hausdorff fu sarcastico sul “gratuito atletismo intellettuale” che si manifesta in “un’orgia di sottigliezze”. In generale i matematici (come F. Engel) confessavano di non avere tempo per tali e tante sottili speculazioni filosofiche. Peirce preparò una lunga recensione, ma pubblicò solo una breve notizia. Couturat si concentrò soprattutto sugli argomenti riguardanti Cantor, ma ne prese lo spunto per una serie di suoi articoli. 250 risolta soltanto abbandonando qualche ammissione del senso comune”12 . Tra queste ammissioni, quella che si dichiara più restio ad abbandonare è quella della classe universale. Invece ritiene inevitabile una modifica del principio di comprensione. Come Cantor con l’ipotesi del continuo, anche Russell oscilla tra la convinzione di avercela fatta e la delusione; nel maggio 1903 scrive nel diario “Quattro giorni fa ho risolto la Contraddizione, il sollievo è indicibile”, per aggiungere qualche tempo dopo “ma la soluzione era sbagliata”13 , e le docce gelate si ripetono. Nell’autobiografia racconta dei giorni passati sedendosi al mattino alla scrivania davanti a un foglio bianco, che alla sera spesso era ancora tale. La prima teoria semplice dei tipi La prima risposta di Russell ai paradossi pare essere l’abbozzo di una teoria dei tipi sviluppata nell’Appendice ai Principles of Mathematics. Le contraddizioni presentate nell’opera sono: la sua nel capitolo X, “La contraddizione”, §100 sgg., quella di Burali-Forti nel §301 e quella di Cantor nei §344 sgg. Nel corso dell’opera tuttavia Russell aveva anche accennato ad altre possibili soluzioni. Ad esempio, nel §344 commentando l’antinomia del massimo cardinale aveva ipotizzato che si potesse negare la classe universale: La difficoltà sorge tutte le volte che cerchiamo di trattare con la classe di tutte le entità in senso assoluto, o con una qualunque altra classe parimenti numerosa; se non fosse della difficoltà di un tale punto di vista, si sarebbe tentati di dire che la concezione della totalità di tutte le cose, o dell’intero universo di entità e di esistenti, risulta in qualche modo illegittima ed essenzialmente contraria alla logica. Ma non è auspicabile adottare una misura cosı̀ draconiana, finché resta la speranza di trovare una soluzione un po’ meno eroica. Nei §§103, 484 aveva supposto che si potesse provare a negare che una proposizione della forma ϕ[f (ϕ)], dove f è costante e ϕ variabile, abbia significato. 12 The principles, cit., §105. A. Garciadiego, Bertrand Russell and the origin of set-theoretical paradoxes, Birkhäuser, Basel, 1992, p. 187. 13 251 Alla fine del §104 aveva anticipato in mezza pagina la trattazione che sarà ampliata nell’Appendice. Una classe intesa come uno è [. . . ] un oggetto dello stesso tipo dei suoi termini [. . . ] una classe come molti può sı̀ essere un soggetto logico, ma in proposizioni di una specie differente da quelle in cui i suoi termini compaiono come soggetti [. . . ] La chiave di tutto il mistero sta nella distinzione dei tipi logici. Nell’Appendice, la teoria dei tipi viene presentata “in via d’esperimento” [tentatively] per la possibile soluzione della contraddizione del §100; sarà però necessario “con ogni probabilità, arricchirla di maggiori sottigliezze prima che riesca a dare risposta a tutte le difficoltà da noi incontrate”. Ogni funzione proposizionale ϕ(x) possiede, oltre al suo sistema [range] di valori di verità, un sistema di valori di significatività, ossia un sistema entro cui deve cadere x se vogliamo che ϕ(x) risulti comunque una proposizione, vera o falsa che sia. Questo costituisce il primo punto della teoria dei tipi. Il secondo è che i sistemi di valori di significatività formano dei tipi , ossia se x appartiene al sistema di valori di significatività di ϕ(x), allora esiste tutta una classe di oggetti (il tipo di x) i quali devono appartenere essi pure al sistema di valori di significatività di ϕ(x) [. . . ]; tale sistema di valori è sempre un tipo singolo o una somma di diversi tipi completi. Il secondo punto è meno preciso del primo, e il caso dei numeri introduce delle difficoltà [. . . ]. Qualsiasi oggetto che non sia un sistema di valori è un termine o individuo. Questo forma il tipo più basso di oggetti [. . . ] Ciò che abbiamo chiamato nel capitolo VI la classe come uno è un individuo, purché i suoi elementi siano individui; gli oggetti della vita quotidiana come: persone, tavoli, sedie, mele, ecc., sono classi come uno [. . . ] Questi oggetti pertanto sono dello stesso tipo degli individui semplici. [. . . ] Il tipo successivo consiste dei sistemi [range] o classi di individui. (Non va associata alcuna idea ordinale con la parola sistema.) Cosı̀ “Tizio e Caio” è un oggetto di questo tipo, e non produrrà in generale una proposizione fornita di significato se lo sostituiamo a “Tizio” in una qualsiasi proposizione vera o falsa di cui Tizio sia un costituente. (Ciò costituisce, in un certo modo, una giustificazione per la distinzione grammaticale fra singolare e plurale; ma non vi è stretta analogia [. . . ].) Se u è un sistema di valori determinato da una funzione proposizionale ϕ(x), non-u consisterà di tutti gli oggetti per cui ϕ(x) è falsa, in modo che non-u è contenuto nel sistema di valori di significatività di ϕ(x), e contiene soltanto oggetti 252 dello stesso tipo degli elementi di u [. . . ]14 . Rispetto alla nota contraddizione, questo punto di vista sembra essere il migliore; infatti non-u deve essere il sistema di valori di falsità di “x è un u”, e invece “x è un x” deve essere in generale privo di significato; di conseguenza “x è un u” deve esigere che x ed u siano di tipi differenti. Russell discute quindi la difficoltà delle classi miste, cioè le classi i cui elementi non appartengono tutti allo stesso tipo minimo, ad esempio “Heine e i francesi”, e conclude che se esistono classi siffatte devono avere un tipo differente sia dalle classi di individui sia dalle classi di classi di individui. Quindi descrive il tipo che segue alle classi di individui, e che consiste di classi di classi di individui, che esemplifica con le federazioni di società. Conviene di parlare di classi sono per classi di individui, e di classi di classi solo per classi di classi di individui, e cosı̀ via. Per la nozione generale userà il termine sistema. “Vi è tutta una progressione di tipi siffatti, poiché un sistema può essere formato di oggetti di un tipo dato qualsiasi, e ne risulta un sistema di tipo superiore ai suoi elementi”. “Una nuova serie di tipi ha inizio dalla coppia con verso”. Con questo intende la coppia ordinata. Le relazioni, secondo il punto di vista estensionale della logica simbolica sono sistemi appartenenti a questa serie di tipi. Ma possiamo formare anche le terne, e le coppie formate da una terna e un individuo, e cosı̀ via. “Tutte queste producono nuovi tipi. Otteniamo cosı̀ un’immensa gerarchia di tipi, ed è difficile sapere con certezza quanti essi possano essere [. . . ] ma il numero totale sarà soltanto α0 ”15 . Altre serie di tipi sorgono dalle proposizioni e dai numeri, che Russell considerava differenti specie di oggetti, sicché non si ha una semplice gerarchia su una base, ma un albero di tipi. Anche i numeri sono un tipo che sta al di fuori delle serie anzidette, e che presenta certe difficoltà per il fatto che ogni numero da ogni altro tipo di sistemi trae fuori certi oggetti, e precisamente quei sistemi che hanno il dato numero di 14 [Russell osserva ora che due funzioni proposizionali possono avere lo stesso sistema di valori di verità ma diversi sistemi di valori di significatività, per cui non-u diventa ambiguo. Ma esiste sempre un tipo minimo entro il quale è contenuto u e non-u può essere definito come il resto di questo tipo. Un tipo minimo è un tipo che non è la somma di due tipi. Dopo la frase successiva Russell osserva che è dubbio che possa venir garantito il risultato ivi auspicato se non ci si limita ai tipi minimi.] 15 Russell aggiunge che è solo una congettura, basata sul fatto che le serie cosı̀ ottenute assomigliano alla serie dei razionali. 253 elementi. Ciò rende erronea l’ovvia definizione dello 0; ogni tipo di sistema avrà infatti il proprio sistema nullo, che sarà un elemento dello 0 considerato come un sistema di sistemi, in modo che non possiamo dire che 0 sia il sistema il cui unico elemento è il sistema nullo. [. . . ] Poiché tutti i sistemi hanno dei numeri, i sistemi formano un sistema; di conseguenza x ∈ x è talvolta fornito di significato, ed in questi casi la sua negazione è pure fornita di significato: Esiste di conseguenza un sistema w di sistemi, per cui x ∈ x è falso; la contraddizione del capitolo X dimostra che questo sistema w non appartiene al sistema di valori di significatività di x ∈ x. Si può osservare che x ∈ x può soltanto essere fornita di significato quando x è di un tipo di ordine infinito, giacché in x ∈ u, u deve sempre essere di un tipo superiore di uno a x; ma il sistema di tutti i sistemi è naturalmente di un tipo di ordine infinito. Le proposizioni sono quelle che sollevano più problemi, ma d’altra parte “che le proposizioni costituiscano un tipo risulta dal fatto, se è un fatto, che soltanto di esse si può dire con significato che sono vere o false”16 . Il numero di proposizioni deve essere altrettanto grande di quello di tutti gli oggetti, perché “x è identico a x” è in relazione uno-uno con x. Peraltro non dovrebbero esistere più proposizioni che individui, perché il concetto proposizionale (definito in precedenza da Russell) è un individuo. Quindi il numero di proposizioni è uguale a quello degli oggetti17 . Invece per il teorema di Cantor devono esistere più sistemi di proposizioni che proposizioni, mentre tali sistemi sono solo alcuni degli oggetti. Proviamoci ad applicare la dimostrazionem [del teorema di Cantor] assumendo una particolare relazione uno-uno, la quale associ ogni proposizione p, che non sia un prodotto logico, al sistema il cui unico elemento è p, mentre associa il prodotto di tutte le proposizioni al sistema nullo di proposizioni, e associa ogni altro prodotto logico di proposizioni al sistema dei suoi propri fattori. Allora il sistema w che, per il principio generale della dimostrazione di Cantor, non è correlato ad alcuna proposizione, è il sistema delle proposizioni che sono prodotti logici, ma non fattori di se stesse. Tuttavia, per la definizione stessa che stabilisce la corrispondenza in esame, w dovrebbe venir posto in correlazione con il prodotto logico di w. Si troverà cosı̀ che la vecchia contraddizione spunta fuori di nuovo; noi possiamo infatti provare che il prodotto logico di w è un elemento di w, e insieme che non 16 Russell vuol forse dire che le proposizioni sono l’ambito di significatività di “essere vero o falso”, ma la spiegazione sembra circolare, perché non verrebbe in mente di parlare di “vero” e “falso” se non si avesse già il concetto di proposizione. 17 Applicazione informale del teorema di Cantor-Schröder-Bernstein. 254 lo è. Questo sembra dimostrare che non esiste un tale sistema w; la teoria dei tipi però non ci dimostra perché un tale sistema non esista. Sembra dunque derivarne che la nota contraddizione richiede ulteriori sottigliezze per la sua soluzione, ma io non riesco a immaginare quali esse siano. Enunciamo per esteso questa nuova contraddizione. Se m è una classe di proposizioni, la proposizione “ogni m è vera” può essere o non essere essa stessa un m. Ma esiste una relazione uno-uno di questa proposizione con m: infatti, se n è differente da m, “ogni m è vera” non è la stessa proposizione di “ogni n è vera”. Consideriamo ora l’intera classe di proposizioni della forma “ogni m è vera”, e aventi la proprietà di non essere elementi dei rispettivi m. Sia w questa classe, e sia p la proposizione “ogni w è vera”. Se p è un w, essa deve possedere la proprietà definiente di w; ma questa proprietà richiede che p non sia un w. D’altro canto, se p non è un w, allora p possiede per l’appunto la proprietà definiente di w, e pertanto è un w. La contraddizione sembra cosı̀ inevitabile. V Russell considera una possibile via d’uscita, V basata sul fatto che se m V è la V congiunzione delle proposizioni in m, allora (m ∪ { m}) è equivalente V a m, per cui se identifichiamo tra loro proposizioni equivalenti allora m risulta il prodotto logico tanto di una classe di cui essa è un elemento quanto di una di cui essa non lo è, e potrebbe essere il w di sopra. Tuttavia Russell scarta tale scappatoia, perché funzioni proposizionali equivalenti possono e sono spesso diverse, e lo sono anche nell’esempio trattato. L’Appendice termina con le seguenti parole: La stretta analogia di questa contraddizione con quella discussa nel capitolo X fa supporre fortemente che le due debbano avere la stessa soluzione, o almeno soluzioni molto simili. [. . . ] Per riassumere: la speciale contraddizione di cui al capitolo X appare, sı̀, risolta dalla teoria dei tipi, ma esiste almeno una contraddizione strettamente analoga ad essa che probabilmente non è risolvibile in base a questa teoria. La totalità di tutti gli oggetti logici, o di tutte le proposizioni, comporta, a quanto pare, una difficoltà logica fondamentale. Non sono riuscito a scoprire quale possa essere la completa soluzione di tale difficoltà; ma poiché essa interessa proprio i fondamenti del ragionare, io ne raccomando caldamente lo studio a tutti coloro che si interessano di logica. Potrebbe essere la nuova antinomia ad aver scoraggiato Russell dall’approfondire il progetto della teoria dei tipi. È curioso che Russell non torni più su questa contraddizione nel seguito, 255 anche quando elabora di nuovo la teoria dei tipi in modo sistematico18 . Tre teorie Probabilmente le difficoltà intraviste consigliano a Russell sul momento di abbandonare la teoria dei tipi. Riesuma allora le alternative che aveva adombrato nei Principles cercando di dare loro una forma più definita e sviluppata. Lo fa in un articolo elaborato nel 190519 . Intanto cerca una formulazione logica uniforme delle contraddizioni. Aveva già trovato, e comunicato a Frege nel 1902, una versione della propria contraddizione in termini di relazioni: Si consideri la relazione che intercorre tra due relazioni R ed S se R ed S sono identiche e R non sussiste tra R ed S. Si indichi tale relazione con (R)T (S). Prendendo R = T si ottiene una contraddizione20 . Nel lavoro del 1905 espone una formulazione unitaria per le tre antinomie, sua, di Cantor e di Burali-Forti. Data una proprietà ϕ e una funzione f tali che, se ϕ appartiene a tutti gli elementi di u, f ‘u esiste, ha la proprietà ϕ e non appartiene a u; allora l’assunzione che esista una classe w di tutti i termini che hanno la proprietà ϕ, e che f ‘w esista porta alla conclusione che f ‘w ha e non ha al contempo la proprietà ϕ. L’antinomia di Russell si ottiene prendendo cone ϕ la proprietà di non appartenere a se stesso, e come f la funzione identica: quella di Burali-Forti prendendo la proprietà di essere un ordinale e f ‘w = ordinale di w; quella di Cantor prendendo la proprietà di essere un cardinale e f ‘w = cardinale di P(w). Vista cosı̀ “la natura delle contraddizioni che infestano la teoria del transfinito”, constatato che non solo isolate ma prodotte quasi con una ricetta uniforme, che non sono matematiche ma appartengono alla logica, e quindi richiedono qualche modifica nelle assunzioni logiche correnti, Russell individua la modifica necessaria nella affermazione che “Una funzione proposizionale di una variabile non determina sempre una classe”, come aveva già 18 Tra i possibili motivi si può congetturare che o non considerasse più le proposizioni come enti reali, oppure eliminasse la contraddizione con un ovvio appello al carattere impredicativo della definizione di w, si veda oltre. 19 “On some difficulties in the Theory of Transfinite Numbers and Order Types”, 1906, cit. 20 Lettera di Russell a Frege dell’8 agosto 1902, in G. Frege, Alle origini della logica moderna, Boringhieri, Torino, 1983, p. 198. 256 sospettato nei Principles a proposito delle credenze del senso comune. Negli stessi Principles d’altra parte, nella presentazione degli indefinibili, aveva invece dichiarato che “lo studio delle funzioni proposizionali sembra essere rigorosamente equivalente a quello delle classi”. Russell chiama ora predicativa una funzione proposizionale quando essa determina una classe. Per la realizzazione della modifica indica tre diverse direzioni, dichiarando di non prendere posizione per ora e di limitarsi a segnalare vantaggi e svantaggi di ciascuna. La teoria zigzag parte21 dal suggerimento che le funzioni proposizionali determinano classi quando sono abbastanza semplici, e non lo fanno quando sono complicate e recondite. In questo caso non è la grandezza di una classe che provoca difficoltà, perché ad esempio “x non è umano” è semplice, ma è soddisfatta da tutte le entità meno un numero finito di esse. Nella teoria zigzag la negazione di una funzione predicativa è anch’essa predicativa. Se ϕ non è predicativa, per ogni classe u o esistono elementi di u che non soddisfano ϕ o esistono elementi di non-u per cui ϕ è vera. Una funzione che non è predicativa lo è sia dal punto di vista dei termini che non include sia da quello dei termini che include; da qui una caratteristica di zigzag che ha ispirato il nome, particolarmente evidente nel teorema di Cantor. La sua dimostrazione “costruisce una ipotetica classe w con la norma22 ‘x non è un elemento della classe con la quale è correlato dalla relazione R’, dove R è la relazione che correla individui e classi. Tali ipotetiche classi sono quasi predestinate a non essere classi, e hanno una certa qualità zigzag, nel fatto che x è un w quando x non è un elemento del suo correlato, e non è un w quando è un elemento del suo correlato”. Per costruire tale teoria occorrono assiomi che fissino quali sono le funzioni predicative; il vantaggio sarebbe che sono ammesse solo funzioni semplici; lo svantaggio è che gli assiomi potrebbero essere molto complicati e privi di intrinseca plausibilità23 . 21 O dovrebbe partire; benché Russell le chiami “teorie” sono piuttosto indicazioni di lavoro, cosa che Poincaré come vedremo non coglie, considerandole teorie sistemate. 22 [“Norma” sta per funzione proposizionale, o per definizione; Russell discute in questo lavoro le posizioni di E. W. Hobson (in “On the general theory of transfinite numbers and order types”, Proceed. London Mathematical Society, (2) 5 (1905), pp. 170-88) che usava tale terminologia. Non esaminiamo la discussione con Hobson perché di interesse secondario, in gran parte una ripetizione di argomenti già esaminati in riferimento ad altri autori.] 23 In effetti dovrebbero delimitare soprattutto la forma sintattica delle funzioni proposi- 257 Secondo Russell, la teoria era stata anticipata nei Principles dalla osservazione di provare a negare che una proposizione della forma ϕ[f (ϕ)], dove f è costante e ϕ variabile, abbia significato. La teoria della limitazione della grandezza vuole realizzare che ogni classe propria possa essere ordinata in modo simile a un segmento degli ordinali, sı̀ da eliminare in particolare l’antinomia di Burali-Forti. Il criterio della predicatività in questa teoria non è la semplicità della forma ma una limitazione sulla grandezza della classe definita; se u è una classe, “x non è un elemento di u” è sempre non predicativa. La motivazione è che, siccome esistono processi che sembrano essenzialmente impossibilitati a terminare, mentre la classe dei termini generati dal processo dovrebbe essere il completamento del processo, viene naturale supporre che i termini generati da tali procedimenti non formino una classe. L’esistenza di processi auto-riproduttivi di questo genere sembra rendere impossibile il concetto di una totalità di tutte le entità. “Questa teoria24 ha, a prima vista, una grande plausibilità e semplicità, e non sono pronto a negare che non sia la vera soluzione. Ma la plausibilità e la semplicità tendono a sparire ad un esame attento.” In riferimento alla sua formulazione generale della ricetta per le antinomia, vista sopra, la teoria della limitazione della grandezza trascura nella conclusione (che afferma che o ϕ è non predicativa, o che se ϕ determina una classe allora f ‘w non esiste) l’alternativa che f ‘w non esista. Salvo il caso in cui f è l’identità (quello dell’antinomia di Russell), tale alternativa sembra sempre possibile. Una difficoltà della teoria secondo Russell è che essa non prescrive in modo preciso di quanto la successione degli ordinali è legittimata a salire, ad esempio solo fino a ω 2 o a ω ω o ω1 . “Coloro che sostengono questa teoria zionali ammesse. Una realizzazione fedele allo spirito della teoria zigzag è ritenuta da molti (Fraenkel, Bar-Hillel, Wang) la teoria NF di W. Quine, in “New Foundations for Mathematical Logic”, Amer. Math. Monthly, 44 (1937), pp. 70-80, incorporato in From a Logical Point of View , Harvard Univ. Press, Cambridge Mass., 1953. Le formule predicative sono le cosiddette formule stratificate, le uniche che si possono usare per definire insiemi: le formule stratificate senza quantificatori sono quelle nelle quali è possibile assegnare indici alle variabili, stesso indice alla stessa variabile, in modo che in ogni sottoformula x ∈ y l’indice di y sia maggiore di uno di quello di x; con un operatore di astrazione che ingloba i quantificatori, occorre poi che anche per ogni termine t ed s, in t ∈ s l’indice di t sia minore di uno di quello di s. La teoria risultante NF è sotto molti aspetti divergente da ZF: esiste la classe universale V , viene meno il teorema di Cantor, V = P(V ), l’assioma di scelta è inconsistente, e l’assioma dell’infinito derivabile. 24 [Nei Principles l’aveva dichiarata ispirata da una scelta troppo drastica.] 258 senza dubbio intendono che debbano essere ammessi tutti gli ordinali che possono essere definiti, per cosı̀ dire, dal basso, cioè senza introdurre l’intera successione degli ordinali. Cosı̀ ammetterebbero tutti gli ordinali di Cantor, escludendo solo il massimo. Ma non è facile enunciare in modo preciso questa limitazione; almeno, io non ci sono riuscito.” Secondo una opinione diffusa ci sarebbe riuscito Zermelo; la sua teoria sarebbe ispirata e realizzerebbe il principio della limitazione di grandezza. Si può accettare tale interpretazione solo in relazione alla forma restrittiva del principio descritta da Russell, per la quale solo le classi grandi come l’universo, o la totalità degli ordinali, non esisterebbero, o non sarebbero insiemi. Ma, in ZF in realtà, più che in Z, esistono insiemi grandi quanto si vuole25 . L’eliminazione delle classi Nella terza proposta, la teoria senza classi [no classes theory], “le classi sono eliminate del tutto”. Non nel senso di assumere che nessuna funzione determini una classe o relazione, ma semplicemente astenendosi dall’assumere il contrario. Il punto forte della teoria sta proprio nella astensione da assunzioni dubbie, sicché tutta la matematica che permette di ottenere è esente da tutti i dubbi che coinvolgono le classi e relazioni. Russell dichiara di aver anticipato questo progetto nei Principles; il rimando è tuttavia solo a una dichiarazione di insoddisfazione con le classi: “Non sono riuscito a percepire alcun concetto che soddisfi le condizioni richieste per la nozione di classe. La contraddizione [. . . ] dimostra che c’è qualcosa che manca, ma finora non sono riuscito a scoprirla”. La teoria contrasta con il senso comune che ritiene ovvio che le classi esistano; molta della teoria di Cantor, anche quella che sembra non afflitta 25 In particolare, esistono ordinali arbitrariamente grandi, senza una limitazione superiore definibile. Non è chiaro cosa intenda Russell quando ipotizza che la successione degli ordinali potrebbe salire solo fino a ω1 (ovviamente “ω1 escluso”, ché se ci fosse ω1 ci sarebbe anche ω1 + 1); forse vuol dire che non si potrebbe dimostrare che esiste un insieme bene ordinato di cardinalità più che numerabile, perché gli ordinali sono i tipi degli insiemi bene ordinati. Ma con l’assioma di scelta ogni insieme è bene ordinabile, e l’esistenza di un insieme più che numerabile si dimostra con il teorema di Cantor. Russell ha ragione a ritenere che si vogliono avere a disposizione tutti gli ordinali, e non c’è bisogno di scervellarsi a come enunciarlo. “Tutti” sono quelli dimostrabili in una teoria, e dipendono dalla forza della teoria. Solo nella metateoria si può vedere che ce ne sono di più in una teoria rispetto a un’altra. Ad esempio il primo ordinale regolare e con indice limite, cioè il primo debolmente inaccessibile, ha una definizione, ma non esiste in ZF. 259 dalle antinomie, dovrebbe certamente essere abbandonata (e a prezzo di una fatica non necessaria, se poi le classi dovessero esistere); infine l’articolazione della teoria appare molto difficile. Le difficoltà di realizzazione sono molte. La maggior parte delle definizioni devono essere riformulate per adeguarsi al nuovo punto di vista, e i teoremi di esistenza diventano più ardui: occorre ad esempio per ogni ordinale trovare proposizioni che siano equivalenti alla esistenza di quell’ordinale; Russell vi è riuscito per ω ma non è ancora in grado di farlo per ω1 . Russell dà comunque uno schizzo di come potrebbe procedere. Per una proposizione p che contenga a come suo costituente, p(x/a) denoti quello che diventa p quando x si sostituisca ad a in tutti i posti in cui occorre. a si può intendere in senso lato come il soggetto di p. Gli enunciati che hanno funzioni proposizionali come argomenti vengono sostituiti da affermazioni del tipo “p(x/a) è vera per determinati valori di x”. Ad esempio invece di dire “la classe u è una classe che ha un solo elemento” si dirà “esiste una entità b tale che p(x/a) è vera se e solo se x è uguale a b”. I valori di x per cui p(x/a) è vera rimpiazzano la classe u, ma “non si assume che questi valori collettivamente formino una singola entità che è la classe composta da essi”. Non è chiaro perché Russell introduca una nuova notazione, tanto più che osserva che se b non occorre in p e si pone q = p(b/a), allora “q(x/b) è vera per ogni x” se e solo se “p(x/a) è vera per ogni x”, cioè la verità di p(x/a) per ogni x è indipendente dal soggetto a, e quindi dipende solo dalla forma di p. Potrebbe allora usare le funzioni proposizionali solite, con la notazione ϕ(x), se non fosse che – è l’unica spiegazione offerta – “la notazione inevitabilmente suggerisce l’esistenza di qualcosa denotata da ‘ϕ’ ”26 . In un poscritto finale aggiunto in stampa il 5 febbraio 1906 Russell si dice ora sicuro che la teoria senza classi è la soluzione adeguata e opta per essa. Può darsi che fosse ispirato da Maxime Bôcher (1867-1918), un matematico americano con il quale ha una breve corrispondenza e che gli scrive ad esempio27 : Il punto decisivo è la vostra “classe come uno” [. . . ] Io non posso ammettere che una classe sia in sé una entità; per me è sempre molte entità (la vostra “classe come molti”). Quando parliamo di 26 In seguito dirà che con p(x/a) voleva indicare una affermazione su di un soggetto a, come se questo garantisse una delimitazione naturale, ma presto abbandonerà questa nuova notazione sperimentale. 27 Citato da Lackey, cit., p. 131. 260 essa come di una singola entità, noi stiamo considerando un altro oggetto che associamo alla classe, ma non la classe in sé. Cioè, la “classe come uno” è semplicemente un simbolo o un nome che possiamo scegliere a piacere. Russell presenta un lavoro alla London Mathematical Society dove la eliminazione delle classi è portata più avanti, ad esempio alle classi di classi28 . In questo lavoro mette a frutto lo studio che aveva nel frattempo condotto sulla denotazione29 . Come nell’asserzione “l’attuale re di Francia è calvo” la frase “l’attuale re di Francia” non sta per alcunché e tuttavia l’affermazione ha un senso perfettamente definito, cosı̀ le classi, i numeri e quasi tutto ciò di cui parla la matematica sono false astrazioni. Non si deve chiedere “cosa è il numero uno?”, ma “quale è il significato di un enunciato in cui occorre la parola uno?”. Russell chiama p/a una matrice, presentandolo come un simbolo incompleto e privo di significato, un simbolo per la frase “il risultato della sostituzione in p di a con”: “questo simbolo spettrale [shadowy] rappresenta una classe”. Dire che x è un elemento della classe α significa ora dire che per qualche valore di p e a, α è la matrice p/a e p(x/a) è vera”. Invece della funzione variabile ϕ, che non poteva essere staccata dal suo argomento30 , abbiamo le due variabili p ed a che sono entità, e possono variare. Ma ora “x è un x” diventa privo di significato, perché “x è un α” richiede che α sia della forma p/a, e cosı̀ non è una entità. In quanto è un simbolo incompleto cioè, p/a non può essere sostituito ad a in p/a. L’eliminazione delle classi di classi è illustrata con i numeri. Per 0, si parte dall’affermazione “per tutti i valori di x, p(x/a) è falso”; chiamata q questa 28 B. Russell, “On the Substitutional Theory of Classes and Relations”, in Lackey, Essays in Analysis, cit. pp. 165-89. 29 In particolare “On denoting”, Mind , 14 (1905), pp, 479-93, ristampato in Essays in Analysis, cit. pp. 103-19. 30 [Facendo un riassunto della teoria di Frege, Russell afferma che “x è un elemento di u” è definito da “esiste una funzione ϕ che definisce la classe u e è soddisfatta da x”. Assumendo che la classe sia un’entità, si apre la strada alle contraddizioni. L’errore sta nel parlare di “una funzione ϕ” nel ruolo di variabile, e fare affermazioni del tipo “esiste una ϕ” o “per tutte le ϕ”.] 261 affermazione, si considera la matrice q/(p, a): se p0 e a0 hanno la relazione q/(p, a), cioè {q/(p, a)}(p0 , a0 ) è vera, allora svolgendo le abbreviazioni si ha “per tutti i valori di x, p0 (x/a0 ) è falsa”, che afferma che p0 /a0 è una classe senza elementi. Lo 0 è una “relazione tra una proposizione e un’entità, la relazione che, qualunque cosa si sostituisca all’entità, il risultato è sempre falso”. In generale, la definizione formale è la seguente: “La matrice q/(p, a) è detta una classe di classi, se, per tutti i valori di r, c, r0 , c0 , se r/c = r0 /c0 allora {q/(p, a)}/(r, c) è equivalente a {q/(p, a)}/(r0 , c0 ) [. . . ] In tale caso, diciamo che la classe r/c è un elemento della classe di classi q/(p, a) quando {q/(p, a)}/(r, c) è vera”31 . Quando una formula contiene matrici, il criterio di significatività è che possa essere enunciata esclusivamente in termini di entità. Russell ammette che lo sviluppo tecnico dei principi della matematica diventa molto più complicato con la teoria sostituzionale; il vantaggio è che si ha una vera semplificazione nelle assunzioni fondamentali e nelle proposizioni primitive. Il lavoro resterebbe valido se anche esistessero classi e relazioni; ma Russell vuole assumere solo che esistano proposizioni, e non crede che tale assunzione sia pericolosa. Il carattere sintattico della eliminazione suggerisce una distinzione di tipi. Le matrici si dividono in tipi, come illustrato sopra da quelle per classi e per classi di classi. Sono in verità i tipi che impediscono ad esempio l’antinomia di Cantor: se α è il numero totale di entità, 2α sarà il numero totale delle classi di entità, e 2α > α, ma non ci sarà alcuna classe di entità avente 2α elementi. Il lavoro sulla teoria sostituzionale ha giudizi controversi e Russell lo ritira. Tuttavia difende in modo convinto la teoria in uno scambio con Poincaré, sempre nel 1906. Il circolo vizioso Poincaré aveva attaccato i logicisti32 , dedicando ampio spazio a Russell, il quale risponde nel settembre 190633 con un articolo che rappresenta una tap31 La condizione r/c = r0 /c0 serve a garantire che {q/(p, a)}/(r, c) non dipenda separatamente da r e c ma dalla matrice r/c. 32 H. Poincaré, “Les mathématiques et la logique”, Revue de Métaphysique et de Morale, 14 (1906), pp. 294-317. 33 B. Russell, “Les paradoxes de la logique”, Revue de Métaphysique et de Morale, 14 (1906), pp. 627-50, pubblicato in inglese col titolo del manoscritto originale “On 262 pa importante nello sviluppo del pensiero di Russell sulle antinomie, perché in questa occasione Russell accetta e fa proprio un suggerimento di Poincaré, nonostante il disaccordo quasi totale sul resto. I temi della disputa sono numerosi, in corrispondenza ai vari argomenti usati da Poincaré contro la categoria dei logicisti nella quale faceva confluire Peano, Couturat, Russell, Cantor e Zermelo. In particolare Poincaré osservava divertito che la proposta di Russell di non considerare le classi come entità indipendenti rappresentava o richiedeva una ricostruzione radicale della logistica, mettendo in imbarazzo i logici che parlano soltanto di classi e di classi di classi. Russell precisa che i cambiamenti richiesti non sono dopo tutto molto grandi. Usa un paragone con il calcolo infinitesimale che ora non assume più e non usa gli infinitesimi, avendo cosı̀ eliminato alcune contraddizioni, ma senza modificare alcuna formula del calcolo. Quindi difende il lavoro dei logicisti dilungandosi sul “soggetto della ‘intuizione’ e la natura dell’evidenza per la verità delle proposizioni nella logistica”. Il metodo della logistica è sostanzialmente lo stesso di qualsiasi altra scienza. Vi è la stessa fallibilità, la stessa incertezza, la stessa mescolanza di induzione e deduzione, e la stessa necessità di fare appello, per la conferma dei principi all’accordo ampio con l’osservazione dei risultati calcolati. L’obiettivo non è quello di bandire l’“intuizione”, ma di controllare e sistematizzare la sua utilizzazione, eliminare gli errori a cui conduce il suo uso non consapevole, e scoprire leggi generali da cui, per deduzione, possiamo ottenere risultati veri e che non sono contraddetti mai, e in casi cruciali confermati, dall’intuizione. Le “proposizioni primitive” da cui iniziano le deduzioni della logistica dovrebbero, se possibile, essere evidenti all’intuizione; ma non è indispensabile, e comunque non è questa la vera ragione per la loro accettazione. La ragione è induttiva, vale a dire che, tra le loro conseguenze note (incluse esse stesse) molte appaiono essere vere all’intuizione, e nessuna falsa, e quelle che appaiono vere all’intuizione non sono, per quel che si può vedere, deducibili da qualsiasi sistema di proposizioni indimostrabili inconsistente con il sistema in oggetto. [. . . ] ‘Insolubilia’ and their Solution by Symbolic Logic” in Essays in Analysis, cit., pp. 190-214. 263 Ma, come è mostrato dalle contraddizioni, l’intuizione non è infallibile. Quindi resterà sempre un elemento di incertezza [. . . ]. Noi dovremmo essere costantemente sull’allerta per scoprire casi cruciali dove [le regole logiche] possono portare all’errore, se mai lo fanno. A questo fine, abbiamo bisogno di una facoltà veloce di dedurre conseguenze, e di una capacità immaginativa per il genere di conseguenze che possono essere false. Se, alla fine, arriviamo a un insieme di principi che si raccomandano all’intuizione, e che mostrano esattamente perché prima cadavamo in errore, possiamo avere una ragionevole assicurazione che i nuovi principi sono comunque più vicini alla verità dei precedenti. Quindi espone in dettaglio la teoria senza classi che aveva elaborato nel lavoro ritirato34 . L’eliminazione delle classi comporta anche il riconoscimento della distinzione di tipi, come già rilevato nel precedente lavoro. Anzi, “La teoria dell’Appendice B [dei Principles] tecnicamente differisce poco dalla teoria senza classi”. Infatti, la nozione di una classe che è elemento di se stessa diventa priva di significato, come si è visto sopra, mentre è facile definire cosa intendiamo quando diciamo che una classe è un elemento di una classe di classi. In questo modo, otteniamo una serie di tipi, cosı̀ che, laddove prima sarebbe potuto emergere un paradosso, ora abbiamo una differenza di tipi che rende l’enunciato paradossale privo di significato. I vari tipi che emergono in questo processo: classi, classi di classi, classi di classi di classi, relazioni binarie, classi di relazioni binarie, relazioni binarie di classi di entità, relazioni ternarie e cosı̀ via, sono tutte semplicemente frasi incomplete come “il risultato di rimpiazzare a in p con . . . ”. Non esiste quindi qualcosa come la serie completa di ordinali di ogni tipo: “c’è una formula che dà il numero ordinale di tutti gli ordinali di un dato 34 Forse aveva deciso di cogliere l’occasione di questa forma di pubblicazione della teoria, e che non fosse il caso di ripetersi. 264 tipo; questo non è del tipo dato, ed è il primo ordinale maggiore di quelli del tipo dato”35 . La novità del lavoro sta tuttavia in questa frase: Poincaré sostiene che i paradossi sorgono tutti da qualche genere di circolo vizioso. Sono d’accordo con lui. Per confermare la presenza costante del circolo vizioso Poincaré allarga il panorama delle contraddizioni prese in esame, includendo quelle della definibilità e addirittura quella del mentitore. Poincaré in questo modo tuttavia smentisce se stesso, e la sua affermazione che “i Cantoriani si sono dimenticati [che non esiste l’infinito attuale] e sono caduti in contraddizione”. Il paradosso del mentitore infatti non ha nulla a che fare con l’infinito. Inoltre l’unico senso in cui Cantor e i logicisti devono ammettere l’infinito attuale è quello per cui è possibile fare affermazioni su tutti o alcuni dei termini che hanno una certa proprietà, anche quando il numero di tali termini non è finito. Tuttavia Russell riconosce che la chiave dei paradossi va cercata nel circolo vizioso, e in particolare nel suggerimento di Poincaré “che ciò che in un modo qualunque concerne tutti di qualsiasi o alcuni (indeterminati) degli elementi di una classe, non deve essere esso stesso uno degli elementi della classe”. Il principio che Russell vuole assumere, “nel linguaggio di Peano”, è Ciò che coinvolge una variabile apparente [vincolata36 ] non deve essere uno dei possibili valori di quella variabile. 35 Russell si limita ad affermare l’esistenza di questa e altre formule, senza scriverle. Ad esempio afferma che alcuni dei principali teoremi di esistenza sono ottenuti in un modo indiretto. Si assume che per ogni proposizione esista almeno una entità che non è menzionata nella proposizione. Ammesso poi che esista una entità a, se si considera la proposizione a = a si conclude che esiste una entità diversa da a, quindi ne esistono almeno due; continuando cosı̀ per ogni n si dimostra che esistono almeno n entità, quindi ne esiste una infinità numerabile. Ma se l’affermazione che esistono almeno due elementi può essere resa da ∃a∃b(a 6= b), e cosı̀ per ogni n, forse solo la loro congiunzione infinita può essere presa come affermazione che le entità sono almeno numerabili, che invece Russell ritiene scontata. I buoni ordini di questa infinità di entità sono gli ordinali della seconda classe, che sono ordinali di entità. Il buon ordine degli ordinali della seconda classe è ω1 che è un ordinale di ordinali, non un ordinale di entità, ed è di un tipo superiore; si continua cosı̀, anche se Russell confessa che non è in grado di arrivare a ωω . 36 Nel linguaggio di Peano sono chiamate variabili reali e apparenti quelle che altrimenti sono dette rispettivamente libere e vincolate. 265 “Ma [Poincaré] non si rende conto della difficoltà di evitare circoli viziosi di questo genere”. La difficoltà è che può diventare necessario “costruire una [originale] teoria delle espressioni contenenti variabili apparenti che dia il principio come suo esito”. Il principio del circolo vizioso non è in sé la soluzione, ma il risultato che deve conseguire dal modo come è costruita la teoria. In particolare per Epimenide non basta la no classes theory; il tutti deve riguardare le proposizioni stesse. Una affermazione su tutte le proposizioni deve essere o priva di significato o l’affermazione di qualcosa che non è una proposizione; c’è quindi bisogno di un significato di proposizione per il quale nessuna proposizione contiene una variabile vincolata37 . Nel paradosso del mentitore, “io sto mentendo” significa “esiste una proposizione p che sto affermando e che è falsa”. Quindi non è una proposizione. L’affermazione è falsa non perché egli stia enunciando una proposizione vera ma perché benché stia facendo un’affermazione non sta enunciando una proposizione. Lo stesso argomento dispone dell’antinomia di Richard e di quella di Berry. Ma la difficoltà di costruire una logica che incorpori tali requisiti può essere illustrata dal destino delle leggi logiche. Il principio del terzo escluso ad esempio afferma che “ogni proposizione è vera o falsa”, e la maggior parte delle persone pensa che il principio si applichi a se stesso e quindi che si affermi che il principio del terzo escluso è vero o falso. Invece la legge del terzo escluso non è una proposizione; è tuttavia una affermazione vera, ma nel senso che tutti i suoi casi particolari sono veri. Poincaré direbbe, pensa Russell, che il principio del terzo escluso è “tutte le proposizioni sono vere o false, esclusa la proposizione che tutte sono o vere o false”. Ma in questo modo non sfugge alla contraddizione. Bisogna trovare un modo di esporre la legge del terzo escluso in modo che non si applichi a se stessa, anche senza dire che non si applica a se stessa. Possiamo farlo restringendola alle proposizioni che non contengono variabili vincolate, purché lo facciamo senza dire che non contengono variabili vincolate. Allora si avrà una gerarchia, la legge per enunciati privi di variabili vincolate (benché non sia chiaro come possa non dire che non contengono variabili vincolate), 37 La restrizione sembra un po’ forte, dal momento che prima parlava delle affermazioni su tutte le proposizioni; ma forse va messa in relazione anche con l’esclusione di tutti per le classi. 266 che ha una variabile vincolata (“ogni enunciato . . . ”), la legge per enunciati con una variabile vincolata, che conterrà due variabili vincolate, e cosı̀ via senza mai esaurirle tutte. Un’altra difficoltà è illustrata dal principio di induzione. La presenza di un circolo vizioso denunciata da Poincaré è formalmente corretta, e bisognerebbe restringersi a proprietà che si possano esprimere senza variabili vincolate. Pure ci sono molti casi in cui sembra inevitabile applicare l’induzione a una variabile di una formula che contiene una quantificazione su un’altra variabile: la confrontabilità n < m∨n = m∨m < n è un esempio, in quanto si dimostra di solito dimostrando per induzione su n la formula ∀m(n < m∨n = m∨m < n). Una scappatoia potrebbe essere suggerita secondo Russell dal paradosso di Epimenide, nella variante in cui Epimenide dice “tutte le proposizioni della forma ϕx affermate da Epimenide sono false”; se questa affermazione fosse della forma ψ(Epimenide) si avrebbe una contraddizione. Quindi un enunciato che contiene una variabile funzionale vincolata non deve essere della forma ϕx anche quando contiene x38 ; ed è naturale estendere la richiesta a enunciati che contengono variabili individuali vincolate. Ma questa variante di Epimenide mostra solo una affermazione contenente una variabile libera x e una variabile vincolata non è identica a una affermazione della forma ϕx; non esclude che non possa essere equivalente. Nel caso di Epimenide in affetti la sua asserzione è equivalente a una della forma ϕ(Epimenide). Sostituendo asserzioni equivalenti si aggirerebbe la restrizione sull’induzione; ma Russell non dà nessun esempio matematico, in particolare non discute il caso da lui stesso citato, per mostrare quale formula equivalente usare. Dall’esposizione di Russell, non si capisce se a questo stadio della sua riflessione egli sia convinto di poter presentare una soluzione alle difficoltà enunciate, oppure non sappia ancora come risolverle. Non si capisce cioè se la realizzazione del principio del circolo vizioso sia considerata una strada obbligata, ma oscura, oppure se egli vede la strada che porta alla luce. Per quel che riguarda la no classes theory, il collaboratore di Russell, Alfred North Whitehead, era per parte sua contrario a “fondare tutta la matematica su un artificio tipografico”, e sosteneva che il loro [di Whitehead e Russell] obiettivo era quello di sistematizzare il ragionamento in matematica, 38 Russell intende probabilmente che x non deve essere il soggetto. 267 e per questo bisognava mantenere le classi: “Il rigore estremo deve essere temperato da considerazioni pratiche [. . . ] Le classi possono essere mantenute in base alla considerazione che [. . . ] il ragionamento effettivo della matematica usa abitualmente le classi anche quando non ce ne sarebbe bisogno. Cosı̀ il nostro compito è di sistematizzare il ragionamento relativo alle classi, anche se fosse un’idea primitiva che potrebbe essere evitata”39 . Alla fine nel 1906 Russell scrivendo a Jourdain gli racconterà che tutto funziona con la sua no classes theory fino a che non “non considero la funzione W , dove W (ϕ). ≡ .ϕ ∼ ϕ(ϕ), e allora [. . . ] non ho guadagnato nulla rifiutando le classi”40 ; tornerà perciò a un atteggiamento realista. La eliminazione delle classi lo aveva portato a mettere di nuovo in evidenza i vantaggi, o la necessità, della distinzione dei tipi, e forse si era convinto che la natura delle classi era meno importante della struttura dei tipi in vista della esclusione di ogni circolo vizioso. La teoria dei tipi Nel 1907 Russell elabora la sua nuova teoria dei tipi41 . Il lavoro inizia con un elenco delle contraddizioni da risolvere, che servono come banco di prova della teoria42 , e rappresentano “solo una selezione tra un numero indefinito” di analoghe. La più vecchia contraddizione è quella di Epimenide il cretese, che dice “sto mentendo”; quindi viene messa quella di Russell sia nella forma della classe di tutte le classi che non appartengono a se stesse, sia nella forma relazionale vista sopra. Seguono quella di Berry e quella di König sull’ordinale definito come il primo ordinale non definibile. Infine è presentato il paradosso di Richard e ultima l’antinomia di Burali-Forti. Tutte le contraddizioni elencate hanno una caratteristica comune “che possiamo descrivere come auto-riferimento o riflessività”. In tutte le contraddizioni si dice qualcosa su tutti i casi di qualche genere, e da quello che 39 Lettere di Whitehead a Russell del febbraio 1906, citate da Lackey, in Essays in Analysis, cit. pp. 131-2. 40 Cit. da Grattan-Guiness, “Bertrand Russell on his paradox and the multiplicative axiom”, cit. Russell sembra dimenticare qui o non dare penso alla sua osservazione che la teoria senza classi deve anche essere una teoria dei tipi, e coerentemente non dovrebbe scrivere la W . 41 “Mathematical Logic as based on the Theory of Types” (1908), cit. 42 Il suo merito non è solo quello di risolvere le contraddizioni, spiega Russell, ma anche “una certa consonanza” con il buon senso, benché questo non sia un merito su cui insistere, dal momento che il buon senso è meno affidabile di quanto comunemente si crede. 268 si dice un nuovo caso sembra essere generato, che è e nello stesso tempo non è dello stesso genere dei casi che tutti sono stati considerati. Russell passa in rassegna tutte le contraddizioni per far vedere il fenomeno dell’auto-riferimento. Conclude cosı̀ che la nozione “tutte le proposizioni”, come anche “tutti gli ordinali” sono illegittime. “Tutte le nostre contraddizioni hanno in comune l’assunzione di una totalità che, se fosse legittima, sarebbe immediatamente ampliata da nuovi elementi definiti in termini di quella totalità”. Questo conduce alla regola: “Ciò che presuppone [involves] il tutti di una collezione non deve essere uno della collezione”, o al contrario: “Se, assumendo che una collezione avesse un totale, essa avrebbe elementi definibili solo in termini di quel totale, allora tale collezione non ha totale”. La regola è tuttavia puramente negativa, e non mostra come evitare o correggere gli errori che derivano dal suo mancato rispetto. Non si può dire “quando parlo di tutte le proposizioni intendo tutte salvo quelle nelle quali ‘tutte le proposizioni’ sono menzionate”, perché cosı̀ abbiamo proprio menzionato le proposizioni nelle quali “tutte le proposizioni” sono menzionate. “È impossibile evitare di menzionare qualcosa dicendo che non la menzioneremo”. Quindi è necessario “costruire una logica senza menzionare cose come ‘tutte le proposizioni’ o ‘tutte le proprietà’, e senza anche dover dire che le escludiamo. L’esclusione deve risultare naturalmente ed inevitabilmente dalle nostre dottrine positive, che devono rendere chiaro che ‘tutte le proposizioni’ e ‘tutte le proprietà’ sono frasi prive di senso”. Le prime difficoltà che vengono in mente sono quelle già notate da Russell, cioè le leggi logiche e il principio di induzione. Una prima soluzione consiste nella differenza tra “tutti” e “qualsiasi”. La distinzione, già discussa nei Principles, assume ora un ruolo decisivo. Si tratta, nella terminologia logica moderna, della distinzione tra una variabile quantificata universalmente e una variabile libera. Entrambe sono necessarie e presenti nella matematica. Nelle dimostrazioni geometriche che iniziano con “Sia ABC un triangolo . . . ”, ABC è un triangolo qualsiasi. In una definizione come “f è continua in x0 se per ogni ε e ogni δ . . . ”, la f e x0 sono qualsiasi, mentre gli ε e i δ sono tutti. Asserire qualsiasi valore di una funzione proposizionale significa asserire la funzione proposizionale. 269 La differenza tra asserire ϕx e asserire ∀xϕx è stata segnalata e sottolineata per primo da Frege43 . Le variabili libere sono essenziali per il pensiero deduttivo: per dedurre ad esempio ∀xψx da ∀xϕx e ∀x(ϕx → ψx) occorre particolareggiare a un x qualsiasi ϕx e ϕx → ψx, per usare il modus ponens 44 . Quando le variabili sono proposizioni o proprietà, la quantificazione deve essere vietata, e si potranno fare solo affermazioni per un qualsiasi valore della variabile. Le leggi fondamentali della logica non riguardano cosı̀ tutte le proposizioni (di una certa forma), sono schemi (nella terminologia moderna) costituiti dall’insieme di tutti i possibili singoli casi. Anche il principio di induzione diventa uno schema, perfettamente adeguato a tutti i suoi usi. Non è invece possibile usare l’induzione per definire i numeri, dicendo che un numero naturale è tale se possiede ogni proprietà che sia goduta da 0 e da ogni successore di uno che la possiede. Russell accetta cosı̀ la critica predicativista di Poincaré alla definizione di Dedekind. Segue una lunga discussione del quantificatore universale. La maggior parte delle affermazioni usano quantificatori ristretti a una proprietà, ad esempio “Tutti i tedeschi sono biondi”. Ma non esistono simili quantificatori in logica, nell’analisi logica di Frege accettata anche dalla logica moderna. La giustificazione di Russell è che “tutti i tedeschi” è una frase denotante, e incompleta; non può essere il soggetto di una proposizione. L’affermazione espansa e corretta è ∀x(Tedesco(x) → Biondo(x)) con il quantificatore universale ∀x non ristretto. Tuttavia non si potrebbe fare un’affermazione del genere, perché tra tutti i valori di x ricadrebbero anche tutte le proposizioni e tutte le totalità illecite. D’altra parte non lo si può restringere con una proprietà o una classe, perché si riproporrebbe con queste la situazione qui esemplificata da “Tedesco(x)”. La restrizione deve venire dall’interno dalla proposizione quantificata. La funzione proposizionale Tedesco(x) → Biondo(x) “deve avere un certo ambito di significatività che non coincide con tutti i valori di x, ma che eccede” quelli di “Tedesco(x)”. 43 G. Frege, Grundgesetze der Arithmetik , 1893, cit., vol. I, §17. L’esempio va bene per illustrare il ruolo delle variabili libere, ma come inferenza logica è controproducente per l’argomento di Russell; infatti quando si è concluso ψx per un x qualsiasi , si passa a ∀xψx, cioè si afferma “per tutti gli x, ψx”. Invece, vedi sopra il seguito. 44 270 “Se la funzione cessa di avere significato quando la variabile esce da un certo ambito, allora la variabile è ipso facto confinata a quell’ambito, senza che sia necessario dichiararlo esplicitamente”. Russell giustifica cosı̀ i sistemi di significatività delle funzioni proposizionali che aveva asserito esistere nell’Appendice dei Principles. Si può dunque affermare che “ogni proposizione che contiene tutti asserisce che una certa funzione proposizionale è sempre vera; questo significa che tutti i valori di detta funzione sono veri, non che la funzione è vera per tutti gli argomenti, perché ci sono argomenti per i quali la funzione è priva di significato, cioè non ha alcun valore”. Il lavoro preparatorio per la teoria dei tipi è terminato. Nella attuale versione della teoria appare, insieme ai tipi, un altro concetto, quello di ordine. Un tipo è definito come il sistema di significatività di una funzione proposizionale [. . . ]. Quando una variabile apparente [vincolata] occorre in una proposizione, il sistema dei valori della variabile apparente è un tipo, il tipo fissato dalla funzione a cui “tutti i valori” [della variabile] si riferiscono. [. . . ] Il principio [del circolo vizioso], nel nostro linguaggio tecnico, diventa: “Ciò che contiene una variabile apparente non deve essere un possibile valore di quella variabile”. Cosı̀ ciò che contiene una variabile apparente deve essere di un tipo diverso da quello dei possibili valori di quella variabile; diremo che è di un tipo superiore. Cosı̀ sono le variabili apparenti contenute in una espressione che determinano il suo tipo. Questo è il principio guida per quel che segue. Russell chiama elementari le proposizioni che non contengono variabili vincolate, e generalizzate quelle che contengono variabili vincolate. Nelle proposizioni elementari, i termini sono il soggetto, quelli di cui sono asseriti i predicati e le relazioni. I termini delle proposizioni elementari li chiameremo individui ; essi formano il primo tipo, o il più basso. Non è necessario, in pratica, sapere quali oggetti appartengono al tipo più basso, o anche se il tipo più basso di una variabile che occorre in un dato contesto è quello degli individui o qualcun altro. Perché in pratica solo i tipi relativi delle variabili sono rilevanti; cosı̀ il tipo più basso che occorre in un dato contesto può essere chiamato il tipo degli individui, per quel che riguarda quel contesto. [. . . ] quello che è essenziale è il modo come gli altri tipi sono generati dagli individui, 271 comunque sia costituito il tipo degli individui. [. . . ]45 Le proposizione elementari, insieme a quelle che contengono solo individui come variabili apparenti, le chiameremo proposizioni del primo ordine. Queste formano il secondo tipo logico. Abbiamo cosı̀ una nuova totalità, quella delle proposizioni del primo ordine. Possiamo allora formare nuove proposizioni nelle quali occorrono come variabili apparenti proposizioni del primo ordine. Queste le chiameremo proposizioni del secondo ordine; esse formano il terzo tipo logico. Cosı̀ ad esempio, se Epimenide asserisce “tutte le proposizioni del primo ordine da me affermate sono false”, egli asserisce una proposizione del secondo ordine; la può affermare in modo veritiero, senza al contempo asserire in modo veritiero alcuna proposizione del primo ordine, e cosı̀ non sorge alcuna contraddizione. Il processo descritto può essere continuato indefinitamente. L’(n+1)-esimo tipo logico consisterà delle proposizioni di ordine n, che saranno quelle che contengono come variabili apparenti proposizioni di ordine n − 1, ma non superiore. I tipi sono mutuamente esclusivi, quindi non è possibile alcuna fallacia riflessiva, fintanto che ricordiamo che una variabile apparente deve essere sempre ristretta a qualche tipo. In parallelo con la gerarchia delle proposizioni c’è una gerarchia di funzioni proposizionali. Russell discute la possibilità di utilizzare per la loro definizione le matrici p/a e la notazione p(x/a), afferma che se ne avrebbero certi vantaggi, forse per salvare il lavoro fatto nei precedenti articoli, ma conclude che è meglio rimpiazzare p con ϕa e p(x/a) con ϕx, Una funzione il cui argomento è un individuo e il cui valore è sempre una proposizione del primo ordine sarà chiamata una funzione del primo ordine. Una funzione che coinvolge una funzione o una proposizione del primo ordine come variabile apparente sarà detta una funzione del secondo ordine, e cosı̀ via. Una funzione di una variabile che è dell’ordine immediatamente superiore a quello del suo argomento sarà chiamata funzione predicativa. [. . . ] La gerarchia delle funzioni può essere ulteriormente spiegata come segue. Una funzione del primo ordine di un individuo x sarà denotata da ϕ!x [. . . ]. Nessuna funzione del primo ordine contiene una funzione come variabile apparente; quindi tali funzioni formano una totalità ben definita, e la ϕ in ϕ!x può essere trasformata in una variabile apparente. Qualunque proposizione in cui ϕ compare come variabile apparente, e in cui non c’è alcuna variabile apparente di tipo superiore a ϕ, è una proposizione del secondo ordine. Se una tale proposizione contiene un 45 [Ora Russell veramente, contraddicendo quanto appena detto, cerca di definire gli individui, come quelli che sono privi di ogni complessità, per differenziarli dalle proposizioni, che sono complesse.] 272 individuo x, non è una funzione predicativa di x; ma se contiene una funzione del primo ordine ϕ, è una funzione predicativa di ϕ, e sarà scritta f !(ϕ!ẑ )46 . Allora f è una funzione del secondo ordine predicativa; i possibili valori di f di nuovo formano una totalità ben definita, e possiamo usare f come variabile apparente. [. . . ] Adotteremo le seguenti convenzioni. Variabili del tipo più basso che occorrono in un dato contesto saranno denotate da lettere latine minuscole (eccetto f e g che sono riservate per funzioni); una funzione predicativa di un argomento x (dove x può essere di qualsiasi tipo) sarà denotata da ϕ!x [. . . ]; una funzione generale di x sarà denotata da ϕx [. . . ]. In ϕx, ϕ non può essere trasformata in una variabile apparente, perché il suo tipo è indeterminato; ma in ϕ!x, dove ϕ è una funzione predicativa il cui argomento è di un qualche tipo dato, ϕ può diventare una variabile apparente47 . Alcune delle contraddizioni sono risolte dalla teoria dei tipi, cioè dalla restrizione che le frasi contenenti le parole “tutte le proposizioni” e simili sono prima facie prive di significato, perché la generalizzazione può essere applicata solo all’interno di un tipo. Russell lo fa vedere per il mentitore, Berry e il minimo ordinale indefinibile. Per le altre, come Burali-Forti, occorrono ulteriori approfondimenti. È assolutamente necessario, se la matematica deve essere possibile, che abbiamo qualche metodo per fare affermazioni che normalmente siano equivalenti a quello che abbiamo in mente quando (in modo impreciso) parliamo di “tutte le proprietà di x”. [Ad esempio per l’induzione.] [. . . ] parlare di tutti i valori di [una] funzione [. . . ] richiede che essa sia di un qualche ordine assegnato; ma qualunque ordine assegnato non ci permetterà di dedurre molte proposizioni della matematica elementare. Quindi dobbiamo trovare qualche metodo per ridurre l’ordine di una funzione proposizionale senza influire sulla verità o falsità dei suoi valori. Questo sembra ciò che il senso comune realizza con l’ammissione delle classi . Data una qualunque funzione proposizionale ϕx, di qualunque ordine, si assume che essa sia equivalente, per tutti i valori di x, a una affermazione della forma “x appartiene alla classe α”. [. . . ] Io credo che lo scopo principale a cui servono le classi, e la principale ragione che le rende linguisticamente convenienti, è che esse forniscono un metodo per ridurre l’ordine di una funzione proposizionale. Io perciò, non assumerò nulla di 46 [Nel testo è scritto f !(ψ! ẑ ), ma deve trattarsi di un refuso.] [Queste convenzioni anticipano quello che sarà lo stile sistematicamente ambiguo dei Principia, senza indicazione esplicita dei tipi delle variabili.] 47 273 quello che sembra essere implicito nell’ammissione del senso comune delle classi, se non questo: che ogni funzione proposizionale è equivalente, per tutti i suoi valori, a qualche funzione predicativa [degli stessi argomenti]. Questa assunzione [. . . ] mantiene delle classi tanto quanto serve, ma abbastanza poco da evitare le contraddizioni [. . . ]. Chiamerò questa assunzione assioma delle classi , o assioma di riducibilità. L’induzione matematica può ora essere enunciata solo per tutte le funzioni predicative di numeri. Il timore che con l’assioma di riducibilità possano tornare ad affacciarsi i paradossi non è giustificato, perché in essi interviene o qualcosa d’altro oltre alla verità o falsità dei valori delle funzioni, oppure compaiono espressioni che restano prive di significato anche applicando l’assioma di riducibilità. Ad esempio “Epimenide asserisce ψx” non è equivalente a “Epimenide asserisce ϕ!x”, anche se ψx e ϕ!x sono equivalenti. Esaurite le motivazioni e le spiegazioni delle caratteristiche della teoria dei tipi, Russell espone formalmente nel capitolo VI il sistema di logica che ne risulta. La teoria sarà chiamata teoria ramificata dei tipi , perché il tipo di una funzione dipende sia dal tipo degli argomenti sia dal tipo delle variabili vincolate che occorrono in essa. Il sistema è basato su sette idee primitive che sono: funzione proposizionale; negazione; disgiunzione; la verità di un qualunque valore di una funzione proposizionale; la verità di tutti i valori di una funzione proposizionale (diremmo: il quantificatore universale); funzione predicativa di un argomento di qualsiasi tipo; l’asserzione (che qualche proposizione è vera), indicata dal segno `. L’idea di variabile è probabilmente implicita in quella di funzione proposizionale. Russell non è molto rigoroso nella formalizzazione; ad esempio non definisce “proposizione”, anche se stipula, ad esempio per la negazione, che “se p è una proposizione, anche ∼ p è una proposizione”. Non enuncia una regola di sostituzione. Seguono alcune definizioni, tra le quali gli altri connettivi, precisamente ⊃ per l’implicazione, il puntino per la congiunzione, ≡ per la biimplicazione, il quantificatore esistenziale, la notazione ϕx̂ per la funzione, in quanto distinta dai singoli valori. Quindi è presentato un elenco di 14 assiomi e regole: 274 (1) (2) (3) (4) (5) (6) (7) Una proposizione implicata da una premessa vera è vera. `: p ∨ p. ⊃ .p. `: q. ⊃ .p ∨ q. `: p ∨ q. ⊃ .q ∨ p. `: p ∨ (q ∨ r). ⊃ .q ∨ (p ∨ r). `: .q ⊃ r. ⊃: p ∨ q. ⊃ .p ∨ r. `: (x).ϕx. ⊃ .ϕy. L’ottava proposizione primitiva mette in difficoltà Russell, in quanto non è una formula, “non può essere espressa coi nostri simboli”, ma una sorta di metaregola: (8) Se ϕy è vera, dove ϕy è un valore qualsiasi di ϕx̂, allora (x).ϕx è vera. (9) `: (x).ϕx. ⊃ .ϕa, per ogni a costante. (10) `: .(x).p ∨ ϕx. ⊃: p. ∨ .(x).ϕx. (11) Se f (ϕx) è vera qualsiasi sia il valore di x e F (ϕy) è vera qualsiasi sia il valore di y, allora f (ϕx).F (ϕx) è vera qualunque sia il valore di x. (12) Se ϕx.ϕx ⊃ ψx è vera per ogni possibile valore di x, allora ψ è vera per ogni possibile valore di x. (13) `: .(∃f ) : .(x) : ϕx. ≡ .f !x, che è l’assioma di riducibilità, come anche il prossimo, per due variabili. (14) `: .(∃f ) : .(x, y) : ϕ(x, y). ≡ .f !(x, y) L’unico caso in cui interviene la teoria dei tipi è (11), che implicitamente permette di identificare variabili reali solo se sono dello stesso tipo; il sistema si presenta con una ambiguità formale che è utile: “non è mai necessario nel corso di una qualsiasi deduzione considerare il tipo assoluto di una variabile; è solo necessario vedere che le differenti variabili che occorrono in una proposizione siano dei tipi relativi appropriati”. Questo esclude ad esempio la quarta contraddizione perché “una relazione tra R ed S è sempre di un tipo superiore ad entrambe” e quindi “la relazione R tra R ed S” è priva di significato. L’uguaglianza è definita da x = y. =: (ϕ) : ϕ!x. ⊃ .ϕ!y. 275 Le classi sono introdotte nel seguente modo. Per ogni funzione f di funzioni predicative ϕ!ẑ si considera una associata funzione estensionale48 ponendo f {ẑ (ψz)}. =: (∃ϕ) : ϕ!x. ≡x .ψx : f {ϕ!ẑ }. La funzione f {ẑ (ψz)} è in realtà una funzione di ψẑ , anche se non la stessa di f (ψẑ ), ma “è conveniente trattare f {ẑ (ψz)} tecnicamente come se avesse come argomento ẑ (ψz), che chiameremo ‘la classe definita da ψ’ ”. Se due funzioni sono equivalenti, le classi definite da esse sono uguali, che è “la proprietà caratteristica delle classi”, quindi “siamo giustificati nel trattare ẑ (ϕ) come la classe definita da ϕ”. Secondo Quine49 , Russell riduce sı̀ in questo modo le classi alle funzioni proposizionali, ma siccome le funzioni proposizionali occorrono come variabili nella quantificazione, la logica dei Principia è impegnata alle funzioni proposizionali in re, e l’eliminazione delle classi ammonta a una riduzione delle classi a proprietà o attributi. Siccome Russell non distingueva uso e menzione, egli credeva di aver ridotto le classi a entità linguistiche, mentre di fatto le aveva ridotte solo a proprietà platoniche. Russell in una nota a “On some difficulties . . . ” aveva anticipato che, siccome le obiezioni alla esistenza delle classi valgono anche per l’esistenza delle funzioni proposizionali come entità separabili distinte da tutti i loro valori, nella teoria ogni volta che si parla di una funzione proposizionale si intende una abbreviazione per parlare di alcuni o tutti i suoi valori; questo quando sembrava orientato alla no classes theory. Non si può dire che tale principio sia rispettato nella teoria dei tipi, ma d’altra parte non è detto che debba esserlo. Non è credibile che Russell non fosse consapevole dell’impegno ontologico del suo sistema; peraltro in una serie di note non pubblicate del 1906 scriveva proprio che “qualunque cosa sia una variabile apparente [vincolata] deve avere qualche specie di essere”, quasi anticipando lo slogan di Quine che “essere è essere il valore di una variabile vincolata”. Dopo le classi, Russell introduce l’operatore descrittivo “l’x tale che ϕ” per poter definire le usuali funzioni matematiche, che hanno come valori 48 Brevemente, significa che se gli argomenti sono equivalenti, come funzioni, anche i valori lo sono. 49 Willard v. O. Quine, “Whitehead and the rise of modern logic”, in The Philosophy of Alfred North Whitehead (a cura di P. A. Schilpp), The Library of Living Philosophers, Open Court, La Salle, 1941, pp. 125-64. 276 dei termini, e che chiama descrittive. Quindi definisce i cardinali, e discute l’assioma dell’infinito, nella forma che nessun classe finita contiene tutti gli individui, e che può essere assunto oppure no. Se lo si assume, si possono definire anche operazioni infinitarie sui cardinali, si ottiene ℵ0 e cardinali maggiori ma non ℵω , neanche dopo aver introdotto gli ordinali50 . Nell’occasione Russell osserva che l’assioma moltiplicativo è equivalente a quello di Zermelo, dimostrando in nota la direzione che finora gli mancava; preferisce non aggiungerlo agli assiomi, ma segnalarlo ogni volta che si usa. Osserva che se pure i cardinali sono ambigui, nel senso che hanno un significato diverso a seconda del tipo al quale si riferiscono, tuttavia si possono confrontare le cardinalità delle classi anche se esse hanno tipo diverso; infatti una relazione biunivoca può sussistere tra gli elementi di due classi anche se queste hanno tipo diverso – avrà un tipo superiore al massimo dei due. Infine definisce gli ordinali, e spiega di nuovo come la teoria dei tipi eviti la contraddizione di Burali-Forti: “Tutti gli ordinali di un tipo possono essere ordinati per grandezza in una serie bene ordinata, che ha un numero ordinale di un tipo superiore a quello degli ordinali che compongono la serie”. La teoria dei tipi sarà ridotta di nuovo a una teoria semplice, non ramificata, da Frank P. Ramsey (1903-1930), il quale osserverà che la gerarchia degli ordini è usata da Russell solo per le antinomie epistemologiche, e forse sarebbe meglio trascurarle in quanto dipendono da fattori linguistici non logici né matematici51 . 50 Manca evidentemente qualcosa di equivalente al rimpiazzamento (Fraenkel e Skolem furono condotti ad esso proprio dalla considerazione di ℵω ), ma non è chiaro quanto Russell fosse consapevole di cosa mancasse. 51 F. P. Ramsey, “The foundations of mathematics”, Proceed. London Mathematical Society, (2) 25, 1925, pp. 338-84, ristampato in F. P. Ramsey, The foundations of mathematics and other logical essays, Paul, Trench, Trubner, London, 1931, pp. 1-61; trad. it. I fondamenti della matematica e altri scritti logici , Feltrinelli, Milano, 1964. Secondo Quine invece, nella nota introduttiva a “Mathematical Logic as based on the Theory of Types” in van Heijenoort, cit., pp. 150-2, la costruzione di Russell è inutilmente complicata per la sua incapacità di distinguere tra le funzioni proposizionali come notazioni e le funzioni proposizionali come attributi e relazioni: “Se per ogni funzione proposizionale ne esiste una predicativa coestensiva, allora i simboli per le funzioni proposizionali sarebbero potuti dall’inizio essere concepiti come i corrispondenti predicativi. In breve, i tipi delle funzioni proposizionali sarebbero potuti essere descritti subito come dipendenti solo dai tipi degli argomenti”. Se l’assioma di riducibilità è vero, la ramificazione era inutile in partenza. Questa critica era stata anticipata da Leon Chwistek, “Antynomje Logiki Formalnej”, Przeg. Filoz., 24 (1921), pp. 164-71. 277 Nell’immediato, la teoria dei tipi è discussa da Poincarè52 nel 1909, e Russell gli risponde53 nel 1910. Poincaré apprezza il riconoscimento del principio del circolo vizioso da parte di Russell, anche se ora Poincaré stesso lo formula in un modo leggermente diverso, ponendo l’accento sul fatto che gli insiemi devono avere una definizione stabile, che non sia modificata dalla introduzione di nuovi elementi; gli insiemi infiniti sono generati progressivamente, e quando si aggiungono nuovi elementi si modifica la relazione tra l’insieme e gli elementi già introdotti, e magari alcuni di essi debbono essere espulsi. Questo succede ad esempio quando gli elementi sono quelli definibili con una frase finita; man mano che si aggiungono elementi e l’insieme si modifica, il senso delle frasi cambia, elementi che non erano definibili lo diventano e al contrario elementi che erano definiti ora non lo sono più dalla stessa frase. Le definizioni per cui questo non succede le chiama predicative, e non le ritrova in modo palese nella impostazione di Russell, che peraltro interpreta in modo approssimativo, confondendo tipi e ordini. Afferma nel suo riassunto che una proposizione non sarà sempre dello stesso ordine qualunque sia x, perché il suo ordine dipende dall’ordine di x; la funzione sarà detta predicativa se essa è di ordine k + 1 quando x è di ordine k. Lamenta che Russell non abbia dato esempi, e che non abbia spiegato bene la funzione dell’assioma di riducibilità, che dovrebbe servire a dimostrare il principio di induzione. Poincaré ne sarebbe lieto, dal momento che sospetta che non sia che un’altra forma dello stesso principio; i tentativi di dimostrare il principio di induzione gli ricordano quelli di dimostrare il quinto postulato di Euclide assumendo una delle sue conseguenze come una verità evidente. Per quel che riguarda la gerarchia, Poincaré osserva che Russell non ha chiarito se oltre alle proposizioni di ordine n, per ogni n, le quali si possono definire in modo naturale, esistano anche proposizioni di ordine α, dove α è un ordinale transfinito, in particolare ω. In caso affermativo, si dovrebbe spiegare che cosa sono tali proposizioni, in caso di risposta negativa, si presuppone di avere già la distinzione tra finito e infinito. Poincaré prova a proporre una sua applicazione dell’assioma: la definizione dei numeri naturali come quelli che appartengono a tutte le classi ricorrenti non ha senso se non si precisa l’ordine delle classi ricorrenti; cosı̀ si hanno 52 H. Poincaré, “La logique de l’infini”, Revue de Métaphysique et de Morale, 17 (1909), pp. 451-82. 53 “La Théorie des types logiques”, cit. 278 numeri di vario ordine; ma se un numero è di ordine n, è anche di ordine n − 1, sicché si determina una successione di insiemi via via più ristretta, e si potrebbero chiamare di ordine ω quei numeri che appartengono a tutti gli ordini n, e ottenere cosı̀ una definizione. Russell prende atto del tono non polemico dell’interlocutore, e siccome questi ha chiesto maggiori spiegazioni, coglie l’occasione per esporre in modo più diffuso le motivazioni e le interpretazioni filosofiche del proprio sistema, sulle quali nel lavoro pubblicato su una rivista di matematica non aveva potuto dilungarsi. L’esposizione è in effetti più ampia e minuziosa di quella del 1908, ma Russell non risponde ad alcuna delle domande poste da Poincaré. 279 appendice La teoria dei tipi54 La teoria dei tipi è un sistema di logica, più che di teoria degli insiemi. la teoria predicativa dei tipi PT Definizione induttiva di simbolo di tipo: (i) “o” è un simbolo di tipo; (ii) se t1 , . . . , tn sono tutti simboli di tipo, (t1 , . . . , tn ) è un simbolo di tipo; (iii) null’altro è un simbolo di tipo. Intuitivamente: gli individui sono le cose di tipo o; un insieme di individui ha tipo (o); una relazione binaria tra individui ha tipo (o, o); una relazione binaria tra individui e relazioni binarie tra individui ha tipo (o, (o, o)), e cosı̀ via. Una gerarchia di tipi basata sull’insieme non vuoto D è la collezione di tutte le relazioni tipate su D. Le relazioni tipate su D sono individuate dalla seguente definizione induttiva: (i) un elemento di D è una relazione di tipo o; (ii) un insieme di n-uple di elementi di D è una relazione di tipo (o, o, . . . , o); | {z } n (iii) una relazione di tipo t = (t1 , . . . , tn ) è un insieme di n-uple hr1 , . . . , rn i, dove ogni ri è di tipo ti , per 1 ≤ i ≤ n. Se D e D0 sono due insiemi non vuoti della stessa cardinalità, le gerarchie di tipi basate su D e rispettivamente D0 sono isomorfe. Alfabeto di PT, la teoria predicativa dei tipi: per ogni tipo t, una lista infinita di variabili {xtn }1≤n di tipo t; per ogni tipo t, una lista infinita di costanti {atn }1≤n di tipo t; parentesi, virgola, negazione, disgiunzione, accento circonflesso, ∀, ∃. Definizione induttiva simultanea dei termini e delle formule: (i) una variabile o una costante di un dato tipo sono termini di quel tipo; (ii) Se A è un termine di tipo (t1 , . . . , tn ) e se y1 , . . . , yn sono termini rispettivamente di tipo t1 , . . . , tn , allora A(y1 , . . . , yn ) è una formula; 54 Da W. S. Hatcher, Foundations of Mathematics, W. B. Saunders, Philadelphia, 1968; trad. it. Fondamenti della matematica, Boringhieri, Torino, 1973, cap. 4. I sistemi presentati in questa appendice sono quelli classici che risalgono al lavoro di Russell; una nuova teoria, che ha influenzato la costruzione di linguaggi di programmazione tipati, è stata elaborata negli ultimi anni da Martin-Löf: si veda Per Martin-Löf, Intuitionistic Type Theory, Bibliopolis, Napoli, 1984. 280 (iii) se A e B sono formule, anche (¬A) e (A ∨ B) sono formule; (iv) se A è una formula e y una variabile, anche (∀y)A e (∃y)A sono formule; (v) se A è una formula e y1 , . . . , yn (n > 0) sono variabili libere distinte nell’ordine della loro prima occorrenza in A da sinistra a destra, e sono rispettivamente di tipo t1 , . . . , tn , l’espressione che si ottiene da A mettendo un accento circonflesso su tutte le occorrenze delle variabili libere della lista y1 , . . . , yn e chiudendo il risultato in parentesi è un termine di tipo (t1 , . . . , tn ), che si chiama astratto. Le variabili y1 , . . . , yn sono vincolate nel termine cosı̀ formato. Se in A ci sono due o più variabili dello stesso tipo, almeno una delle quali viene a essere vincolata nella formazione dell’astratto, allora le variabili di quel tipo che vengono circonflesse devono essere scritte a pedice del termine, nell’ordine della prima occorrenza da sinistra a destra. Una notazione più usuale per gli astratti, per chi è abituato alla teoria degli insiemi, è quella di {y | A(y)} per A(ŷ), per y libera in A. Ovviamente anche l’interpretazione insiemistica di x(t) (xt ) è (xt ∈ x(t) ). Definizione di ordine di un simbolo di tipo: (i) l’ordine del simbolo di tipo “o” è 0; (ii) un simbolo di tipo della forma (o, . . . , o) ha ordine 1; (iii) un simbolo di tipo della forma (t1 , . . . , tn ) è di ordine n + 1 se il massimo ordine dei simboli di tipo ti è n. Definizione di ordine di un termine: (i) l’ordine di una variabile o di una costante è l’ordine del simbolo di tipo che occorre come indice nella variabile; (ii) se A è un astratto, sia n il massimo ordine di tutte le sue variabili (vincolate e libere) e delle costanti. Se esiste una variabile vincolata y di ordine n in A, A è di ordine n + 1; se no, A è di ordine n. Esempio Il termine (o) (o) ((∀x1 )x1 (x̂01 )) è un termine di tipo (o). Questo simbolo di tipo ha ordine 1, ma il termine ha ordine 2 perché contiene una variabile quantificata di ordine 1. L’ordine di un astratto è sempre maggiore o uguale dell’ordine del suo tipo. Definizione Un astratto è predicativo se e solo se l’astratto ha lo stesso ordine come l’ordine del suo tipo. Altrimenti è detto impredicativo. Esempio di una costruzione non predicativa nella dimostrazione che ogni insieme di numeri reali limitato superiormente ha un estremo superiore. 281 Sia G un tale insieme e consideriamo l’insieme dei razionali, di tipo t, che sono elementi di elementi di G, formalmente ((∃x)(G(x) ∧ x(ŷ)). Sia y di tipo t ed n l’ordine di t. Allora perché l’astratto sia ben formato, deve essere x di tipo (t) e G di tipo ((t)). L’astratto ha tipo (t) e quindi dovrebbe avere ordine n + 1 per essere predicativo. Ma l’astratto contiene la variabile libera G di ordine n + 2 ed è di ordine n + 2, quindi non è predicativo. La spiegazione intuitiva delle precedenti definizioni è la seguente: le relazioni e gli insiemi di una gerarchia di tipi sono pensati come costruiti dal basso, in modo che una relazione il cui tipo è di un dato ordine n > 0 è formata solo da relazioni il cui tipo è di ordine è minore di n. Gli individui, il cui tipo ha ordine 0 sono alla base. Le variabili di un dato tipo prendono valori delle relazioni di quel tipo in ogni gerarchia di tipi. Un astratto chiuso definisce o nomina una entità del suo tipo. Se un astratto chiuso A di tipo t non ha l’ordine del suo tipo, deve contenere variabili vincolate il cui tipo ha ordine maggiore o uguale a quello del tipo di A, oppure costanti il cui tipo ha ordine maggiore del tipo di A. In ogni caso, l’astratto definisce una entità facendo riferimento a entità la cui esistenza dipende dalla esistenza di entità del tipo di quella che stiamo definendo. L’ordine di una formula che abbia almeno una variabile libera è definita come l’ordine dell’astratto che si ottiene circonflettendo tutte le variabili libere della formula, e si dice predicativa se il suo ordine è uguale all’ordine del tipo dell’astratto cosı̀ ottenuto. Le variabili hanno ordine uguale all’ordine del loro tipo, per cui in realtà non stanno per entità arbitrarie del loro tipo ma solo per entità definite predicativamente. Questo si realizza con una restrizione sulle regole dei quantificatori. Ad esempio nella particolarizzazione del quantificatore universale il termine sostituito alla variabile deve essere dello stesso tipo e ordine della variabile a cui è sostituito, e quindi predicativo. Definizione dell’uguaglianza. x = y. ≡ .(∀z (t) )(z (t) (x) ≡ z (t) (y)), dove x e y sono due termine di tipo t in cui z (t) non occorre. Assiomi di PT. PT.1 (A(ŷ1 , . . . , ŷn ))(z1 , . . . , zn ) ≡ A(z1 , . . . , zn ), 282 dove le yi sono variabili libere distinte della formula A(y1 , . . . , yn ) nell’ordine della prima occorrenza da sinistra a destra, e l’astratto è predicativo e per ogni i zi ha lo stesso tipo di yi ed è libera per yi in A(y1 , . . . , yn ). PT.2 (∀z1 ) . . . (∀zn )(x(t1 ,...,tn ) (z1 , . . . , zn ) ≡ y (t1 ,...,tn ) (z1 , . . . , zn )) ⊃ x(t1 ,...,tn ) = y (t1 ,...,tn ) , dove le zi sono di tipo ti e sono tutte variabili distinte che non occorrono nei termini x(t1 ,...,tn ) e y (t1 ,...,tn ) . Si assume inoltre un sistema di logica, come la deduzione naturale, con le ovvie restrizioni ad esempio sulle sostituzioni che devono rispettare i tipi. Teorema Per ogni formula A(xt ) predicativa rispetto a xt , ` (∃x(t) )(∀xt )(x(t) (xt ) ≡ A(xt )). Dimostrazione Si parte dalla tautologia (x(t) (xt ) ≡ x(t) (xt )) quindi si passa a (∀xt )(x(t) (xt ) ≡ x(t) (xt )), a (∃y (t) )(∀xt )(y (t) (xt ) ≡ x(t) (xt )), e infine a (∀x(t) )(∃y (t) )(∀xt )(y (t) (xt ) ≡ x(t) (xt )). Si applica quindi la particolarizzazione con il termine (A(x̂t )), che è predicativo perché A(xt ) lo è, e si usa PT.1. 2 Da PT.1 si ha come caso particolare ` (∀xt )((A(ŷ t ))(xt ) ≡ A(xt )), con le dovute restrizioni sintattiche: A(y t ) contiene y t libera ed è predicativa rispetto a y t , xt è libera per y t in A(y t ), e A(xt ) risulta dalla sostituzione di xt a tutte le occorrenze libere di y t . Non si può tuttavia derivare dal teorema la contraddizione di Russell perché (¬ŷ(ŷ)), che dovrebbe essere presa al posto di (A(ŷ t )), non può essere espressa in PT. PT.2 è l’assioma di estensionalità, che insieme alla definizione di uguaglianza permette di dimostrare ` x(t) = y (t) ≡ (∀z t )(x(t) (z t ) ≡ y (t) (z t )), ma solo per i termini55 di tipo diverso da o. 55 Le variabili metalinguistiche per i termini sono x, y, . . ., perché i ti sono riservati ai tipi. 283 La parte destra dell’equivalenza è predicativa rispetto a x(t) , mentre la definizione di uguaglianza non lo è. (o) (o) Si definisce V ((o)) per (x̂1 = x̂1 ), come classe universale per il tipo (0), ma la definizione è proposta solo come esempio, si potrebbe dare anche per gli altri tipi superiori. Per V (o) si usa una formula logicamente valida che dia luogo a un astratto predicativo, ad esempio (x(o) (ŷ 0 ) ≡ x(o) (ŷ 0 ). Si dimostra (o) (o) ` (∀x1 )V ((o)) (x1 ), e più in generale (t) (t) ` (∀x1 )V ((t)) (x1 ), come pure ` (∀xo1 )V (o) (xo1 ). Si definisce Λ(t) per (x̂t1 6= x̂t1 ), come classe vuota per il tipo t, e si dimostra ` (∀xt1 )(¬Λ(t) (xt1 )). Si possono quindi dare le definizioni di singoletto, complemento, intersezione e unione ponendo {x(t) }((t)) per (ŷ (t) = x(t) ), con y (t) non occorrente in x(t) (questa precisazione sarà omessa nei casi successivi), (t) (x(t) ) per (¬x(t) (x̂t )), (x(t) ∩ y (t) )(t) per (x(t) (ẑ t ) ∧ y (t) (ẑ t )), (x(t) ∪ y (t) )(t) per (x(t) (ẑ t ) ∨ y (t) (ẑ t )). La definizione dello 0, per il tipo minimo per cui ha senso la classe vuota, è 0((o)) =def {Λ(o) }((o)) , quella di successore (t) S(x((t)) )((t)) =def (∃z t )(ŷ (t) (z t ) ∧ x((t)) (ŷ (t) ∩ {z t }(t) )). La definizione naturale dei numeri, N ((((o)))) è impredicativa: (((o))) ((∀x1 (((o))) )(x1 ((o)) (0((o)) ) ∧ (∀x2 (((o))) )(x1 (((o))) ⊃ x1 ((o)) (x2 ((o)) (x̂3 284 (((o))) ) ⊃ x1 ))). ((o)) ((o)) ) )) (S(x2 ⊃ Non si può quindi usare PT.1 per ottenere un astratto e relativamente ad esso dimostrare gli assiomi di Peano. Come assioma dell’infinito si può assumere PT.3 (o,o) (∃x1 (o,o) )((∀xo1 )(¬x1 (o,o) ∧(∀xo1 )(∀xo2 )(∀xo3 )(x1 (o,o) (xo1 , xo1 )) ∧ (∀xo1 )(∃xo2 )(x1 (o.o) (xo1 , xo2 ) ∧ x1 (xo1 , xo2 ))∧ (o,o) (xo2 , xo3 ) ⊃ x1 (xo1 , xo3 ))). la teoria dei tipi TT La teoria dei tipi TT ha lo stesso linguaggio e assiomi e regole di inferenza come PT ma senza la restrizione predicativa. Il sistema si chiama anche teoria semplice dei tipi, a meno di non riservare questo nome a una ulteriore semplificazione che vedremo in seguito. la teoria ramificata dei tipi RT Nei Principia mathematica Russell ha usato una diversa presentazione formale. Le variabili erano differenziate non solo per tipo ma anche per ordine, sı̀ che si ((o),(o,o))/5/(3,2) dovrebbe scrivere x1 per indicare una variabile di tipo ((o), (o, o)) e ordine 5, il cui primo argomento è di tipo (o) e ordine 3 e il secondo di tipo (o, o) e ordine 2. Il sistema RT della teoria ramificata dei tipi ha infatti come variabili e costanti lettere con pedice un numero naturale > 0 e apice espressioni della forma “o/0” o “(t1 , . . . , tn )/k/(y1 , . . . , yn )” dove i ti sono simboli di tipo, k e gli yi sono numeri naturali con la restrizione che per ogni i il numero yi è maggiore o uguale dell’ordine del corrispondente tipo ti , e k è maggiore del massimo dei valori degli yi ; e se ti è o, allora yi deve essere 0 (i numeri che seguono immediatamente il simbolo di tipo sono l’ordine; l’espressione completa è il tipo-ordine). Definizione delle formule: (i) variabili e costanti sono termini con il tipo-ordine indicato; (ii) se x è un termine di tipo-ordine (t1 , . . . , tn )/k/(y1 , . . . , yn ), e z1 , . . . , zn sono termini di tipo rispettivamente ti , e di ordine minore o uguale agli yi , allora x(z1 , . . . , zn ) è una formula; (iii) espressioni ottenute combinando formule con connettivi e quantificatori sono formule; (iv) se A(z1 , . . . , zn ) è una formula nella quale le variabili libere zi occorrono nell’ordine della prima occorrenza, sono di tipo ti e di ordine yi , e k è il massimo ordine di tutte le variabili e le costanti nella formula, allora (A(ẑ1 , . . . , ẑn )) è un termine di tipo-ordine (t1 , . . . , tn )/r/(y1 , . . . , yn ), dove r è k se la formula non ha variabili vincolate di ordine k, e k + 1 altrimenti. 285 Gli assiomi RT.1, RT.2 e RT.3 di RT sono gli stessi che per PT, dove la definizione di predicatività ora diventa: Un termine di tipo-ordine (t1 , . . . , tn )/k/(y1 , . . . , yn ) è predicativo se e solo se k è y + 1, dove y è il massimo degli ordini y1 , . . . , yn . Le variabili e le costanti di tipo-ordine o/0 sono predicative. Se si escludono dal linguaggio di RT tutti i termini eccetto quelli di tipo-ordine o/0 e (t1 , . . . , tn )/k/(y1 , . . . , yn ), dove gli yi sono gli ordini di ti e k è l’ordine di (t1 , . . . , tn ), allora le formule di RT corrispondono in modo naturale a quelle di PT, e gli assiomi e le regole ristrette a queste formule costituiscono un sistema equivalente a PT. Scriviamo le formule indicando a latere il tipo-ordine delle variabili, invece di scriverlo come apice. Il sistema PM si ottiene da RT aggiungendo Assioma di predicatività (∀x)(∃w)(∀z1 ) . . . (∀zn )(w(z1 , . . . , zn ) ≡ x(z1 , . . . , zn )), dove x è di tipo-ordine (t1 , . . . , tn )/k/(y1 , . . . , yn ) e w è predicativa di tipo-ordine (t1 , . . . , tn )/r/(y1 , . . . , yn ), r ≤ k. Nella notazione di Russell: (∃y)(∀x)(y!(x) ≡ A(x)). la teoria semplice dei tipi ST Il sistema ST dei tipi semplici, o semplificati, si ottiene riducendo le relazioni a insiemi, con la definizione insiemistica della coppia ordinata. Una relazione tra termini di tipo n ed m diventa, con la definizione di sotto, un insieme di tipo max(n, m) + 3. Formalmente i tipi sono ora “o” e “(. . . (o) . . .)” con n coppie di parentesi, o più semplicemente 0 e n. Le gerarchie di tipi sopra un insieme D dato sono gli insiemi della gerarchia T0 = D Tn+1 = P(Tn ). Gli assiomi sono gli stessi di TT, numerati nello stesso modo, salvo le ovvie modifiche di scrittura. 286 Assiomi di SP SP.1 (A(ŷ))(x) ≡ A(x), con x libera per y in A(y). SP.2 (∀z n )(xn+1 (z n ) ≡ y n+1 (zn )) ⊃ xn+1 = y n+1 , dove x = y è definita da (∀z)(z(x) ≡ z(y)) per x e y di tipo n e z di tipo n + 1. ST.3 (∃x31 )((∀x01 )¬x31 (hx01 , x01 i) ∧ (∀x01 )(∃x02 )(x31 (hx01 , x02 i)∧ ∧(∀x01 )(∀x02 )(∀x03 )(x31 (hx01 , x02 i) ∧ x31 (hx02 , x03 i) ⊃ x31 (hx01 , x03 i))). 287