caricato da barberobelli

Dove va la matematica: Saggi scientifici di Keith Devlin

Saggi scientifici
Keith Devlin
Dove va la matematica
Bollati Boringhieri
Prima edizione marzo 1 9 94
© 1 9 9 4 Bollati Boringhieri editore s.r. l . , Torino, corso Vittorio Emanuele 86
I diritti di memorizzazione elettronica, di riproduzione e di adattamento totale o parziale
con qualsiasi mezzo (compresi i microfilm e le copie fotostatiche) sono riservati
Stampato in Italia dalla Stampatre di Torino
CL 6 1 -980 1 -5
ISBN 88-339-08 4 0-2
Titolo originale Mathematics: The New Golden Age
Penguin Books 1 988
© 1988 Keith Devlin
Traduzione di Annarosa Giannetti e Agnese Manassero
Indice
7
Fonti delle figure
8
Ringraziamenti
9
Prefazione
Dove va la matematica
IJ
r.
Numeri primi, scomposizione in fattori e codici segreti
Il più grande numero primo del mondo, 13
Numeri primi, 14
I test di pri
malità, 18
I numeri primi di Mersenne, 2 2
Scomposizione in fattori, 2 5
I numeri di Fermat, 27
Una mente matematica strabiliante, 30
Numeri
perfetti, 3 1
Codici segreti, 3 4
4I
2.
Gli insiemi, l'infinito e la non-decidibilità
Nuovi orizzonti, 41
Il metodo assiomatico, 4 2
Un esempio: gli interi, 45
Consistenza, completezza, verità, 47
I teoremi di incompletezza di Godei, 49
La teoria assiomatica degli insiemi, 5 0
Insiemi infiniti, 54
I transfiniti e
il problema del continuo di Cantor, 58
Il teorema di Cantor, 6 1
66
3.
I sistemi numerici e il problema del numero di classi
La soluzione di un problema che ha 1 80 anni, 66
Le notevoli proprietà del nu
mero 1 63 , 66
I primi sistemi numerici, 71
I numeri negativi, 73
I numeri
reali, 74
I numeri complessi, 76
I quaternioni, Br
Gli interi di Gauss, 82
Il problema del numero di classi, 83
88
4.
Bellezza dal caos
La bellezza in matematica, 88
Quanto è lunga la linea costiera della Gran Bre
tagna?, 90
Nuove dimensioni, 94
Alla scoperta di un nuovo mondo, 99
Ordine e caos, r oo
Gli insiemi di Julia, 1 05
L'insieme di Mandelbrot, 1 08
II5
5·
I gruppi semplici
É variste Galois, I I6
Il teorema enorme, I I 5
La simmetria, I 20
Il concetto di gruppo, I 2 2
Altri esempi di gruppi, I 3 0
I gruppi semplici, I 3 5
I l problema della classificazione, I 3 8
L e diciotto famiglie e i gruppi spora
dici, I 40
r47
6 . Il decimo problema di Hilbert
Una breve rassegna storica, I 4 7
Le equazioni diofantee e l'algoritmo eucli
deo, I 49
Algoritmi e macchine di Turing, I 5 2
Insiemi calcolabili, I 5 5
I l decimo problema d i Hilbert, I 6o
I conigli d i Fibonacci e l a risoluzione di
Matjasevic, I 63
r67
7.
Il problema dei quattro colori
La matematica con il calcolatore diventa adulta, I 6 7
Il problema di Guth
rie, I 69
Mappe, grafi e topologia, I 7 2
La formula di Eulero, I 7 7
Il teo
rema di de Morgan, I 8o
Il teorema dei cinque colori, I 8 I
Il metodo di
Kempe, I 86
La formula di Heawood, I 88
Verso il teorema dei quattro
colori, I 90
Il metodo della carica di Heesch, I 9 2
La dimostrazione del teorema dei quattro colori, I 94
I97
8. L'ultimo teorema di Fermat
Il problema più famoso della matematica, I97
Le terne pitagoriche, 20I
Il
caso n=4, 203
Il caso n= 3, 208
Altri due casi: n= 5 e n = 7 , 2 I O
Gli
interi ciclotomici e l' annuncio di Lamé, 2 rr
Kummer e i numeri ideali, 2 I 3
I numeri primi regolari, 2 I 4
La situazione attuale, 2 I 6
Il futuro, 2 I 9
22r
9 · Problemi difficili sui numeri complessi
Un argomento complesso, 2 2 I
Divertimenti con i numeri, 225
tante tra i problemi irrisolti , 227
L'ipotesi di Riemann, 2 3 3
tura d i Mertens, 2 3 6
L a congettura d i Bieberbach, 242
249
I O.
Il più impor
La conget-
Nodi e altre questioni topologiche
Boy scout, fisici, e un altro libro , 249
Cos'è la topologia?, 2 5 0
Come si
fa topologia?, 2 56
Topologia dei nodi, 2 5 9
Oltre la superficie, 2 70
La
congettura di Poincaré, 2 7 7
La teoria delle varietà, 279
284
I I.
L'efficienza degli algoritmi
Ancora algoritmi, 284
Il problema del commesso viaggiatore, 288
Ritorno alla realtà: la programmazione lineare, 293
30r
Letture di approfondimento
305
Indice dei nomi
30 9
Indice analitico
P e NP, 290
Fonti delle figure
Figure 4 . 1 , 4 . 1 0-4 . 1 6: H. O. Peitgen e P. H Richter, La bellezza dei frattali, Bollati Boringhieri,
Torino 1 987 .
Figure 4 . 2 , 4 . 3 : B. Mandelbrot , Fractals: Form, Chance and Dimension, W. H. Freeman and
Co. , New York 1 9 7 7 .
Figura 4 . 7 : L. M. Blumenthal e K . Menger, Studies i n Geometry, W. H . Freeman and Co. , New
York 1 970.
Figure 7·4 e 7 . 1 : « Scientific American>>, W. H . Freeman and Co., New York.
Figura 1 0 . 1 0 : Cordon Art BV.
RINGRAZIAMENTI
Come tutti i matematici d ' oggi, posso definirmi esperto in un' area minima
di un campo vasto e in continuo sviluppo . Quindi, nel tentativo di offrire
un rendiconto esauriente, son dovuto ricorrere all ' aiuto di altri studiosi per
eliminare gli errori inevitabilmente presenti nella prima stesura. I miei rin
graziamenti spettano perciò a Sir Michael Atiyah, Amanda Chetwynd, David
Nelson, S tephen Power, Hermann te Riele, Morwen Thistlethwaite e David
Towers, che hanno letto tutto o parte del manoscritto e mi hanno dato pre
ziosi suggerimenti. Grazie anche alla Penguin Books che fin dall ' inizio ha
dimostrato vivo interesse per quello che poteva sembrare un compito impos
sibile, la compilazione di un testo « divulgativo » sulla materia più impene
trabile concepita dall' uomo. Eventuali omissioni ed errori sono imputabili
esclusivamente a me .
Prefazione
Al giorno d'oggi, la matematica sembra attraversare una nuova età
dell'oro. «Nuova», certo; ma quale è stata la prima? Forse il periodo
degli antichi geometri greci intorno al3oo a. C.? O piuttosto il secolo
XVII, quando Newton e Leibniz sviluppavano il calcolo infinitesimale
e Fermat lavorava alla teoria dei numeri? O forse la carriera matema
tica di Gauss da sola (r7n-r855) merita il titolo di età dell'oro. O,
più tardi ancora, lo merita il periodo che vide il lavoro di Riemann,
Poincaré, Hilbert e altri. Effettivamente, tra la metà dell'Ottocento
e l'inizio della seconda guerra mondiale la produzione matematica
fu veramente portentosa.
Come per qualsiasi altro settore della ricerca umana, non è possi
bile stabilire in modo categorico quale sia stato il «periodo più grande».
Ogni generazione costruisce sul lavoro delle precedenti, e si può dire
che la nostra epoca è erede di tutta la ricerca matematica del passato.
Nell'Annuario internazionale dei matematici compaiono circa 2 5 500
nomi di matematici professionisti di tutto il mondo, il che rappresenta
solo una piccola parte del numero reale, senza contare poi la schiera
dei «dilettanti» (alcuni dei quali hanno comunque fatto scoperte signifi
cative). Stando a questi dati (criterio peraltro poco attendibile, poi
ché, soprattutto in matematica, quantità e qualità non sono necessa
riamente sinonimi), la nostra dovrebbe essere una nuova età dell'oro.
Il mio intento è quello di far conoscere ai non addetti ai lavori,
che pure abbiano un qualche interesse a questi problemi, gli sviluppi
più recenti nel campo della matematica. Per ragioni di spazio ho dovuto
essere molto rigoroso nella scelta degli argomenti. Innanzitutto mi sono
limitato alle vicende dei venticinque anni che vanno dal r96o al r985,
IO
PREFAZIONE
con maggior attenzione alla seconda parte di questo periodo. Poiché
il libro è destinato a un vasto pubblico, ho trattato solo argomenti
che hanno meritato l'attenzione della stampa mondiale e che meglio
si prestano alla divulgazione. Naturalmente, le scelte sono state anche
condizionate dai miei gusti e preferenze personali.
Al lettare si richiede solo interesse e un po ' di pazienza: capire la
matematica, anche a livello superficiale, richiede tempo. Inevitabil
mente, alcune parti saranno più facilmente comprese da chi abbia una
discreta preparazione matematica, ma mi sono sforzato di contenerle.
(Comunque, in una prima lettura si potrà sempre sorvolare su qual
che punto che risulti difficile). Sebbene i capitoli siano per la maggior
parte indipendenti l'uno dall 'altro, sono ordinati in modo che la let
tura dei primi faciliti la comprensione di quelli seguenti.
Nonostante le limitazioni di cui si è detto e il poco spazio a disposi
zione, ho cercato di presentare un po ' della ricca varietà della matema
tica odierna, ma temo che quanto qui esposto rappresenti solo la punta
di un iceberg. Pur consapevole delfatto che un libro come questo possa
non colpire nel segno, spero almeno che non se ne discosti troppo.
Lancaster, maggio 1986
Dove va la matematica
C apitolo
1
Numeri primi, scomposizione in fattori e codici segreti
Il più grande numero primo del mondo
Il più grande numero primo>'' conosciuto al mondo è un gigante
che per essere espresso nella notazione decimale standard richiede
6 5 050 cifre. Usando una notazione esponenziale, cioè sotto forma
di potenza, esso acquista una dimensione più maneggevole:
0
2 2 16 9 1_ I .
Ciò significa che il numero in questione si ottiene moltiplicando 2
per se stesso 2 I 6 090 volte, e quindi sottraendo I dal risultato .
La notazione esponenziale è ingannevole . Per tentare di farsi
un'idea della sua capacità di rappresentare grandi numeri, imma
giniamo di prendere una normale scacchiera di 8 caselle per 8 e
di collocarvi delle pile di gettoni spessi due millimetri, per esem
pio monete da I oo lire, in base alla seguente regola. Numeriamo
le caselle da I a 64 . Sulla prima casella collochiamo due gettoni;
sulla casella due ne mettiamo quattro; sulla casella tre, otto e così
via, collocando su ciascuna casella esattamente due volte il numero
di gettoni di quella precedente . Sulla casella n avremo allora una
pila di 2" gettoni. In particolare, sull'ultima casella avremo una pila
di 2 64 gettoni. Quanto sarà alta questa pila? Un metro? Cento
metri? Un chilometro? Niente affatto ! Che ci crediate o no, la
nostra pila di gettoni si estenderà oltre la Luna (lontana solo 400 ooo
chilometri) e il Sole (I 50 milioni di chilometri) , e di fatto raggi un*
Vedi oltre per la spiegazione di questo termine.
CAPITOLO PRIMO
gerà quasi la stella più vicina, Proxima Centauri, che dista qual
cosa come quattro anni luce dalla Terra. Nella notazione decimale,
il numero 2 64 è
I 8 446 744 073 709 55 I 6 I 6 .
Questo solo per 2 64 • Per ottenere il numero 2 216091 che compare
nell'espressione del numero primo record avremmo bisogno di una
scacchiera di 465 caselle per 465 !
Come si fa a trattare numeri di queste dimensioni? Per comin
ciare potremmo usare un calcolatore, e non uno qualsiasi: il numero
primo record visto poc' anzi è stato scoperto utilizzando una delle
macchine più potenti del mondo (un mostro capace di eseguire due
cento miliardi di operazioni aritmetiche al secondo) , e anche così
il calcolo ha richiesto più di tre ore . Ma la sola potenza di calcolo
non è sufficiente: occorre anche l'abilità del matematico . Nel
seguito di questo capitolo parleremo di come si sia sviluppata que
sta abilità, e degli altri campi ai quali può essere applicata.
Numeri primi
« L' azione migliore è quella che procura la massima felicità per il
maggior numero », scriveva nel I 7 25 Francis Hutcheson, nella sua
Inquiry into the Origina l of our Ideas of Beauty and Virtue. Sembra
inverosimile che pensasse al « numero » nel senso matematico del
« più grande numero primo conosciuto » e via dicendo, ma ciò nono
stante la sua affermazione si applica abbastanza bene all'eterno
fascino esercitato sull'uomo dagli oggetti matematici più basilari:
i numeri naturali, quelli che servono per contare: I , 2 , 3 , . . . Questi
oggetti matematici astratti sono fondamentali non solo per la nostra
vita quotidiana, ma praticamente per tutta la matematica, tanto
che Leopold Kronecker, un matematico del secolo scorso , scrisse:
« Dio creò i numeri naturali e tutto il resto è opera dell'uomo ».
I numeri naturali godono di varie proprietà, rispetto alle quali
i numeri stessi si dividono in due classi: quelli che ne sono dotati
e quelli che ne sono privi . Per esempio esiste la proprietà di essere
pari, la quale ripartisce i numeri naturali nella classe dei numeri
che sono appunto pari (2 , 4, 6 ecc .) e in quella dei numeri che non
lo sono (i numeri dispari: I , 3 , 5 , 7 ecc . ) . Oppure la proprietà di
15
NUMERI PRIMI
essere divisibili per 3 (Qui e altrove, in questo libro, quando affer
miamo che un numero divide un altro intendiamo dire che lo fa
esattamente, senza ottenere alcun resto; quindi 3 , 6, 9, I 2 sono
tutti divisibili per 3 , mentre I , 2 , 4, 5 , 7 non lo sono) . La ripar
tizione pari-dispari è naturale e importante, quella tra i numeri
divisibili per 3 e i numeri che non lo sono non è così naturale
e neppure così importante. Un altro esempio di classificazione
naturale (e importante) è data dalla proprietà di essere un qua
drato perfetto, come I = I 2 , 4 = 2 2 , 9 = 3 2 , I 6 , 2 5 , 3 6 , . . . . E ce
ne sono altre . Ma la suddivisione di gran lunga più importante
dei numeri naturali è quella tra i numeri che sono primi e quelli
che non lo sono .
Un numero naturale n si dice primo se i soli numeri per cui è
divisibile sono I e n stesso . Il numero I è un caso speciale, e per
convenzione non lo si considera primo .
Così 2 , 3 , 5 , 7 , r r , I 3 , q, I 9 sono tutti numeri primi; I , 4 ,
6, 8 , 9 , I o , I 2 , I 4 , I 5 , I 6, I 8 , 2 0 non lo sono ( i numeri che non
sono primi sono talvolta chiamati composti) . Per esempio, 7 è primo,
perché nessuno dei numeri 2 , 3 , 4, 5 , 6 lo divide; I 4 non è primo,
poiché è divisibile sia per 2 sia per 7 .
Il motivo principale per cui i numeri primi sono così importanti
era già noto al matematico greco Euclide (ca 350-300 a. C .) , il quale
nel libro IX dei suoi Elementi (una summa in tredici volumi di tutto
lo scibile matematico di allora) dimostrò quello che oggi è noto
come il teorema fondamentale dell 'aritmetica : ogni numero naturale
maggiore di I è primo, oppure può essere espresso in modo unico
come prodotto di numeri primi, a prescindere dall'ordine in cui
questi sono disposti .
Per esempio, il numero 75 900 è il prodotto di sette /attori primi
(due dei quali fattori ripetuti) :
7 5 900 = 2
X
2
X
3
X
5
X
5
X
II
X
23 .
L'espressione a destra del segno d'uguaglianza è la scomposizione
in fattori primi del numero 7 5 900 .
Il teorema fondamentale dell' aritmetica ci dice che i numeri
primi sono i « mattoni » con cui sono costruiti tutti i numeri natu
rali: come tali, essi equivalgono agli elementi della chimica e alle
particelle elementari della fisica. La conoscenza della scomposi-
16
CAPITOLO PRIMO
zione in fattori primi di un numero qualsiasi offre al matematico
informazioni quasi complete su quel numero, come sarà bene illu
strato più oltre in questo capitolo (vedi il paragrafo sui codici
segreti) . Ma per il momento, cosa possiamo dire sui numeri primi
in quanto tali?
Il primo quesito che ci si può porre a proposito dei numeri primi
è quanto siano frequenti . Esiste, per esempio, un massimo tra i
numeri primi, oppure essi proseguono all'infinito, diventando sem
pre più grandi? A prima vista sembrano essere davvero molto fre
quenti. Dei primi dieci numeri dopo I (cioè, da 2 a I I inclusi) ,
cinque sono primi: 2 , 3 , 5 , 7 , I I , esattamente la metà del totale .
Dei successivi dieci numeri, da I 2 a 2 I , ce ne sono tre primi
( I 3 , I 7 , I 9) , cioè il 3o per cento circa. Tra 2 2 e 3 I la percentuale
dei primi è di nuovo del 3o per cento, mentre nei due gruppi suc
cessivi di dieci numeri scende al 20 per cento . Sembra così che
i numeri primi diminuiscano man mano che si avanza lungo la serie
dei numeri naturali . La tabella I . I mostra il numero dei primi
minori di n (denotato da :rr: ( n)) per alcuni valori di n, e fornisce
in ciascun caso la misura della « densità » :rr:( n )/n .
Abbiamo visto che i primi diventano sempre più rari man mano
che si procede nella sequenza dei numeri . Ma finiscono per esau
rirsi completamente? La risposta è no . Anche questo fatto fu dimo
strato da Euclide, usando un argomento che a tutt'oggi rimane
un modello di eleganza del ragionamento matematico. Innanzitutto,
immaginiamo i numeri primi disposti in ordine crescente:
Pt , P2 , p , , ···
Così P 1 = 2 , p 2 = 3 , p, = 5 e così via. Si tratta di dimostrare che
questa successione deve continuare all'infinito, ovvero, in altre
Tabella 1 . 1 La distribuzione dei numeri primi; :n:(n)
è il numero di primi minori di n
n
:n:(n)
:n:(n)/n
I 000
1 0 000
1 00 000
I 000 000
1 68
229
9 59 2
78 498
o, r 68
0,1 23
0,096
0,078
l
17
NUMERI PRIMI
parole, che per ogni n, avendo enumerato P�> p2 , , Pm deve esserci,
oltre Pn , un ulteriore numero primo nella lista. Il trucco consiste
nel considerare il numero
• • •
N = P 1P2 P3 . . . pn + I
ottenuto moltiplicando tra loro tutti i numeri primi p1, p2 , p 3 e
così via fino a Pn , e poi sommando I al risultato . Ovviamente N
è maggiore di Pn , cosicché se N fosse primo sapremmo che esiste
un numero primo oltre Pn , che è quanto vogliamo dimostrare.
D ' altro canto, se N non fosse primo, sarebbe divisibile per qual
che primo, diciamo p. Ma se si prova a dividere N per uno qualun
que tra i numeri primi p1, p2 , . . . , Pn si ottiene sempre il resto di I ,
il medesimo I che era stato aggiunto nella costruzione di N. Così
il nostro p deve essere un numero primo diverso da quelli della
lista. Dunque, in ogni caso ci sarà un numero primo maggiore di
Pn , il che ci consente di concludere che la lista dei primi continua
all'infinito .
Si tenga presente che non sappiamo se il numero N sopra otte
nuto è primo o no. Facendo qualche prova, scopriremo che i numeri
costruiti in modo analogo sono spesso primi: per esempio,
Nl
N2
N3
N4
N5
=
=
=
=
=
2 + I = 3.
2 x 3 + I = 7.
2 X 3 X 5 + I = 3I,
2 x 3 x 5 x 7 + I = 2!!,
2 x 3 x 5 x 7 x I I + I = 23 I I '
sono tutti primi . Ma i tre successivi non lo sono :
N6 = 2 x 3 x 5 x 7 x I I
N7 = I9 x 97 x 2 7 7 ,
Ns = 3 4 7 X 2 7 953 ·
x
I 3 + I = 3 0 03 I = 59
x
509,
In effetti, nessuno sa se ci sia un numero infinito di primi della
forma
Nn = P1P2 . . . pn + I ,
né, viceversa, se ci sia un numero infinito di numeri composti della
stessa forma (sebbene almeno una delle due possibilità deve natu
ralmente essere vera) . Questo è soltanto uno dei tanti quesiti sui
18
CAPITOLO PRIMO
numeri primi, tutti formulati in modo elementare, di cui è scono
sciuta la risposta.
Uno dei più famosi quesiti irrisolti sui numeri primi è la conget
tura di Golbach . In una lettera a Eulero scritta nel I 74 2 , Chri
stian Goldbach ipotizzò che ogni numero pari maggiore di 2 fosse
una somma di due primi. Per esempio :
4
6
8
IO
12
=
=
=
=
=
2
3
3
5
5
+
+
+
+
+
2,
3.
5.
5,
7.
Grazie ai calcolatori, la congettura di Goldbach è stata verificata
per tutti i numeri pari fino a I oo milioni, ma a tutt'oggi non ne
è stata dimostrata definitivamente la verità o la falsità.
I test di primalità
Sebbene la maggior parte dei problemi classici relativi ai numeri
primi siano rimasti insoluti, gli ultimi anni hanno visto un note
vole sviluppo di metodi che consentono di appurare se un numero
è primo o no . « Metodi per verificare la primalità? - ci si può
chiedere - Ma è ovvio come si fa! » In effetti, c'è un modo natu
rale e diretto per stabilire se un numero è primo oppure no . Dato
un numero, diciamo n, vediamo in primo luogo se è divisibile per
2 ; se lo è, allora n non è primo, e il problema è risolto . Poi pro
viamo con 3 ; se 3 divide n, allora n non è primo, e di nuovo il
problema è risolto . Poi proviamo a dividere n per 5 (possiamo tra
lasciare 4: dal momento che 2 non divide n se siamo arrivati a questo
punto, neppure 4 può dividerlo) . Se 5 non divide n, proviamo con
7 (di nuovo possiamo tralasciare 6, poiché né 2 né 3 dividono n) ;
e così via . Se arriviamo a .Jn senza trovare un numero che divida
n, allora sappiamo che n deve essere primo (se n non fosse primo,
sarebbe il prodotto di due numeri u e v compresi tra I e n, che non
possono essere entrambi maggiori di .Jn).
Il processo di cui sopra è noto come il metodo della divisione
per tentativi. Quantunque funzioni abbastanza bene per numeri rela-
NUMERI PRIMI
tivamente piccoli, esso diventa di difficile applicazione quando
entrano in gioco numeri molto grandi. Per rendersi conto di quanto
risulti poco pratico, supponiamo di dover scrivere un programma
che realizzi il metodo della divisione per tentativi sul più veloce
calcolatore esistente (ne abbiamo fatto cenno all'inizio di questo
stesso capitolo) . Per un numero di I o cifre il programma termine
rebbe il calcolo all'istante e la risposta apparirebbe immediatamente.
Per un numero di 20 cifre ci impiegherebbe due ore. Per un numero
di 50 cifre richiederebbe dieci miliardi di anni . Un numero di I oo
cifre richiederebbe
I 000 000 000 000 000 000 000 000 000 000 000 000
anni, un numero con trentasei zeri . Questo non è solo un inutile
calcolo di un numero molto grande: come sarà spiegato più avanti
in questo capitolo, una delle tecniche crittografiche più sicure
oggi in uso richiede primi costituiti da un numero di cifre che va
da 6o a I oo .
Come s i può stabilire, dunque, s e u n numero d i I oo cifre è
primo? Il miglior metodo attualmente disponibile è una tecni
ca molto sofisticata, sviluppata intorno al I 98o dai matematici
Adleman, Rumely, Cohen e Lenstra, e spesso indicata con le loro
iniziali come test ARCL. Quando questo test viene programmato
su un calcolatore veloce come quello menzionato prima, i tempi
di elaborazione sono I o secondi per un numero di 20 cifre, I 5
secondi per un numero di 5 0 cifre e 4 0 secondi per un numero di
I oo cifre . Il computer sarà anche in grado di trattare un numero
di I ooo cifre se gli sarà concessa una settimana di tempo per risol
vere il problema.
Come funziona il test? Bene, dipende da una quantità non in
differente di sofisticati procedimenti matematici (di livello ben
superiore a quello di un tipico corso universitario) , sicché non è
possibile dare qui una risposta esauriente . Non è tuttavia diffi
cile spiegare l'idea chiave del metodo, che si basa su una sem
plice ma acuta scoperta matematica del grande Pierre de Fermat
( I 60 I - I 665) .
Pur essendo un matematico dilettante (era infatti giurista di pro
fessione) , Fermat giunse ad alcuni tra i più profondi risultati mai
20
CAPITOLO PRIMO
visti in matematica. Egli dimostrò che se p è un numero primo,
allora per qualunque numero a minore di p, il numero a P -i- I è
divisibile per p. Per esempio, supponiamo che p sia uguale a 7 e
che a sia uguale a 2 . Allora
ap-l_
I = 26 - I = 64 - I = 63 ,
e in effetti 63 è divisibile per 7 . Provate voi stessi per qualun
que valore di p (primo) e a (minore di p) : il risultato è sempre
lo stesso .
Disponiamo dunque di un metodo per verificare se un numero n
è primo o no . Calcolate il numero 2 n-i - I e verificate se è divi
sibile per n: se non lo è, allora n non può essere primo (infatti,
se n fosse primo, secondo il teorema di Fermat, 2 n-i - I sarebbe
divisibile per n) . Ma che cosa si può concludere se 2 •- i _ I risulta
essere invece divisibile per n? Sfortunatamente non possiamo con
cludere che n è primo, anche se è molto probabile che lo sia. Il
guaio è che, mentre il risultato di Fermat ci dice che 2 •- i - I è
divisibile per n ogniqualvolta n è primo, esso non dice che non
esistano numeri composti aventi la stessa proprietà (è come dire
che tutte le automobili hanno le ruote, ma ciò non vieta che altri
veicoli le abbiano: le biciclette, per esempio) . In effetti, ci sono
numeri non primi che godono della proprietà di Fermat . Il più pic
colo è 3 4 I , che non è primo essendo il prodotto di I I e 3 I ; ma
se lo verificassimo, troveremmo che 2 3 40 - I è in effetti divisibile
per 3 4 I (vedremo tra poco che non è necessario arrivare a calco
lare 2 3 4 0 ) . I numeri composti che si comportano come primi per
quanto si riferisce alla proprietà di Fermat sono chiamati pseudo
primi. Così se, quando verifichiamo la primalità usando il risul
tato di Fermat, scopriamo che 2 n - i - I è veramente divisibile
per n, allora possiamo concludere che n è o primo o pseudoprimo,
anche se la probabilità che n sia primo è molto alta. Infatti, seb
bene gli pseudoprimi siano infiniti, essi sono molto meno frequenti
dei primi autentici: per esempio, ce ne sono solo due minori di
I ooo e solo 245 al di sotto del milione.
Detto per inciso , non cambia molto se invece di 2 usiamo qual
che altro numero, per esempio 3 o 5 , nella verifica della proprietà
di Fermat . Qualunque numero si usi, ci sarà qualche pseudoprimo
21
NUMERI PRIMI
che ci impedirà di ottenere una risposta inappellabile al nostro que
sito sulla primalità.
Usando il test di cui sopra, non è necessario calcolare il numero
2n-t, numero che abbiamo già notato essere molto grande per
valori anche modesti di n. Tutto quanto dobbiamo fare è stabilire
se 2n-t_ I è divisibile per n. Ciò significa che possiamo ignorare
i multipli di n in qualunque passaggio del calcolo .
In altre parole, ciò che dobbiamo calcolare è il resto che otter
remmo se 2n-t_ I fosse diviso per n. Lo scopo è di vedere se
questo resto è zero o no, ma poiché i multipli di n sono ovvia
mente ininfluenti nel calcolo del resto, possiamo ignorarli . Mate
matici e programmatori hanno un modo standard per indicare il
resto : il resto di a diviso b viene scritto
a mod b .
Così, per esempio, 5 mod 2 = I , 7 mod 4 = 3 , e 8 mod 4 = O .
Per esemplificare il test di Fermat, applichiamolo alla verifica
della primalità del numero 6 I . Dobbiamo calcolare il numero
( 260- I ) mod 6 r .
Se questo non è zero, 6 I non è primo; se è zero, 6 I è o primo
o pseudoprimo (in realtà è un autentico primo, come già sappia
mo) . Cercheremo di evitare di calcolare l'ingombrante numero
260• Incominciamo constatando che 26 = 64, e di conseguenza
26 mod 6 I = 3 . Allora, poiché 230 = ( 26 ) 5, otteniamo :
230
mod 6 I = ( 26 mod 6 I ) 5 mod 6 I = 3 5 mod 6 I = 243 mod 6 I = 6o .
Così :
260 mod 6 I
Quindi:
= ( 230) 2 mod 6 I = ( 230 mod 6 I ) 2 mod 6 I =
= 6o 2 mod 6 I = 3 6oo mod 6 I = r .
( 260- I ) mod 6 I = O .
Poiché il risultato finale qui è O , concluderemo che 6 I è o primo
o pseudoprimo, come abbiamo premesso .
A questo punto può darsi che vogliate cimentarvi da soli con
qualche calcolo . Provate a verificare che
210 mod 3 4 I
= I,
22
CAPITOLO PRIMO
e poi servitevi di questa uguaglianza per dimostrare che
2 H0 mod 3 4 I = r .
Questo risultato vi dice che il numero 3 4 I è o primo o pseudo
primo (in questo caso, come prima accennato, 3 4 I è in realtà uno
pseudoprimo) .
Il test ARCL agisce in modo da modificare il test di Fermat, così
che non possa essere « ingannato » da uno pseudoprimo . È questa
modifica che richiede conoscenze matematiche tanto profonde .*
I numeri primi di Mersenne
Il test ARCL è il più veloce test di primalità di impiego generale
attualmente disponibile, dove l'espressione « di impiego generale »
sta a significare che esso funziona con qualsiasi numero dato n .
M a per numeri con strutture particolari ci sono spesso metodi alter
nativi molto più veloci, che sfruttano proprio le particolarità dei
numeri in esame . L'esempio più eclatante riguarda i numeri della
forma 2 n - I . Tali numeri sono oggi chiamati numeri di Mersenne
dal nome di un monaco francese del secolo xvii, Marin Mersenne .
Nella prefazione della sua opera Cogitata Physica-Mathematica
( I 644) , Mersenne affermò che il numero
Mn = 2 n -I
è primo per n = 2 , 3 , 5 , 7 , I3 , I7 , I 9, 3I , 67 , I27 , 257 , ed è compo
sto per ogni altro n minore di 257 . Come se ne rese conto? Nessuno
lo sa. Comunque, era sorprendentemente vicino alla verità. Solo nel
I 947 , quando comparvero le calcolatrici da tavolo, fu finalmente pos
sibile verificare la sua asserzione. Aveva fatto solo cinque errori: M67
e M257 non sono primi, M61 , M89 e M107 sono primi .
I numeri di Mersenne offrono un ottimo metodo per ottenere
numeri primi molto grandi. La rapida crescita della funzione 2 n
all' aumentare di n ci garantisce che i numeri di Mersenne Mn
diventano in fretta molto grandi; l'idea, quindi, è di cercare valori
* Se davvero volete controllare per conto vostro, potete consultare l' articolo di Cohen e
Lenstra, Primality testing and Jacobi sums, « Mathematics of Computation », XLII (r 984) ,
pp. 297•330.
23
NUMERI PRIMI
di n per i quali M. è primo . Tali numeri primi sono chiamati
primi di Mersenne. Basta un po ' di algebra elementare per capire
che M. non è primo se non lo è n, cosicché bisogna considerare
solo valori primi di n. Ma persino quando n è primo dà origine
quasi sempre a un numero di Mersenne M. composto, ragion per
cui la ricerca di valori appropriati di n non è semplice. Ciò non
emerge affatto dai primi casi, poiché
M2 = 2 2 - I = 3 ,
M} = 2 3 - I = 7 ,
M5 = 2 5 - I = 3 I ,
M7 = 2 7 - I = I 2 7
sono tutti primi. Ma la serie si interrompe con
Mu = 2047 = 23 X 8 9 .
Seguono altri tre valori primi :
Mu = 8 I 9 I ,
M 17 = I 3 I 07 I ,
M19 = 5 2 4 2 87 .
D a questo punto diventa più difficile trovare i numeri primi di
Mersenne . I successivi cinque valori di n per i quali M. è primo
sono 3 I , 6 I , 89, I 07 , I 2 7 .
Vedendo tali numeri per la prima volta, siamo facilmente por
tati a concludere che se p è un primo di Mersenne, allora anche
MP è primo . Questo è senz' altro vero all'inizio : 3 è un primo di
Mersenne e lo è anche M3 ; 7 è un primo di Mersenne e lo è
anche M7 ; altrettanto vale per M3 1 e M 1 2 7 . Ma qui la sequenza si
arresta: sebbene 8 I 9 I sia un primo di Mersenne (poiché corrisponde
a Mu) , M8191 (che ha 2 466 cifre) è composto . Questo fatto fu sco
perto nel I 95 3 utilizzando uno dei primi calcolatori (vedi il para
grafo sui numeri perfetti in questo stesso capitolo) .
In effetti, a tutt'oggi sono noti solo trenta primi di Mersenne.
I dodici valori di n su elencati, per i quali M. è primo, erano tutti
conosciuti fin dai primi anni di questo secolo . I successivi cinque
(n = 5 2 I , 6o7 , I 2 79, 2 2 03 , 2 2 8 ! ) furono tutti trovati nel I 95 2
da Raphael Robinson con il calcolatore SWAC. Il valore n = 3 2 I 7
fu scoperto nel I 957 da Hans Riese! usando un BESK. Nel I 96 I
Alexander Hurwitz usò un IBM 7090 per ottenere i valori 4253
CAPITOLO PRIMO
e 4423 e, nel I 963 , Donald Gillies con l 'ILLIAC-11 trovò 9689, 994 I
e I I 2 I 3 . Bryant Tuckerman su un IBM 360-9 I scoprì n= I 9 9 3 7
nel I 97 I . Nel I 978, i numeri primi record fecero notizia sui gior
nali: dopo un lavoro di tre anni, che aveva richiesto 3 5 0 ore di
tempo di elaborazione sul CYBER I 74 della California State Uni
versity a Hayward, due liceali diciottenni, Laura Nickel e Curt
Noli, avevano trovato il primo di Mersenne M2 1 70 1 di 65 3 3 cifre .
Un anno dopo Noli migliorò il record con il primo M2 3 2 09 di 6987
cifre . Più tardi nello stesso anno il record spettò a David Slowin
ski, un giovane programmatore del Cray Research di Chippewa
Falls nel Wisconsin che, servendosi del potentissimo CRAY-I, trovò
il primo M44 497 di I 3 3 95 cifre . Nel I 9 8 2 , sulla stessa macchina,
Slowinski mostrò che M86 2 4 3 (con 25 962 cifre) è primo . Poi, pas
sando all' ancor più potente CRAY-XMP, arrivò a scoprire il primo
M1 3 2 049 di 39 75 I cifre . Infine, nel settembre I 985 , a Houston,
nel Texas, un CRAY-XMP di proprietà della Chevron Geosciences
trovò l' attuale detentore del record, cioè il numero M2 1 6 091 di
65 050 cifre. Poiché la Chevron usava il programma « Prime Fin
der » di Slowinski, il merito della scoperta in realtà spetta a que
st'ultimo . La compagnia utilizzava quel programma perché costi
tuisce un valido metodo per evidenziare la presenza di qualunque
errore nel sistema del computer .
Finisce qui la storia? Probabilmente no . Si suppone che non ci
sia un limite ai numeri di Mersenne, ma che ce ne sia un numero
infinito . Tuttavia, questo non è stato dimostrato, e tutto ciò che
sappiamo è che ce ne sono almeno trenta, cioè quelli identificati
fino a ora.
Il metodo adottato per verificare la primalità dei numeri di Mer
senne è molto semplice, sebbene non lo sia la matematica che ne
costituisce la base. È conosciuto come il test di Lucas-Lehmer, dai
nomi di Edouard Lucas, che scoprì l'idea di fondo nel I 876, e di
Derrick Lehmer, che perfezionò il metodo nel I 93 0 . Per verifi
care se il numero di Mersenne M" è primo (assumendo che si sap
pia già che n è primo) , calcoliamo i numeri U (O) , U ( I ) , . . . , U (n - 2)
secondo le regole seguenti:
U (O) = 4 ,
U (k + I ) = ( U (k) 2 - 2) modM" .
25
NUMERI PRIMI
Se alla fine troviamo che U (n - 2 ) = O, allora Mn è primo; se
U (n - 2) ;é O, allora Mn non è primo .
Per esempio, supponiamo di voler usare il test di Lucas-Lehmer
per stabilire se M5 è primo . È un calcolo superfluo, poiché noi
sappiamo già che M5 = 3 I è primo, ma è tuttavia utile per illu
strare il metodo . Abbiamo quindi:
U (O)
U(I)
U(2)
U(3)
=
=
=
=
4,
(4 2 - 2) mod 3 I = I4 mod 3 I = 1 4 ,
( I 4 2 - 2 ) mod 3 I = I 94 mod3 I = 8 ,
(8 2 - 2) mod 3 I = 62 mod 3 I = O .
Poiché U (3 ) = O, M5 deve essere primo .
Se volete cimentarvi voi stessi con qualche calcolo, provate con
M7 = I 2 7 , che è primo, e M11 = 2047, che non lo è (vedi sopra) .
Scomposizione in fattori
Al convegno dell'ottobre I 903 della prestigiosa American Mathe
matical Society, il matematico Frederick Nelson Cole compariva
nella lista degli oratori con una relazione dal titolo senza pretese:
« Sulla scomposizione in fattori di grandi numeri ». Quando venne
il suo turno, Cole si diresse alla lavagna e, senza pronunciar parola,
eseguì il calcolo di 2 elevato a 67, sottraendo poi I dal risultato .
Sempre senza profferir parola, su una parte sgombra della lavagna
moltiplicò tra loro i due numeri I 93 707 7 2 I e 7 6 I 83 8 25 7 2 8 7 .
I l risultato dei due calcoli risultò identico. Cole ritornò a sedere
sempre in perfetto silenzio e (unico caso del genere documentato)
l'intero uditorio presente al convegno dell'American Mathemati
cal Society si alzò e applaudì in modo entusiastico l' « oratore ».
Cole aveva trovato (pare dedicandoci i pomeriggi delle dome
niche per vent' anni) i fattori primi del numero di Mersenne M67•
Fin dal I 876 si sapeva che M67 è un numero composto, ma ciò era
stato scoperto (da Edouard Lucas stesso) usando il test di Lucas
Lehmer, che, sebbene fornisca una risposta al quesito se un numero
dato di Mersenne sia primo o composto, non dà alcuna informa
zione sui fattori di un numero di cui già si sappia che è composto .
CAPITOLO PRIMO
Lo stesso vale per il test ARCL, come si può capire dalla breve descri
zione che ne abbiamo dato, e per qualunque test di primalità attual
mente disponibile.
Come si possono trovare i fattori di un numero che sappiamo
essere composto? Il procedimento per tentativi è chiaramente fuori
discussione, per lo stesso motivo per cui non è praticabile come
test per la primalità. Ma, in pratica, le divisioni successive com
paiono in tutte le attuali realizzazioni dei test di primalità e dei
metodi di scomposizione. Dal momento che ciò può essere fatto
velocemente, è sensato incominciare con le divisioni successive,
diciamo per il primo milione di numeri primi . Se si trova un divi
sore, allora sia il problema della primalità, sia quello della scom
posizione in fattori sono risolti. Se non lo si trova, allora sappiamo
almeno che il numero o è primo o, se composto, ha solo fattori
primi grandi. Quest'ultimo fatto viene usato in un semplice metodo
di scomposizione dovuto a Fermat, che adesso descriveremo .
Supponiamo che n = uv, dove u e v sono entrambi numeri dispari
grandi, e, per esempio, che u � v . Poiché noi sappiamo che n ha
solo fattori primi grandi, questa è la situazione che ci si presenta
quando vogliamo trovarli . Poniamo
x=
Allora O � y
�
( u + v) ,
Y
)
=�
2 (u - v .
< x � n,
e u = x + y, v= x - y, per cui
n = (x + y) (x - y) = x 2 - y 2 ,
che può essere riscritto come
y 2= x 2
_
n2.
Viceversa, se x e y soddisfano l'equazione [ r ], allora n si scompone così:
n = (x + y) (x - y) .
Di conseguenza, scomporre n in un prodotto di due numeri equi
vale a trovare i numeri x e y che soddisfano l'equazione [ r ], nel
qual caso la scomposizione in fattori che ne risulta è data dall'e
quazione [z]. Si tenga presente che tale procedimento non dà neces
sariamente la scomposizione in fattori primi di n; ma una volta
27
NUMERI PRIMI
che un numero è stato scomposto in due fattori, questi a loro volta
possono essere scomposti, compito senza dubbio molto più age
vole, poiché sono numeri più piccoli.
Per trovare x e y come nell'equazione [ r ], iniziamo dal più pic
colo numero k tale che k � Vn; poi proviamo ciascuno dei valori
x = k, x = k + r , x = k + 2 , . . . , controllando ogni volta se x 2 - n
è un quadrato perfetto . Una volta trovata questa x, la scomposi
zione è in effetti completa. Ammesso che n abbia due fattori pressappoco della stessa grandezza (e perciò vicini a Vn, da cui il metodo
prende avvio) , la soluzione si dovrebbe trovare abbastanza in fretta.
Se a questo punto volete sperimentare voi stessi il metodo, i numeri
1 0 3 7 9 e 93 343 costituiscono un buon esempio .
Ci sono vari modi per sveltire questo processo . Per esempio,
se fate i calcoli a mano, non è necessario estrarre la radice qua
drata di x 2 n ogni volta, per vedere se è un numero intero. Poi
ché nessun quadrato perfetto finisce con 2 , 3 , 7 o 8, ogniqualvolta
trovate che x 2 - n finisce con una di queste cifre potete immedia
tamente ignorare quel valore di x.
Lo stesso Fermat usò questo metodo per ottenere la scomposi
zione in fattori
-
2 0 2 7 65 r 2 8 r = 44 o2 r X 46 o6 r .
I programmi per i calcolatori usano alcuni metodi piuttosto sofi
sticati per « eliminare all'istante » valori impossibili di x (processo
noto, per evidenti motivi, con il nome di setacciatura) . Nel 1 974,
alcuni matematici dell'Università della California a Berkeley
costruirono un dispositivo elettronico ideato espressamente per
setacciare i numeri, lo SRS- r 8 r , che può trattare 20 milioni di
numeri al secondo .
I numeri di Fermat
L'n-esimo numero di Fermat Fn si ottiene elevando 2 alla poten
za n, elevando ancora 2 al numero ottenuto, e aggiungendo r al
risultato :
Fn = 2 2 " + I .
Così F0 = 3 , Ft = 5 , F2 = 1 7 , F3 = 2 5 7 (è evidente la rapida ere-
CAPITOLO PRIMO
scita di questi numeri, dovuta all' applicazione ripetuta della fun
zione esponenziale) e F4= 2 1 6 + I= 65 53 7 .
S i cominciò a provare interesse per questi numeri in seguito a
una dichiarazione fatta da Fermat in una sua lettera a Mersenne
nel I 64o. Avendo notato che ciascuno dei numeri compresi tra
F e F4 è primo, Fermat scrisse: « Ho trovato che i numeri della
0
forma 2 2" + I sono sempre primi, e da allora ho sostenuto con
gli analisti la validità di questo teorema ». Tale osservazione do
vrebbe servire come avvertimento a tutti coloro che giungono a
una conclusione basandosi su poche informazioni, perché, nono
stante la sua grande dimestichezza con i numeri, Fermat era in
errore . Ciò fu dimostrato per la prima volta in modo inequi
vocabile dal grande matematico svizzero Eulero nel I 73 2 : F5=
= 4 2 94 967 2 9 7 non è primo . Sebbene Eulero sia giunto a que
sto risultato applicando il metodo delle divisioni successive, l'i
ronia della sorte vuole che un calcolo diretto che si serve proprio
del test di Fermat dimostri la non primalità di F5• V ediamolo :
se p è primo, allora 3 p-I modp = I , ma per p= F5 otteniamo
3 p-I modp= 3 0 2 9 0 2 6 I 6o, quindi F5 non può essere primo .
Ulteriori studi hanno dimostrato quanto Fermat fosse in errore:
ora sappiamo che F. è composto per tutti i valori di n da 5 a 2 I ,
come pure per vari altri valori, e l'ipotesi più diffusa è che F. sia
composto per tutti i valori di n superiori a 4 ·
I numeri di Fermat offrono un altro esempio di numeri di forma
particolare la cui primalità può essere verificata velocemente . Un
metodo comune è fornito dal teorema di Proth : il numero di Fer
mat F. è primo se e solo se
3 !F,- 0'2 m od F.=
-
r.
Questo risultato fornisce un test di primalità molto valido per i
numeri di Fermat . Come probabilmente avete già intuito, esso è
strettamente collegato con il test di Fermat trattato prima. Ma
adesso non ci interessa tanto la verifica della primalità dei numeri
di Fermat , quanto la scomposizione in fattori dei numeri che sap
piamo essere composti. Infatti, è in questo campo che negli ultimi
anni si sono registrati sviluppi significativi, sviluppi che hanno tro
vato impieghi anche al di fuori della matematica (vedi il paragrafo
sui codici segreti in questo stesso capitolo) .
NUMERI PRIMI
Come abbiamo già visto, Eulero dimostrò che il numero di Fer
mat F5 è composto, e ne calcolò anche un fattore primo: 64 r . Nel
I 88o Landry dimostrò che F6 è composto, e anche questa volta
si trovò subito un fattore primo : 2 7 4 I 7 7 · Per F7 la trafila fu un
po ' diversa: nel I 905 Morehead e Western dimostrarono che era
composto, ma solo nel I 97 I Brillhart e Morrison (dotati di un IBM
3 60-9 I ) trovarono la scomposizione in fattori
F7 = 21 2 S + I
= 340 2 8 2 3 66 9 2 0 938 463 463 374 6o7 43 I 768 2 I I 45 7
= 59 649 589 I 2 7 497 2 I 7 x 5 704 689 2 00 685 I 2 9 054 7 2 ! .
Essi applicarono un metodo proposto molto prima da Lehmer e
Powers che comportava l'impiego di frazioni continue, e il calcolo
richiese circa un'ora e mezza. Versioni migliorate del metodo delle
frazioni continue, come è oggi chiamato, costituiscono alcuni dei
metodi più efficaci attualmente disponibili per la ricerca dei fattori.
Gli stessi Morehead e Western dopo aver dimostrato nel I 905
che F7 è composto, scoprirono nel I 909 che anche Fs è composto .
Fu solo nel I 98 I che Brent e Pollard ne trovarono la scomposi
zione in fattori, e ci vollero due ore di calcoli su un UNIVAC uoo/42 .
Il metodo escogitato da Pollard era a quel tempo insolito, in quanto,
diversamente dalla maggior parte dei metodi adottati in matema
tica, non garantiva di produrre un risultato . Si sapeva solo che,
se si fosse eseguito un certo calcolo, allora sarebbe stato molto pro
babile trovare una scomposizione in fattori del numero entro un
lasso di tempo ragionevole, ma esisteva una piccola possibilità di
insuccesso . (In questo si distingueva dal metodo delle divisioni suc
cessive, nel quale è piccola la probabilità di ottenere un risultato
entro un miliardo di anni ! ) Nonostante l' elemento di casualità, il
vantaggio del metodo di Pollard era dato dal fatto che la probabi
lità di successo nella scomposizione era assai alta. La tecnica della
scomposizione in fattori di Pollard è un esempio di metodo Monte
Carlo ; questi metodi, comparsi recentemente, non offrono la cer
tezza di un risultato, ma un'alta probabilità di successo in un tempo
molto minore .
I due fattori primi di Fs (che ha 78 cifre) sono
I 2 3 8 9 2 6 3 6 I 5 5 2 897
30
CAPITOLO PRIMO
e
Fino al momento in cui sto scrivendo, nessuno è riuscito a scom
porre F9• Se il matematico tedesco Karl Friedrich Gauss fosse
ancora in vita nel nostro tempo, in cui disponiamo di veloci calco
latori, forse potrebbe essere di aiuto . Egli giunse a quello che sen
z' altro deve essere considerato il più strabiliante risultato sui numeri
di Fermat, collegandoli a un problema classico della geometria greca.
A questo punto non possiamo non fare una presentazione partico
lare di una delle menti matematiche più geniali che il mondo abbia
mai conosciuto.
Una mente matematica strabiliante
Karl Friedrich Gauss nacque a Brunswick, in Germania, nel
r 777 . Il padre, muratore, sperava che il figlio potesse aiutarlo nel
suo lavoro, sia come manovale sia nella contabilità. Il giovane Gauss
sembrò molto idoneo a quest'ultimo compito quando, a soli tre
anni, fu in grado di correggere i calcoli per le paghe fatti dal padre.
Fortunatamente per il futuro della matematica, per non parlare
della fisica e dell' astronomia, il duca di Brunswick venne a sapere
del bambino prodigio e si assunse l'impegno di provvedere alla sua
istruzione . All'età di quindici anni, avendo sorpassato di molto
i suoi stessi insegnanti, Gauss frequentò il Collegium Carolinum,
dove, nel giro di tre anni, superò anche i suoi professori .
Nel 1 796, quando era ancora studente, Gauss giunse alla sor
prendente dimostrazione della relazione tra la geometria classica
e i numeri di Fermat . Il risultato apparve nella settima e ultima
parte della sua opera colossale Disquisitiones Arithmeticae (pubbli
cata ancora oggi) , apparsa nel r 8o r quando Gauss aveva solo ven
tiquattro anni, che costituisce la base della teoria dei numeri. Il
contenuto di questo capitolo è una piccola parte di tale settore della
matematica, che tratta delle proprietà dei numeri naturali.
Uno dei problemi preferiti dai matematici della Grecia antica
era la costruzione di figure piane (cerchi, triangoli, parallelogrammi
31
NUMERI PRIMI
e così via) servendosi solo di una riga (non graduata, e quindi adatta
solo per tracciare linee rette) e di un compasso (usato solamente
per disegnare archi di circonferenza, e non per riportare una lun
ghezza) . Servendosi, a volte, di procedimenti ingegnosi, è possi
bile costruire un gran numero di figure geometriche usando solo
questi due strumenti rudimentali . Fino alla metà degli anni ses
santa, tali costruzioni costituivano una parte significativa dell'in
segnamento matematico nelle scuole di tutto il mondo . Già i Greci
sapevano costruire poligoni regolari di n lati per n = 3 , 4, 5 , 6,
8 , Io, 1 2 , I 5 , I6 (un poligono è regolare se tutti i suoi lati hanno
la stessa lunghezza e tutti i suoi angoli interni sono uguali) .
Il diciannovenne Gauss dimostrò che un poligono regolare coò.
n lati può essere costruito usando solo riga e compasso se e solo
se n = 2 k per qualche valore di k, oppure n = 2 k p1p 2 . . . p, (per
qualche k) dove p 1 , p2 p, sono numeri primi di Fermat distinti .
In particolare, per un qualsiasi primo p di Fermat si può costruire
un poligono regolare di p lati . Per il primo numero di Fermat,
F0 = 3, si ottiene un triangolo equilatero che è facile da costruire,
e per quello successivo, F1 = 5 , si ottiene un pentagono regolare .
Poiché F2 = 1 7 è anch'esso un primo di Fermat, il risultato di
Gauss mostra che anche un poligono regolare di I 7 lati può essere
costruito usando riga e compasso . Questo fu il primo e l'unico
passo in avanti nella costruzione di poligoni regolari dal tempo
dei Greci, e Gauss fu così orgoglioso della sua scoperta che pre
tese che sulla sua tomba venisse inciso un poligono regolare di
I 7 lati . Sebbene la sua richiesta non sia mai stata soddisfatta, un
tale poligono è scolpito su un lato del monumento eretto in sua
memoria a Brunswick .
• • •
Numeri perfetti
Come rilevarono i pitagorici (i seguaci di Pitagora, matematico
del secolo VI a. C .) , il numero 6 possiede una proprietà abbastanza
singolare : è uguale alla somma dei suoi divisori propri, cioè diversi
dal numero stesso :
6 = I + 2 + 3·
Il numero successivo dotato di questa proprietà è 2 8 : gli unici
CAPITOLO PRIMO
numeri che lo dividono sono I , 2 , 4, 7 , I 4 e 2 8 , e
2 8 = I + 2 + 4 + 7 + J4 .
I pitagorici chiamarono perfetti questi numeri.
Nella sua Introductio Arithmeticae (sec . I d . C .) il matematico
greco Nicomaco elencò quattro numeri perfetti conosciuti, e cioè
6, 2 8 , 496 e 8 1 2 8 . Da questo dato di fatto scaturirono due ipo
tesi: che il numero perfetto n-esimo contenesse n cifre e che i numeri
perfetti finissero alternativamente per 6 o per 8 . Entrambe le
ipotesi sono errate. Per cominciare, non esistono numeri perfetti
di cinque cifre . Inoltre, sia il quinto sia il sesto dei numeri per
fetti terminano per 6, essendo rispettivamente 33 550 3 3 6 e
8 589 869 056. È vero, tuttavia, che qualsiasi numero perfetto pari
termina o per 6 o per 8 : ciò può essere dimostrato direttamente,
e non dipende dal sapere o no quali numeri siano veramente
perfetti .
Nel libro IX dei suoi Elementi, Euclide, intorno al 3o0-350 a. C . ,
dimostrò che se 2 n - I è primo, allora il numero 2 n - 1 (2 n - I ) è
perfetto . Duemila anni dopo, Eulero dimostrò che ogni numero
perfetto pari è di questo tipo . Così fu provata la stretta relazione
tra i primi di Mersenne e i numeri perfetti, il che comporta che
al momento si conoscono esattamente trenta numeri perfetti pari.
Non si conoscono numeri perfetti dispari, e si congettura che non
ne esista alcuno . Quantunque ciò non sia stato dimostrato, vi è
tuttavia qualche prova a favore di tale ipotesi . Si sa che un even
tuale numero perfetto dispari dovrebbe essere più grande di I o 100
e avere almeno I I fattori primi distinti . D ' altro canto, se la storia
può essere maestra, si dovrebbe andare cauti nel fare ipotesi sui
numeri perfetti. Nel suo libro Theory of Numbers del I 8 I I , Peter
Barlow, a proposito dell' ottavo numero perfetto 2 30 (2 31- I ) , un
numero di I 9 cifre scoperto da Eulero nel I 77 2 , scrisse: «È il più
grande che sarà mai scoperto; poiché questi numeri sono sempli
cemente una curiosità priva di qualunque utilità pratica, è impro
babile che qualcuno in futuro prosegua la ricerca ».
Barlow aveva ragione nel dire che i numeri perfetti hanno valore
di semplice curiosità, ma sottovalutava il fascino che le curiosità
possono suscitare, come illustra fin troppo bene la prima parte di
33
NUMERI PRIMI
questo capitolo . I numeri perfetti sono senz' altro singolari . Per
esempio, ogni numero perfetto (pari) è triangolare, il che significa
che può essere rappresentato da un numero di biglie sistemate in
modo da formare un triangolo equilatero (cioè è della forma
� n (n + I ) per qualche valore di n) . Altra particolarità: se pren
diamo un qualsiasi numero perfetto diverso da 6 e sommiamo tutte
le cifre che lo compongono otteniamo un multiplo di nove aumen
tato di un'unità . Collegato a questo fatto è il risultato che la radice
numerica di qualsiasi numero perfetto è I . (Per ottenere la radice nu
merica si sommano tutte le cifre del numero, poi tutte le cifre del
numero così ottenuto e così via, fino a giungere a un numero di
una sola cifra) .
E ancora, ogni numero perfetto è la somma di numeri dispari
consecutivi elevati al cubo . Per esempio :
2 8 = I3 + 3\
496 = I 3 + 3 3 + 5 3 + 7 3 •
Ancora un esempio : se n è perfetto, allora la somma dei reciproci
di tutti i divisori di n è sempre uguale a 2 . Per esempio, 6 ha come
divisori I , 2 , 3 , 6 e
...!.._
I
+ ...!.._ + ...!.._ + ...!.._ = 2 •
6
3
2
In effetti, tale è stato lo sforzo compiuto per la ricerca di que
sti numeri « curiosi » che, nonostante l' affermazione di Barlow sulla
loro inutilità, il loro calcolo è diventato un punto di riferimento
per la misurazione della potenza dei calcolatori. Per esempio, pren
diamo il numero di Mersenne M819t> primo numero a interrom
pere la catena dei primi di Mersenne che a loro volta danno ori
gine a primi di Mersenne (vedi sopra) . Per dimostrare con il test
di Lucas-Lehmer che questo numero di 2 466 cifre non è primo
(e quindi non dà un numero perfetto) ci vollero I OO ore la prima
volta, quando il test venne eseguito nel I 95 3 , sull'ILLIAC-1. Nel
corso degli anni il tempo di calcolo è sceso drasticamente: da 5
a 2 ore su un IBM 7090, 40 minuti su un ILLIAC-11, da 3 a I minuto
su un IBM 3 60-9I, e I O secondi su un CRAY- r .
34
CAPITOLO PRIMO
Codici segreti
Nell' autunno del 1 98 2 , durante un convegno scientifico a Win
nipeg, in Canada, due matematici e un ingegnere informatico usci
rono a bere una birra. I due matematici portarono subito il discorso
sulla scomposizione in fattori di grandi numeri, e sul relativo pro
blema di calcolo . Il programmatore intervenne dicendo che il tipo
di macchina su cui egli lavorava avrebbe facilmente risolto uno
dei principali problemi in cui si erano imbattuti. Così un incontro
casuale in un bar ebbe una ripercussione non indifferente nel campo
della sicurezza dei dati, perché la difficoltà di scomporre in fat
tori sta alla base di una delle forme più avanzate di codice segreto .
La storia di come una teoria matematica apparentemente inutile
ed esoterica sia divenuta la base di sistemi moderni di sicurezza è
uno dei racconti matematici più interessanti di questo secolo e allo
stesso tempo un serio ammonimento per chi sostiene che una sin
gola e limitata ricerca scientifica sia priva di applicazioni pratiche.
Gli stessi matematici sono tra i maggiori detrattori, quando si
tratta di sminuire l'utilità delle loro ricerche. Nel suo brillantis
simo Apologia di un matematico, il grande matematico inglese God
frey H. Hardy dice: « La vera matematica non ha alcun effetto
sulla guerra . Nessuno ha ancora scoperto un uso bellico della teo
ria dei numeri o della relatività, e sembra molto improbabile che
se ne scopra uno ancora per molti anni ».* Questa affermazione è
del 1 940. Nel 1 945 il mondo poté vedere l'orribile smentita dell'af
fermazione di Hardy sugli usi bellici della relatività, sotto forma
di bomba atomica. Per quanto riguarda l'altro suo esempio, la teoria
dei numeri, questo oggetto « inutile » ora fornisce i sistemi di sicu
rezza che sono usati per il controllo (e forse un giorno lo saranno
anche per il lancio) delle centinaia di missili nucleari proliferati
dopo la prima bomba atomica di Hiroshima. Tanta basti per quanto
riguarda le previsioni sulle applicazioni (o meno) delle scoperte
matematiche nel mondo reale. Il campo di ricerca di Hardy era,
guarda caso, proprio la teoria dei numeri, e parte del suo lavoro
si è rivelata di utilità pratica, nonostante la sua affermazione: « Non
*
[G. H. Hardy, Apologia di un matematico, Garzanti, Milano 1 989, p. 99] .
NUMERI PRIMI
35
ho mai fatto nulla di "utile" . Nessuna mia scoperta ha aggiunto
qualcosa, né verosimilmente aggiungerà qualcosa, direttamente o
indirettamente, nel bene o nel male, alle attrattive del mondo ».*
Naturalmente non c'è nulla di nuovo nell'idea dei codici segreti.
Giulio Cesare li usò per garantire la sicurezza degli ordini che
inviava ai suoi generali durante le guerre galliche. Oggigiorno non
sono solo le forze armate ad adottare tecniche crittografiche per
rendere sicure le loro comunicazioni: anche per motivi commer
ciali e politici è opportuno garantire la sicurezza dell'informazione.
Come elaborare un sistema crittografico? « Con grande cura »,
si potrebbe rispondere, celiando ma non troppo . L'ipotetico crit
toanalista (cioè il « nemico » che sta cercando di decifrare il vostro
codice) dispone di molte armi, da potenti calcolatori a sofisticate
tecniche matematiche e statistiche. Certamente i crittogrammi ele
mentari usati da Cesare sono del tutto inadeguati . In un codice
cesareo il messaggio originale viene trasformato sostituendo cia
scuna lettera con un'altra secondo una determinata regola, ad esem
pio rimpiazzandola sempre con la terza lettera successiva dell' al
fabeto, sicché A viene sostituita da D, G da J, Y da B e così via:
la parola « matematica » diventerebbe « pdwhpdwlfd ». A un esame
superficiale, un messaggio crittografato in questo modo appare inde
cifrabile per chi non conosca la regola applicata, ma ciò non è affatto
vero . Ci sono infatti solo 25 possibili slittamenti di cifra, e un
nemico che sospetti che ne stiate usando uno può provarli tutti
uno dopo l'altro, finché trova: quello giusto . E d' altro canto, anche
se si ricorre a un altro criterio meno ovvio per la sostituzione delle
lettere, il codice che ne risulterà non sarà sicuro . Il problema è
che ci sono frequenze ben precise con cui le singole lettere ricor
rono in italiano, come in qualunque altra lingua; contando il numero
di ricorrenze di ciascuna lettera nel vostro testo cifrato, un nemico
può facilmente dedurre il vostro criterio di sostituzione, special
mente se impiega un calcolatore per sveltire il processo .
Escluso il metodo della sostituzione, che altro possiamo ten
tare? Qualunque soluzione adottiate presenta gli stessi pericoli .
Se al vostro testo è applicato uno schema in qualche modo ricono
scibile, un' analisi statistica sofisticata è solitamente in grado di
*
[lbid. , p. 1 05] .
CAPITOLO PRIMO
accedere al codice con discreta facilità. A questo punto emerge
la vera difficoltà: affinché il vostro messaggio sia decodificabile
dal destinatario (probabilmente a mille chilometri di distanza) la
trasformazione operata sul messaggio dal vostro schema crittogra
fico, chiaramente, non deve cambiare del tutto l'ordine; il mes
saggio deve rimanere inalterato dietro allo schema adottato, qua
lunque esso sia. Tuttavia questo ordine deve restare occultato in
modo tale da impedire che un nemico riesca a scoprirlo .
Tutti i sistemi di codice moderni si servono dei calcolatori . Si
può presumere che il nemico possegga potenti mezzi elettronici
per analizzare il vostro messaggio, ai quali il vostro sistema deve
essere in grado di resistere . A causa della difficoltà di progettare
e di rendere sicuri i sistemi cifrati, essi sono invariabilmente co
stituiti da due componenti: una procedura crittografica e una
« chiave ». La prima è di norma un programma o eventualmente
un calcolatore progettato a quel preciso scopo . Per cifrare un mes
saggio il sistema richiede sia il messaggio che la chiave scelta, di
solito un dato numero segreto . Il programma crittografico codifi
cherà il messaggio secondo un criterio che dipende dalla chiave
scelta, cosicché solo conoscendo quest 'ultima sarà possibile deco
dificare il testo cifrato prodotto (fig. I . r ) . Dato che la sicurezza
dipende dalla chiave, il medesimo programma crittografico può
essere usato da molte persone per molto tempo, e ciò significa che
vale la pena di impiegare tempo e fatica per la sua realizzazione.
Un' analogia utile è data dal fatto che i fabbricanti di casseforti
e serrature riescono a rimanere sul mercato realizzando un tipo
di serratura che possa essere venduto a centinaia di clienti, ognuno
dei quali confida sulla unicità della propria chiave a garanzia della
sicurezza . (In questo caso la « chiave » potrebbe essere una parti
colare combinazione, il che mostrerebbe l'affinità fra i due usi della
parola « chiave » in questo contesto) . Proprio come un estraneo non
è in grado di accedere alla vostra cassaforte se non conosce la com
binazione, pur sapendo come è stata progettata la vostra serratura,
così il nemico può sapere quale sistema crittografico state usando
senza tuttavia riuscire a penetrare nei vostri messaggi cifrati, passo
per il quale è indispensabile conoscere la vostra chiave .
In un tipico crittosistema a chiave privata, il mittente e il desti
natario si accordano preventivamente su una qualche chiave segreta
37
NUMERI PRIMI
che poi usano per scambiarsi messaggi. Finché tengono segreta tale
chiave, il sistema, se ben strutturato, dovrebbe essere sicuro . Un
esempio è dato dal sistema di ideazione americana Data Encryp
tion Standard (DES) , la cui chiave è formata da un numero di 56
cifre in rappresentazione binaria (in altre parole una lista di 56
zeri e uno) . Perché una chiave tanto lunga? Perché il funziona
mento del DES non è un segreto per nessuno. Tutti i particolari
sono stati pubblicati, e in teoria un nemico potrebbe decifrare i
vostri messaggi semplicemente provando tutte le possibili chiavi
una dopo l' altra finché ne trova una che funziona. Con il DES ci
sono 2 56 chiavi, un numero così grande da rendere l'impresa vir
tualmente impossibile. In realtà questa cifra non è ancora suffi
cientemente grande per fornire una sicurezza assoluta, ma in qua
lunque sistema cifrato si deve accettare un compromesso tra la
sicurezza e la convenienza per l'utente. Più complessa è la chiave,
più ingombrante diventa il processo .
Sebbene al momento attuale il DES sia ampiamente diffuso,
sistemi come questo hanno un ovvio svantaggio . Prima di poterlo
usare, il mittente e il destinatario devono accordarsi sulla chiave
Mittente
Destinatario
Figura 1 . 1
Un tipico sistema in codice. Il programma di codifica (che può essere un dispositivo
ad hoc, o un programma per un calcolatore qualsiasi) utilizza una chiave segreta scelta
da chi produce il testo in codice. Un sistema analogo opera all'altra estremità. I sistemi
tradizionali impiegano la stessa chiave sia per la codifica che per la decodifica, e il pro
gramma di decodifica compie semplicemente le operazioni del programma di codifica
invertendone l'ordine. I sistemi a chiave pubblica utilizzano due chiavi diverse e la
relazione tra la codifica e la decodifica dipende dalla matematica implicata nel codice.
CAPITOLO PRIMO
che useranno e, poiché non potranno trasmettersela su un qual
siasi canale di comunicazione, dovranno incontrarsi per scegliere
la chiave (o, come minimo, servirsi di un corriere fidato) . Un tale
sistema non è opportuno per comunicazioni tra individui che non
si conoscano già. In particolare, non si presta a essere utilizzato
per scambi internazionali in campo bancario o commerciale, dove
spesso si rivela necessario inviare messaggi in giro per il mondo
a destinatari non conosciuti dal mittente.
Nel 1 975 Whitfield Diffie e Martin Hellman proposero un
nuovo tipo di sistema cifrato, la crittografia a chiave pubblica, in
cui sono richieste non una ma due chiavi, una per cifrare e l' altra
per decifrare : in pratica, è una serratura con una chiave per chiu
dere e una per aprire . Un siffatto sistema funziona così : un nuovo
utente acquista il programma usato da tutti gli appartenenti alla
rete di comunicazione. Quindi, tramite il programma, genera due
chiavi : una delle due, la sua chiave di decodifica, la tiene segreta;
l'altra, quella che sarà usata per cifrare messaggi inviati a lui da
chiunque altro nella rete, la pubblica in una guida degli utenti .
Per inviare un messaggio a un utente della rete, basta cercare la
sua chiave pubblica, cifrare il messaggio usando quella chiave e
spedirlo . Per decifrare il messaggio non serve conoscere la chiave
di codifica, che è nota a tutti: occorre la chiave di decodifica, cono
sciuta soltanto dal destinatario. Con questo sistema neppure il mit
tente è più in grado di decifrare il proprio messaggio, una volta
che lo abbia codificato !
Tutto questo in teoria, ma come costruire, in pratica, un tale
sistema? Sembrerebbe impossibile . La chiave, se mi è concesso di
usare questa parola, consiste nello sfruttare i punti forti e i punti
deboli di quegli stessi calcolatori la cui esistenza rende tanto diffi
cile il compito del crittografo . Come è stato detto prima in questo
capitolo, trovare numeri primi grandi (diciamo dell'ordine di 50
cifre) è relativamente facile, come pure moltiplicarne due per atte
nerne uno solo di un centinaio di cifre o più . Ma scomporre un
tale numero nei suoi due fattori primi è praticamente impossibile .
Questa è l'idea che sta alla base del sistema a chiave pubblica mag
giormente in uso oggi, il sistema RSA, dalle iniziali dei suoi idea
tori Ronald Rivest, Adi Shamir e Leonard Adleman del Massa
chusetts Institute of Technology. La chiave segreta di decodifica
NUMERI PRIMI
39
consiste essenzialmente in due grandi numeri primi scelti dall'u
tente con l' aiuto di un computer (e non certo da un qualunque
elenco di primi, al quale un nemico potrebbe avere accesso) . La
chiave pubblica di codifica è il prodotto di questi due primi . Poi
ché non c'è un metodo veloce di scomposizione di grandi numeri,
è praticamente impossibile recuperare la chiave di decodifica dalla
chiave pubblica di codifica. La cifratura di un messaggio corri
sponde alla moltiplicazione di due grandi numeri primi (processo
relativamente facile) , la decifrazione al processo opposto di scom
posizione in fattori (processo decisamente non facile) . In realtà,
il sistema non è così semplice . Occorre un minimo di conoscenze
matematiche, tutte note dal tempo di Fermat . Il punto importante
è che, poiché decifrare un messaggio è esattamente l'opposto che
cifrarlo, lo stesso deve valere per la relazione tra le due chiavi .
Ecco perché oggigiorno la sicurezza di grandi reti internazio
nali di dati fa affidamento sull'incapacità dei matematici di tro
vare un metodo valido di scomposizione in fattori di grandi numeri,
in grado allo stesso tempo di produrre facilmente grandi numeri
primi. Ovviamente, la sicurezza di tali sistemi dipende dalla diffi
coltà non ancora superata di scomposizione in fattori, oltre che
da altri elementi qui non menzionati. E questo è il punto in cui
si è inserito l'incontro di Winnipeg . Gli ideatori del sistema soste
nevano all'origine che due numeri primi di circa 50 cifre fossero
sufficientemente sicuri (come sempre con sistemi del genere, più
grandi sono i numeri usati, più costoso diventa farli funzionare,
e quindi si cerca un punto di compromesso) . Fino al 1 982 i migliori
metodi di scomposizione sviluppati erano in grado di trattare
numeri di circa 50 cifre, servendosi di grandi macchine come il
CRAY- r . Avendo capito come la struttura particolare delle unità
aritmetiche del CRAY- r poteva essere sfruttata per superare uno
dei problemi su cui erano bloccati, il progettista di computer Tony
Warnock fornì agli esperti di scomposizione in fattori Marvin Wun
derlich e Gus Simmons proprio le informazioni di cui avevano biso
gno per estendere i loro modelli di calcolo a numeri da 6o a 70
cifre . Di colpo i sistemi RSA risultarono meno sicuri . Sebbene la
contromossa sembrasse ovvia (usare numeri primi di r oo cifre cia
scuno per produrre una chiave pubblica di 200 cifre) , questo avan
zamento inatteso causò un'ondata di incertezza nel settore della
CAPITOLO PRIMO
sicurezza delle comunicazioni. Questa sensazione di insicurezza
è stata ancora aumentata da ulteriori progressi nella scomposizione
in fattori; sebbene numeri di 90 cifre sembrino essere l' attuale
limite massimo di scomposizione, la quantità di matematica sofi
sticata che viene comunemente usata per affrontare il problema
potrebbe in qualsiasi momento sfondare tale limite.
C apitolo
2
Gli insiemi, l'infinito e la non-decidibilità
Nuovi orizzonti
T alvolta la risoluzione di un annoso problema segna la fine di
un' area di ricerca in matematica, e il risultato di anni di studi sem
bra chiudere un'era; in altri casi, invece, può dischiudere orizzonti
del tutto nuovi e imprevisti. Questo è quanto accadde nel 1 963
con la soluzione del problema del continuo di Cantor da parte di
Paul Cohen, matematico ventinovenne della Stanford University.
Non solo la natura della soluzione era rivoluzionaria, ma anche
i metodi sviluppati da Cohen per ottenerla erano del tutto nuovi.
Si vide subito che tali metodi avevano una vasta gamma di appli
cazione, e nei venti anni seguenti molte ricerche presero spunto
dalla scoperta di Cohen. In riconoscimento di questo lavoro, al
giovane ricercatore venne assegnata nel 1 966 la medaglia Fields,
la più alta onorificenza che si possa concedere a un matematico,
equivalente al premio Nobel per le altre scienze.
Prima del 1 963 , un matematico, posto di fronte al problema
di determinare la natura di un'ipotesi, aveva due possibilità: pro
varne la verità o la falsità. L'esperienza e l'intuizione sono spesso
le sole guide per capire quale delle due possibilità merita lo sforzo
più grande; una scelta sbagliata può causare un'enorme perdita
di tempo nello sforzo di ottenere l'impossibile. Ma, prima del
1 963 , si aveva sempre la sensazione che alla fine della giornata
si sarebbe arrivati a una risposta. Cohen distrusse per sempre
questa convinzione confortante, dimostrando che ci sono propo
sizioni matematiche che non sono né vere né false, ma indecidibili.
CAPITOLO SECONDO
A onor del vero, l'esistenza di proposizioni indecidibili era già stata
stabilita da Kurt Godei nel I 93 I ma, come spiegheremo più avanti,
non si pensava che questo fatto potesse influenzare la matematica
« quotidiana », come fu invece con il risultato di Cohen.
Per spiegare esattamente ciò che avvenne nel I 963 è necessa
rio risalire alla natura intrinseca della matematica, e ad un'idea
pionieristica dell'inizio del secolo .
Il
metodo assiomatico
Di fronte al problema di determinare la verità o la falsità di
un'ipotesi, fisici, chimici, biologi, insomma, quasi tutti gli scien
ziati approntano qualche esperimento o, come minimo, fanno uso
di qualche ragionamento che dipenda dall'evidenza sperimentale.
Deve essere così, perché queste scienze studiano vari aspetti del
mondo fisico, il quale è l' arbitro finale tra « ciò che è » e « ciò che
non è » . Ma cosa avviene in matematica?
Al livello più elementare, la matematica è molto simile a qual
siasi altra scienza fisica, in quanto sceglie alcuni aspetti del mondo
attorno a noi per studiarli in dettaglio . Così facendo, la realtà
che ci circonda può fornirci qualche informazione. Se si vuole
verificare che la somma degli angoli interni di un triangolo è pari
a I 8o gradi, si può andare in giro a misurare gli angoli di un'e
norme quantità di triangoli . Questa verifica sarebbe certo accet
tata da un fisico o da un chimico, ma non da un matematico;
né un tale procedimento costituirebbe una verifica matematica
dell' asserzione che la somma degli angoli di qualsiasi triangolo
è I 8o gradi .
La ragione per cui un metodo puramente sperimentale non è
adeguato per determinare la verità matematica sta nella natura
stessa della matematica, e in ciò che si vuole che sia. Benché le
sue radici affondino nel mondo fisico, la matematica è una disci
plina precisa e formalizzata. Punti, rette, piani e altri concetti mate
matici non hanno un'esatta contropartita nella realtà (il cap . 4
fornisce alcune interessanti delucidazioni su questo punto) . Il mate
matico si fa una visione del mondo del tutto astratta e idealizzata,
e ragiona con le sue astrazioni in modo assolutamente preciso e
GLI INSIEMI, L ' INFINITO E LA NON-DECIDIBILITÀ
43
rigoroso . Il semplice (ma importante) esempio che segue potrà ser
vire a chiarire le idee .
Una delle astrazioni matematiche più elementari è quella di
numero . È attraverso i numeri che la maggior parte di noi ha fatto
il suo primo incontro, di solito in tenera età, con le astrazioni mate
matiche. Con un processo che sembra quasi un miracolo quando
ci si rifletta, già nei primi anni di vita arriviamo tutti a ricono
scere che c'è qualcosa in comune tra una collezione di tre mele,
una collezione di tre zii, una collezione di tre fiori e così via. Que
sta astrazione dell' « idea di tre » induce la formazione del concetto
mentale del numero tre . Ciò che fa apparire questo miracoloso è
il fatto che il numero tre non esiste affatto in natura; è un concetto
puramente astratto, con cui però siamo talmente familiari che non
ci sentiamo a disagio quando parliamo di « numero tre » o di qual
siasi altro numero . Ci si rende davvero conto del grado di astra
zione quando si prova a spiegare cos'è il numero tre senza usare
la parola « tre »: non ci si riesce, eppure nessuno di noi se ne preoc
cupa. La stessa cosa vale per tutte le altre astrazioni matematiche:
sebbene possano avere le loro origini nel mondo reale, le astra
zioni in quanto tali sono concetti puri, che non esistono al di fuori
della nostra mente.
Il concetto di numero sta alla base di quel settore della mate
matica che è la teoria dei numeri, di cui abbiamo parlato nel capi
tolo precedente. Come possiamo maneggiare dei concetti astratti,
in modo che risultino utili anche nel mondo fisico? Iniziamo ad
elencare qualche regola di base . Per i numeri, questo equivale a
formulare dei postulati (o assiomi) universalmente validi, per poi
procedere con successive deduzioni dai postulati iniziali serven
dosi solo di ragionamenti logici e rigorosi. (È anche possibile sta
bilire postulati che regolino le deduzioni logiche stesse; questo è
il compito della logica matematica, una disciplina strettamente con
nessa con l' argomento di questo capitolo) . Per esempio, sappiamo
per esperienza che quando due numeri sono sommati tra di loro
l'ordine con cui sono presi è senza importanza; così 5 + 3 è lo stesso
di 3 + 5 · Un primo assioma « ragionevole » da includere in un
sistema per l'aritmetica è l' affermazione:
per ogm m e n ,
m + n = n + m.
44
CAPITOLO SECONDO
Questa particolare proposizione è la cosiddetta proprietà commu
tativa dell'addizione. Un altro esempio è la proprietà associativa del
l'addizione:
per ogni m, n e k,
(m + n) + k = m + (n + k) .
Anche questo postulato deriva dall'osservazione del modo di fare
le addizioni nella pratica . Per esempio, se si vogliono addizionare
i tre numeri 3 , 5 e I O , non ha importanza se si sommano prima
3 e 5 (ottenendo 8) e poi si aggiunge I O al risultato, oppure si addi
zionano 5 e I o (ottenendo I 5) e poi si somma 3 : sia in un caso
che nell' altro si ottiene I 8 .
Adottando i due assiomi precedenti abbiamo già fatto un grande
passo, un passo che equivale a un atto di fede. Entrambi gli assiomi
possono essere verificati « sperimentalmente » esaminando molti
numeri, ma non esiste neppure la possibilità teorica di verificare
tutti i casi possibili, poiché sono infiniti . Possiamo allora essere
sicuri che i due assiomi rimangano veri quando i numeri coinvolti
sono molto grandi, per esempio dell'ordine di milioni di cifre? Sem
bra ragionevole, probabilmente anche ovvio . Ma la matematica
(e la maggior parte delle altre discipline) è piena di esempi di « verità
ovvie » che risultano false: sulla base dell'esperienza corrente sembra
persino ovvio che il Sole giri intorno alla Terra! Le prove di cui di
sponiamo possono solo suggerire che i due assiomi siano veri. Non
sarà mai possibile dimostrarlo definitivamente: la loro verità deve
essere assunta a priori. Questo è il motivo per cui tali affermazioni
sono chiamate assiomi, dalla parola latina axioma che significa
« principio ». In un certo senso, è possibile « dimostrare » i due prece
denti assiomi, formulando postulati « più fondamentali » per i numeri
naturali da cui dedurre le più note regole dell' aritmetica; ma que
sto sposta solamente l'atto di fede un passo indietro, non lo elimina.
Per sottolineare il punto principale del capoverso precedente,
vale la pena forse di ricordare che, sebbene entrambe le proprietà
considerate siano accettate come assiomi per l'aritmetica degli
interi, la proprietà commutativa è falsa per determinati sistemi di
numeri infiniti (vedi oltre in questo capitolo) e la proprietà asso
ciativa non vale quando è applicata all' aritmetica del calcolatore
(ciò accade quando numeri molto grandi sono addizionati ad altri
molto piccoli) .
45
GLI INSIEMI, L ' INFINITO E LA NON-DECIDIBILITÀ
A questo punto è bene dare uno sguardo un po' più in dettaglio
allo sviluppo assiomatico di una teoria matematica. Poiché abbiamo
già visto alcuni aspetti dell' aritmetica degli interi (cioè i numeri
interi positivi e negativi) , continuiamo su questa strada.
Un esempio: gli interi
Gli assiomi seguenti permettono uno studio adeguato dell' arit
metica di base (cioè addizione e moltiplicazione) degli interi .
( I ) Per ogni m, n, m + n = n + m e mn = nm (proprietà commu
tativa dell' addizione e della moltiplicazione) .
(z) Per ogni m, n, k, (m + n) + k = m + (n + k) e (mn) k = m (nk)
(proprietà associativa dell' addizione e della moltiplicazione) .
(3 ) Per ogni m, n, k, m (n + k) = (mn) + (mk) (proprietà distribu
tiva della moltiplicazione rispetto all' addizione) .
(4) Esiste un numero O tale che, per qualsiasi numero n, n + O = n
(esistenza dell'elemento neutro additivo) .
(5) Esiste un numero I tale che per qualsiasi numero n, n x I = I
(esistenza dell'elemento neutro moltiplicativo) .
(6) Per ogni numero n esiste un numero k tale che n + k = O (esi
stenza dell'elemento simmetrico additivo) .
(7) Per ogni m, n, k, se k è diverso da O e km = kn, allora m = n
(legge di cancellazione) .
Partendo da questi assiomi, è possibile dimostrare tutte le pro
prietà usuali dell' aritmetica degli interi . A titolo di esempio, c'è
una regola analoga all' assioma 7 che si riferisce all' addizione:
se
k + m = k + n,
allora
m = n.
Per provare questo, si parta dalla relazione k + m = k + n . Allora,
per l' assioma I ,
m + k = n + k.
Per l' assioma 6, sia l un numero tale che k + l = O . Addizionando
l ad entrambi i membri della precedente equazione, otteniamo :
(m + k) + l = (n + k) + l.
46
CAPITOLO SECONDO
Così, per l' assioma 2 :
m + (k + l) = n + (k + l) .
In altre parole, tenendo conto della scelta di l
m + O = n + O.
Usando l' assioma 4, segue subito da quest'ultima equazione che
m=n
come richiesto .
Ancora, per dimostrare che x x O = O per ogni numero x, ragio
mamo come segue .
x + O = x (per l' assioma 4, con n = x) ,
= x X I (per l' assioma 5 , con n = x) ,
= x x ( I + O) (per l' assioma 4, con n = I ) ,
= (x X I ) + (x X O) (per l'assioma 3 , con m = x, n = I , k = O),
= x + (x X O) (per l'assioma 5, con n = x) .
Così dalla proprietà analoga all' assioma 7, valida per l' addizione,
appena provata (con k = x, m = O , n = x X O) :
O=x
x
O.
A questo punto può darsi che il lettore voglia verificare ciascuna
delle seguenti proprietà di base dell' aritmetica degli interi. In cia
scun caso, si dovrebbe assicurare di usare solamente proprietà già
conosciute, o perché sono assiomi o perché sono già state provate.
( I ) Esiste uno e un solo elemento O che soddisfa le condizioni dell' assioma 4, vale a dire: se O ' ha la proprietà che n + O ' = n
per ogni numero n, allora O ' = O (unicità dello O) .
( 2 ) Esiste uno e un solo elemento I che soddisfa le condizioni del
l' assioma 5 (unicità di I ) .
(3) Per ogni coppia m, n esiste uno e un solo numero k tale che
n + k = m.
Si noti che l'ultimo dei risultati precedenti garantisce che la sot
trazione è sempre possibile negli interi (poiché l'unico numero k
sarà m - n) , anche se questa operazione non è stata menzionata
negli assiomi veri e propri. Un caso particolare è quello in cui m = O,
il che prova l'unicità di k nell' assioma 6.
GLI INSIEMI, L ' INFINITO E LA NON-DECIDIBILITÀ
47
Naturalmente, se in matematica fosse necessario dimostrare ogni
affermazione in modo così dettagliato il compito del ricercatore
sarebbe praticamente impossibile. Le cose sono semplificate dal
fatto che la conoscenza matematica è cumulativa: una volta che
una proprietà è stata dimostrata, da quel momento può essere usata
senza difficoltà, come abbiamo fatto in precedenza per provare
che x X O = O. Di conseguenza, queste dimostrazioni minuziose
sono necessarie solo per le parti iniziali di una teoria assiomatica.
Nella maggior parte dei casi il ragionamento matematico è molto
più simile a una versione rigorosa della « logica di base » impiegata
in qualsiasi altra scienza.
Consistenza, completezza, verità
La maggior parte della matematica moderna consiste nel fare
deduzioni da assiomi, che non si riferiscono necessariamente ad
alcunché di fisico . Gli assiomi per l' aritmetica degli interi, dati
nel precedente paragrafo, sono stati ottenuti esaminando il com
portamento delle operazioni di addizione e moltiplicazione su quegli
interi che ci sono familiari (ciò equivale a dire interi piccoli, seb
bene sia utile ricordare che i numeri negativi sono stati definiti
vamente accettati solo nel secolo XVIII, come vedremo nel cap . 3 ) .
Una volta stabiliti gli assiomi, ogni domanda sulla loro « verità »
diventa irrilevante, così come lo diviene il problema di quali siano
gli oggetti ai quali gli assiomi si riferiscono . Ad esempio, in nessuno
degli assiomi dati nel precedente paragrafo è fatta alcuna menzione
di cosa sia esattamente un numero . Esistono infatti molte altre
collezioni di oggetti matematici che pure, come conseguenza della
loro definizione formale, risultano soddisfare questi assiomi. Poiché
i sistemi di assiomi si applicano spesso a situazioni diverse tra
loro, i matematici introducono termini specifici per descrivere
le strutture che soddisfano un particolare sistema assiomatico .
Qualsiasi struttura matematica che soddisfi gli assiomi del para
grafo precedente è detta dominio di integrità (anello, se manca
l' assioma 7) . Così, per richiedere che gli interi, insieme con le loro
operazioni aritmetiche di addizione e moltiplicazione, soddisfino
questi assiomi, è sufficiente dire che essi costituiscono un dominio
CAPITOLO SECONDO
di integrità. I numeri razionali (cioè le frazioni) , i numeri reali e
i numeri complessi offrono altri esempi di domìni di integrità.
Qualsiasi risultato ottenuto tramite deduzioni logiche a partire
da un dato sistema di assiomi sarà vero per le strutture astratte
che soddisfano quel sistema assiomatico; però non solo sarebbe
impossibile rispondere a quesiti sulla « verità » del risultato nel
mondo reale, ma i medesimi non avrebbero significato . Se gli
assiomi forniscono una buona immagine di un fenomeno del mondo
reale, allora anche le conseguenze di quegli assiomi avranno sen
z' altro corrispondenza con il mondo reale e potranno persino offrire
qualche informazione utile, in modo da giovare alla razza umana
(o forse causarne la distruzione) . Per quanto concerne la matema
tica, la pertinenza o meno degli assiomi iniziali è senza importanza.
Alcuni sistemi assiomatici che hanno dato vita a campi di ricerca
molto interessanti non sembrano avere alcun tipo di relazione con
il mondo fisico; tuttavia questo non vuoi dire che non se ne potrà
scoprire una in futuro . A costo di isolarsi dalla realtà, il matema
tico è capace di lavorare in un mondo di assoluta certezza, con
la potenziale ricompensa che il suo risultato trovi applicazioni estese
(in primo luogo all'interno della matematica stessa) , perché il suo
sistema di assiomi si adatta a strutture diverse da quella che aveva,
o che poteva avere, in mente .
Se allora il criterio non può essere quello della « verità», quali
considerazioni regolano la formulazione di un sistema di assiomi?
Un requisito essenziale è la consistenza: non si deve poter dedurre
dagli assiomi due conseguenze tra loro contraddittorie . Questo
requisito deve essere soddisfatto da tutti i sistemi assiomatici, anche
se vedremo che provare la consistenza di un sistema è non solo
difficile, ma implica persino considerazioni filosofiche .
Un altro requisito d'obbligo per qualsiasi sistema assiomatico
che voglia rappresentare una particolare struttura matematica (come
l'aritmetica degli interi) è la completezza: il sistema assiomatico deve
essere abbastanza ricco da permettere la dimostrazione di tutti i
« fatti veri » relativi alla struttura in questione. Soddisfare entrambi
i requisiti precedenti comporta una delicata azione di equilibrio :
per ottenere la completezza, può essere necessario aggiungere nuovi
assiomi, rischiando così di pregiudicare la consistenza.
GLI INSIEMI, L ' INFINITO E LA NON-DECIDIBILITÀ
49
I teoremi di incompletezza di Godet
All'inizio del secolo il matematico tedesco di fama mondiale
David Hilbert propose un programma per lo sviluppo della mate
matica all'interno del formalismo rigoroso del metodo assiomatico .
Secondo la convinzione di Hilbert, tutta la matematica può essere
vista come la manipolazione logico-formale di simboli, basata su
assiomi predefiniti . Questo significa che, in teoria, si potrebbe
« produrre tutta la matematica » con un calcolatore. Nel 1 93 1 , però,
il giovane matematico austriaco Kurt Godei, con due teoremi sor
prendenti e del tutto inaspettati, dimostrò che il programma di
Hilbert non poteva aver successo .
Godei provò che ogni sistema assiomatico consistente, che sia
abbastanza esteso da permettere lo sviluppo dell' aritmetica ele
mentare degli interi, contiene sempre asserzioni che non possono
essere né dimostrate né smentite a partire dagli assiomi di base
(primo teorema di incompletezza) . Inoltre, la consistenza del
sistema è tra quelle asserzioni indimostrabili a partire dagli assiomi,
per cui la nozione di consistenza, fondamentale per il programma
di Hilbert, è destinata a rimanere per sempre ambigua (secondo
teorema di incompletezza) .
Sebbene i risultati di Godei indicassero che il metodo assioma
tico non avrebbe potuto essere elevato alla posizione di onnipo
tenza immaginata da Hilbert, non si deve pensare che essi ne
abbiano decretato la morte: il metodo assiomatico era ed è tut
tora praticato all'interno della matematica ordinaria. Al contra
rio, in questo secolo esso ha assunto una posizione preminente.
Ciò che Godei ci ha costretto ad abbandonare è la convinzione
o la speranza che un sistema assiomatico sia in grado di rispon
dere a tutte le richieste che noi potremmo ragionevolmente fargli.
Di fatto, con il crescente successo del metodo assiomatico, gli
anni dopo l' annuncio di Godei videro gradualmente crescere la
convinzione che soltanto alcune proposizioni molto tecniche non
potevano essere provate . Ad esempio, Godei giunse al primo teo
rema di incompletezza mostrando che nella teoria elementare dei
numeri è possibile formulare un' asserzione analoga a questa, ovvia-
CAPITOLO SECONDO
mente paradossale, in italiano :
la frase inclusa nel riquadro in questa pagina
è falsa .
Nell' analoga proposizione sulla teoria dei numeri di Godei, « falso »
è sostituito da « non dimostrabile ». Proprio perché l'aritmetica ele
mentare è necessaria a formulare una tale proposizione, il risul
tato di Godei si applica solamente a sistemi assiomatici capaci di
svilupparla (ma naturalmente qualsiasi sistema assiomatico desti
nato ad adempiere agli scopi del programma di Hilbert dovrebbe
metterei in grado di ottenere l' aritmetica elementare) .
Inoltre, tornando al secondo teorema di incompletezza di Godei,
sebbene la consistenza di un sistema assiomatico sia un aspetto
importante, il fatto che questa non possa essere provata a partire
dagli assiomi non è poi così grave . Quando si cominciano a fissare
gli assiomi, la loro consistenza viene data quasi per scontata, e l'in
teresse principale sta nelle loro conseguenze . Ad esempio, l'ipo
tesi che gli assiomi dell' aritmetica siano consistenti non è del tipo
di cui in genere si preoccupano i teorici dei numeri, per i quali
i risultati di Godei sull'incompletezza non sono poi così rilevanti.
Perlomeno così sembrava prima che un giovane americano pro
vasse il contrario. Il sorprendente risultato di Paul Cohen del 1 963
cancellò la gradevole sensazione che l'incompletezza non influen
zasse i problemi « veri », colpendo proprio quella parte della mate
matica che ne costituisce il fondamento: la teoria degli insiemi .
La teoria assiomatica degli insiemi
Alla fine del secolo XIX, lo sviluppo della matematica pura (in
particolare dei vari argomenti derivati dal calcolo infinitesimale
di Newton e di Leibniz) portò il matematico tedesco Georg Fer
dinand Ludwig Philipp Cantor a formulare una teoria generale che
sarebbe servita come fondamento di tutta la matematica. La for
mulazione di Cantor è tuttora un valido punto di partenza, ed è
conosciuta come teoria degli insiemi. I suoi concetti e metodi per
vadono praticamente tutta la matematica moderna, ma il suo svi
luppo fin dalle origini è stato assai travagliato, come si vedrà nelle
GLI INSIEMI, L ' INFINITO E LA NON-DECIDIBILITÀ
51
pagine seguenti . Prima, comunque, è necessario soffermarci un
attimo sulla logica formale .
Mentre Cantar sviluppava le sue idee sulla teoria degli insiemi,
e in particolare su un sistema di numeri adatti a misurare la « dimen
sione » degli insiemi infiniti, Gottlob Frege ideava quella che ora
è conosciuta come logica dei predicati. In linea di massima, essa
fornisce un linguaggio formale universale che si adatta all'espres
sione di un qualunque concetto matematico, anche se la sua impor
tanza non è dovuta al reale bisogno o desiderio da parte dei mate
matici di portare avanti il loro lavoro usando tale linguaggio. Invero,
proprio per la sua struttura elementare, l'espressione di un con
cetto o ragionamento matematico nell' ambito della logica di Frege
sarà il più delle volte estremamente lunga e ingombrante . Il lavoro
di Frege è importante per due motivi: primo, perché dimostra abba
stanza chiaramente che tutti i vari settori della matematica sono
parte di un'unica totalità coerente; secondo, molto più importante,
perché ci mette in grado di fare un'analisi corretta dei metodi dedut
tivi usati dai matematici nel costruire le dimostrazioni . (Si deve
notare che, recentemente, è stato fatto largo uso della logica dei
predicati nel tentativo di sviluppare programmi di calcolo che otten
gano, o aiutino a ottenere, teoremi matematici . Ovviamente per
presentare la matematica in una forma adatta al calcolatore si deve
usare un linguaggio preciso e abbastanza semplice, e la logica dei
predicati si presta bene allo scopo) .
Il concetto di insieme introdotto da Cantar è estremamente sem
plice . Un insieme è una collezione di oggetti o, almeno, una colle
zione di oggetti matematici. L'idea nuova consiste nel considerare
la collezione un unico oggetto a tutti gli effetti. Gli insiemi più pic
coli possono essere descritti enumerando i loro membri (o elementi) ,
di solito racchiudendo la lista tra parentesi graffe .
Così la scrittura:
[ 1 , 3, 5. 9 }
denota l'insieme i cui elementi sono i numeri I, 3 , 5, 9· Per insiemi
più grandi (anche infiniti) , non è possibile elencare tutti gli ele
menti, e allora si deve fare assegnamento su qualche proprietà per
determinare l'insieme al quale si sta pensando . La notazione con
venzionale per denotare l'insieme degli oggetti x per cui la pro-
52
CAPITOLO SECONDO
prietà P (x) è valida è:
( x [ P (x) ) .
Allora, l'insieme di tutti i numeri primi (insieme infinito) può essere
denotato con
( x [ x è numero primo ) .
Vi saranno anche insiemi per i quali non esiste una proprietà defi
nitoria, i quali non possono essere descritti per mezzo dei loro
elementi, ma questo punto non è veramente rilevante per una
discussione a livello elementare. (Grosso modo, tali insiemi nascono
« per difetto », poiché la nozione di insieme non implica l'esistenza
di una proprietà che lo determini; ma questo è un problema sot
tile, di livello avanzato) . Ignoriamo per il momento questi insiemi
ambigui a favore di quelli ben definiti, e chiediamoci quali pro
prietà possano essere ritenute valide nella definizione di un insieme.
La risposta di Cantar fu (come ormai possiamo aspettarci) : qual
siasi proprietà che può essere espressa tramite la logica dei predi
cati di Frege, che, proprio per la sua natura formale, è precisa,
e include tutte le proposizioni della matematica.
A questo punto le cose non potrebbero apparire più rosee . La
teoria degli insiemi fornisce un adeguato modello di riferimento
sul quale costruire tutte le strutture e gli oggetti matematici e la
logica dei predicati di Frege offre un linguaggio universale per defi
nire e trattare questi oggetti, ivi inclusa la nozione stessa di insieme.
Anche Frege fece un uso estensivo dei concetti della teoria degli
insiemi nei suoi Grundgesetze der Arithmetik, opera che costitui
sce il punto di arrivo della sua ricerca.
Proprio mentre il secondo volume del suo libro era in stampa,
Frege ricevette una lettera, datata 1 6 giugno 1 90 2 , da Bertrand
Russell. « C 'è un solo punto in cui io ho incontrato una difficoltà »,
scriveva Russell, dopo un primo paragrafo di lodi al lavoro del col
lega; tale « difficoltà » distruggeva completamente l'intera teoria
di Frege .
L'idea, nota come paradosso di Russell, è tanto semplice quanto
profonda. Secondo il principio fondamentale della teoria degli
insiemi di Cantar, se P (x) è una qualsiasi proprietà (esprimibile
con la logica dei predicati) applicabile all'oggetto matematico x,
allora esiste un insieme corrispondente formato da tutti gli x per
53
GU INSIEMI , L ' INFINITO E LA NON-DECIDIBIUTÀ
i quali
P(x)
è vera, cioè l'insieme
{ x i P(x) } .
Niente impedisce che gli oggetti x qui implicati siano a loro volta
insiemi, giacché un insieme è un ente matematico come qualsiasi
altro (anzi, quando la teoria degli insiemi è presa a fondamento
della matematica, ogni ente matematico risulta essere un insieme
di un tipo o di un altro) . Russell prese in considerazione la propo
sizione (applicabile agli insiemi x)
R (x) :
x
non è un elemento di
x.
Il simbolo convenzionale per l' appartenenza a un insieme è E , di
modo che x E y significa che x è membro di y, e la non apparte
nenza è denotata con x f/. y. Così la proprietà di Russell R (x) può
essere scritta come x f/. x.
Diamo ora un nome all'insieme determinato dalla proprietà R (x),
ad esempio y. In questo modo
y
=
{ x l x f/. x } .
Poiché y è un insieme, è ragionevole domandarsi se y è un ele
mento di se stesso . Se è così, allora y deve soddisfare la proprietà
che lo definisce, che è come dire y f/. y, cioè y non è elemento di
se stesso . D ' altro canto, se y non è elemento di se stesso, allora
non può soddisfare la proprietà che lo definisce; quindi y E y, e y
è elemento di se stesso . Così siamo arrivati a una situazione con
traddittoria, dove se y è un elemento di se stesso, allora non lo
è, e se non è elemento di se stesso, allora lo è . Un vero paradosso .
Ciò che rendeva il paradosso di Russell così profondo era la sua
assoluta semplicità. Esso utilizzava solamente i concetti fondamen
tali dai quali dipende praticamente tutta la matematica.
Una soluzione al dilemma provocato dal paradosso di Russell
fu proposta dal matematico tedesco Ernst Zermelo, il cui lavoro
sulle equazioni integrali (un' area della matematica che ha molte
possibilità di applicazione) lo aveva portato a studiare alcuni pro
fondi problemi relativi alla natura degli insiemi infiniti. Nel 1 908,
allo scopo di stabilire un solido impianto insiemistico per il suo
lavoro, pubblicò una ricerca in cui sviluppò un sistema di assiomi
per la teoria degli insiemi. Modificata in seguito da Abraham Fraen-
54
CAPITOLO SECONDO
kel, la teoria degli insiemi di Zermelo-Fraenkel fu gradatamente accet
tata come l'approccio assiomatico « corretto » alla teoria degli insiemi
astratti. Una sua trattazione completa richiederebbe più spazio di
quanto noi disponiamo; la si può però trovare in molti testi ele
mentari (vedi in fondo al volume le Letture d'approfondimento) .
In virtù dei teoremi di incompletezza di Godei, non c'è possibili
tà, naturalmente, di provare che gli assiomi di Zermelo-Fraenkel
per la teoria degli insiemi sono consistenti, ma essi sembrano sfug
gire a paradossi del tipo di quello di Russell e la maggior parte dei
matematici è convinta che non condurranno ad alcuna contraddizio
ne; tale convinzione si è rafforzata man mano che la teoria ha
mostrato di resistere alla prova del tempo e ad usi diversificati.
Questo per quanto riguarda la consistenza. E la completezza?
I teoremi di incompletezza ci garantiscono l'esistenza di proposi
zioni sugli insiemi che non possono essere né provate né confu
tate sulla base degli assiomi adottati. Questa impossibilità assume
un'importanza maggiore del solito a causa della particolare natura
della teoria degli insiemi . Poiché l'intero edificio della matema
tica moderna può essere (e in larga misura lo è in modo esplicito)
costruito su tale teoria, si corre il rischio di fornire basi instabili
a molte importanti aree di ricerca. Nonostante questa possibilità,
gli assiomi di Zermelo-Fraenkel apparvero idonei a fornire una
« buona » teoria degli insiemi, e la maggioranza dei ricercatori ignorò
tranquillamente il pericolo dando per scontato che ciò non li riguar
dasse . Questo fu vero fino al 1 963 , quando Cohen uscì alla ribalta
con la sua scoperta.
Sebbene il risultato di Cohen trovi ora applicazione in nume
rosi settori, inizialmente interessò in modo particolare un problema
che implicava i numeri « transfiniti » di Cantor, la cui teoria si rivelò
ben fondata dopo la formulazione degli assiomi di Zermelo
Fraenkel. È giusto quindi il momento di inoltrarci nell'infinito e
di dare uno sguardo alla teoria di Cantor .
Insiemi infiniti
Anche se il mondo in cui viviamo è finito, la matematica che
ci serve per studiarlo coinvolge l'infinito quasi ad ogni passo: l'in-
GLI INSIEMI, L ' INFINITO E LA NON-DECIDIBILITÀ
55
sieme di tutti i numeri naturali è un insieme infinito, la scrittura
precisa del numero :n richiede infinite cifre decimali, il numero
di punti sulla più piccola delle linee è infinito e così via. Si sono
fatti dei tentativi per evitare l'uso dell'infinito, ma la matematica
che ne risulta viene ad essere assai ingombrante e pesante. Mal
grado la sua completa astrazione, l'infinito è un mondo estrema
mente semplice. Andare dal finito all'infinito è come allontanarsi
dallo schermo televisivo : quando si è abbastanza lontani, la com
plessità indecifrabile delle numerose e minuscole macchie luminose
che occupano lo schermo assume la forma di un'immagine coerente;
andando all'infinito, la complessità del finito si perde. Questo feno
meno non è limitato alla matematica pura. In economia, ad esem
pio, si preferisce studiare sistemi economici idealizzati con un
numero infinito di operazioni piuttosto che i sistemi circoscritti
ma molto complessi del mondo reale, e in fisica si usa la nozione
di volumi infiniti per studiare alcuni concetti relativi al calore e
all'energia elettrica.
Il lavoro pionieristico di Cantor sulla teoria degli insiemi giunse
a completamento proprio grazie allo sviluppo del sistema dei cosid
detti numeri (o cardinali) transfiniti e della loro aritmetica. Ci si
potrebbe domandare: « Perché abbiamo bisogno di tali numeri? »
Per la stessa ragione per cui abbiamo bisogno di numeri finiti: per
contare il numero di elementi di un insieme. I numeri naturali ser
vono per misurare la dimensione di un insieme finito, mentre per
misurare la dimensione di un insieme infinito sono necessari i trans
finiti (vedremo tra poco che un solo « tipo » di infinito non è suffi
ciente) . Avendo accettato questo punto, ci si potrebbe domandare
che cos 'è un numero transfinito . Una buona risposta potrebbe
essere: « Cosa è un numero finito? » Come dicevamo all'inizio di
questo capitolo, i numeri naturali sono semplici prodotti dell'im
maginazione, per cui postulare l'esistenza di numeri infiniti non
dovrebbe essere poi tanto diverso . Ciò che importa è come questi
numeri infiniti si comportino, e questo è il punto chiave della teo
ria di Cantor .
I numeri naturali vengono astratti da insiemi finiti, siano essi
di tipo matematico o reali, come insiemi di mele, insiemi di per
sone e così via: il numero tre è ciò che tutti gli insiemi di tre ele
menti hanno in comune. Questa sembrerebbe a prima vista una
CAPITOLO SECONDO
definizione « tautologica », che non è affatto una definizione, ma
Cantor osservò che le cose non stavano così. Piuttosto, prima di
parlare di transfiniti dobbiamo spiegare il concetto di cardinalità
degli insiemi, che ora vedremo .
Due insiemi, chiamiamoli A e B , hanno la stessa dimensione o
cardinalità se è possibile accoppiare i loro elementi in modo tale
che ogni elemento di A sia associato esattamente a un elemento
di B e viceversa. Così per esempio, gli insiemi
A = ( I, 2, 3, 4 ) ,
B = I OO ,
:n ,
..J2,
�
hanno la stessa cardinalità, come si può vedere dalla corrispon
denza (che non è l'unica possibile) :
2
I
I OO
3
4
t
t
I
2
..J2
:n
Allo stesso modo gli insiemi
A = ( a, b, c ) ,
B = ( piede, calza, scarpa )
hanno la stessa dimensione in virtù della corrispondenza
a
b
c
t
piede
calza scarpa.
Si noti che in nessuno dei due casi emerge il concetto di « numero
di elementi » nell'insieme: per parlare di « uguale cardinalità » non
è necessario avere a priori la nozione di « cardinalità », né c'è alcun
bisogno di considerare solo insiemi finiti. Le stesse idee sono appli
cabili a insiemi infiniti (anche se in questo caso non è possibile
descrivere esplicitamente la corrispondenza) . Quando passiamo agli
insiemi infiniti, tuttavia, ci troviamo subito di fronte a qualche
risultato inaspettato . Ad esempio, sia A l'insieme dei numeri natu
rali e sia B l'insieme dei numeri pari . Intuitivamente, B dovrebbe
essere « la metà » di A, ma secondo la nostra definizione questi
due insiemi hanno la stessa cardinalità, come è testimoniato dalla
57
GLI INSIEMI, L ' INFINITO E LA NON-DECIDIBILITÀ
corrispondenza
I
2
3
4
5
t
t
t
t
t
2
4
6
8
IO
t
Non c'è comunque contraddizione, o , se c'è, è solamente con i
nostri preconcetti . Non bisogna dimenticare che gli insiemi infi
niti non sempre si comportano nello stesso modo di quelli finiti.
Una simpatica illustrazione del genere di comportamento che
si presenta con gli insiemi infiniti è fornita dall'albergo di Hilbert.
Questa istituzione puramente astratta ha un numero di stanze infi
nito, numerate con I , 2 , 3 e così via per tutti i numeri naturali.
Una notte accade che tutte le stanze sono occupate da un numero
infinito di ospiti. Tuttavia, un ritardatario può essere ancora allog
giato senza che nessuno venga messo fuori: basta sistemare il nuovo
arrivato nella stanza I , spostando il suo occupante nella stanza 2 ,
l'occupante di quella nella 3 e così via . Tutti gli ospiti sono spo
stati nella camera successiva, permettendo così al nuovo arrivato
di occupare la camera I (in effetti è possibile sistemare infiniti ritar
datari; riuscite a vedere come?) Sebbene l'idea di un albergo infi
nito possa sembrare assurda, non c'è niente di sbagliato rispetto
alla logica interna della discussione. Anche se contrario all'intui
zione, questo è il genere di cose che succede quando si comincia
ad esplorare il mondo dell'infinito .
L'esempio dei numeri naturali e dei naturali pari potrebbe
indurci a ipotizzare che tutti gli insiemi infiniti abbiano la stessa
cardinalità, il che significherebbe che non occorre un sistema di
numeri transfiniti . In realtà, ciò accade per molti insiemi infiniti
che si incontrano comunemente in matematica: ne sono un esem
pio l'insieme dei numeri primi, l'insieme dei numeri naturali, l'in
sieme dei numeri interi e l'insieme dei numeri razionali. Gli insiemi
aventi la stessa cardinalità dei naturali sono spesso chiamati nume
rabili, poiché mettendoli in corrispondenza con i naturali è possi
bile contare i loro elementi; ma, come scoprì C antor, non tutti
gli insiemi infiniti hanno la stessa cardinalità, perché c'è un'intera
gerarchia infinita di infiniti, che diventano sempre più grandi. La
dimostrazione di Cantor di questo punto centrale è allo stesso
CAPITOLO SECONDO
tempo semplice ed elegante, e utilizza solo le nozioni fondamen
tali della teoria degli insiemi . È nondimeno molto astratta, e pro
prio per questo motivo sarà trattata a fine capitolo per chi voglia
approfondire l' argomento . Qui ci limiteremo a dire che l'insieme
dei reali non ha la stessa cardinalità dell'insieme dei naturali, pur
avendo la stessa cardinalità dell'insieme dei punti del piano e del
l'insieme dei punti dello spazio tridimensionale .
I transfiniti e il problema del continuo di Cantor
Una volta che si sia afferrato il concetto di cardinalità si può
procedere a sviluppare un sistema di « numeri » che può essere usato
per « misurare » qualsiasi insieme, sia esso finito o infinito (i numeri
in sé saranno solo delle astrazioni, naturalmente) . Il punto impor
tante è che se due insiemi hanno la stessa cardinalità (vale a dire
se i loro elementi possono essere associati nel modo descritto nel
paragrafo precedente) , allora il numero di elementi di ciascun
insieme deve essere uguale. Così ad esempio, quando si misura la
cardinalità dei due insiemi
{ Fred, Elsie, Fido ) ,
{ a , b, c ) ,
si trova che entrambi hanno lo stesso numero di elementi, per l'esat
tezza tre . Analogamente, quando si misura la cardinalità dei due
insiemi infiniti
{ I,
2 , 3 , 4, 5 , . . ) ,
.
{ 2 , 4, 6, 8,
I O, . . . ) ,
si trova di nuovo che essi hanno lo stesso numero di elementi; in
questo caso tale numero è il più piccolo dei transfiniti, indicato
da Cantar con il simbolo �0, (si legge aleph-zero : « aleph » è la
prima lettera dell' alfabeto ebraico; il motivo per cui si sottoscrive
lo zero sarà chiaro tra un momento) .
Cosa è il « numero tre »? Ciò che tutti gli insiemi di tre elementi
hanno in comune o, per dirla in altro modo, è ciò che è comune
a tutti gli insiemi aventi la stessa cardinalità dell'insieme { a, b, c ) :
« tre » è un' astrazione che emerge dalla nozione di cardinalità. Ci
sono vari metodi in matematica per rendere precisa questa affer
mazione, ma qui non ne prenderemo in esame nessuno . Il punto
GLI INSIEMI, L ' INFINITO E LA NON-DECIDIBILITÀ
59
principale è che la finitezza non è affatto rilevante. Così se si accetta
il concetto di « numero tre » non si dovrebbe avere difficoltà ad
accettare il « numero 1'\ 0 », che accomuna tutti gli insiemi aventi
la stessa cardinalità dell'insieme degli interi positivi .
Come detto prima, non tutti gli insiemi infiniti hanno la stessa
cardinalità: esiste una intera gerarchia infinita di infiniti; proprio
come c'è una serie infinita di numeri finiti I , 2 , 3 , . . . , così pure
c'è una serie infinita di transfiniti 1'\0, 1'\ 1 , 1'\ 2 , 1'\ 3 , . . . , ciascuno
maggiore di quello precedente .
L' addizione e la moltiplicazione degli aleph di Cantor vengono
ad essere particolarmente semplici (e quasi sorprendenti, a prima
vista) . In tutti e due i casi il risultato è dato dal maggiore tra i
due transfiniti . Così ad esempio
1'\ o + 1'\ 1 = 1'\ 1 ,
1'\ 1 x 1'\ 3 = 1'\ 3 .
La proprietà dell'albergo di Hilbert corrisponde al fatto che 1'\ 0 +
+ I = 1'\0; per far « traboccare » l' albergo dovrebbero arrivare 1'\ 1
ospiti.
Molti degli insiemi infiniti che si incontrano in matematica hanno
cardinalità 1'\ 0 : l'insieme degli interi positivi, l'insieme di tutti i
numeri interi (cioè positivi e negativi) , l'insieme dei razionali e l'in
sieme dei numeri primi. Ma, come Cantor mostrò, l'insieme di tutti
i numeri reali ha senza dubbio più di 1'\0 elementi. Il quesito che
ne scaturisce è quale sia la dimensione di questo insieme. Poiché
non è 1'\0, deve essere uno degli 1'\ 1 , 1'\ 2 , 1'\3, . . . , ma quale? Malgrado
ripetuti tentativi, neppure Cantor fu in grado di rispondere a que
sta domanda apparentemente semplice, così come non vi riuscirono
altri valenti matematici . Infatti il problema del continuo di Cantar
(è questo il nome con cui è noto) ha resistito a tanti e tali tentativi
di risoluzione, che David Hilbert, quando tenne un'allocuzione intro
duttiva al Congresso internazionale dei matematici nel I900 a Parigi,
la incluse in un elenco di problemi che egli vedeva come le sfide
più importanti per i matematici nel nuovo secolo che iniziava. Il
nome del problema deriva dal fatto che si chiede di determinare
la cardinalità del continuo reale, essendo questa la parola usata per
descrivere l'insieme dei numeri reali quando siano considerati come
i punti che costituiscono la retta reale.
6o
CAPITOLO SECONDO
Fu fatto qualche progresso nel 1 93 8 , quando Kurt Godei usò
nuove tecniche di logica matematica per dimostrare che, partendo
dagli assiomi di Zermelo-Frenkel, non è possibile provare in modo
definitivo che l'insieme dei numeri reali non ha dimensione � 1 •
Questo però non risolse il problema, poiché non s i escludeva l'ipo
tesi che gli assiomi fossero, semplicemente, insufficienti per deci
dere in un senso o nell'altro .
Tuttavia, nonostante questa possibilità, negli anni che seguirono
il risultato di Godei tutti sembravano convinti del fatto che il pro
blema del continuo fosse in realtà decidibile all'interno della teoria
di Zermelo-Fraenkel. Nel qual caso, poiché Godei aveva mostrato
che non si poteva dimostrare che la risposta fosse diversa da � 1 ,
il continuo doveva avere cardinalità � 1 ; con il tempo, ciò sarebbe
stato provato in modo definitivo . Di conseguenza, non fu conside
rato del tutto irragionevole assumere questa tesi proposta da Godei,
ogni volta che un problema matematico richiedesse la conoscenza
della cardinalità del continuo, e molti risultati furono provati con
l'assunto che l'ipotesi del continuo fosse vera (cioè che il continuo
avesse cardinalità � 1 ) .
Nel 1 963 giunse l a notizia che Paul Cohen della Stanford Uni
versity aveva sviluppato una nuova tecnica logica con la quale era
riuscito a provare che l'ipotesi del continuo non poteva essere
dedotta dagli assiomi di Zermelo-Fraenkel. Sommato al risultato
di Godei, questo confermò che l'ipotesi del continuo era di fatto
non decidibile nel sistema di Zermelo-Fraenkel.
Che altro dire? Dal risultato di Cohen si possono dedurre due
conclusioni. Innanzitutto, esso dimostra l'inadeguatezza degli assiomi
di Zermelo-Fraenkel, inadeguatezza che risulta molto grave. Un
conto è sapere che il sistema è inadeguato, come era stato antici
pato dai teoremi di incompletezza di Godei, ma il fatto che il sistema
si riveli incapace di rispondere a un quesito basilare quale: « quanti
sono i numeri reali? » è assai più grave. Qualche matematico cercò
di parare il colpo sostenendo che si sarebbero dovuti formulare altri
assiomi per ovviare all'inadeguatezza che era emersa. Se si intra
prende questa strada, ci si trova a dover affrontare il problema di
ricercare altri assiomi adatti. Poiché la teoria degli insiemi ha una
natura sostanzialmente semplice e occupa una posizione basilare
in matematica, qualsiasi assioma si introduca dovrà essere « credi-
GU INSIEMI, L ' INFINITO E LA NON-DECIDIBIUTÀ
61
bile ». Gli assiomi credibili sono quelli che, anche se a prima vista
non appaiono ovvi (come del resto alcuni degli assiomi di Zermelo
Fraenkel) , sembrano perlomeno naturali quando ci si accinge a stu
diarli. Questa considerazione vieta di intraprendere la strada più
facile, cioè di adottare semplicemente l'ipotesi del continuo come
un assioma della teoria degli insiemi: nulla giustificherebbe tale com
portamento . Il fatto che i matematici lavorino alla teoria assioma
tica degli insiemi da oltre mezzo secolo senza aver trovato alcun
altro principio simile induce la maggior parte degli esperti a con
cludere che in realtà non esiste un assioma « mancante ».
Rimane da considerare l'altra conclusione che si può trarre dalla
scoperta di Cohen: per quanto poco piacevole la cosa possa appa
rire, non esiste una sola teoria degli insiemi, bensì parecchie. (Pro
prio come è successo per la geometria: nel secolo XIX si è giunti
alla conclusione che non esiste una sola geometria « esatta », ma esi
stono tre geometrie alternative, ciascuna con i suoi assiomi e i suoi
teoremi) . In alcune teorie degli insiemi l'ipotesi del continuo sarà
vera, e in altre sarà falsa.
Il lettore avrà notato l'uso dell'espressione « parecchie » teorie
degli insiemi, invece di « due ». Infatti, l'ipotesi del continuo non
è la sola indecidibile partendo dagli assiomi di Zermelo-Fraenkel.
Dopo la scoperta di Cohen nel 1 963 , risultò evidente che il suo
nuovo metodo (detto di forcing) era applicabile a molte situazioni,
non solo alla teoria degli insiemi. Nei due decenni seguenti si giunse
a dimostrare la indecidibilità di numerosi problemi classici irrisolti.
Si abbandonò per sempre la vecchia idea che, con sufficiente tempo
e abilità, qualsiasi problema ben posto potesse in qualche modo essere
risolto : alle asserzioni vere e a quelle false si affiancarono quelle
indecidibili, che non sono né vere né false. Il metodo di Cohen fornì
perlomeno un mezzo per stabilire l'appartenenza o meno di un pro
blema a questa terza classe, sicché il suo risultato diede un contri
buto positivo alla matematica.
Il
teorema di Cantar
Come fece Cantor a dimostrare l'esistenza di un'intera gerar
chia di infiniti? Per i lettori che volessero vedere un esempio di
CAPITOLO SECONDO
ragionamento matematico puramente astratto, ecco una versione
moderna dell'argomentazione di Cantar. Essa prende avvio dalla
nozione di sottoinsieme.
Se X è un insieme qualsiasi, una qualunque collezione di oggetti
estratti da X è detta sottoinsieme di X. Così, la collezione
{ a, c, d )
è un sottoinsieme della collezione
{ a, b , c, d, e, f ) .
L'insieme dei numeri primi è un sottoinsieme dell'insieme di tutti
i numeri interi.
Si consideri ora l'insieme costituito da tutti i sottoinsiemi del
l'insieme X. Esiste tale insieme? Reminiscenze del paradosso di Rus
sell dovrebbero essere sufficienti ad invitare alla cautela nel postu
lare l'esistenza di insiemi. In questo caso non ci sono problemi, per
quanto se ne sa. Uno degli assiomi della teoria degli insiemi di
Zermelo-Fraenkel dà per certa l'esistenza di un insieme di questo
tipo, detto insieme delle parti (o insieme potenza di X), e indicato
con fJ' (X) . Ad esempio, se X = { a, b ) , allora .9l (X) è costituito
dagli insiemi
0, { a ) , { b ) , { a , b ) .
Cos'è il simbolo 0? Rappresenta l'insieme vuoto o insieme nullo,
l'insieme privo di elementi. Se questo è davvero un insieme, allora
sarà sicuramente un sottoinsieme di qualsiasi altro insieme, dal
momento che, in modo apparentemente banale, ma non di meno
logicamente valido, un insieme senza elementi possiede la proprietà
secondo la quale tutti i suoi « elementi » si trovano in qualunque
insieme X si scelga. Basandosi esclusivamente su questo ragiona
mento, si potrebbe pensare che non sia opportuno inserire tra le
altre « finzioni » della matematica la nozione di insieme vuoto . Del
resto, neanche zero è un vero numero . Ecco perché l'insieme vuoto
è considerato un insieme a tutti gli effetti, non meno di tutti gli
altri insiemi. È un elemento neutro proprio come il numero O. (In
verità, O è il numero di elementi dell'insieme 0) .
Un altro esempio: se X = { I , 2, 3 ) , allora .9l (X) è l'insieme i
cui elementi sono gli insiemi:
0,
{ I ) , { 2 ) , { 3 ) , { I, 2 ) , { I, 3 ) , { 2, 3 ) , { I, 2, 3 ) .
GLI INSIEMI, L'INFINITO E LA NON-DECIDIBILITÀ
I due esempi dati dovrebbero essere sufficienti a mostrare che
sembra essere un insieme molto più grande di X. Quando
X ha due elementi, f!I (X) ne ha quattro, e quando X ne ha tre,
f!I (X) ne ha otto . In verità, una dimostrazione matematica abba
stanza semplice mostra che se un insieme finito X ha n elementi,
allora f!I (X) ha zn elementi. Il lettore avrà capito dalla discussione
sulla funzione esponenziale 2 n fatta nel capitolo r come la dimen
sione di !!l (X) aumenti molto rapidamente al crescere del numero
di elementi di X. Questa differenza nei ritmi di crescita continua
fino all'infinito, anche se, come ha dimostrato l'albergo di Hilbert,
tali spostamenti dal finito all'infinito non dovrebbero mai essere
dati per scontati. Cantor ha dimostrato l'esistenza di un numero
infinito di infiniti facendo vedere che, per qualsiasi insieme X, f!I (X)
ha cardinalità maggiore di X. Di qui si giunge facilmente al con
cetto di quantità infinita di infiniti: se X indica l'insieme dei numeri
naturali, allora X1 = !!l (X) è un insieme di grandezza infinita mag
giore di X, X2= f!I (X1 ) è più grande di X1 , X3 = f!I (X2 ) è più
grande di x2 e così via.
Per verificare il risultato di Cantor supponiamo « per assurdo »
che f!I (X) abbia la stessa cardinalità di X. Il nostro compito è di
ricavare una contraddizione da questa ipotesi. Ammesso che il ragio
namento sia valido dal punto di vista logico, la conclusione inelut
tabile sarà che l' assunto iniziale deve essere falso, dal momento che
un assunto vero non può portare a un risultato falso o contraddit
torio. Poiché X e f!I (X), per ipotesi, hanno la stessa dimensione,
esisterà una corrispondenza tra questi due insiemi: per ogni elemento
x di X ci sarà in !!l (X) un elemento in corrispondenza biunivoca con
x, cioè tale che x non corrisponde a nessun altro elemento di X;
inoltre ogni elemento di !!l (X) sarà il corrispondente di un elemento
di X. Poiché questo ragionamento vuole essere valido per qualsiasi
insieme X, finito o infinito, non è possibile raffigurare questa cor
rispondenza servendosi di frecce come si è fatto altrove (si veda
l'inserto A) .
Ora si consideri un elemento arbitrario x di X. Allora il suo cor
rispondente, che chiameremo A, è un elemento di f!I (X), cioè A
è un sottoinsieme di X, costituito da alcuni degli elementi di X.
Ci chiediamo se anche x sia compreso tra questi elementi, cioè se
sia un elemento di A . È una domanda del tutto sensata. Per alcuni
!!l (X)
CAPITOLO SECONDO
elementi x di X la risposta sarà presumibilmente « SÌ », per altri « no ».
Sia U l'insieme di tutti quegli elementi x di X per cui x non è un
elemento del suo corrispondente. L'insieme U consiste di elementi
di X, quindi anche U è un sottoinsieme di X, cioè è un elemento di
[!> (X) . Così U sarà il corrispondente di qualche elemento di X, che
chiameremo w .
Ora si ponga la domanda: « W è un elemento di U? » Se lo è, allora
w soddisfa la proprietà che definisce U, cioè w non è elemento del
suo corrispondente U; d'altro canto, se w non è un elemento di
U, allora w non soddisfa la proprietà che definisce U, ed è quindi
un elemento del suo corrispondente U. Questa è una situazione inso
stenibile, una contraddizione. Come si è detto prima, l'unica con
clusione possibile è che la congettura iniziale deve essere falsa: X
e [!> (X) non possono avere la stessa dimensione, e il risultato di
Cantor è dimostrato.
Questo è uno straordinario esempio di come un disastro possa
diventare molto proficuo. Al lettore non sarà sfuggito il paralleli
smo tra il ragionamento di prima e il paradosso di Russell; ma in
questo caso tutti i passaggi possono essere giustificati con assiomi
di Zermelo-Fraenkel, e anziché ottenere una contraddizione costi
tuita da un paradosso che demolisce un'intera teoria, si arriva alla
dimostrazione desiderata, cioè che l'ipotesi iniziale è falsa.
Lo sviluppo della teoria degli insiemi è stato un grande successo
della matematica moderna, e oggi non c'è parte della matematica
che non sia in qualche misura influenzata da idee e metodi tratti
da questa teoria. Bertrand Russell definì il successo di Cantor « forse
il più grande di cui la nostra epoca possa vantarsi »; e David Hil
bert disse: « Nessuno ci potrà cacciare dal paradiso creato per noi
da Cantor ».
GU INSIEMI, L' INFINITO E LA NON-DECIDIBILITÀ
Inserto
A
-
Dimostrazione del teorema di Cantor
Dato un insieme infinito X, si dimostra che g; (X) non ha
la stessa cardinalità di X, ed è quindi maggiore. Il punto cen
trale della dimostrazione consiste nel provare che la presunta
esistenza di una corrispondenza tra gli elementi di X e quelli
di g; (X) porta a una contraddizione. Se indichiamo gli ele
menti di X con le lettere dell'alfabeto (che è un insieme finito,
naturalmente, ma comunque adeguato a illustrare il procedi
mento) , allora la presunta corrispondenza potrebbe essere così
rappresentata:
Elemento di X
y
z
Sottoinsieme di X
( a, b, c, d ) = A ( y)
( b, d, p, q, z ) = A (z) .
In questo caso y non è un elemento dell'insieme A(y) con cui
è in corrispondenza, mentre z è un elemento del suo insieme
corrispondente A (z) . Sia U l'insieme di tutti gli elementi di
X che non sono elementi del loro insieme corrispondente:
U= ( x l x � A (x) ) .
Dal momento che U è un sottoinsieme di X, U deve essere
messo in corrispondenza con un elemento di X, ad esempio w :
w +-+
U= A(w ) .
Cercando di stabilire se w sia o no un elemento dell'insieme
A(w) , si arriva a una contraddizione. Se w è elemento di A(w)
allora w non può essere in U, ma poiché U è proprio A(w) ,
questa è una contraddizione. D'altro canto, se w non è un
elemento di A (w) , allora w sarà un elemento di U, e ancora,
poiché U= A (w ) , arriviamo a una contraddizione.
C apitolo 3
I sistemi numerici e il problema del numero di classi
La soluzione di un problema che ha r Bo anni
Nel 1 983 Don Zagier dell'Università del Maryland e del Max
Planck Institut di Bonn, e Benedict Gross, della Brown Univer
sity di Providence, annunciarono di aver risolto il problema del
numero di classi, un problema famoso tra i matematici, proposto
da Karl Friedrich Gauss nel r 8o r . Anche se la loro dimostrazione
non era affatto la più lunga nella storia della matematica (questa
sarà vista nel cap . 5) , con le sue 3 00 pagine era più lunga di molte
altre . Quello che affascinò i matematici non fu tanto la lunghezza
della dimostrazione, quanto la sua natura: era molto indiretta e
collegava due aree della matematica apparentemente distinte in
modo davvero notevole .
Sebbene il problema e la sua soluzione siano altamente astratti
e implichino alcuni concetti matematici molto difficili, in fondo
tutto ha a che fare con sistemi numerici di vario tipo, ed è certa
mente possibile descrivere gli aspetti generali della teoria. Questo
sarà l'argomento del presente capitolo, nel quale si farà anche cenno
allo sviluppo storico della matematica odierna.
Le notevoli proprietà del numero r63
Nel secolo XVIII il grande matematico svizzero Eulero scoprì,
non si sa come, che la formula
/(n) = n 2 + n + 4 1
I SISTEMI NUMERICI
ha una proprietà abbastanza particolare: se si pone n uguale a un
qualunque numero compreso tra O e 3 9 , il valore risultante di /(n)
è un numero primo . Ad esempio /(O) = 4 1 è primo, come lo sono
/ ( r ) = 43 e /(2) = 4 7 · Non è stata scoperta nessun' altra formula
quadratica che produca altrettanti numeri primi, partendo da n = O
e operando con successivi valori di n. Sebbene la sequenza dei
numeri primi si arresti per n = 40, perché /(40) = 4 1 2 , la formula
produce ancora molti numeri primi. Tra i primi r o milioni di valori
di f(n) la proporzione di primi è circa uno su tre, un rapporto molto
più alto di quello di ogni altra formula quadratica (si veda il cap. 6
per un'ulteriore discussione sulle formule generatrici di numeri
primi) .
Poiché la formula di Eulero sembra così insolita nella sua copiosa
produzione di numeri primi, è probabile che abbia qualcosa di par
ticolare . Che cosa? Le proprietà delle formule relative agli interi
spesso risultano strettamente collegate con le proprietà delle stesse
formule considerate come formule per numeri reali, o anche per
numeri complessi. C ' è un'intera branca della matematica, cono
sciuta come teoria analitica dei numeri, che utilizza questo feno
meno (si veda il cap . 9) . Cosa avviene quando la formula di Eulero
è considerata una formula per i numeri reali?
Per prima cosa riscriviamo la formula con x, simbolo usato soli
tamente per un numero reale, al posto di n, usato piuttosto per
un intero; allora si ha:
/ (x) = X 2 + x + 4 1 .
A chiunque ricordi l' algebra imparata a scuola dovrebbero venire
in mente le equazioni quadratiche: equazioni della forma
ax 2 + bx + c = O,
che devono essere risolte rispetto a x, quando i valori di a, b, c
sono noti. Il lettore potrebbe anche ricordare che esiste una for
mula che dà le due soluzioni :
- b ± ..J b 2 - 4 ac
x=
2a
(le due soluzioni dell'equazione si hanno scegliendo il segno + o
il segno - ) .
68
CAPITOLO TERZO
Poiché non è possibile calcolare la radice quadrata di un numero
negativo (quando si considerano i numeri reali) , il segno del
l'espressione b 2 - 4 ac è molto importante . Se è positivo , l'equa
zione quadratica avrà due soluzioni; se è negativa, non ci saranno
soluzioni (reali) ; se risulta uguale a zero, allora ci sarà una sola solu
zione, ma questo è un caso particolare . Tale espressione è chia
mata il discriminante dell' equazione quadratica.
Qual è il valore del discriminante della forma quadratica di
Eulero
X2 + X + 4I?
Qui a
=
I, b = I,
C =
4 I , COSÌ
b 2 - 4 aC = I - I 64= - I 63 .
Poiché il discriminante è negativo sappiamo immediatamente che
l'equazione quadratica
X 2 + x + 4 I= O
non ha soluzioni (reali) . Ci sono due soluzioni complesse:
x = - .l..
2
±
l_ ...r;c;3 ;. ,
2
ma di numeri complessi si parlerà più avanti in questo capitolo .
Qui, che lo si creda o no, sta la ragione del comportamento spe
ciale della formula di Eulero come generatrice di numeri primi.
La sua particolarità non sta nel fatto che il discriminante sia nega
tivo (parecchie formule hanno questa proprietà) , ma che il suo
valore sia esattamente - I 63 . « Cosa ha di strano il numero I 63 ? »,
ci si potrebbe domandare. Procedendo nella lettura si vedrà che
è un numero davvero molto particolare, strettamente correlato ad
alcune costanti matematiche fondamentali .
Quali sono le più frequenti « costanti » della matematica, cioè
quei numeri che continuano a saltar fuori nei posti più imprevi
sti? La più nota è n , il rapporto tra la misura della circonferenza
e il suo diametro . Questa definizione indica già che n è partico
lare: perché mai si dovrebbe ottenere la stessa risposta per ogni
cerchio, qualunque sia la sua dimensione?
Già dalla fine del secolo XVIII si sapeva che n è irrazionale, vale
a dire che la sua rappresentazione decimale continua indefinita-
I SISTEMI NUMERICI
mente, senza stabilizzarsi in alcun ciclo periodico . Con venti cifre
decimali, n si scrive:
n = 3 , I 4 I 592 653 589 793 2 3 8 46 .
Grazie ai calcolatori, ora si conoscono più di 30 milioni di cifre di n .
Oltre che nella geometria del cerchio, n ricorre in molte altre
situazioni . Ad esempio la somma dei termini della successione
infinita
I __!__ + __!__ __!__ + __!__ _I_ + . . .
3
5
7
9
II
-
-
-
vale n/4 . Lo sviluppo di metodi per il trattamento di somme infi
nite come questa fu uno dei risultati più significativi conseguiti
nel secolo xvm . Un altro esempio : la somma di
I +I +I +I + ...,
I+I6
4
9
25
dove l'n-esimo termine della successione è il reciproco di n 2 , è
n 2/6 .
n compare in quest' altra sorprendente situazione: se si lancia
un fiammifero su una tavola sulla quale sono tracciate alcune linee
parallele distanti tra loro quanto la lunghezza del fiammifero, la
probabilità che il fiammifero vada a toccare una delle linee è 2/n .
Dopo n, la costante matematica più frequente è e, la base dei
logaritmi naturali. Anche il numero e è irrazionale e la sua rappre
sentazione decimale è infinita. Con venti cifre decimali e si scrive:
e = 2 , 7 I 8 2 8 I 8 2 8 459 045 2 3 5 3 6 .
Anche e , come n , può essere definito i n vari modi: ad esempio,
è quel numero per il quale il grafico della funzione
y
= ex
ha la proprietà che il gradiente in ogni punto è uguale al valore
di y nello stesso punto. Quindi, se una popolazione p cresce secondo
la legge seguente
p = e',
dove t è il tempo, allora il tasso di crescita a ogni istante è esatta
mente uguale alla dimensione della popolazione in quell'istante .
CAPITOLO TERZO
Un'altra definizione di e è la seguente: è quel numero tale che l'area
delimitata dalle curve y = I/x, y = O, x = I , x = e è esattamente
uguale a I (fig. 3 . I ) . Espressa in termini di integrale, questo equi
vale a dire che
r�
dx = I .
Un' altra definizione ancora comporta una somma infinita:
I +I +I +I + ...,
e=I+2!
3!
4!
I!
dove N ! (da leggere « N fattoriale ») denota il prodotto
I X 2 X 3 X 4 X . . . X N. In realtà, questo è un caso particolare della
formula
2
}
4
ex = I + _!S_ + ..?S._ + ..?S._ + ..?S._ + . . .
I!
2!
3!
4!
Anticipando per un momento una teoria che sarà trattata più
avanti in questo capitolo , osserviamo che la formula precedente
Figura J . I
Definizione della costante e come il numero tale che l'area tratteggiata è esattamente 1 .
7I
I SISTEMI NUMERICI
è valida anche s e il numero x è complesso, cioè se h a l a forma a + ib,
dove i = � . Questo porta a qualche sorprendente risultato;
ad esempio, Eulero scoprì che
e.-i = - I .
In altre parole, quando il numero irrazionale e è innalzato alla
potenza di n (numero irrazionale) volte il numero immaginario
r-r_ , il risultato è il numero intero - r . Un altro risultato ugual
mente sorprendente che mette in relazione e, n e r-r_ è :
i i = e - "12 = 0 , 2 07 879 5 76 3 . . .
E ora veniamo al punto focale di questa discussione sulle costanti
matematiche . I tre numeri n, e, ..{;63 sono tutti irrazionali. Tut
tavia, con dodici cifre decimali,
e" ..[[6j = 2 6 2 5 3 7 4 I 2 64o 768 744,ooo ooo ooo ooo .
In realtà questo numero non è un intero; un valore più accurato è
2 6 2 5 3 7 4 I 2 640 768 743 . 999 999 999 999 250
che è corretto alla quindicesima cifra decimale . Dunque, e" ..J 1 6 '
è « quasi » un intero, cosa che non avviene per la maggior parte
delle espressioni di tipo e" ..J" con k numero naturale. Ecco saltare
di nuovo fuori il numero I 63 ; e se pensate che la cosa non sia
casuale, ma che ci sia qualcosa sotto, siete nel giusto . Cosa ci sia
di particolare nel numero I 63 sarà rivelato nel resto del capitolo .
La storia comincia nella Grecia antica.
I primi sistemi numerici
Sembra che i greci antichi siano stati i primi a sviluppare una
teoria matematica dell' aritmetica. Sia la scuola ionica (fondata da
Talete intorno al 6oo a. C . ) sia quella pitagorica (fondata da Pita
gora circa cinquant' anni più tardi) diedero ampio sviluppo alla
geometria e, in particolare i pitagorici, all' aritmetica. Furono i
greci a rendersi conto per primi del fatto che i numeri naturali
I , 2 , 3 , . . . formano una collezione infinita sulla quale si possono
CAPITOLO TERZO
eseguire le operazioni aritmetiche di base di addizione e moltipli
cazione. Benché essi non conoscessero i numeri negativi come tali,
sapevano come adoperare il segno meno in espressioni del tipo:
(7 - 2 ) x (6 - 3 )
=
(7
x
6) - (7
x
3) - (2
x
6) + (2
x
3) .
Probabilmente il loro modo di affrontare il problema non era dis
simile da quello espresso dalla vecchia cantilena di scuola:
Meno per meno uguale più,
la ragione non domandarla tu.
Tuttavia c'era una buona ragione perché i greci rifiutassero di con
siderare come numero un'entità come - 5 : essi pensavano ai numeri
come a misure di distanze, aree e volumi. Le loro regole algebriche
erano pensate in termini geometrici, come se, ad esempio, per som
mare due numeri si sommassero insieme due aree (fig. 3 . 2 ) .
S e i greci non s i servirono di numeri negativi, ebbero certamen
te bisogno delle frazioni, o numeri razionali, come li chiamano
Figura 3 . 2
L'algebra greca. I greci consideravano identità algebriche del tipo
(a - b)1 = a 1 - 2 ab + b1
in termini puramente geometrici. Per ottenere l'area tratteggiata cioè (a - b) 1, si può
cominciare con il quadrato intero (a1), sottrarre il rettangolo formato dalle regioni I
e III (ab) e quello formato dalle regioni II e III (ancora ab) e aggiungere il quadrato
piccolo (b1) per compensare il fatto che questa area è inclusa in entrambi i rettangoli
sottratti. Questo dà l'identità precedente.
I SISTEMI NUMERICI
73
Figura 3 · 3
I l teorema d i Pitagora. Per qualunque triangolo rettangolo avente lati a e b e ipote
nusa h, vale l'identità
h > = a > + b>.
Quando a= b = 1, questa identità dà h = ..f2, quantità irrazionale non esprimibile come
quoziente di due numeri interi.
i matematici. Un numero razionale positivo è un numero della forma
dove a e b sono entrambi numeri naturali . Poiché b può
valere I , i numeri razionali includono i numeri naturali, cioè, uti
lizzando la terminologia del capitolo 2 , i numeri naturali formano
un sottoinsieme dei numeri razionali. Fino al secolo VI a. C . i greci
credevano che il sistema dei numeri razionali positivi fosse ade
guato ai loro scopi geometrici. In seguito essi si accorsero che questo
non era sempre vero: in particolare, scoprirono che la radice qua
drata di 2 non era un numero razionale; questo significa che, ad
esempio, i numeri razionali sono inadeguati per misurare l'ipote
nusa di triangolo rettangolo, la cui base e la cui altezza misurino
una unità (fig. 3 .3 ) . Per poter misurare tutte le lunghezze geometri
che sono necessari i numeri reali, sui quali ci soffermeremo tra
breve . Questa scoperta segnò effettivamente la fine di qualsiasi
passo avanti in aritmetica da parte dei greci, i quali da quel mo
mento limitarono la loro matematica alle costruzioni geometriche.
a/b,
I numeri negativi
La prima algebra sistematica che fece uso dello zero e dei numeri
negativi fu sviluppata nel secolo vn d . C . dai matematici indiani,
che si servirono di numeri negativi e positivi per descrivere tran
sazioni finanziarie che coinvolgevano crediti e debiti. Oltre a essere
74
CAPITOLO TERZO
i primi a usare lo zero in modo moderno, essi scrissero equazioni
con numeri negativi simbolizzati da un punto sopra il numero (un
primo precursore del nostro segno meno) e formularono esplicita
mente una legge dei segni (più per più è più, più per meno è meno,
meno per meno è più) . Gli indiani, inoltre, si resero conto del fatto
che ogni numero positivo ha due radici quadrate, una positiva e
l' altra negativa.
Tuttavia, questi primi sviluppi in India non influenzarono i mate
matici europei del Rinascimento, tra il secolo XIV e il secolo XVI .
Seguendo la tradizione greca, questi si divertivano a manipolare
i segni meno, ma non riconoscevano i numeri negativi come tali.
Le radici negative delle equazioni erano chiamate « radici fittizie ».
Nel secolo xvn, alcuni matematici incominciarono a usare i
numeri negativi, ma questa tendenza incontrò forti opposizioni,
talvolta da parte di matematici eminenti . Cartesio parlava delle
radici negative come di « false radici » e anche Blaise Pasca! pen
sava che non potesse esistere un numero più piccolo di zero. Gott
fried Leibniz, pur concordando sul fatto che i numeri negativi
avrebbero potuto condurre a delle assurdità, li difese come un utile
strumento nell'esecuzione di calcoli. Eulero accettò i numeri nega
tivi, credendo però che fossero più grandi dell'infinito (il cui sim
bolo è oo ) . Egli ragionava così: poiché a/O = oo , allora se noi divi
diamo a per un numero più piccolo di zero il risultato deve essere
più grande dell'infinito .
Fu durante il secolo XVIII che finalmente si diffuse l'uso alge
brico dei numeri negativi (indicati con il segno meno), benché anche
allora molti matematici fossero perplessi e, se fosse stato possi
bile, ne avrebbero volentieri evitato l'uso . In verità, è solo quando
si adotta una teoria assiomatica dei numeri (vedi cap. 2) che i nega
tivi acquistano davvero senso. Questa osservazione si applica altret
tanto bene ai numeri complessi; prima, però, dovremmo dire qual
cosa sui numeri reali .
I numeri reali
Benché questa trattazione dei sistemi numerici sia divisa in para
grafi secondo i differenti tipi di numeri, dal punto di vista storico
75
I SISTEMI NUMERICI
una tale distinzione è arbitraria, perché le teorie dei numeri nega
tivi, dei numeri reali e dei numeri complessi si sono sviluppate più
o meno nello stesso periodo . La sistemazione rigorosa dei reali fu
senz' altro il risultato più importante. Era una questione molto deli
cata, tanto che, sebbene nella teoria dei numeri complessi sia data
per scontata l'esistenza dei numeri reali, furono proprio questi
ultimi a essere formalizzati per ultimi.
Per tutti gli scopi pratici i numeri razionali sono più che suffi
cienti . Nel mondo reale (opposto a quello matematico) questi sono
i soli numeri ad essere usati, dal momento che le soluzioni ai pro
blemi sono date al massimo con alcune cifre decimali . Tuttavia,
i numeri razionali possiedono anche alcune piacevoli proprietà mate
matiche. Se si sommano, si sottraggono, si moltiplicano o si divi
dono (tranne che per zero) due numeri razionali, il risultato è ancora
un numero razionale; inoltre l' aritmetica dei numeri razionali sod
disfa tutti gli assiomi per un dominio di integrità esposti nel capi
tolo 2 (p. 45) . Il matematico riassumerebbe tutto questo dicendo
che i numeri razionali costituiscono un campo . Cosa è un campo?
È un dominio di integrità in cui è possibile la divisione, cioè una
struttura che soddisfa i sette assiomi di pagina 45 più il seguente:
(8) Per un qualsiasi numero x diverso da O, esiste un numero y
tale che xy = r (esistenza dell'inverso rispetto alla moltipli
cazione) .
È facile verificare che y, la cui esistenza è garantita dall'assioma 8,
è unico per ogni x dato . Normalmente scriviamo x - i , o talvolta
r/x, per indicare questo unico inverso . L' assioma 8 rende possi
bile la divisione poiché, naturalmente, afb è lo stesso di ab - 1 •
In sintesi, un campo è una struttura che permette di eseguire
tutte le usuali operazioni aritmetiche con le comuni proprietà. Il
campo dei numeri razionali, però, non può, come è stato scoperto
dai Pitagorici, fornire le soluzioni di equazioni del tipo
Usando i numeri razionali, si può trovare una soluzione con ogni
grado di accuratezza:
I2
=
r;
( r ,4) 2 = 1 ,96;
( I ,4 I ) 2 = 1 ,998 1 ;
( 1 ,4 1 4) 2 = 1 ,999 3 96;
CAPITOLO TERZO
e così via, ma non esiste alcun numero razionale il cui quadrato
sia esattamente uguale a 2 . I numeri reali, d'altro canto, costitui
scono un campo che include i numeri razionali, e sono abbastanza
« ricchi » da poter risolvere equazioni del tipo di quella precedente.
L'idea chiave è offerta dal processo di approssimazioni successive
relativo all'esempio precedente. I numeri r ; r ,4; r ,4 r ; r ,4 r 4 ; . . .
forniscono approssimazioni sempre migliori di un numero il cui
quadrato è 2 ; se fosse possibile utilizzare infinite cifre decimali,
saremmo in grado di scrivere un numero il cui quadrato è esatta
mente uguale a 2, cioè
r ,4 r 4 2 1 3 . . . (ad in/initum) .
Poiché, ovviamente, non è possibile scrivere una sequenza infi
nita di cifre decimali, come si procede in pratica? Lasciando che
la matematica si sostituisca al senso comune nel trattare questi con
cetti necessariamente infiniti, il che significa che i numeri reali
devono essere sviluppati in modo assiomatico . Ne risulta un pro
cesso estremamente difficile, molto al di là del livello di un libro
come questo. In realtà, la formulazione di un sistema di assiomi
per i numeri reali fu uno delle più importanti conquiste della mate
matica, raggiunta negli anni tra il r 87o e il r 88o.
I numeri reali includono tutti i razionali (proprio come gli interi
formano un sottoinsieme dei numeri razionali) ma anche molti altri
numeri . Un numero reale che non è razionale è chiamato numero
irrazionale. Esempi di numeri irrazionali sono :n , e, .Jk per un qual
siasi numero naturale k che non sia un quadrato perfetto .
I numeri complessi
Nel secolo XVI i matematici europei, e in particolare l'italiano
Raffaele Bombelli, cominciarono a capire che nella risoluzione di
problemi algebrici è spesso utile assumere che i numeri negativi
ammettano radici quadrate. Possiamo capire, considerando il clima
culturale del tempo, che tali numeri fossero chiamati numeri imma
ginari, anche se per il matematico moderno tutti i numeri sono con
cetti « immaginari », le radici quadrate di quantità negative né più
né meno di tanti altri. Tuttavia, è ancora in uso parlare delle radici
I SISTEMI NUMERICI
77
quadrate dei numeri reali negativi come di numeri immaginari,
dando quindi in questo contesto alla parola «immaginario » un signi
ficato tecnico particolare .
In effetti, per poter disporre di radici quadrate di numeri reali
negativi è necessario solamente postulare l'esistenza di una solu
zione per l'equazione
x2 + I = O .
Se indichiamo con « i » una soluzione di questa equazione (i 2 = - I ),
allora, dato un qualunque numero reale positivo a , la radice qua
drata di - a sarà i ..fa. In effetti, ci saranno due radici quadrate:
i ..fa e - i ..fa. Analogamente, ci saranno due soluzioni dell'equa
zione x 2 + I = O, cioè i e - i. I numeri della forma ia, con a reale,
sono i numeri immaginari. La lettera « i » fu usata per la prima volta
in questo contesto da Eulero .
Un numero complesso è un numero della forma a + i b , dove a
e b sono numeri reali . Il segno + qui non indica la consueta ope
razione di addizione (e come potrebbe?) , ma serve a separare la
parte reale a del numero complesso dalla parte immaginaria i b . Si
noti che se b = O allora a + i b = a, perciò i numeri reali formano
un sottoinsieme dei numeri complessi; allo stesso modo, se a = O
allora a + i b = i b , perciò anche i numeri immaginari formano un
sottoinsieme dei numeri complessi.
A questo punto si potrebbe pensare che non sia giustificato chia
mare numero qualcosa della forma a + i b , anche se si è disposti
in linea di principio ad ammettere l'esistenza di i = � - Ma
ciò che importa è come i numeri si comportano, non ciò che sono :
se i numeri complessi hanno un' aritmetica utile e sfruttabile, sia
in matematica sia in un contesto più ampio, e se formano un campo,
allora essi hanno lo stesso diritto di essere chiamati « numeri »
quanto tutti gli altri . Qual è quindi l' aritmetica dei numeri com
plessi? Le regole verranno date qui appresso . Per la maggior parte
delle persone, questo è il primo sistema numerico che venga loro
presentato da un punto di vista assiomatico . Gli interi, i razionali
e i reali sono concetti già familiari ai più, quando sono affrontati
assiomaticamente.
La regola per sommare due numeri complessi è decisamente sem
plice: si sommano rispettivamente le loro parti reali e le loro parti
CAPITOLO TERZO
immaginarie . Quindi:
(a + i b) + (c + id) = (a + c) + i (b + d ) .
Così a d esempio,
(2 + 3 i) + ( 7 + i) = 9 + 4 i
( - 3 + 4 i) + (4 - 2 i) = I + 2 i.
La moltiplicazione di numeri complessi è un po ' più complicata.
Usiamo le regole ordinarie dell' algebra per moltiplicare le due
somme dentro le parentesi e poi poniamo i 2 = - I , per cui :
(a + i b) · (c + id) = ac + i ad + i bc + i 2 bd
= ac + i ad + i bc - bd
= (ac - bd) + i (ad + be) .
Così, ad esempio
(2 + 3 i) . (5 + 7 i) = I o + I 4 i + I 5 i + 2 I F
= IO + J4i + 15i - 2 1
= - I I + 29i.
Può forse sorprendere il fatto che i numeri complessi possano essere
divisi . La regola è questa:
a + i b = a c + bd + i be - a d .
c 2 + d2
c 2 + d2
c + id
Così, ad esempio:
3XI+5X2
5XI -3 X 2 .
+
l
I+4
I+4
3 + IO
5-6 .
=
+ 5 1
5
I3
I
=5 1.
5 --
-
--
·
In effetti, i numeri complessi formano un campo : il lettore
potrebbe verificarlo per esercizio. Per quanto insolita possa appa
rire la nozione di numero complesso, essa consente dunque un tipo
di aritmetica « normale ». In realtà il campo complesso ha una pro
prietà importantissima, non valida per alcun altro sistema nume-
79
I SISTEMI NUMERICI
rico : nel campo dei numeri complessi ogni equazione polinomiale
può essere risolta; ciò equivale a dire che se a0, a 1 , , a. _ 1 , a.
sono numeri complessi, allora ci sarà un numero complesso x che
risolve l'equazione
a.x " + a. _ 1 x" - 1 + . . . + a1 x + a0 = O
• • •
.
Questo non è vero per i numeri reali, come attesta l'equazione
x2 + r = O
Il risultato appena ricordato è conosciuto come il teorema fon
damentale dell'algebra. Fu formulato per la prima volta da Girard
nel r 62 9 , e poi dimostrato in modo ancora imperfetto da D' Alem
bert nel 1 746 e da Eulero nel 1 749 . La prima dimostrazione inte
ramente corretta fu data da Gauss nel 1 799 nella sua tesi di dot
torato . Gauss fu così impressionato dal risultato che in seguito ne
diede altre tre dimostrazioni completamente diverse .
Il teorema fondamentale dell' algebra è solo una delle molteplici
ragioni per cui il sistema dei numeri complessi è così « bello ». Un
altro motivo importante è che il campo dei numeri complessi per
mette lo sviluppo di un tipo di calcolo differenziale che porta alla
fertile teoria delle funzioni di variabile complessa (se ne accen
nerà nel cap . 9) .
La teoria dei numeri complessi non solo è affascinante da un
punto di vista matematico, ma risulta anche estremamente utile.
Il primo a fare dei numeri complessi un uso scientifico significa
tivo fu Charles Steinmetz, che se ne servì in modo massiccio per
eseguire calcoli riguardanti le correnti alternate. In effetti, oggi
giorno un ingegnere elettrotecnico non potrebbe fare a meno dei
numeri complessi, come non potrebbe farne a meno chiunque lavori
nel campo dell' aerodinamica o della dinamica dei fluidi. Nella teoria
della relatività, Einstein ha fatto uso dei numeri complessi: le tre
dimensioni spaziali sono considerate reali e la dimensione tempo
immaginaria; anche nella meccanica dei quanti il fisico ha a che
fare con numeri complessi.
Però, a dispetto del fatto che essi costituiscano un campo e siano
molto utili, e a dispetto del fatto che anche gli altri sistemi nume
rici siano astratti, pure costruzioni ideali, molte person� provano
ancora un certo disagio davanti ai numeri complessi . E in larga
misura, o forse esclusivamente, una questione di familiarità. I
numeri reali, ad esempio, possono apparire oggetti matematici estre.
8o
CAPITOLO TERZO
Figura 3 · 4
La retta reale. Gli assiomi per i numeri reali garantiscono che essa è continua, non ha
<< buchi>>, neppure quelli infinitamente piccoli dove viene saltato un singolo punto (nel
senso che la retta razionale ha un « buco » dove dovrebbe esserci ...h ) .
asse immaginario
asse reale
Figura 3 · 5
I l piano complesso. I l numero complesso a + i b corrisponde a l punto d i coordinate
(a, b) . I numeri reali si trovano sull' asse orizzontale e i numeri immaginari puri sul
l' asse verticale.
mamente complicati quando sono posti sotto il « microscopio » del
l' analista, ma c'è sempre l'immagine semplice e confortante della
retta reale a cui ricorrere, cioè di una linea retta infinita con O nel
mezzo (fig. 3 . 4) .
La buona notizia è che c'è un'immagine egualmente confortante
dei numeri complessi. Proprio come i numeri reali possono essere
pensati come punti della retta reale, così i numeri complessi pos-
I SISTEMI NUMERICI
sono essere identificati con i punti del piano a due dimensioni
(fig . 3 .5) . Il primo a proporre questa visualizzazione dei numeri
complessi fu Caspar Wessel, un ispettore norvegese autodidatta,
che tenne una conferenza sulle sue idee in proposito nel I 7 97· La
stessa idea fu riproposta, oltre che da Gauss, da Jean-Robert
Argand, un contabile svizzero che nel r 8o6 pubblicò un libro sul
l' argomento . Questo ebbe un successo immediato, e il piano com
plesso , come è chiamato il piano bidimensionale quando è inteso
come rappresentazione dei numeri complessi, è talvolta indicato
come il diagramma di Argand.
I quaternioni
Prendendo spunto dalla rappresentazione dei numeri complessi
come punti sul piano, il matematico irlandese William Rowan
Hamilton ( r 8o5- r 865) sviluppò una interpretazione algebrica
(essenzialmente assiomatica) dei numeri complessi in termini di
coppie di numeri reali . Egli proseguì le sue ricerche passando allo
spazio tridimensionale, e scoprì che non in tre, ma in quattro dimen
sioni è possibile sviluppare un sistema di « numeri ipercomplessi »
analogo a quello per il piano .
Non fu facile arrivare ai quaternioni, come Hamilton chiamò
i suoi nuovi numeri, e fu solamente dopo parecchi anni di studio
che egli riuscì a ottenere un risultato significativo . Come accade
spesso nella ricerca matematica, l'intuizione risolutiva non lo colpì
mentre era seduto alla scrivania. Un giorno del r 843 , al crepu
scolo, egli passeggiava con la moglie lungo il Royal Canal di Du
blino, quando capì che, se avesse trascurato la proprietà commu
tativa per la moltiplicazione, tutto il resto avrebbe funzionato :
avrebbe ottenuto un sistema numerico diverso, ma accettabile. Era
così esaltato per questa intuizione che si fermò al Brougham Bridge
per incidere le formule di base su una pietra. Il graffito originale
è da tempo consumato, ma sul ponte ora compare una targa com
memorativa.
In breve, un quaternione è un numero della forma
a + i b + j c + kd
CAPITOLO TERZO
dove a, b, c, d, sono numeri reali e i, j , k sono numeri « immagi
nari » che soddisfano l'equazione F = j 2= k 2 = - 1 . Le equazioni
fondamentali che Hamilton scrisse sul ponte sono :
ij = k,
j i= - k ,
jk = i,
kj = - i ,
ki = j ,
ik = - j.
Usando queste regole, due quaternioni qualunque possono essere
moltiplicati tra loro con le ordinarie regole dell' algebra, per dare
un terzo quaternione, mentre l' addizione si esegue termine a ter
mine come per i numeri complessi. Il sistema numerico risultante
soddisfa tutti gli assiomi per un dominio di integrità (p. 45) eccet
tuata la proprietà commutativa della moltiplicazione .
I quaternioni hanno trovato applicazioni considerevoli nella fisica
moderna, così come altri numeri ancora più bizzarri, gli ottonioni,
un sistema numerico a otto dimensioni in cui, oltre alla proprietà
commutativa, si è persa anche la proprietà associativa della molti
plicazione. Ora è opportuno tornare ai numeri naturali e in parti
colare al lavoro di Gauss sulla teoria dei numeri.
Gli interi di Gauss
Nel 1 796 Gauss dimostrò un complesso teorema di teoria dei
numeri, chiamato legge di reciprocità quadratica, che riguarda le solu
zioni di equazioni del tipo
cioè della forma
x 2 mod 7
=
3,
x 2 mod p
=
q,
dove p e q sono numeri primi . Nel tentativo di generalizzare il
suo teorema per equazioni di ordine superiore (x 3 modp = q, e
così via) , egli trovò che i suoi calcoli erano facilitati se si lavo
rava con numeri della forma a + i b, dove a e b sono interi e
i = � come al solito, piuttosto che con i soli interi . Ora tali
« interi complessi » sono conosciuti come interi di Gauss. Sono
particolarmente utili quando è richiesta una scomposizione in
fattori : infatti, proprio come gli interi ordinari ammettono la
I SISTEMI NUMERICI
scomposizione
a 2 - b 2 = (a + b) (a - b) ,
così gli interi di Gauss danno
a 2 + b 2 = (a + i b) (a - i b) .
Ad un primo sguardo, gli interi di Gauss sembrerebbero occu
pare la stessa posizione all'interno del campo dei numeri com
plessi di quella che occupano gli interi ordinari all'interno del campo
dei numeri reali . Ma quanto gli interi di Gauss assomigliano agli
interi?
Come si è detto nel capitolo I , il fatto più significativo relativo
agli interi è racchiuso nel teorema fondamentale dell' aritmetica:
ogni intero è esprimibile come prodotto di un unico insieme di
primi, moltiplicato eventualmente per - I . Gauss dimostrò che
tra gli interi di Gauss vi sono dei numeri che sono « primi » (cioè
non scomponibili) e che in rapporto a questi « primi » vale un ana
logo del teorema fondamentale dell'aritmetica, il teorema della fat
torizzazione unica. I primi, qui, non sono numeri della forma a + i b ,
dove entrambi a e b sono primi : i primi di Gauss sono definiti
come quegli interi di Gauss che non possono essere ridotti a un
prodotto di altri interi di Gauss . Per questa ragione i matematici
spesso li chiamano irriducibili.
Il
problema del numero di classi
Gli interi di Gauss si rivelarono utili in altri contesti, oltre che
nelle leggi di reciprocità; in particolare, emerse il loro rapporto
con l'ultimo teorema di Fermat , del quale si parlerà più diffusa
mente nel capitolo 8. Risultarono così utili che si pensò di esami
nare altri sistemi numerici simili, ed è proprio quanto fece Gauss .
Tra i vari sistemi possibili, particolarmente significativi sono quelli
di forma a + b �, dove d è un intero positivo diverso da uno .
A questo punto si profila ancora una sorpresa. Per ottenere un
sistema « ragionevole », che abbia qualche somiglianza con gli interi
ordinari, nel caso in cui d mod 4 = 3 si deve ammettere che a e b
CAPITOLO TERZO
possano anche essere divisi per due; così ad esempio
2_ +
2
2 �3 '
saranno numeri nel sistema che corrisponde a d = 3 . Se d mod 4 :f: 3 ,
allora, come per gli interi di Gauss, a e b devono essere interi.
Una volta che si sia introdotta la piccola modifica di cui sopra,
ci si può domandare per quale valore di d si ottenga anche una
teoria dei numeri « ragionevole ». In particolare, per quale valore
di d si ottiene un teorema di fattorizzazione unica? Per d = I lo
si ottiene, così pure per d = 2 e d = 3 , ma per d = 5 non lo si ottiene.
In questo sistema, ad esempio, il numero 6 ha due distinte fatto
rizzazioni in termini irriducibili:
6 = 2 X 3 , 6 = ( I + .../5) X (I - r-j) .
Gauss si conoscevano nove valori di d per
Ai tempi di
i quali il
sistema dei numeri a + b � (con a e b che variano come indi
cato sopra) possiede un teorema di fattorizzazione unica. Essi sono :
d = I , 2 , 3 , 7, I I , I 9, 43 , 67 , I 63 .
Ci sono altri valori? Nonostante sforzi considerevoli da parte di
Gauss e di altri nei decenni che seguirono , nessuno riuscì a tro
varne . Il risultato successivo è dovuto a Heilbronn e Linfoot; nel
I 934 essi dimostrarono che poteva esistere al più un decimo valore,
enormemente grande . Ma esisteva davvero?
Nel I 95 2 una sola persona conosceva la risposta (negativa) a
questa domanda. In quell'anno Kurt Heegner, uno scienziato sviz
zero in pensione che si dedicava alla matematica per hobby, pub
blicò quella che egli riteneva la dimostrazione della non esistenza
di un decimo d, ma nessuno gli credette; il suo articolo era molto
difficile da seguire, e il resto del mondo dovette aspettare altri
quindici anni prima di conoscere la verità. Nel I 967 Harold Stark
del Massachusetts Institute of Technology e Alan Baker dell'Uni
versità di Cambridge, ognuno per conto proprio e con metodi dif
ferenti, dimostrarono anch'essi che non esisteva un decimo d, e
la comunità matematica se ne convinse. Motivati dalla loro sco
perta, Stark e Baker cominciarono a esaminare il preesistente lavoro
di Heegner e, con loro stupore, trovarono che era sostanzialmente
corretto : il povero svizzero aveva visto giusto, nonostante tutto .
I SISTEMI NUMERICI
Ecco il motivo per cui il numero I 63 è così particolare e genera
quei risultati curiosi menzionati all'inizio del capitolo: è il più grande
valore di d per cui il sistema di numeri a + b � ammette una
fattorizzazione unica. Sfortunatamente, non è possibile dare qui
alcuna indicazione su come questa proprietà di I 63 sia collegata
a quanto detto in precedenza, poiché ciò richiederebbe una prepa
razione matematica specifica.
Chiuso il discorso sui sistemi di numeri a + b "- d che ammet
tono una fattorizzazione unica, che cosa si può dire di quelli che
non l'ammettono? Ancora una volta fu Gauss a indicare la via da
seguire. A ciascun sistema di numeri di tipo a + b � egli asso
ciò un numero naturale h(d ) , chiamato numero di classi di quel
sistema. Questo numero di classi dà una misura del margine con
cui la fattorizzazione unica viene a mancare : se il numero di classi
è I (come per ciascun valore di d nella lista di Gauss) , allora vale
la fattorizzazione unica; se h(d) = 2 (come è ad esempio per d = 5 ,
6, I O , I 3 ) , allora non esiste una fattorizzazione unica; quando il
numero di classe è 3 (per d = 2 3 , 3 I , 59, ad esempio) la fattoriz
zazione è « ancor meno unica »; quando è 4 (per d = 1 4 , I 7 , 2 I ,
ad esempio) lo è ancora di meno, e così via. Più grande è il numero
di classe, più modi esistono di scomporre in fattori i numeri del
sistema.
Nel paragrafo 303 delle sue Disquisitiones Arithmeticae (il menu
mentale lavoro citato nel cap. I ) , Gauss presentò alcuni calcoli
molto lunghi di numeri di classi, e osservò che per ogni numero
di classi k sembrava esistere un valore massimo di d per cui h(d) = k.
Il massimo d per cui h(d) = I era (per quanto ne sapeva) d = I 63 ,
il più grande d per cui h(d) = 2 sembrava essere d = 4 2 7 , e il mas
simo d per cui h(d) = 3 era apparentemente d = 907 . Gauss non
riuscì a dimostrare nulla di definitivo su questi valori, ma era con
vinto del fatto che esistesse un d massimo per ogni valore di k.
Il problema del numero di classi, che ha senso se si assume come
vera la congettura di Gauss , consiste nel determinare per ciascun
numero di classe k il più grande d per cui h(d)= k. Il risultato di
Heegner del I 9 5 2 risolveva il problema del numero di classi per
il caso h = 1 .
Dal tempo di Gauss al nostro secolo non fu fatto alcun pro
gresso sul problema del numero di classi . Nel I 9 I 6 Hecke dimo-
86
CAPITOLO TERZO
strò che se una particolare asserzione piuttosto complessa, cono
sciuta come ipotesi di Riemann generalizzata, fosse stata vera, allora
lo sarebbe stata anche la congettura di Gauss. Poiché nessuno
sapeva (o meglio, nessuno sa) , se l'ipotesi generalizzata di Riemann
sia vera o no, il risultato di Hecke non disse molto. Nel 1 934, lavo
rando su un articolo appena pubblicato di Deuring e Mordell, Heil
bronn dimostrò la congettura di Gauss assumendo che l'ipotesi
di Riemann generalizzata fosse falsa. Poiché l'ipotesi in questione
dovrà certamente essere vera o falsa, anche se noi non lo sappiamo,
o magari (tenendo a mente i risultati di cui si è parlato al cap . 2 )
non possiamo saperlo, i lavori di Hecke e di Heilbronn presi insieme
dimostrarono finalmente la congettura di Gauss.
Una volta confermata la validità della congettura di Gauss, fu
finalmente chiaro il modo per risolvere il problema del numero
di classi. Ma i progressi furono estremamente lenti . Dapprima
appare il risultato di Heegner del 1 9 5 2 per il caso h = I . Nel 1 967
mentre lavoravano allo stesso caso, Beker e Stark risolsero il caso
h = 2 . Nessuno dei metodi sviluppati, però, si dimostrò utile in
altri casi .
La grande vittoria avvenne nel 1 97 5 , quando Dorian Golfeld,
all'Università del Texas a Austin, ottenne una soluzione parziale .
Con una lunga e complessa argomentazione nell' ambito della teo
ria analitica dei numeri complessi, Goldfeld mostrò che, qualora
si fosse disposto di uno strumento matematico abbastanza sofisti
cato, ne sarebbe seguita la soluzione completa del problema del
numero di classi. L'oggetto richiesto era una curva geometrica di
una determinata forma, * avente alcune insolite proprietà. Il pro
blema non era trovare curve della forma desiderata, ma piuttosto
attenerne una con le proprietà particolari richieste. Goldfeld fallì,
nonostante tutti i suoi tentativi, come del resto tutti gli altri che
si dedicarono al problema.
Nel 1 983 , finalmente, ci riuscirono Zagier e Gross . La loro idea
chiave fu di cercare alcuni punti speciali sulla curva, che in onore
*
In particolare si tratta di una curva ellittica, la cui equazione è della forma
y2
=
ax 3 + bx2 + ex + d.
Le curve ellittiche hanno molte applicazioni nella teoria dei numeri, oltre a quella descritta qui.
I SISTEMI NUMERICI
del lungamente trascurato Heegner furono chiamati punti di Hee
gner. La dimostrazione consisteva in un'enorme equazione: il solo
calcolo dei due termini dell'equazione occupò r oo pagine; poi si
dovettero confrontare i termini in ogni membro per provare che
l'equazione era corretta (nonostante la lunghezza, un matematico
definirebbe « di routine » questa parte della dimostrazione) . Quello
che è veramente notevole è il fatto che una singola curva, in qual
che modo, controlli il comportamento di una famiglia infinita di
numen .
Dopo r 83 anni, il problema del numero di classi di Gauss era
stato finalmente archiviato .
C apitolo 4
Bellezza dal caos
La bellezza in matematica
Bertrand Russell scrisse nel
1918:
La matematica, giustamente considerata, non contiene soltanto la verità,
ma la bellezza suprema, una bellezza fredda e austera, come quella della
scultura. *
U n altro famoso matematico inglese,
G . H . Hardy, affermò :
Le forme create dal matematico, come quelle create dal pittore o dal poeta,
devono essere belle; le idee, come i colori o le parole, devono legarsi armonio
samente . La bellezza è il requisito fon qamentale : al mondo non c'è un posto
perenne per la matematica brutta. ( . ) E senza dubbio molto difficile definire
la bellezza matematica, ma questo è altrettanto vero per qualsiasi genere
di bellezza. Possiamo anche non sapere che cosa intendiamo per « bella poe
sia », ma questo non ci impedisce di riconoscerne una quando la leggiamo . * *
. .
Tutti e due pensavano a una forma di bellezza estremamente astrat
ta, una bellezza recondita nota ai matematici di professione , ma
che la grande maggioranza di noi è destinata a non vedere mai,
e molto probabilmente neppure a sospettare . È una bellezza ele
gante, dalla forma e dalla struttura logica, una bellezza che si può
cogliere solo dopo un lungo e arduo apprendistato .
Diciamo piuttosto che questa era la situazione fino all'inizio degli
anni ottanta, quando lo sviluppo degli elaboratori elettronici, e
in particolare delle loro potenzialità grafiche, segnò l'inizio di nuove
* [B. Russell, Lo studio della matematica, in Misticismo e logica e altri scritti, Longanesi,
Milano 1 964, pp. Bx sg.]
** [G. H. Hardy, Apologia di un matematico, Garzanti, Milano 1 989, pp. 67 sg.]
BELLEZZA DAL CAOS
tecniche matematiche, foriere di cambiamenti radicali . I calcola
tori hanno dischiuso le porte a una nuova area di ricerca, quella
della dinamica caotica; sebbene parte della matematica implicata
in questo settore non sia meno ardua e astratta di quella conte
nuta in altri campi di ricerca, la bellezza intrinseca delle strutture
che ne risultano può essere mostrata sullo schermo di un calcola
tore, in modo che tutti la possano ammirare, professionisti e non.
Stampe di immagini prodotte dal calcolatore costituivano il nucleo
di una mostra organizzata dal Goethe Institut, che incominciò a
Figura 4 . r
L'arte dei frattali : uno sguardo sul mondo di Mandelhrot.
CAPITOLO QUARTO
girare il mondo nel I 985 e che trovò pari ospitalità presso i dipar
timenti universitari di matematica e presso le gallerie d'arte. Anche
l'industria cinematografica non tardò a rendersi conto delle poten
zialità della nuova matematica, e oggi molte idee rubate alla dina
mica dei sistemi complessi (altra espressione usata per indicare il
medesimo campo) sono usate per le immagini dei film di fanta
scienza.
La figura 4 . I mostra solo un esempio delle numerose realizza
zioni grafiche delle strutture comuni in questo nuovo campo; molte
di queste possono essere riprodotte a colori per dar risalto a motivi
non apprezzabili in bianco e nero . Per quanto possa sembrare sor
prendente, la complessità della figura 4 . I è il risultato dell' applica
zione di nozioni matematiche abbastanza semplici, sebbene un' ana
lisi dettagliata possa richiedere metodi molto complessi . Tutto ciò
sarà spiegato nel corso del capitolo .
Quanto
è
lunga la linea costiera della Gran Bretagna?
Questo era il titolo di un articolo che ha fatto epoca; comparve
nella rivista « Science » nel I 96 7 , ad opera di Benoit Mandelbrot,
un brillante matematico francese che lavorava al Thomas J . Wat
son Research Center dell'IBM di Yorktown Heights, nello Stato
di New York . A prima vista la domanda sembra abbastanza inno
cua, per cui ci si può aspettare una risposta soddisfacente, data
con l'aiuto di una carta geografica o di una ricognizione aerea. Il
guaio è che, per quanto accuratamente l'operazione venga eseguita,
non è possibile ottenere una risposta esatta, e ciò per un motivo
molto semplice: non esiste « una » risposta « esatta »! Mandelbrot
giunse a questa sorprendente conclusione ragionando nel seguente
modo .
Supponiamo di eseguire la nostra misurazione sorvolando la linea
costiera a bordo di un aeroplano a un' altezza di I O ooo metri,
scattando fotografie in continuazione; poi, usando la scala oppor
tuna, calcoliamo la lunghezza totale che risulterà dal grande numero
di fotografie fatte. Quanto è precisa questa risposta? Non molto :
da una distanza di I o ooo metri molti piccoli promontori e baie
non si possono distinguere. Se dovessimo ripetere la misurazione
BELLEZZA DAL CAOS
da un piccolo aereo che vola a 500 metri di altezza, i particolari
visibili sarebbero molto più numerosi e di conseguenza il risultato
sarebbe molto maggiore del precedente: ciò che sulla prima foto
grafia appariva come un tratto di costa uniforme risulterà ora costi
tuito da numerose piccole insenature, baie e promontori .
Ora supponiamo di partire a piedi per misurare la linea costiera
con l'ausilio, ad esempio, di un compasso con apertura di un metro.
Dettagli della costa invisibili dall'aria daranno luogo a un risul
tato ancora maggiore. Se si ripeterà la misurazione con il compasso
con apertura di I o centimetri, il risultato sarà più grande ancora,
e così via: più piccola sarà l'unità di misura adottata, maggiore
sarà la quantità di dettagli rilevati e maggiore il risultato . In breve
tempo rileveremo i ciottoli, quindi i granelli di sabbia, le mole
cole e così via. Il risultato diventerà sempre più grande.
Naturalmente, nel mondo fisico questo processo di misurazione
sempre più minuta deve a un certo punto finire . I limiti umani
ci farebbero probabilmente interrompere con il compasso di aper
tura pari a un metro, mentre il fisico potrebbe obiettare che il pro
cedimento ha un limite teorico a livello atomico . Ma dal punto
di vista astratto del matematico il processo di rilevamento di misure
sempre più fini può continuare indefinitamente . Poiché ciò signi
fica che la corrispondente sequenza di misure aumenta all'infinito,
ne deriva che non esiste una risposta precisa dal punto di vista
matematico del problema della lunghezza della linea costiera, ma
solo risposte arbitrarie, che non possono neppure ritenersi appros
simazioni della realtà.
Un'entità matematica analoga alla linea costiera non misurabile
di Mandelbrot è offerta da una figura geometrica studiata per la
prima volta da Helge von Koch nel 1 904, che noi chiameremo isola
di Koch . La figura 4 . 2a mostra l'isola di Koch vista da un razzo
nello spazio interplanetario; da questa distanza ha esattamente
l'aspetto di un triangolo equilatero . Man mano che il razzo si avvi
cina alla Terra, appare chiaro che ciascuno dei tre lati in realtà
contiene un promontorio a forma di triangolo equilatero, che occupa
la parte centrale del lato per un terzo della sua lunghezza (fig. 4 . 2b) ;
s e la lunghezza del perimetro nella figura 4 . 2a è di 3 unità, quella
nella figura 4 . 2 b sarà 3 X j unità. Avvicinandoci ancora di più, ci
CAPITOLO QUARTO
(b)
(a)
Figura 4 . 2
Costruzione dell'isola
di
(c)
Koch.
accorgeremo che, allo stesso modo, ciascuno dei dodici lati che vede
vamo prima contiene un promontorio a forma di triangolo equila
tero che ne occupa la terza parte centrale (fig. 4. 2c) ; la lunghezza del
perimetro adesso è 3
X
j x j unità. La figura 4·3 mostra l'isola vi
sta da una distanza molto ravvicinata, con una rilevazione di dettagli
Figura 4·3
L'isola di Koch prende forma.
93
BELLEZZA DAL CAOS
sempre più particolareggiati, e offre qualche indicazione sulla reale
forma dell' isola di Koch .
Per il matematico, l' aspetto più interes sante della questione
è
la
regolarità con cui appaiono i dettagli ai livelli successivi: a ogni sta
dio , la parte centrale di ogni segmento della costa
è
rimpiazzata da
due segmenti, ciascuno della medesima lunghezza della parte sosti
tuita, come si vede nella figura
4·4·
Come si può dedurre osservando le figure
4.2 e 4.3, l'isola di Koch,
dal punto di vista matematico, ha una forma ben definita, di cui la
figura
4·3 offre una buona approssimazione per quanto l'occhio umano
riesce a distinguere . La linea costiera dell'isola di Koch, se la si vuole
definire da un punto di vista matematico,
è la « curva » che corrisponde
al limite della successione infinita di approssimazioni, le prime tre
delle quali sono mostrate nella figura
4. 2.
A
questo punto la mate
matica si sostituisce alla cartografia: matematicamente parlando, questa
curva limite
è definita in modo preciso e,
come qualunque altra curva,
consiste in un numero infinito di punti allineati in modo da formare
una linea continua. Il processo per arrivare alla curva limite
logo a quello per arrivare al numero
sione infinita di decimali
j
è
ana
come limite della succes
0,3 0,33 0,333 0 , 3 3 3 3 0 , 3 3 3 3 3 . . . .
Poiché l'isola di Koch è una porzione definita del piano , essa
avrà un' area definita . Il reale valore numerico della sua superficie
dipenderà naturalmente dalle unità di misura che verranno impie
gate, ma sarà senz ' altro finito . Esso può essere calcolato come
il limite di una successione di numeri, in maniera molto simile
(a)
Figura 4 · 4
Generazione della linea costiera d i Koch.
(b)
94
CAPITOLO QUARTO
all'esempio del numero f , ed è in realtà esattamente 1 ,6 volte
l' area del triangolo della figura 4 . 2a . Ma qual è la lunghezza della
linea costiera che delimita questa superficie finita? Ebbene, ciascu
no stadio successivo del processo aumenta la lunghezza della linea
costiera di .j- , e quindi quando si raggiungerà la curva di Koch
(nome dato alla curva perimetrale) questo aumento di .j- si sarà
verificato un numero infinito di volte: dunque la lunghezza della
curva di Koch è infinita.
Come può una superficie finita avere un perimetro infinito? Le
stesse figure 4 . 2 e 4·3 forniscono la risposta. Ad ogni approssima
zione successiva, la curva perimetrale si deforma da un lato all' al
tro per l'intera lunghezza. Queste deformazioni possono essere dise
gnate in dettaglio, purché si usi una scala adatta, ma quando si
arriva alla curva di Koch la deformazione è avvenuta infinite volte.
Si verifica allora qualcosa di molto strano : interviene una nuova
dimensione.
Nuove dimensioni
Le curve che di solito incontriamo in geometria sono tutte uni
dimensionali: un essere costretto a vivere su una linea retta o su
un cerchio può muoversi in una sola direzione (se il movimento
all'indietro è considerato semplicemente un movimento in avanti
negativo) . Le superfici geometriche solite, come i piani e le super
fici sferiche, sono bidimensionali: hanno due direzioni indipendenti
di movimento, spesso indicate in termini di avanti/indietro e
destra/sinistra. Gli oggetti solidi sono tridimensionali, poiché am
mettono tre direzioni di movimento . Ad esempio, un treno può
muoversi solo in una direzione, le navi possono viaggiare in due
direzioni sulla superficie del mare e un aereo può muoversi in tre
direzioni .
Per quanto attiene all'esperienza umana, l'universo in cui
viviamo ha solo tre dimensioni, anche se la teoria della relatività
considera il tempo come una « quarta dimensione », e alcune
moderne teorie fisiche arrivano ad attribuire undici dimensioni
all'universo (le tre che percepiamo fisicamente più altre otto che
95
BELLEZZA DAL CAOS
si manifestano come le forze basilari della natura: gravità, magne
tismo e così via) . Ma per il matematico la tridimensionalità non
occupa un posto privilegiato . È possibile prendere in considera
zione spazi di quattro o più dimensioni, cosa che avviene abitual
mente. Sebbene non possano essere rappresentati dalla geometria
tradizionale, questi spazi multidimensionali possono essere di reale
uso pratico; un esempio pertinente sarà dato dalla programmazione
lineare, di cui parleremo nel capitolo I I . Si noti comunque, che
tutte queste dimensioni sono ancora numeri interi .
Che cosa c'entra la linea costiera di Koch con tutto ciò? Essendo
una curva, la si potrebbe pensare unidimensionale; ma questo non
è vero: per quanto ciascuna delle approssimazioni alla curva di Koch
che si ottengono con il processo sopra descritto sia unidimensio
nale, la curva limite non lo è. Quando la direzione di percorrenza
cambia un numero infinito di volte, non ci troviamo più in un
mondo a noi familiare; in realtà, nemmeno l'uso della parola « dire
zione » è qui del tutto giustificato . Quindi non possiamo sperare
di attribuire una dimensione alla curva di Koch parlando di dire
zione del movimento, ma dobbiamo trovare un modo nuovo di
giungere al concetto di dimensione che non dipenda dalla direzione.
È opportuno utilizzare un metodo che si adatti alla natura della
curva di Koch. La sua caratteristica basilare è l'autosomiglianza :
le parti, in scala ridotta, sono simili al tutto .
Supponiamo di prendere una figura D-dimensionale e di divi
derla in N parti del tutto simili. Allora il rapporto di similitudine r
tra l'intera figura e una singola parte sarà dato da
r=
�N .
Poiché la figura è D-dimensionale e r deve essere calcolato « lungo
una dimensione », occorre prendere la radice D-esima di N.
Per esempio, supponiamo di avere una linea retta e di spezzarla
in N segmenti uguali (fig. 4 . 5 ) . Ciascun segmento è esattamente
I/N dell'intera lunghezza, quindi il rapporto di similitudine sarà
N. Questo è proprio il valore ottenuto dalla formula quando si
prenda D = I .
Oppure potremmo prendere un rettangolo (D = 2) e sezionarlo
in N parti, dividendolo in senso orizzontale e verticale in k seg
menti (fig . 4 . 6) . Allora l'intero rettangolo è diviso esattamente
CAPITOLO QUARTO
N
segmenti
Figura 4 · 5
Autosomiglianza per una linea retta.
in N = k 2 « copie » più piccole del tutto, e il rapporto lineare r tra
il tutto e la parte è dato da
Ancora una volta si ottiene il risultato che ci si aspettava.
In entrambi i casi sembra di aver girato in tondo , ma stavamo
esaminando casi molto familiari e per nulla problematici. Quando
applichiamo la medesima analisi alla curva di Koch, giungiamo a
una conclusione decisamente più sorprendente. Per questa curva
non conosciamo D, ma i valori di N e r si determinano facilmente :
basta osservare il processo di riproduzione che dà origine alla curva.
Come prima cosa, consideriamo un tratto della linea costiera (vedi
fig. 4 . 4a) ; uno qualunque, dal momento che sono tutti uguali. Nel
processo di riproduzione (vedi fig. 4.4b) , il singolo segmento è sosti-
k
segmenti
Figura 4 .6.
Autosomiglianza per un rettangolo.
97
BELLEZZA DAL CAOS
tuito da quattro segmenti (quindi N = 4) , ciascuno corrispondente
a un terzo della lunghezza del segmento originale (quindi r = 3 ) .
Poiché questo è vero per qualunque tratto della linea costiera, sarà
vero per l'intera curva di Koch. Quindi, secondo la formula cal
colata sopra,
Che valore ha D? Certamente non è un numero intero . L'unico
modo per determinarlo è usare i logaritmi. Se prendiamo i loga
ritmi di entrambi i membri di questa equazione, otterremo
log 3 = D log 4 .
D può essere calcolato consultando l e tavole dei logaritmi o ser
vendosi di una calcolatrice; con quattro cifre decimali il risultato è
D = r ,26r8.
Quindi la curva di Koch è un'entità matematica la cui dimensione
è frazionaria.
Non solo le curve possono avere dimensioni frazionarie; si pos
sono costruire anche « superfici » e « solidi » altrettanto originali
adottando procedure di autoriproduzione . Per esempio, partendo
da un cubo e rimuovendo successivamente le parti centrali si arriva
alla fine, cioè dopo un numero infinito di ripetizioni, a un oggetto
noto come la spugna di Sierpinski (D = 2 , 7 268), la cui struttura
appare nella figura 4· 7 . Questo oggetto incredibile ha un volume
zero racchiuso da una superficie infinita. Ciascuna faccia esterna
è nota come tappeto di Sierpinski, e ha una superficie zero delimi
tata da un perimetro infinito . La dimensione del tappeto di Sier
pinski è D = r , 2 6 r 8, la stessa della curva di Koch. Noi dovremmo
essere in grado di confermare tutti e due i valori di D associati
alla spugna osservando la figura 4· 7 e servendoci della formula
r = V'N '
o, mediante logaritmi,
D=
log N
.
log r
Le figure con dimensione frazionaria sono state chiamate frat
tali da Mandelbrot nel r 977 . La geometria frattale studia tali oggetti.
CAPITOLO QUARTO
Figura 4 · 7
L a spugna d i Sierpinski prende forma.
Nel resto di questo capitolo parleremo di frattali di tipo diverso
dalla curva di Koch e dalla spugna di Sierpinski. Questi ultimi sono
estremamente regolari, perché il processo di autoriproduzione è
lo stesso a ogni livello, e l'osservazione ravvicinata di un parti
colare della figura per cogliere più dettagli non procura sorprese:
si tratta di una riproduzione del medesimo ad infinitum. A partire
dal 1 980, grazie ai calcolatori, si sono esaminati frattali in cui il
modulo di riproduzione cambia continuamente (anche se, come
risulterà chiaro, spesso lo si può ancora definire « autoriprodu
zione ») . Con figure di questo tipo, l'osservazione ravvicinata può
dare risultati del tutto inaspettati, un esempio dei quali è dato
dalla figura 4· I . L'esame di questi frattali riguarda in parte la mate
matica, in parte la sperimentazione elettronica, e porta il ricerca
tore in un nuovo mondo pieno di fascino e spesso estremamente
bello . Come per molti altri « nuovi mondi », la sua scoperta fu in
parte dovuta al caso .
BELLEZZA DAL CAOS
99
Alla scoperta di un nuovo mondo
Già nel 1 978, il lavoro di Mandelbrot sui frattali aveva visto
notevoli sviluppi . L' anno precedente era stato pubblicato il suo
libro Gli oggetti frattali: forma, caso e dimensione, dove egli dimo
strava come molti fenomeni quotidiani nel campo della fisica, della
biologia e della matematica diano origine a frattali . Tutti i frattali
che egli aveva preso in considerazione si erano rivelati, come la
curva di Koch, autosimili . Essi davano origine a sviluppi matema
tici interessanti e talvolta a conclusioni sorprendenti, nonché a
figure affascinanti e perfettamente simmetriche, molte delle quali
illustrate nel libro di Mandelbrot . Però, tutti gli esempi erano intrin
secamente prevedibili, cosa che non si verifica nei frattali della
vita reale : la linea costiera della Gran Bretagna, ad esempio, mani
festa un comportamento frattale molto meno regolare della curva
di Koch . Questo estremo ordine e totale prevedibilità nascevano
dal fatto che i frattali in esame erano autosimili per cambiamenti
di scala e per traslazioni (in linguaggio matematico, invarianti per
trasformazioni lineari) . Mentre lavorava con Mark Laff alla IBM nel
1 978-79, Mandelbrot incominciò a esplorare frattali invarianti per
trasformazioni non lineari, in cui, invece di una semplice variazione
di scala, si possono eseguire operazioni più complicate, quali il qua
drato , il cubo e cosl via . In casi come questi, l' unico modo per
farsi un' idea dell' aspetto del frattale corrispondente è farlo gene
rare da un elaboratore. In effetti, all'inizio di questo secolo, il lavoro
di Gaston Julia e Pierre Fatou in Francia sugli stessi concetti si
era arrestato , in gran parte, a causa dell 'impossibilità di rappre
sentare gli oggetti in esame; Mandelbrot era venuto a conoscenza
di questo lavoro quando era studente all' É cole Polytechnique a
Parigi, dove Julia era stato suo insegnante.
Alla fine del 1 979 Mandelbrot era giunto alla conclusione che
valesse la pena esaminare, servendosi di un calcolatore, il compor
tamento della particolare funzione x 2 + c, in cui sia la variabile x
sia il parametro costante c sono numeri complessi . Quale tipo di
comportamento fosse esattamente considerato sarà spiegato più
avanti, ma basti per ora dire che è possibile usare i calcolatori per
tracciare diagrammi che mettano in relazione questo comporta
mento con i valori variabili del parametro c.
I OO
CAPITOLO QUARTO
Per ironia della sorte, Mandelbrot non era all'IBM in quello che
doveva essere l' anno cruciale, il 1 979-80, ma era in visita alla Har
vard University, e quindi non aveva la possibilità di accedere quo
tidianamente alle famose strutture di calcolo dell'IBM nel momento
in cui più che mai il suo lavoro lo richiedeva. Ma nello scanti
nato dello Science Center di Harvard egli trovò un piccolissimo
calcolatore Vax appena arrivato, a cui erano collegati un visore
Tektronix piuttosto vecchio e una stampante Versatec che poteva
fornire delle copie su carta. Un assistente di Harvard, di nome
Peter Moldave, offrì gratuitamente i suoi servizi come program
matore del progetto, e così il lavoro andò avanti .
La prima immagine che ottennero fu una rozza versione della
doppia macchia simile a uno scarafaggio mostrata, in modo molto
più particolareggiato, nella figura 4 . 1 3 . Era quanto si aspettavano,
la teoria lo aveva previsto . Più sconcertanti erano alcune macchie
più piccole staccate dalla figura principale; un esame più attento
di queste rivelò che esse erano versioni più piccole dello « scara
faggio » principale ! Ancora una volta sembrava manifestarsi il con
sueto comportamento autoriproduttivo dei frattali. Eseguendo cal
coli più rigorosi si ottenevano figure migliori, con più dettagli,
finché improvvisamente le figure incominciavano ad assumere un
aspetto sempre più confuso . Forse la loro vetusta attrezzatura per
la stampa era difettosa? Per sincerarsene, Mandelbrot si portò a
casa a Yorktown Heights il programma, per provarlo su un IBM.
Non solo la confusione non sparì, ma una figura di qualità migliore
rivelò che tale confusione nascondeva un motivo ricorrente pre
ciso . Osservando ancora più da vicino, Mandelbrot e Moldave tro
varono che alcune delle macchie piccole come granelli di polvere
non erano versioni ridotte dello scarafaggio, come avevano imma
ginato, ma erano piuttosto dei bei motivi complessi, spirali, fami
glie di figure dall' aspetto di cavallucci marini, e simili (figg. 4· I
e 4· 1 6) . Mandelbrot aveva intravisto il suo nuovo mondo .
Ordine e
caos
Ordine e caos. Nel corso della storia, e all'interno dell'universo,
sono loro a contendersi la supremazia . Spesso solo una lama di col-
IOI
BELLEZZA DAL CAOS
tello li separa: una piccola variazione di pressione può trasformare
il regolare flusso dell' acqua da un rubinetto in un complesso caos
di vortici; comunità animali ordinate, comprese quelle umane, pos
sono essere trasformate con incredibile facilità in anarchie incon
trollabili . Al polo opposto l'ordine può emergere dal caos, come
testimonia l'evoluzione della vita dal caos formale dell'universo,
ultimo gradino il genere umano. Come vedremo, il passaggio dal
l'ordine al caos, e il successivo emergere dell'ordine dall'interno
di quel caos, viene rivelato in modo evidente dallo studio di sem
plici circuiti retroattivi.
L' aspetto essenziale del meccanismo di retro azione è questo :
esiste una certa quantità x che varia (nel tempo o in relazione a
qualche altra variabile) in modo tale che il valore di x in qualsiasi
istante dipende con andamento regolare dal suo valore nell'istante
precedente (fig. 4 . 8) . Procedimenti di questo tipo permeano tutte
le scienze esatte e la maggior parte, se non tutte, delle scienze spe
rimentali. Molta della matematica moderna è stata sviluppata per
trattare tali procedure; ad esempio, il caso in cui l'incremento
tra la vecchia x e la nuova x è infinitesimale portò allo sviluppo
di varie tecniche per la risoluzione delle equazioni differenziali.
Per studiare un processo di retroazione dal punto di vista mate
matico, si assume che la regola per generare il nuovo valore di x
a partire dal precedente sia data da una funzione /(x) . Quindi, par
tendo da un valore iniziale x0 di x, i valori successivi x1, x2 , X3 ,
sono generati secondo la regola illustrata nella figura 4 · 9 · Non è
necessario porre restrizioni sulla funzione/(x) , sebbene il processo
di retroazione conseguente non risulti molto interessante a meno
che la/(x) scelta sia diversa da una funzione lineare, cioè della forma
• • •
/(x) = ax + b,
Figura 4 . 8
Il meccanismo d i retroazione cambia i l valore d i x .
102
CAPITOLO QUARTO
Figura 4 · 9
Valori successivi d i
x
generati dal meccanismo d i retroazione.
per a e b costanti. Ci occuperemo in modo particolare del caso
in cui /(x) contenga un parametro . La scelta di quel parametro può
avere un effetto determinante sul comportamento del processo di
retroazione che ne consegue.
Si è soliti considerare un meccanismo di retroazione come un
sistema dinamico, il quale manda un punto iniziale x0 successiva
mente nei punti x 1 , x2 , x}, . . . La sequenza dei punti nei quali x0
è mandato è detta traiettoria o orbita di x0• Se questa traiettoria è
ordinata possiamo parlare di dinamica classica; se non lo è, siamo
nel caso della dinamica caotica . Dovrebbe bastare questa nomen
clatura a indicare quanto questo studio sia collegato con molti feno
meni della vita di tutti i giorni .
Per fare un esempio, consideriamo la crescita di una popola
zione su un arco di un certo numero di anni. Supponiamo che la
dimensione iniziale della popolazione sia x0, e che x. sia la popo
lazione dopo n anni. Il tasso di crescita durante l'anno ( n + r )-esimo
è allora
X + l - Xn
:.
...
.
r = ____:n .:..:.
x._..::.
Se il tasso di crescita è costante di anno in anno, questa equazione
sarà valida per ogni valore di n; possiamo allora modificarla per
esprimere la legge dinamica lineare
x. + 1 = /(x.) = (r + r) x
•.
Dopo n anni, la popolazione sarà
x. = ( r + r) • X0,
espressione ottenuta procedendo a ritroso a partire da x. =
BELLEZZA DAL CAOS
1 03
= ( I + r) x. _ 1 , x. _ 1 = ( I + r) x. _ 2 e così via, fino a x1 = ( I + r) x0 •
Questo è un esempio di crescita esponenziale, tipica di molti feno
meni della vita reale oltre che dell'accrescimento della popolazione.
Come dovrebbe essere chiaro da quanto abbiamo visto nel capi
tolo I , una dinamica di crescita di questo tipo, se protratta senza
controllo per un certo numero di anni, condurrà a popolazioni ster
minate . In realtà, tale crescita si verificherà solo per un periodo
limitato, dopo di che si giungerà a una stabilizzazione. Nel I 845
P . F . Verhulst formulò una legge di crescita che tiene conto del
l'esistenza di una dimensione massima possibile di popolazione,
che chiameremo X. La legge di Verhulst dice che il tasso di cre
scita scende da r a O man mano che la popolazione si avvicina a X.
Un modo semplice per rappresentarlo dal punto di vista matema
tico consiste nel sostituire il tasso costante di crescita r con il tasso
variabile di crescita r - ex. , dove c è una costante. Dal momento
che la crescita della popolazione dovrebbe diventare zero quando
X11 = X, il valore della costante c dovrà essere r/X. Dunque con
questo valore la legge dinamica per il processo di Verhulst è
x. + 1 = /(x.) = ( I + r - ex. ) x. = ( I + r) x. - ex; .
Una volta che si è raggiunto il valore X, la popolazione rimarrà
costante:
/(X) = X.
Se la popolazione è minore di X aumenterà; se è maggiore dimi
nuirà. Se si fa una prova, a mano o con un calcolatore, si vedrà che
il procedimento di Verhulst porterà la popolazione ad evolversi,
fino a stabilizzarsi sul valore X, indipendentemente dalle condi
zioni iniziali . O meglio, questo accade a patto che r sia minore
di 2 , cioè se il tasso di crescita è minore del 2oo per cento, limita
zione senza dubbio valida per la crescita delle popolazioni umane.
Ma, come osservò il meteorologo E . N . Lorenz nel I 963 , per valori
di r più grandi di 2 la legge di Verhulst descrive determinati aspetti
dei flussi turbolenti; inoltre ne esistono anche applicazioni nel
l' ambito della fisica dei laser, dell'idrodinamica e della teoria delle
reazioni chimiche, sicché il comportamento dei sistemi di Verhulst
per valori di r maggiori di 2 non è privo di interesse. Ed è proprio
in questo caso che si riscontrano i risultati più affascinanti.
1 04
CAPITOLO QUARTO
Ponendo c = r/X, la relazione precedente diventa
Xn + 1 = (I + r) Xn -
; x: .
Cambiando opportunamente le unità di misura possiamo assumere
che X = I , sicché la legge si semplifica ancora in
Xn + l = ( I + r) xn - rx: = Xn + rxn ( I - xn ) .
Chi possiede u n calcolatore può facilmente eseguire qualche
prova per vedere come varia la legge di Verhulst per valori diffe
renti di r, partendo in ciascun caso da un valore iniziale, ad esem
pio, di x0 = o, I . Il programma dovrebbe leggere il valore scelto
di r, porre x = o, I , ripetere l'operazione
x = x + r * x * ( I - x) ,
500 volte, per dar tempo al processo di stabilizzarsi, e poi calco
lare e stampare i successivi 20 valori di x. Per valori di r minori
di 2 il processo si stabilizza in fretta sul valore di equilibrio di
x = I ; per r appena maggiore di 2 il processo si stabilizza in una
oscillazione regolare tra due valori (r = 2 , I dà i valori o,82 e I , I 3 ) .
Questo comportamento continua per tutte l e scelte d i r fino a
r = 2 ,5 , quando si ha una ricorrenza ciclica di quattro punti (0,54;
I , I 6; o,7o; I , 23) . Ciò continua fino a r = 2 ,55, quando incomin
cia un ciclo di otto valori. Per r = 2 ,5 65 , il ciclo raddoppia ancora
una volta giungendo a sedici valori sui quali il procedimento si ripete
poi all'infinito; i raddoppiamenti continuano con frequenza sem
pre maggiore, fintanto che a r = 2 ,5 7 l'effetto di duplicazione si
è verificato un numero infinito di volte. A questo punto il com
portamento del sistema dinamico diviene caotico, e i punti si spo
stano di qua e di là in tutte le direzioni senza uno schema apparente.
I vari cicli ai quali tende il processo di Verhulst per valori di
r minori di 2 ,57 sono detti attrattori. Quindi per r minore di 2 l ' at
trattore consiste in un punto, vale a dire x = I ; per r compreso
tra 2 e 2 , 5 , l'attrattore è costituito da una coppia di valori; per r
compreso tra 2 ,5 e 2 ,55, l'attrattore è un ciclo di 4 punti, e cosl via.
Un'immagine più chiara di ciò che avviene si può ottenere dise
gnando un grafico che lega il comportamento del processo, dopo
la fase iniziale di assestamento, ai vari valori di r. Il grafico più
BELLEZZA DAL CAOS
grosso nella figura 4 . 1 0 mostra che cosa si ottiene prendendo valori
di r da 1 , 9 a 3 , 0 , misurati lungo l' asse orizzontale, e tracciando
r 20 valori successivi di x dopo una fase iniziale di 5000 ripetizioni.
Un' analisi attenta della regione caotica al di sopra di r = 2 ,5 7
dimostra che u n tale caos apparente nasconde u n grande ordine .
Per esempio , vicino a r = 3 , 0 c ' è una sola regione caotica; per
r = 2 ,679 questa si suddivide in due regioni caotiche, per r = 2 ,59 3
in quattro, poi in otto, in sedici e così via, duplicandosi ogni volta,
finché a r = 2 , 5 7 questa duplicazione è avvenuta molte volte, sic
ché l'intero processo sembra riprodurre il comportamento del
sistema dinamico . In effetti c ' è una costante universale secondo la
Figura 4 . 1 0
Il procedimento di Verhulst ( r , 9 < r < J ,o), con un ingrandimento dell'area evidenziata,
che illustra l' autoriproduzione. Lungo l'asse orizzontale sono tracciati i valori di r da
1 , 9 a 3 , 0 . Per ogni valore di r, lungo l'asse verticale, sono tracciati 1 2 0 valori successivi
di x dopo un numero iniziale di 5000 ripetizioni (fatte per permettere al processo di
stabilizzarsi) . Per valori di r inferiori a 2 è generato un solo valore di x . Per r compreso
tra 2 e 2 ,5 ci sono due valori, per r tra 2 , 5 e 2 , 5 5 ce ne sono quattro, poi fino a 2 , 5 65
ce ne sono otto. Questo processo di raddoppiamento continua sempre più rapidamente
fino a r= 2 , 5 7 , dove subentra il caos . Ma all'interno del caos incomincia a emergere
un nuovo ordine, autoriproduzione compresa.
r o6
CAPITOLO QUARTO
quale si susseguono i raddoppiamenti, associata non soltanto ai due
processi di duplicazione incontrati finora, ma anche a tutti gli altri
esempi di questo fenomeno : è il così detto numero di Feigenbaum,
il cui valore fino a dieci decimali è
4 , 669 2 0 ! 6609 .
Molto più appariscente è la comparsa nella regione caotica di
fasce dove sembra regnare l'ordine . Per esempio, vicino a r = 2 , 83
il caos improvvisamente cede il posto a un ciclo a tre punti (o
3 -ciclo) ; e, nelle zona circostante il punto centrale, scopriamo un
piccolissimo duplicato dell'intero diagramma di Verhulst, completo
delle sue fasce ordinate circondate dal caos. Il riquadro nella figura
4 . 1 0 mostra un ingrandimento di questa zona, dilatata nel senso
orizzontale. Ancora una volta siamo di fronte a un comportamento
frattale ! E non è che l'inizio . . .
Gli insiemi di Julia
Gli studi di Mandelbrot menzionati prima presero le mosse dal
lavoro compiuto da P . J. Myrberg negli anni sessanta sulla legge
di Verhulst. Ciò che caratterizzò il lavoro di Mandelbrot fu soprat
tutto l' ammettere che la variabile e il parametro costante fossero
numeri complessi piuttosto che semplici numeri reali . Così il suo
procedimento, invece di mandare numeri in numeri sulla retta reale,
manda punti in punti nel piano complesso bidimensionale (il dia
gramma di Argand) .
Per semplificare un po' le cose, invece di considerare la funzione
/ (x) = x + rx ( I - x) = - rx 2 + ( I + r) x,
vista prima, Mandelbrot usò la formula lievemente più semplice
/(x) = x 2 + c.
Supponiamo di incominciare con un valore x0, un numero com
plesso; poi vediamo che cosa accade quando si ripete la funzione
f per generare una sequenza di punti x0, x1, x2 , secondo la regola
• • •
xn + ! = /(xn) .
BELLEZZA DAL CAOS
107
I risultati ottenuti per il processo di Verhulst fanno presumere che
la scelta della costante c sia fondamentale. Partiamo dal caso più
semplice, c = O. La legge dinamica allora è solo
Ci sono tre possibili soluzioni, a seconda della scelta di x0 • Primo,
se x0 dista dall'origine meno di un'unità i numeri nella succes
sione diventano sempre più piccoli, cioè sempre più vicini a 0: O è
dunque un attrattore per il sistema . Secondo, se X0 dista da O più
di un'unità i numeri nella successione diventano sempre più grandi,
nel qual caso diciamo che l'infinito è un attrattore (quantunque,
non essendo l'infinito un punto nel piano complesso, questo uso
della parola « attrattore » è del tutto convenzionale) . L'ultima possi
bilità si ha quando X0 dista dall'origine esattamente un'unità, cioè
appartiene al cerchio unitario di centro in O; in questo caso la
successione non abbandona mai il cerchio medesimo, che viene
ad essere la frontiera tra le due sfere di attrazione, una regolata
da O , l' altra dall'infinito .
Questo comportamento è tipico di tutti i casi esaminati da Man
delbrot, in quanto divide il piano complesso in due distinte aree
di attrazione separate da una curva che le delimita. Ma Mandel
brot scoprì che, per valori del parametro c diversi da zero, non
soltanto l' attrattore finito può consistere in più di un punto, ma
la frontiera tra le regioni dei due attrattori può essere incredibil
mente complessa ed estremamente bella.
Per c = o,3 r + o,o4 i, ad esempio, l' attrattore finito è un punto
singolo, ma la frontiera tra la sua regione e quella regolata dall'in
finito non è un cerchio perfetto, ma un cerchio deformato nel
l'immagine affascinante che si può osservare nella figura 4· r r a .
S i tratta d i una deformazione frattale: osservando più d a vicino
ciascuna parte della frontiera, usando come « microscopio » un cal
colatore, si troverà l' autosomiglianza tipica delle curve frattali, che
si ripete all'infinito .
Sebbene solo l' avvento del calcolatore abbia reso possibile
l'esame di tali figure, Julia e Fatou avevano dimostrato che qual
siasi tratto della frontiera, non importa quanto breve, contiene
tutte le informazioni necessarie per determinare l'intera curva, in
quanto l'intera frontiera può essere generata sottoponendo ripe-
108
CAPITOLO QUARTO
(a)
(b)
Figura 4 . 1 1
Insiemi di Julia con i loro attrattori .
tutamente quel tratto alla trasformazione che genera il sistema (in
questo caso /(x) = x2 + c) . In onore di Julia, questi insiemi di
frontiera sono oggi noti come insiemi di Julia .
La figura 4 . 1 1 b mostra un insieme di Julia associato a un proces
so dinamico con un attrattore finito che consiste in un 3 -ciclo . La
legge dinamica in questo caso è /(x) = x 2 + c, con c = - o, I 2 +
+ o , 7 4 i . La figura 4 . I 2 mostra altri esempi di insiemi di Julia che
obbediscono alla legge / (x) = x2 + c, non esclusi alcuni esempi
limite in cui le zone degenerano in « polvere » o « dendriti » (vedi
più avanti per i dettagli) .
La diversità di struttura presentata dagli insiemi di Julia a
seconda della scelta del parametro c fa capire quanto questa sia
decisiva. Una domanda che viene spontaneo porsi è se sia possi
bile individuare una qualche struttura nei valori di c che corrispon
dono allo stesso sistema dinamico, e quindi agli stessi insiemi di
Julia. Tentando di rispondere a questa domanda, Mandelbrot scoprì
nel I 980 il sottoinsieme del piano complesso che ora porta il suo
nome : l'insieme di Mandelbrot .
L 'insieme di Mandelbrot
La macchia nera a forma di scarafaggio mostrata nella figura 4 · I 3
è nota con il nome di insieme di Mandelbrot. È stato dimostrato
che questo insieme è strettamente collegato con il comportamento
BELLEZZA DAL CAOS
Figura 4 . 1 2
Insiemi di Julia derivanti dalla frontiera dell'insieme di Mandelbrot.
Figura 4 . 1 3
L'insieme d i Mandelbrot ( - 2 , 2 5 < Rec < o , 7 5 , - r , 5 < Ime < r ,5 ) .
1 09
I lO
CAPITOLO QUARTO
di tutti i processi dinamici e non soltanto con l'esempio preso ora
in considerazione; come tale, occupa un posto speciale di prima
ria importanza in matematica, insieme ad altre figure particolari
come il cerchio e i poligoni regolari .
Come dovrebbe apparire evidente da un rapido sguardo alle
figure 4 . 1 1 e 4 . 1 2 , un processo dinamico complesso o suddivide
il piano in una o più aree interne e una sola area esterna che si
estende all' infinito (figg . 4 . 1 1 a , b; 4 . 1 2a, b, c) , oppure fa degene
rare l'insieme di Julia in un insieme che non delimita alcuna area
interna (figg . 4 . 1 2d, e, /) . Il comportamento esatto dipende dalla
posizione del parametro c rispetto all'insieme di Mandelbrot . Con
siderando sempre la funzione / (x) = x 2 + c, ci occuperemo per
prima cosa dei casi in cui l' insieme di Julia non è degenere , cioè
in cui esiste un attrattore diverso dall'infinito.
Se c è scelto all'interno del corpo centrale dell' insieme di Man
delbrot, allora il corrispondente sistema dinamico ha un attrattore
finito consistente in un unico punto , un punto fisso x che soddi
sfa la condizione / (x) = x. L'insieme di Julia in questo caso è un
cerchio con una deformazione frattale , come nella figura 4· u a ,
i n cui l a costante c è situata vicino a l margine destro del corpo
principale a forma di cardioide dell'insieme di Mandelbrot .
S e , d' altro canto, c è scelto all'interno di una delle gemme attac
cate al corpo principale dell'insieme di Mandelbrot, allora l'insieme
di Julia consiste in un numero infinito di cerchi con deformazioni
frattali situati intorno ai punti di un attrattore ciclico . Nella figura
4 · 1 1 b , ad esempio, c è stato scelto dal centro della macchia grande
all'estremità superiore dell'insieme di Mandelbrot; i tre punti indi
cati formano il 3 -ciclo che funge da attrattore finito per il sistema .
Un punto scelto entro una qualunque delle tre aree contenenti que
sto attrattore tende a muoversi direttamente verso il 3 -ciclo ; punti
scelti nelle altre aree si dirigeranno verso un attrattore « locale »
che viene poi mandato al 3 -ciclo .
Se c è il punto di germinazione di una gemma sull' insieme di
Mandelbrot , l'insieme di Julia risulta avere dei cirri che si proten
dono verso un attrattore marginalmente stabile, come nella figura
4 . 1 2a , che si stabilizza in un 2 o-ciclo (c = 0 , 2 7 3 3 4 + o , oo742i) ,
oppure nella figura 4 . 1 2 b, che h a u n 4-ciclo (c = - 1 , 2 5 ) .
Infine, se c è un qualunque altro punto del contorno dell' in-
BELLEZZA DAL CAOS
III
Figura 4 . 1 4
I l disco di Siegel.
sieme di Mandelbrot, l'insieme di Julia risulta essere ciò che è noto
come il disco di Siegel, un esempio del quale si vede nella figura
4 . 1 4 (c = - 0 , 3 90 54 - 0 , 5 8 6 7 9 i) , dove un punto fisso è circon
dato da cerchi invarianti. Ciò che accade in questo caso è che un
punto entro l' area circoscritta dall'insieme di Julia tenderà verso
il disco contenente il punto fisso, dopo di che orbiterà per sempre
intorno al punto fisso sul suo cerchio invariante .
I quattro tipi d i insiemi d i Julia visti sopra sono i soli possibili
per il processo /(x) = x 2 + c. Nel 1 98 3 Dennis Sullivan dimostrò
l' esistenza di un altro tipo di insieme di Julia non degenere deri
vato da altri tipi di sistemi dinamici complessi, detto anello di
Herman.
Questo è quanto per gli insiemi non degeneri di Julia. E per
gli altri, come quelli delle figure 4 . 1 2d, e, / ? Ingrandimenti del
l' insieme di Mandelbrot rivelano che esso è circondato da sottili
antenne che si diramano dal corpo principale . Se c è scelto su una
di queste antenne, si otterrà un insieme di Julia dalla forma simile .
La figura 4 . 1 2e mostra l'esempio per c = i; qui si ha un unico attrat
tore infinito , a cui tendono tutti i punti, tranne quelli che si tro
vano proprio sul tenue insieme di Julia (detto dendrite) .
La figura 4 . 1 3 non è sufficientemente particolareggiata per
II2
CAPITOLO QUARTO
mostrare anche le suddette antenne, ma è possibile individuare
la posizione di alcune dalla presenza di macchioline sulla loro traiet
toria. Macchioline? Da un esame attento, con un ingrandimento
al calcolatore, risultano essere nient ' altro che minuti duplicati
dello stesso insieme di Mandelbrot ! A loro volta, esse presentano
piccolissime antenne, sulle quali si possono individuare . . . e così
via, ad in/initum . (Le aree ordinate nella zona caotica del dia
gramma della fig . 4 · 1 0 corrispondono alla posizione di questi « ger
mogli » sull ' asse reale) . Se c è scelto su uno di questi germogli , si
otterrà un insieme di Julia dato dalla combinazione di una den
drite e di un numero infinito di copie dell 'insieme di Julia del
corrispondente valore di c sul corpo principale dell'insieme di
Mandelbrot (fig . 4 · 1 5) .
L'unica possibilità che ci rimane è scegliere c all'esterno del
l' insieme di Mandelbrot , con tutte le sue gemmazioni . In questo
caso l'infinito è l'unico attrattore, e l' insieme di Julia si dissolve
in punti isolati detti polvere di Fatou; questa polvere diventa sem
pre più fine a mano a mano che c si allontana dall'insieme di Man
delbrot . Se c è scelto su un punto vicino alla frontiera dell' insieme
di Mandelbrot , la polvere è abbastanza fitta da creare dei motivi
affascinanti, come nelle figure 4 . 1 2d, f. Nella figura 4 . 1 2/, c è
vicino al valore che genera la figura 4 . 1 2c, e c ' è una notevole somi-
Figura 4 . 1 5
U n insieme di Julia d a una gemma di Mandelbrot.
BELLEZZA DAL CAOS
I IJ
Figura 4 . 1 6
Viaggio nella regione di frontiera dell ' insieme d i Mandelbro t .
glianza tra i due insiemi di Julia. Tali « ricami » di polvere hanno
sempre un aspetto frattale, cioè sono autosimili , con una dinamica
caotica .
N o n c i s i stupirà quindi s e l a frontiera dell 'insieme d i Mandel
brot, che ha un ruolo così determinante nella dinamica dei sistemi
associati , è essa stessa un oggetto di grande interesse . Come pro
babilmente ci si aspetterà, a questo punto , la frontiera risulta avere
I I4
CAPITOLO QUARTO
una complicata superfice frattale . La figura 4 . 1 6 offre solo una
percezione fugace di questo mondo straordinario , accessibile solo
tramite i calcolatori, in cui la quantità di particolari che si pos
sono scorgere dipende dalla potenza della macchina. Se esiste un' a
rea della matematica « figlia » dell' era dei calcolatori, questa è pro
prio la teoria dei frattali .
C apitolo 5
I gruppi semplici
Il teorema enorme
Nell' estate del 1 980 il matematico Ronald Solomon dell ' Ohio
State University depose la penna dopo aver risolto un problema
tecnico di algebra : quel semplice atto segnò la fine di una ricerca
iniziata negli anni quaranta, che aveva coinvolto oltre cento mate
matici negli Stati Uniti , in Gran Bretagna, Germania, Australia,
C anada e Giappone . Infatti, il risultato conseguito da Solomon
riempl l'ultimo spazio vuoto di un puzzle enorme ed estremamente
complesso : la classificazione dei gruppi finiti semplici . *
Il teorema di classificazione è senz ' ombra di dubbio il più grande
teorema che la matematica abbia mai conosciuto . La dimostrazione
originale , che occupa quasi 1 5 ooo pagine disseminate in 500 arti
coli su riviste di matematica, ha richiesto il contributo di oltre r oo
matematici. Nel corso delle ricerche furono fatte scoperte che por
tarono ad avanzamenti nella teoria degli algoritmi, nella logica mate
matica, in geometria e nella teoria dei numeri , ed è stata avanzata
l'ipotesi che ci possano essere anche applicazioni nella formula
zione di una teoria unificata dei campi in fisica.
Tuttavia, come per molti risultati importanti in matematica, l'ori
gine del problema è molto semplice; in questo caso si tratta della
nota formula
*
Tutti i termini tecnici saranno spiegati a tempo debito.
u6
CAPITOLO QUINTO
per le radici dell'equazione quadratica
ax 2 + bx + c = O ,
e dei tentativi per ottenere soluzioni simili per equazioni d i grado
maggiore, cioè che comportino potenze di x maggiori di 2 , come
ad esempio l'equazione cubica che vedremo tra poco . Per « solu
zione simile » si intende una soluzione che comporti solo le opera
zioni algebriche di addizione, sottrazione, moltiplicazione e divi
sione, nonché l'estrazione di radici; tali soluzioni sono talvolta dette
soluzioni per radicali .
Évariste Galois
Dall'esame di antiche tavolette, risulta che i matematici babi
lonesi del 1 6oo a. C . sapevano risolvere le equazioni quadratiche,
sebbene non possedessero alcuna notazione algebrica per esprimere
le loro equazioni e soluzioni come facciamo noi oggi. Si giunse alla
soluzione per radicali di un'equazione cubica della forma
ax 1 + bx 2 + ex + d = O ,
solo nel secolo XVI, quando i matematici italiani Scipione d e Ferro
e Nicola Fontana, ognuno per conto proprio, trovarono il metodo
per risolverla. Girolamo Cardano pubblicò la soluzione di Fon
tana nella sua Ars Magna del 1 545 , che conteneva anche il metodo
di Ludovico Ferrari per risolvere un'equazione di quarto grado,
riducendola a una di terzo grado . Ma a quel punto ci si fermò :
nonostante gli sforzi di molti matematici, tra cui anche il grande
Eulero a metà del secolo XVIII, nessuno fu in grado di trovare una
soluzione per l'equazione di quinto grado
ax 5 + bx 4 + cx 1 + dx 2 + ex + f = O
.
Nel 1 770 Joseph Louis Lagrange ipotizzò che le soluzioni non fos
sero esprimibili tramite radicali; nel 1 8 24 il matematico norvegese
Niels Henrick Abel dimostrò che le cose stavano proprio così .
Se non esiste un metodo generale, cioè una formula, per risolvere
un'equazione di quinto grado, è naturale chiedersi se ci sia un modo
per decidere se un'equazione di quinto grado data possa o no essere
I GRUPPI SEMPLICI
II]
risolta per radicali. Abel era alle prese con questo problema quando
morì nel r 82 9 , all'età di 26 anni. Nello stesso periodo, come spesso
accade, anche colui che alla fine avrebbe risolto il problema ci stava
lavorando intensamente . Ma i notevoli risultati ottenuti dal gio
vane É variste Galois sarebbero stati riconosciuti dalla comunità
dei matematici solo dopo circa undici anni dalla sua morte, avve
nuta in un duello . A questo proposito c'è una lunga storia, dalla
quale il giovane è proprio l'unico a uscire a testa alta.
Galois era nato vicino a Parigi nell'ottobre r 8 r r . Incomin
ciò a interessarsi alla matematica all'età di I 4 anni, quando fu
costretto a ripetere il terzo anno di liceo dopo essere stato boc
ciato agli esami. Scoprì che la matematica aiutava a mitigare la
noia che provava per il resto delle materie scolastiche. Sfortuna
tamente, la sua passione crescente per la matematica fece ancora
peggiorare il suo andamento scolastico, e quando all'età di 1 5 anni
sostenne l' esame di ammissione alla prestigiosa É cole Polytechni
que riportò un insuccesso e dovette iscriversi alla più modesta É cole
Normale . Fu lì che l' anno seguente scrisse il suo primo trattato
di matematica: un lavoro valido, sebbene di poco rilievo, sulle fra
zioni continue . Un inizio promettente, ma subito seguito da una
serie di sfortunate circostanze che dovevano concludersi con il suo
completo abbandono della materia che tanto amava.
I due trattati che seguirono, sulle equazioni polinomiali, furono
respinti dall'Accademia francese delle scienze . Peggio, tutti e due
i manoscritti furono inspiegabilmente smarriti. Poi, nel luglio r 829,
ancora una volta non riuscì a. entrare all' É cole Polytechnique,
forse a causa di una sua risposta a una domanda particolare fat
tagli dall'esaminatore. Infatti, quando gli fu chiesto di esporre la
teoria dei logaritmi aritmetici nelle sue linee essenziali, Galois
rispose, molto propriamente ma dimostrando una incredibile man
canza di tatto e di opportunismo, che non esistono logaritmi « arit
metici ». Dopo questa delusione, all'inizio del r 83o Galois presentò
ancora un altro saggio all'Accademia, questa volta per concorrere
al Gran premio per la matematica. Il segretario, Fourier, si portò
il manoscritto a casa per leggerlo, ma morì prima di aver steso la
sua relazione, e il saggio non fu mai ritrovato . Il fatto che per
la terza volta un suo lavoro andasse smarrito, sommato al fatto
che di nuovo gli fu negata l' ammissione all' É cole Polytechnique,
I I8
CAPITOLO QUINTO
convinse Galois a rifiutare la comunità accademica e a diventare
ciò che oggi chiameremmo un contestatore. In quell' anno era stato
espulso da scuola, ed era costretto a vivere dando lezioni private .
Sebbene non si distinguesse in questa attività, proseguì gli studi
matematici, e proprio in quel periodo produsse quello che era desti
nato a diventare il suo saggio più famoso, Sur les conditions de réso
lubilité des équations avec les radicaux, presentato all'Accademia
nel gennaio I 8 3 1 .
Questo fu l'ultimo tentativo che fece per ottenere un ricono
scimento al suo lavoro . A marzo, non avendo avuto notizie dal
l' Accademia, scrisse al presidente per sapere che fine avesse fatto
il suo scritto . Non avendo ricevuto risposta a quella lettera, final
mente mise il cuore in pace: non si sarebbe più occupato di mate
matica. Si arruolò allora nella Guardia Nazionale. Ma qui non sem
brò avere più fortuna di quanta ne avesse avuta con la matematica.
Subito dopo il suo ingresso, la Guardia si sciolse in seguito ad accuse
di cospirazione . A un banchetto organizzato in segno di protesta
il 9 maggio, Galois propose un brindisi al re brandendo un col
tello, gesto che fu, come ci si può immaginare, interpretato dai
suoi compagni come una minaccia alla vita del re; il giorno dopo
fu arrestato . Al processo sostenne di avere in realtà pronunciato
la frase « A Luigi Filippo , se diventa un traditore », ma che il bru
sio aveva coperto le sue ultime parole. Vero o falso che fosse, egli
fu scagionato e liberato il 1 5 giugno .
Il I 4 luglio, finalmente, seppe cosa era successo al saggio che
aveva inviato all'Accademia. Definendolo « incomprensibile », Pois
son lo aveva respinto, concludendo così la sua relazione:
Abbiamo compiuto ogni sforzo per comprendere la dimostrazione di Galois .
Il suo ragionamento non è sufficientemente chiaro, sufficientemente svilup
pato, per permetterei di valutarne la correttezza, e non siamo in grado di
darne un parere in questa relazione . L' autore annuncia che il teorema che
cos tituisce l ' oggetto precipuo di questa dissertazione appartiene a una teo
ria generale suscettibile di molte applicazioni . Forse risulterà che le diverse
parti della teoria si chiariscono a vicenda e che è più facile cogliere il signifi
cato del tutto che delle singole parti . Noi riteniamo quindi che l ' autore
dovrebbe pubblicare l ' intero lavoro per un giudizio definitivo. Nella forma
in cui è stato attualmente sottoposto all' Accademia non possiamo proporne
l ' approvazione .
Chi ha esperienza di risposte negative formulate con tono di suf-
I GRUPPI SEMPLICI
ficienza avverte subito che questa relazione è un classico del suo
genere, ma non sappiamo se questo ennesimo rifiuto abbia o no
influito su ciò che Galois fece dopo . Il 14 luglio fu arrestato per
essere comparso in pubblico indossando l'uniforme della ormai
disciolta Guardia Nazionale e condannato a sei mesi di reclusione.
Poco dopo la sua scarcerazione sulla parola, si innamorò di una
certa Stephanie D. (non se ne conosce il cognome, che pure appa
riva in un manoscritto di Galois, ma che fu poi cancellato furiosa
mente, forse in seguito a un rifiuto) . Questo fatto doveva portarlo
a morte precoce: in qualche modo, l' affaire fu responsabile della
sua partecipazione a un duello . Alexandre Dumas insinuò che il
duello fosse un complotto per mascherare un assassinio a sfondo
politico . Il 29 maggio, alla vigilia del duello, Galois scrisse una
lunga lettera all' amico Auguste Chevalier in cui riassunse le sue
teorie, dando così al mondo dei matematici soltanto un'idea di ciò
che stava per perdere . Nel duello del giorno seguente, Galois fu
colpito al ventre , e ventiquattro ore dopo morì .
Che ne fu del suo trattato respinto? Il 4 luglio 1 843 , Joseph
Liouville scrisse all'Accademia francese esordendo con queste
parole:
� pero di suscitare l' interesse dell 'Accademia annunciando che tra le carte di
Evariste Galois ho trovato una soluzione , tanto precisa quanto profonda,
di questo bel problema: se sia o no risolvibile per radicali . . .
Il concetto di gruppo, che Galois aveva lasciato al mondo doveva
rivelarsi uno dei più significativi di tutti i tempi, con applicazioni in
molti campi della matematica, della fisica, della chimica e dell'inge
gneria.
È un concetto totalmente astratto . Ciò che lo rende così impor
tante è il fatto che molte strutture, spesso di natura del tutto dif
ferente, possono essere considerate gruppi . La nozione di gruppo,
proprio per la sua versatilità, può essere introdotta in modi diversi;
qui abbiamo scelto quello che sfrutta le proprietà di simmetria delle
figure geometriche piane, semplicemente perché offre esempi che
si visualizzano facilmente . Più avanti in questo capitolo incontre
remo altri tipi di gruppi.
! 20
CAPITOLO QUINTO
La simmetria
Consideriamo il triangolo isoscele della figura 5 . I ; nel linguag
gio corrente questa figura geometrica è simmetrica rispetto all' asse
verticale tratteggiato . Con l' affermazione che il triangolo ABC è
simmetrico intendiamo dire che la parte del triangolo a sinistra
dell' asse (cioè il triangolo più piccolo ABD) è l'immagine speculare
della parte a destra (cioè il triangolo A CD) rispetto a uno specchio
immaginario posto perpendicolarmente al piano lungo l' asse AD.
Se dovessimo scambiare di posto (o « riflettere ») le due metà della
figura, il risultato sarebbe un triangolo in tutto e per tutto simile
ed esattamente nella medesima posizione, ma con i lati AB e A C
invertiti di posto e i l lato B C rovesciato .
In termini generali, per qualsiasi figura geometrica S del piano e
per qualsiasi retta l del piano, la riflessione di S rispetto all'asse l
è l' atto di spostare ogni punto di S nella sua immagine speculare
rispetto a l, cioè nel punto che sta a una distanza uguale da l sulla
perpendicolare a l stessa passante per il punto dato . Si noti che è
l' azione di trasformazione della figura a esser detta riflessione
e non il risultato di tale azione (per motivi che risulteranno ovvi
ci occuperemo delle azioni piuttosto che dei loro risultati) . La figura
Figura 5 · r
Simmetria di un triangolo isoscele.
121
I GRUPPI SEMPLICI
ottenuta applicando l a riflessione a una figura S è detta l' imma
gine di S in quella riflessione . La figura 5 . 2 mostra qualche esem
pio di riflessioni .
Usando la nozione di riflessione, il matematico dice che una
figura S sul piano è simmetrica rispetto a un asse di simmetria l
se il risultato della riflessione di S rispetto a l è una immagine che
occupa esattamente la medesima posizione di S sul piano . La figura
5 . 2d mostra un esempio di simmetria rispetto a un asse. La sim
metria rispetto a un asse talvolta è detta simmetria assiale.
La simmetria assiale è ciò che comunemente si intende quando
si usa il termine « simmetria » (per figure sul piano) , ma per il mate
matico esiste un altro tipo di simmetria, illustrata nella figura 5 . 3 .
(a)
(b)
(c)
(d)
Figura 5 . 2
Riflessioni rispetto a un asse. I n ciascun caso l a figura i n neretto è riflessa rispetto all'asse
indicato dalla linea tratteggiata e produce l' immagine meno marcata. In (d ) l'immagine
e la figura originale coincidono .
122
CAPITOLO QUINTO
(a)
Figura 5 · 3
Riflessioni successive.
(b)
(c)
Se la figura mostrata viene ruotata di un angolo di I 2 0 ° in una
direzione o nell' altra rispetto al punto centrale, finirà per occu
pare esattamente la medesima posizione sul piano . Questo è un
esempio di simmetria di rotazione. Si tenga presente che ci stiamo
occupando di rotazione rispetto a un punto: anche se ruotiamo
il triangolo della figura 5 . I di I Bo 0 rispetto alla linea AD presa
come asse, la figura viene a trovarsi nella medesima posizione, ma
il risultato è lo stesso della riflessione rispetto ad AD.
Il concetto di gruppo
Consideriamo ancora il triangolo isoscele della figura 5 . I Quante
simmetrie ha? Vale a dire, quali sono le riflessioni (rispetto ad assi)
e le rotazioni (rispetto a punti) che mandano il triangolo in un'im
magine che occupa esattamente la medesima posizione del trian
golo originale? Innanzitutto, c'è la riflessione rispetto all' asse AD,
che chiameremo r. Esistono altre simmetrie? Chiaramente non esi
stono altre simmetrie assiali, ma che cosa si può dire per le rota
zioni? Certamente una rotazione di 3 60 ° rispetto a un punto qual
siasi riporterà la figura al punto di partenza, ma non ha molto senso
considerarla, poiché in questo caso il risultato non porterebbe ad
.
1 23
I GRUPPI SEMPUCI
alcun cambiamento (mentre nel caso della riflessione r i punti B
e C vengono a occupare posizioni diverse rispetto a quelle iniziali) .
Quindi trascureremo , o quasi, esempi così banali. Ma così come
è utile considerare il numero O (che non modifica il risultato in
una addizione) e il numero r (che non incide su una moltiplica
zione) , allo stesso modo risulta utile annoverare tra le simmetrie
la trasformazione identica I che lascia tutti i punti del piano inva
riati; I può essere considerata una rotazione di 0 ° .
Supponiamo di prendere il triangolo ABC (fig. 5 . 4a) e di appli
care la riflessione r, per dare origine al triangolo ACB della figura
5 . 4b. Che cosa accade quando applichiamo di nuovo r ad ACB?
Chiaramente ci ritroviamo un' altra volta nella configurazione ori
ginale ABC (fig . 5 . 4c) ; quindi, applicare r due volte consecutive
equivale esattamente a non fare nulla, o, per dirla in altri termini,
equivale ad applicare la trasformazione identica I. Questa idea può
essere espressa simbolicamente scrivendo
r �' r = I,
dove l'asterisco 1, significa « applica ancora »; se a e b sono due sim
metrie, a �' b indica l'operazione che consiste nell'applicare prima a,
e poi b al risultato . Usando la stessa notazione , possiamo descri-
Figura 5 - 4
Simmetria d i rotazione.
1 24
CAPITOLO QUINTO
vere gli effetti (in questo caso insignificanti) che si ottengono appli
cando altre sequenze di simmetrie, cioè:
r* I = r,
I * r = r,
I* I = I.
Queste quattro identità si possono riassumere in una tabella:
Triangolo isoscele:
*
I
r
I
I
r
r
r
I
Per vedere l'effetto dell' applicazione della simmetria x seguita da
un' altra simmetria y , scorriamo la riga della x della tabella finché
troviamo la colonna delle y e leggiamo il valore di x * y , cioè il risul
tato delle due simmetrie combinate .
Si tenga presente che abbiamo sempre dato per scontato che
il risultato ottenuto eseguendo due simmetrie di seguito fosse
anch'esso una simmetria. Le cose stanno proprio così, e il lettore
se ne renderà conto se ci pone mente un attimo .
Che cosa accade quando si procede allo stesso modo con la con
figurazione a tre punte della figura 5 . 3 ? In questo caso ci sono
tre simmetrie : una rotazione di r 2o 0 in senso antiorario che chia
meremo v, una rotazione di 240 ° in senso antiorario che chiame
remo w e l'identità I. Ci si potrebbe chiedere che cosa accade con
rotazioni in senso orario . Il risultato di una rotazione di 1 2 0 ° in
senso orario è identico a w, e quello di una di 240 ° gradi equivale
a v, sicché abbiamo davvero elencato tutte le possibilità. Poiché
due rotazioni successive di r 2o 0 danno lo stesso risultato di una
di 240 ° , chiaramente si ha che:
V * V = W.
Allo stesso modo, due rotazioni di 240 ° equivalgono a una rota-
I GRUPPI SEMPLICI
zio ne di r 2 0 ° , cosicché
La tabella completa della composizione di simmetrie è:
Tripode:
1<
I
v
w
I
I
v
w
v
v
w
I
w
w
I
v
Ancora un esempio . Il triangolo equilatero (fig. 5 . 5) ha sei sim
metrie: l'identità I, le rotazioni antiorarie v e w rispettivamente
di r 2 o 0 e 240 ° e le riflessioni x , y, z rispetto agli assi X, Y, Z.
Queste simmetrie si combinano come indicato nella seguente
tabella:
Triangolo equilatero:
1<
I
v
w
x
y
z
I
I
v
w
x
y
z
v
v
w
I
z
x
y
w
w
I
v
y
z
x
x
x
y
z
I
v
w
y
y
z
x
w
I
v
z
z
x
y
v
w
I
Se il lettore desiderasse verificare queste operazioni potrebbe pro
varci, ritagliando un triangolo equilatero di cartone, segnando gli
angoli A B C, e ponendolo su un foglio di carta su cui siano trac
ciate le linee X, Y, Z. A questo punto potrà eseguire materialmente
I 26
CAPITOLO QUINTO
Figura 5 · 5
Simmetrie d i u n triangolo equilatero .
le varie rotazioni e riflessioni. (Dovrà disegnare il triangolo su
entrambi i lati, per consentire le riflessioni) .
Che cosa accade se si hanno combinazioni di più di due simme
trie? Non è necessario prenderle in considerazione, dal momento
che l' applicazione di un numero qualsiasi di simmetrie equivale
a una successione di combinazioni in coppia. Ad esempio, per il
triangolo equilatero che abbiamo appena esaminato (X ''' Y ) �' V è
uguale a v * v, che non è altro che w , usando la tabella due volte.
L'uso delle parentesi si è reso necessario per indicare in quale ordine
dovevano essere abbinate le simmetrie : si applichi x seguito da y,
e poi si applichi v al risultato . Il raggruppamento alternativo
X �' ( y * v) starebbe a significare: si applichi x e poi si applichi y * v
al risultato. Se si seguisse il secondo procedimento, che cosa si otter
rebbe? Ebbene, Y �' V è z, quindi X �' ( Y '� V) è X * Z, che è uguale a w :
il risultato non cambia rispetto all'altro procedimento. Se si riflette
un momento ci si renderà conto che questa proprietà non è casuale,
ma è valida per tutte le simmetrie : se a, b, c sono simmetrie di
una figura, allora
(a * b) * c= a * (b * c) .
Quindi anche l'operazione « * >> gode della proprietà associativa.
127
I GRUPPI SEMPLICI
Prima d i poter dare l a definizione d i gruppo occorre fare un'ul
tima osservazione. È evidente che se si prende qualsiasi simme
tria e la si applica « a ritroso » il risultato sarà un' altra simmetria;
per la riflessione non cambia nulla se si procede in un senso o nel
l' altro, mentre per le rotazioni si inverte semplicemente la dire
zione della rotazione. L' applicazione a ritroso di una simmetria x
è detta l'inversa di x ed è indicata con il simbolo x - i (che va letto
« X alla meno uno » o « inverso di X ») . Per il triangolo isoscele
si ottiene r - 1 = r, come per qualsiasi riflessione . Per il tripode si
ottiene v - l = w e w - i = v , e per il triangolo equilatero v - i = w ,
1 = y , e z - 1 = z. In tutti i casi I - i = I. Il lettore
w - i = v , x - l = x, y
nota qualcosa di particolare a proposito di questi risultati? Se
controlla le varie tabelle, noterà che è sempre vero che a - i * a =
= a * a - i = I. Ancora una volta non si tratta di casualità: se si
pensa a che cosa si intende per simmetria identica e per simmetria
inversa, sarà evidente perché ciò si verifichi .
A questo punto il lettore dovrebbe avere la vaga sensazione che
ci sia qualcosa di molto familiare in quanto detto sopra, anche se
non aveva mai pensato alle simmetrie prima d'ora. Non sembra
tutto molto simile alla normale moltiplicazione di numeri razio
nali, specialmente se si esclude lo zero, che non ha inverso? Il pro
dotto di due numeri razionali qualsiasi diversi da zero è un altro
numero razionale; il raggruppamento non ha importanza per la mol
tiplicazione (cioè (ab) c = a (bc) per qualsiasi a, b, c) , e ogni numero
razionale x diverso da zero ha un inverso x - 1 ( = I/x) tale che
xx - i = x - i x = I , dove il numero I è l'identità rispetto alla mol
tiplicazione . Forse non era proprio quello che il lettore pensava;
può darsi che egli avesse in mente l'esempio dei numeri interi con
l' addizione: la somma di due interi è anch'essa un numero intero;
(a + b) + c = a + (b + c) è sempre vero; c'è un'identità, O , che non
cambia nulla in una addizione; ogni numero intero x ha un inverso
( - x) tale che x + ( - x) = ( - x) + x = O . Può essere che il lettore
avesse ancora un altro esempio in mente; ci sono in effetti molte
possibilità, compresa quella a cui pensava Galois quando consi
derò il problema di risolvere le equazioni di quinto grado . Tutti
questi esempi sono casi particolari del concetto generale di gruppo
introdotto da Galois .
-
!28
CAPITOLO QUINTO
Per il matematico u n gruppo è costituito da:
( r ) un insieme G
(2 ) un'operazione �' che a ogni coppia di elementi x e y di G assegna un elemento x * y , che appartiene pure a G.
L'operazione ,� deve soddisfare le tre condizioni seguenti, cioè gli
« assiomi di gruppo »:
(3) Associatività: per qualsiasi x, y, z in G,
(x * y) * z = x * (y * z) .
(4) Esistenza dell' elemento neutro: esiste I in G tale che per qual
siasi x in G
(5) Esistenza dell'inverso : se x è in G allora esiste un elemento
y di G tale che
X *Y = Y *X = I
.
Abbiamo già incontrato vari esempi di gruppi. Se G è l'insieme
di tutte le simmetrie di una figura data sul piano e * è l'opera
zione che consiste nell' applicare due simmetrie in successione, la
struttura risultante è un gruppo . Altri esempi sono dati dall'in
sieme dei numeri razionali diversi da zero, dove * è la normale
moltiplicazione, e dall'insieme dei numeri interi, dove �. è la nor
male addizione. Entrambi i gruppi di numeri hanno operazioni com
mutative, vale a dire
X * Y = Y * X,
per tutti gli elementi x, y del gruppo . Ma ciò non è necessaria
mente valido per i gruppi in generale; per esempio, non è vero per
il gruppo del triangolo equilatero : osservando la tabella per que
sto gruppo vediamo che x * v = y , ma v �· x = z. I gruppi nei quali
* è commutativo sono spesso detti abeliani, dal nome del matema
tico norvegese Abel già citato .
Se l'operazione * è un'operazione nota, ad esempio un'opera
zione aritmetica, le si dà il suo nome abituale (moltiplicazione, addi
zione o quello che è) . Ma se l'operazione è sconosciuta oppure non
ha un nome corrente, è consuetudine definire * moltiplicazione del
gruppo, e a * b prodotto di a e b nel gruppo. Questo semplicemente
per comodità, e quindi non si deve assolutamente trarre alcuna
conclusione da tale uso .
I 29
I GRUPPI SEMPUCI
Il concetto di gruppo è così importante proprio perché com
prende tanti fenomeni diversi, non soltanto in matematica (dove
i gruppi affiorano ovunque) , ma anche in altre discipline: le rego
larità di un cristallo, le simmetrie degli atomi, le interazioni delle
particelle elementari sono tutti esempi di gruppi. Qualunque cosa
si possa dire sui gruppi in generale sarà vero per qualsiasi gruppo
specifico . Ma come si procede per stabilire le proprietà di un gruppo
arbitrario, astratto? Bisogna eseguire dimostrazioni matematiche
rigorose a partire dalla sola definizione.
Per fare un esempio , dimostreremo che qualsiasi elemento di
un gruppo deve avere un solo inverso; questo deve essere provato,
per poter usare la notazione x - 1 per indicare « l'inverso » di x.
L'assioma (3) della definizione di gruppo garantisce che ogni ele
mento di un gruppo ha almeno un inverso, ma non esclude l'esi
stenza di altri . Naturalmente, per ciascuno degli esempi di gruppi
dati prima è ovvio che nessun elemento ha più di un inverso, ma
ciò non ci è di aiuto in questo contesto : ora vogliamo dare una
dimostrazione applicabile a tutti i casi, compresi i gruppi che non
abbiamo preso in considerazione prima.
Ecco allora la dimostrazione. Assumiamo che G sia un gruppo
qualsiasi , e che x sia un suo elemento qualsiasi . Siano y e z due
inversi di x. L'obiettivo è dimostrare che y = z. Essendo inversi
di x, sia y sia z soddisfano l' assioma (5) :
x * y = y * x = I,
x * z = z * x = I.
Applicando l' assioma (4) a y si ottiene
y = I* y .
Così, grazie all'equazione [z] :
y = (z * x) * y .
Usando l' assioma (3) , ne deriva che:
y = z * (x * y ) ,
e grazie all'equazione [ r ] :
y = z * I.
1 30
CAPITOLO QUINTO
Quindi, applicando l' assioma
(4) a z, si ottiene
Y = z.
Questo completa la dimostrazione . Si noti che abbiamo sfruttato
tutti gli assiomi strutturali implicati nella definizione di gruppo .
Come il lettore può ben immaginare, la maggior parte delle dimo
strazioni nella teoria dei gruppi sono assai più complesse di que
sto esempio (e di conseguenza non sono di solito presentate in modo
così dettagliato) , e spesso implicano altri concetti, ma presentano
sempre una caratteristica comune : sono interamente costituite di
deduzioni logiche basate solo sugli assunti iniziali .
A ltri esempi di gruppi
I gruppi di simmetrie di cui abbiamo parlato prima si riferivano
tutti a figure piane, ma gli stessi concetti sono applicabili alle figure
solide a tre dimensioni . Il cubo , ad esempio , ha 2 4 simmetrie di
rotazione; in questo caso la rotazione è effettuata rispetto a un
asse anziché rispetto a un punto , come nel caso delle due dimen
sioni . Per rendersene conto , si tenga presente che un vertice del
cubo può essere trasportato in un altro vertice qualsiasi e che gli
spigoli che confluiscono in quel vertice possono subire tre rota
zioni diverse. Se consideriamo anche le simmetrie di riflessione
(in questo caso si tratta di riflessioni rispetto a un piano , non a
una retta) il cubo ha un totale di 48 simmetrie .
Il dodecaedro, che è costituito da I 2 pentagoni regolari uguali
sistemati in modo da formare una figura solida (fig . 5 . 6) , ha 6o
simmetrie di rotazione e I 20 simmetrie totali , con quelle di rifles
sioni . Sia nel cubo che nel dodecaedro le simmetrie di rotazione
da sole costituiscono un gruppo incluso nel gruppo di tutte le sim
metrie della figura: i matematici direbbero che , in ciascuno dei
due casi, le simmetrie di rotazione costituiscono un sottogruppo
dell 'intero gruppo di simmetrie .
Le simmetrie di rotazione del dodecaedro costituiscono il più
piccolo gruppo semplice non commutativo (vedi più avanti) ; per
dimostrare che l' equazione polinomiale generale di quinto grado
I}I
I GRUPPI SEMPUCI
Figura 5 . 6
Il dodecaedro.
non poteva essere risolta con i radicali, Galois usò proprio il fatto
che questo gruppo è semplice e che esso ha un numero di elementi
non primo .
Finora abbiamo visto esempi di gruppi infiniti (vedi l' addizione
dei numeri interi) e di gruppi finiti (vedi i vari gruppi di simme
trie) . In questo capitolo ci occuperemo principalmente di gruppi
finiti . Le matrici offrono esempi sia di gruppi finiti sia di gruppi
infiniti .
Una matrice è una serie di numeri (che , per quanto riguarda i
nostri esempi, possono essere razionali o reali) disposti in forma
rettangolare e solitamente racchiusi tra parentesi . Ad esempio :
Le matrici possono avere qualsiasi dimensione, ma noi ci occupe
remo esclusivamente di matrici quadrate, in cui il numero delle righe
è uguale al numero delle colonne (ed è detto ordine della matrice) .
Un esempio di matrice quadrata di ordine 2 è :
[
21
-5
3,8
20
]
CAPITOLO QUINTO
Le matrici hanno una loro aritmetica. La regola per addizio
nare due matrici del medesimo ordine è semplice: si sommano gli
addendi corrispondenti . Quindi
La moltiplicazione è un po' più complicata. In breve, non si
fa altro che moltiplicare le righe delle prima matrice per le colonne
della seconda, termine per termine, sommando i risultati man mano
che si procede . Per matrici di ordine 2 forse è più facile spiegarlo
con un esempio algebrico seguito da uno numerico :
w
[ : :]x[: y ]
[ : � ]x[ : : ]
-
([(cav+dx)
v + bx) ((caww ++by)dy) ] '
([ ( :: ::)
- [ :: -:l
[
+
20)
]
+ ]
]
[
=
�
Un secondo esempio mostrerà che la moltiplicazione di matrici non
è commutativa, sebbene lo sia evidentemente l' addizione:
=
=
(2 - 8)
(6
(3 - 2)
(9
- 6 26
5)
.
I 14
C i si potrebbe chiedere il perché di una definizione così com
plicata. Perché non moltiplicare semplicemente i termini corrispon-
133
I GRUPPI SEMPLICI
denti, come si fa nell'addizione? ll fatto è che i matematici hanno svi
luppato e studiato le matrici pensando a determinate applicazioni (in
particolare alla soluzione di grandi sistemi di equazioni lineari) , e
quelle applicazioni richiedevano le definizioni date. L'aritmetica delle
matrici è oggi così importante che qualsiasi sistema di calcolo rivolto
a utenti in settori scientifici o commerciali è dotato di programmi
per il trattamento di matrici; anzi, l'aritmetica delle matrici è pro
babilmente l'operazione più spesso eseguita dagli attuali calcolatori.
Le definizioni di addizione e di moltiplicazione di matrici di
ordine 3 o di ordine maggiore sono simili a quelle date prima per
l'ordine 2 , e praticamente tutto quanto si dirà qui appresso vale
(con le ovvie modifiche) per matrici di qualsiasi dimensione; per
chiarezza, però, continueremo a occuparci di matrici di ordine 2 .
Le matrici di ordine 2 (o meglio di qualsiasi ordine) formano
un gruppo rispetto all'addizione. La somma di due matrici di ordine
2 è una matrice di ordine 2 , l' addizione è associativa, c'è una
matrice identica data da:
e l'inverso di qualsiasi matrice si ottiene mettendo il segno meno
davanti a tutti gli addendi . Questo gruppo è anche commutativo .
Anche la moltiplicazione dà origine a un gruppo? Certamen
te il prodotto di due matrici di ordine 2 è ancora una matrice di
ordine 2 , la moltiplicazione di matrici è associativa (questo non
è ovvio a prima vista, ma se lo si verifica algebricamente si vedrà
che è vero) ed esiste un elemento neutro, dato dalla matrice
che, moltiplicata per qualsiasi matrice, la lascia immutata. Passando
agli inversi, con un calcolo diretto si può verificare che
[ ][
a
b
c
d
X
d/H
- b/H
- e/H
a/H
] [ ]'
=
I
O
O
I
1 34
CAPITOLO QUINTO
dove H = ad - be; lo stesso avviene con le due matrici di sinistra
scambiate di posto . Così la matrice
[: :l
avrà come inversa la matrice
[
d/H
- b/H
- e/H
a/H
]
'
ammesso che questa seconda matrice esista. L'unico caso in cui
possono esserci dei problemi è quando la quantità H si annulla (si
ricordi che non è mai possibile dividere per zero) . Le matrici per
le quali questo numero H è diverso da zero sono dotate di inversa
e sono dette invertibili (o anche non singolari ) . Le matrici il cui
numero H è zero non hanno l'inversa e sono dette singolari (o non
invertibili ) .
Poiché esistono le matrici singolari, che non hanno inversi, le
matrici non costituiscono un gruppo rispetto alla moltiplicazione;
ma se si considerano solo le matrici invertibili, allora esse formano
un gruppo . La cosa è ovvia? Non proprio . L'associatività non è un
problema, dal momento che vale per tutte le matrici, invertibili
e non. Poiché la matrice identica è invertibile (e quindi un mem
bro dell'insieme che stiamo considerando) , esiste un elemento neu
tro per il gruppo . E gli elementi inversi? Naturalmente tutti i mem
bri dell'insieme scelto hanno inversi, ma si deve verificare che questi
stessi inversi appartengano all'insieme. Si tratta di una verifica
facile, ma che va fatta. Rimane un'ultima cosa da controllare: si
deve sapere se due matrici invertibili moltiplicate tra loro danno
origine a una matrice anch'essa invertibile (cioè che appartiene
all'insieme) . Ancora una volta si tratta di analizzare la struttura
algebrica, cosa che il lettore potrà fare da solo .
Le matrici invertibili costituiscono un gruppo, chiaramente infi
nito e non commutativo, come già si è visto . Alcuni gruppi molto
importanti che tratteremo più avanti in questo capitolo sono sot
togruppi finiti del gruppo delle matrici invertibili .
1 35
I GRUPPI SEMPLICI
Un' altra classe importante è quella dei gruppi dell'orologio, dei
quali il comune orologio di dodici ore costituisce l'esempio più evi
dente. L'insieme G è composto dai numeri interi da I a I 2 , con
l'operazione * di « addizione sull'orologio », in cui I 2 sta per « zero »
e se si continua a contare oltre il I 2 ci si ritrova da capo . Così
ad esempio , 5 più 5 fa I o , 7 più 8 fa 3 , I I più 1 1 fa I O e 7 più
I 2 fa 7· Questo è un gruppo il cui elemento neutro è 1 2 , e l'in
verso di qualsiasi numero del gruppo è la differenza tra questo
numero e 1 2 : così 7 è l' inverso di 5, 9 l' inverso di 3 e così via .
In questo caso il numero I 2 non ha nulla di singolare . Qual
siasi numero andrebbe bene : il gruppo dell' orologio di ordine I O
è la struttura che sta alla base del sistema dei numeri decimali,
il gruppo dell' orologio di ordine 24 corrisponde all' orologio di 2 4
ore, il gruppo dell' orologio di ordine 6 o è collegato con l a misura
zione del tempo , e quello di ordine 3 60 è collegato con la misura
zione degli angoli .
Il nome dato dai matematici al gruppo dell' orologio è gruppo
ciclico , così detto perché gli elementi di un gruppo di questo tipo
procedono per cicli come le ore su un orologio . Per esempio il
gruppo ciclico di ordine 3 ha come tabella dell' addizione la
seguente :
+
I
2
3
I
2
3
I
2
3
I
2
3
I
2
3
I gruppi semplici
Uno degli obiettivi principali di qualsiasi branca delle scienze
è quello di identificare e studiare gli oggetti basilari da cui tutti
gli altri sono costituiti : in biologia avremo le cellule o addirittura
le molecole , in chimica gli atomi , in fisica le particelle fondamen
tali , comunemente dette quark . Altrettanto dicasi per molti set
tori della matematica; l' esempio classico è la teoria dei numeri,
CAPITOLO QUINTO
dove, secondo il teorema fondamentale dell' aritmetica descritto
nel capitolo 1 , i numeri primi sono basilari nella costruzione dei
numeri interi. In ciascuno di questi esempi, gli oggetti di base della
teoria sono strutturalmente semplici, nel senso che, dal punto di
vista della teoria, non si possono ridurre a entità minori dello stesso
tipo . Così gli atomi non si possono spaccare con mezzi chimici,
i numeri primi non si possono scomporre con la divisione e così via.
Le entità fondamentali nella teoria dei gruppi sono i gruppi sem
plici . Per spiegare che cosa siano esattamente e come qualsiasi
gruppo finito dato possa essere scisso nei gruppi semplici che lo
compongono, occorre introdurre la nozione di immagine telesco
pica (o, tecnicamente, di omomoifismo) di un gruppo. Grosso modo,
quando facciamo un'immagine telescopica di un gruppo G otte
niamo una specie di versione « in scala ridotta » di G, e l'opera
zione * pi G si trasferisce nell'immagine telescopica, sebbene
ridotta. E un po' come osservare un oggetto dalla parte sbagliata
del telescopio : la struttura principale dell'oggetto è chiara, ma esso
appare più piccolo, ed è probabile che molti suoi tratti non siano
più discernibili.
Per essere un po' più precisi: dato un gruppo G, allora per for
mare un'immagine telescopica G' di G si deve associare ad ogni
elemento g di G un elemento g' di G' (detto immagine) in modo
tale che, per ogni a, b in G con immagini a ' , b' in G ' , il prodotto
di a' e b' in G' sia l'immagine dell'elemento a * b di G. Così G '
mantiene l a struttura d i G . Nulla qui impedisce che parecchi ele
menti di G abbiano la medesima immagine in G ' , ed è proprio
questo « collasso » o « coagulazione » di elementi che spiega la ridu
zione della grandezza quando si passa da G a G' . I matematici defi
niscono le immagini telescopiche immagini omomorfe.
Ogni gruppo G ha almeno due immagini telescopiche: una è G
stesso, dove ciascun elemento di G è l'immagine di se stesso (que
sta situazione soddisfa in modo banale i requisiti di un'immagine
telescopica, sebbene sia chiaramente un caso estremo) e l'altra, all'e
stremo opposto, è l'immagine puntuale di G, vale a dire il gruppo
che ha come unico elemento l'elemento neutro e. Si noti che, ricor
dando le definizioni, questo gruppo, per quanto piuttosto banale,
è perfettamente legittimo; la « tavola » della moltiplicazione sarà
semplicemente
e * e = e.
I GRUPPI SEMPLICI
137
Nell'immagine puntuale ogni elemento d i G h a l a stessa immagine,
cioè e, e anche in questo caso sono soddisfatti i requisiti per le
immagini telescopiche .
I gruppi ciclici offrono esempi di gruppi che hanno altre imma
gini telescopiche oltre alle due banali appena viste . Per esempio ,
sia G il gruppo ciclico di ordine 2 4 e sia G ' il gruppo ciclico di
ordine I 2 . Per ciascun numero n da I a I 2 in G, la sua immagine
'
'
n è n stesso; per n compreso tra I 3 e 2 4 , n è dato da n - 1 2 ;
allora G ' è un'immagine telescopica di G. Per esempio, prendiamo
gli elementi 7 e I 8 in G; le loro immagini in G sono rispettiva
mente 7 e 6 e la somma di 7 e 6 in G' è I . Secondo la definizione
di immagine telescopica, questa dovrebbe essere uguale all 'imma
gine della somma di 7 e I 8 in G: ebbene, la somma di 7 e I 8 in
G è I , e l'immagine di I in G' è proprio I . Notate che per passare
da G a G' non si fa altro che adottare il metodo usato per la con
versione del tempo dall'orologio di ventiquattro ore a quello di
dodici .
Si osservi che nell'esempio di prima è importante il fatto che
I 2 (l'ordine di G ' ) sia sottomultiplo di 24 (l'ordine di G ) . Un grup
po ciclico di ordine primo non ha immagini telescopiche all 'in
fuori di se stesso e dell'immagine puntuale . Questo fatto offre una
serie di esempi esplicativi del concetto centrale di questo capitolo ,
cioè quello di gruppo semplice :
U n gruppo semplice è u n gruppo l e cui uniche immagini telescopiche sono
il gruppo stesso e la sua immagine puntuale .
Servendosi dell 'immagine telescopica, ogni gruppo finito può
essere scomposto in un unico insieme di gruppi semplici proprio
come un numero composto può essere ridotto nei suoi fattori primi
(vedi cap . I ) . Anzi , l' analogia va oltre : il numero di elementi di
ciascuno di questi gruppi semplici componenti è un divisore del
numero di elementi del gruppo originale, e il prodotto di tutti questi
numeri è uguale al numero degli elementi del gruppo originale . A
questo punto, però , l' analogia si arresta. Per prima cosa, i gruppi
semplici costituenti un gruppo possono contenere un numero com
posto di elementi (come si è detto prima, le simmetrie di rotazione
del dodecaedro regolare formano un gruppo semplice di ordine 6o) .
Inoltre , mentre il prodotto di tutti i numeri primi in un insieme
dato è sempre lo stesso numero , un dato insieme di gruppi sem-
CAPITOLO QUINTO
plici spesso può essere combinato in modi differenti e formare
gruppi ben distinti .
Il problema della classificazione
Una volta identificati i gruppi semplici come le « particelle fon
damentali » della teoria dei gruppi finiti, i matematici si misero
all'opera per tentare di darne una classificazione. In linea di mas
sima volevano semplicemente trovare un criterio per distinguere
i gruppi semplici dagli altri. La definizione è già di per sé una forma
di risposta: i gruppi semplici sono quelli che hanno solo due imma
gini telescopiche; ma questo non era il criterio cercato . Si voleva,
in realtà, una descrizione completa delle strutture che risultano
essere gruppi semplici, sia individuando le caratteristiche generali
che danno origine alle famiglie di gruppi semplici, sia scoprendo
gruppi semplici particolari.
Per esempio, possiamo dire che tutti i gruppi ciclici di ordine
primo sono semplici, mentre non lo sono quelli di ordine compo
sto . In effetti questi sono i soli esempi di gruppi semplici commu
tativi, e quanto abbiamo detto costituisce già una classificazione
completa di tutti i gruppi semplici commutativi, sotto forma di
famiglie « regolari » di gruppi . Fu la classificazione dei gruppi non
commutativi che richiese lo sforzo maggiore. Negli anni a partire
dal decennio 1 940-5 0 , da quando cioè i matematici incomincia
rono a lavorare (più o meno consapevolmente) al teorema della clas
sificazione, si scoprirono parecchie famiglie « regolari » infinite di
gruppi semplici. Alla fine si trovarono in totale 1 8 famiglie, com
prese quella dei gruppi ciclici di ordine primo di cui abbiamo già
parlato, e un' altra altrettanto semplice che verrà descritta più
avanti. Si trovarono altresì un certo numero di gruppi particolari,
molto irregolari, che non rientravano in nessuno degli schemi noti.
I primi cinque di questi gruppi semplici sporadici, come vennero
chiamati, erano stati trovati da É mile Mathieu intorno al 1 86o .
Il più piccolo gruppo di Mathieu ha esattamente 7920 elementi,
il più grande ne ha 2 44 8 2 3 040 . Il sesto gruppo sporadico fu sco
perto solo un secolo dopo, nel 1 965 , da Zvonimir Janko; il gruppo
di Janko, che ha 1 75 560 elementi, consiste in un insieme di matrici
I GRUPPI SEMPLICI
139
di ordine 7 , con la moltiplicazione di matrici come operazione del
gruppo . Il modo in cui questo gruppo fu trovato è indicativo del
tipo di lavoro che portò alla scoperta di un insieme finale di 2 6
gruppi semplici sporadici : affiorò dall'esame della diciassettesima
famiglia regolare di gruppi semplici, trovata da Rimhak Ree nel
1 960 e oggi nota come famiglia di Ree.
Come verrà ora spiegato, a ogni gruppo semplice sono associati
determinati gruppi più piccoli che forniscono informazioni circa
la struttura del gruppo stesso; questi sono detti centralizzanti, e la
loro definizione sarà data più avanti . Per i gruppi di Ree essi con
sistono in matrici di ordine 2 i cui termini appartengono a un
insieme finito di numeri di dimensione uguale a una potenza dispari
di 3 (se la potenza dispari di 3 è r, l'insieme finito di numeri risulta
essere formato solo da r, 2 , 3 ) . Nel tentativo di verificare una
prima, seppur limitata, forma del teorema di classificazione, fu
necessario dimostrare che i gruppi di Ree sono i soli gruppi sem
plici i cui centralizzanti sono matrici di ordine 2, i cui termini sono
presi da un insieme finito di numeri di dimensione uguale a una
potenza dispari di un certo primo p. Sembrava ovvio che in que
sto caso il numero primo p dovesse essere 3 , e alla fine ciò risultò
vero, tranne che nell'unico caso in cui p è 5 e la potenza dispari
è r . Fu proprio questo caso singolare che Janko si propose di stu
diare. Il suo intento era di rimuovere quest'unico ostacolo rima
sto, dimostrando che non esistono gruppi semplici del tipo in que
stione quando l'insieme di numeri richiesto ha dimensione 5 · Non
riuscì nel suo proposito, ma arrivò a un risultato abbastanza curioso,
perché dimostrò che, se un tale gruppo fosse esistito, avrebbe
dovuto contenere esattamente 1 75 560 elementi. Un risultato cosl
preciso fece pensare che un tale gruppo doveva pur essere nasco
sto da qualche parte, e dopo infiniti calcoli a mano Janko riuscì
a trovarlo . Cosl si scoprì il sesto gruppo sporadico , che, in onore
di Janko, fu chiamato J, .
Utilizzando tecniche simili con famiglie di gruppi semplici
diverse dalla famiglia di Ree, Janko trovò presto conferma dell'e
sistenza di altri due gruppi semplici sporadici, uno con 604 8oo
e l' altro con 50 2 3 2 960 elementi, ma non riuscì a trovarli mate
rialmente. Il più piccolo dei due, ]2 , fu infine trovato da Marshall
Hall jr e da David W ales, e quello più grande, ]3 , fu scovato da
Graham Higman e John McKay con l' aiuto di un calcolatore .
CAPITOLO QUINTO
In modo più o meno uguale, negli anni successivi si giunse alla
scoperta di parecchi altri gruppi sporadici, finché nel I 98o Robert
Griess determinò l'ultimo di questi 2 6 gruppi, di cui si sospettava
l'esistenza sin dal I 973 · Questo è di gran lunga il più grande di
tutti, prerogativa che gli è valsa l'appellativo di « mostro ». A titolo
di cronaca, il numero di elementi del mostro è :
8o8 0 1 7 4 2 4 794 5 1 2 8 7 5 886 459 904 9 6 1 7 1 0 7 5 7 005 754 3 68 ooo ooo ooo,
vale a dire, grosso modo, 8 seguito da 53 zeri. Consiste in un certo
insieme di matrici, con termini presi tra i numeri complessi, di
ordine I 96 883 . Va sottolineato il fatto che Griess eseguì a mano
tutti i calcoli necessari per determinare il mostro . Poiché la natura
del gruppo era tale da facilitarne lo studio, Griess lo ribattezzò
« il gigante amichevole ».
La scoperta del mostro fu uno degli ultimi passi compiuti nella
dimostrazione del teorema di classificazione. Ora si sa che i gruppi
finiti semplici consistono nei gruppi delle I 8 famiglie infinite rego
lari di gruppi (la prima è la famiglia dei gruppi ciclici di ordine
primo) , insieme ai 26 gruppi sporadici, e nulla più. Questo è il risul
tato che occupò 500 articoli e I 5 ooo pagine nelle riviste di mate
matica.
Le diciotto famiglie e i gruppi sporadici
Molto spesso in matematica si procede dalla formulazione di
un teorema proposto alla sua dimostrazione, ma ciò non avvenne
per il teorema di classificazione. Non si poteva neppure immagi
nare la dimensione del problema prima della sua risoluzione; avreb
bero potuto, ad esempio, esserci ben più di 2 6 gruppi sporadici,
forse persino un numero infinito , il che avrebbe significato che
non si sarebbe mai potuto raggiungere il traguardo prefisso . La
maggior parte del lavoro fu dedicato alla ricerca sui gruppi sem
plici, piuttosto che alla dimostrazione di un teorema preciso. Questo
rende difficile stabilire con esattezza quando è incominciato il
lavoro che ha portato alla classificazione finale. Nel suo discorso
al Congresso internazionale di matematica ad Amsterdam nel I 954,
Richard Brauer propose un metodo per tentare una classificazione
I GRUPPI SEMPLICI
dei gruppi semplici (di ordine pari, anche se questa restrizione è
risultata superflua) , e questo potrebbe essere uno dei punti di par
tenza. Un'altra data, forse meno discutibile, potrebbe essere il 1 97 2 ,
anno i n cui Daniel Gorenstein tenne una serie d i conferenze al
l'Università di Chicago abbozzando un programma in r 6 passi che,
ipoteticamente, avrebbe dovuto condurre alla soluzione finale del
problema della classificazione. In un certo senso il successo finale
fu possibile grazie a un risultato chiave ottenuto da W alter Feit
e John Thompson nel 1 96 2 , un' altra data che può essere conside
rata « l 'inizio della fine ». Ad ogni modo, per poter proseguire è
necessario fare qualche precisazione sulla natura dei gruppi che
compaiono nella soluzione completa.
Della prima delle r8 famiglie regolari si è già detto : è la fami
glia di tutti i gruppi ciclici di ordine primo . La seconda famiglia
può essere descritta altrettanto facilmente : è l'insieme dei gruppi
di tutte le permutazioni pari di n simboli per qualsiasi numero intero
n maggiore di 4 · Che cosa è una permutazione pari di n simboli?
Si consideri n = 4 (il primo caso interessante) , e si prendano quat
tro simboli, ad esempio le lettere A, B, C, D. Disposte in ordine
alfabetico, queste lettere formano la « parola » AB CD. Scambian
dole ripetutamente di posto a coppie, è possibile ridisporre queste
quattro lettere per formare 4 X 3 X 2 X r = 24 parole (o ordina
menti) differenti . Ciascuno di questi diversi riordinamenti è detto
permutazione di ABCD. È una permutazione pari se la si ottiene
con un numero pari di spostamenti, è una permutazione dispari
se il numero di spostamenti è dispari . Per esempio, CBDA è una
permutazione pari, dal momento che la si ottiene da ABCD scam
biando dapprima A e C e poi A e D; BA CD è una permutazione
dispari, dal momento che si arriva ad essa scambiando i compo
nenti di una sola coppia (AB) .
Come si è fatto per le simmetrie, si considereranno ora le per
mutazioni non come gli ordinamenti finali delle lettere, ma piut
tosto come la sequenza di scambi che hanno portato a tali ordina
menti . Questo significa che si può pensare di combinare due
permutazioni per formarne una: se a e b sono permutazioni (cioè
sequenze di scambi) di ABCD, allora a * b è la permutazione che
consiste nell'eseguire prima gli scambi di a e poi gli scambi di b .
Per esempio, s e a scambia A e C e poi C e D, e s e b scambia
142
CAPITOLO QUINTO
A e B , allora, partendo da ABCD, avremo
a
b
a*b
trasforma
trasforma
trasforma
ABCD
DBA C
AB CD
in
m
in
DBAC,
DAB C,
DAB C.
Chiaramente l'operazione * è associativa. La permutazione iden
tica e, che non cambia nulla, agisce come un'identità:
a * e = e * a = a, per qualsiasi a.
Ovviamente, l'inverso di qualsiasi permutazione consiste nei mede
simi scambi eseguiti nell'ordine opposto; così se a scambia A con
C e poi C con D, allora a - 1 scambia C con D e poi A con C; il
lettore verifichi che a * a - l = a - l * a = e. Quindi le permutazioni
delle quattro lettere A, B, C, D costituiscono un gruppo . Anche
le permutazioni pari sono un gruppo, un sottogruppo del gruppo
di tutte le permutazioni formato esattamente dalla metà degli
elementi del gruppo base: è una semplice conseguenza del fatto che
la somma di due numeri pari è anch'essa un numero pari, così che il
prodotto di due permutazioni pari è ancora una permutazione pari.
Questo gruppo più piccolo è chiamato il gruppo alterno di grado 4 ·
Esso risulta essere una copia perfetta del gruppo di tutte le sim
metrie di rotazione di un tetraedro regolare (vale a dire che
entrambi i gruppi hanno la stessa struttura, e quindi in definitiva
sono il medesimo gruppo) .
Tutto ciò vale per n = 4, ma le stesse considerazioni ci portano
ad altri gruppi alterni di grado n per qualsiasi n maggiore di 2 .
Con due soli simboli, infatti, c'è solamente una permutazione non
banale, che è dispari, quindi il corrispondente gruppo alterno
sarebbe costituito dalla sola identità. Per n = 3 il gruppo di per
mutazioni ha 3 X 2 X r = 6 elementi, e il gruppo alterno è un'im
magine speculare del gruppo ciclico di ordine 3 · (Se a è la permu
tazione pari di ABC che scambia A con B e poi A con C, allora
a trasforma ABC in BCA e a * a trasforma ABC in CAB ; queste
sono le sole permutazioni pari esistenti oltre all'identità. (a * a) * a
trasforma ABC in ABC, e « l 'orologio con tre ore » ha compiuto
un giro) .
Per qualsiasi n maggiore di 4 , il gruppo alterno di grado n è un
gruppo semplice. Questo è quanto sta dietro all'impossibilità di
I GRUPPI SEMPLICI
143
risolvere con i radicali tutte le equazioni polinomiali di grado mag
giore di 4· Ma non si era già detto che proprio il fatto che il gruppo
di simmetrie del dodecaedro regolare sia semplice aveva portato
Galois alla sua conclusione sulle equazioni di quinto grado? Pro
prio così: il gruppo del dodecaedro è una copia esatta del gruppo
alterno di grado 5 .
Dopo i gruppi ciclici di ordine primo e i gruppi alterni di grado
maggiore di 4, le rimanenti 1 6 famiglie regolari sono difficili da
descrivere in un testo come questo . Possiamo solo dire che sono
tutti gruppi di matrici di dimensioni opportune. In alcuni casi le
famiglie furono trovate sulla base delle proprietà delle matrici impli
cate; in altri la famiglia fu prima definita in base ad altri criteri
e solo dopo notevoli sforzi si giunse alla sua descrizione tramite
le matrici .
Che cosa dire poi del modo in cui fu risolto il problema della
classificazione? Molte delle famiglie regolari erano già note all'i
nizio del secolo, così come i cinque gruppi sporadici di Mathieu .
Partendo dalla constatazione che tutti i gruppi semplici non com
mutativi noti contenevano un numero pari di elementi, Burnside
aveva ipotizzato che ciò fosse vero per tutti i gruppi semplici non
commutativi, per quanti ce ne fossero e per quante altre proprietà
potessero avere . Nel 1 96 2 , la validità dell'ipotesi di Burnside fu
confermata da Walter Feit e John Thompson dell'Università di
Chicago, risultato che valse loro il premio Cole per l' algebra nel
1 965 . Per dare un'idea della lunghezza della dimostrazione finale
dell'intero teorema di classificazione basta dire che la dimostra
zione del teorema di Feit-Thompson riempì un intero numero di
255 pagine del « Pacific Journal of Mathematics » (riviste di mate
matica come questa in genere contengono venti o trenta saggi su
argomenti molto vari) .
Con il teorema di Feit-Thompson a disposizione, d'un tratto
si aprì la via per la soluzione del problema della classificazione lungo
le linee tracciate da Brauer nella conferenza del 1 954 a cui abbiamo
già accennato. Ci sono, come si può vedere, due passi da compiere.
Uno consiste nell'identificare i gruppi semplici (o famiglie di gruppi
semplici) che sono necessari per la classificazione; salvo un'unica
famiglia e alcuni gruppi sporadici, questo passo era già stato com
piuto prima del 1 960, anche se a quel tempo la cosa non era affatto
1 44
CAPITOLO QUINTO
evidente . L' altro passo sta nel dimostrare che ogni gruppo sem
plice rientra veramente in una delle categorie date, ed è a questo
punto che la dimostrazione si fa molto complessa. Il fatto è che
si incomincia con un gruppo semplice del tutto arbitrario (di cui,
cioè, si sa solo che è un gruppo semplice) , e poi in qualche modo
si dimostra che esso è un membro di una delle famiglie regolari,
oppure è uno dei gruppi sporadici elencati. Brauer propose un modo
per affrontare questo problema.
La sua idea era di concentrarsi sugli elementi a del gruppo (diversi
dall'elemento neutro e) tali che a * a = e. Questi elementi del gruppo
sono detti involuzioni, ed è facile dimostrare che qualsiasi gruppo
con un numero pari di elementi deve contenere almeno una invo
luzione . Chiunque può provarlo : è sufficiente conoscere le defini
zioni date prima, e la soluzione è così semplice ed essenziale che
merita di essere ricercata. In virtù del teorema di Feit-Thompson,
ne consegue che ogni gruppo semplice non commutativo conterrà
delle involuzioni.
Brauer, prima della dimostrazione del teorema di Feit-Thompson,
ma conoscendo la congettura di Burnside, calcolò i centralizzanti
delle involuzioni di molte tra le famiglie regolari note . Il centraliz
zante di un elemento g di un gruppo G è l'insieme di tutti gli ele
menti a del gruppo per il quale a * g = g * a . Se G è commutativo,
allora il centralizzante di qualsiasi elemento è G stesso, ma in altri
casi non è necessariamente così. Si dimostra però (ed è semplice
da verificare) che il centralizzante di qualsiasi elemento di G è un
sottogruppo di G. I risultati di Brauer erano incoraggianti: tutti
i centralizzanti avevano la stessa struttura generale del gruppo sem
plice originale, sebbene in forma « embrionale ». Questo gli fece
supporre che potesse essere possibile ricostruire l'intero gruppo
conoscendone i centralizzanti, e riuscì a confermare questa sua ipo
tesi per certi casi particolari .
Non solo il lavoro di Brauer sta alla base della scoperta di molti
dei gruppi sporadici (tra cui i tre gruppi di Janko già menzionati) ,
ma fornisce un criterio per inserire un dato gruppo semplice arbi
trario all'interno della classificazione proposta. Per prima cosa si
dimostra che il centralizzante di una involuzione del gruppo dato
« assomiglia molto » al centralizzante di una involuzione in uno dei
gruppi semplici noti nello schema della classificazione; quindi si
I GRUPPI SEMPLICI
145
cerca di estendere questo « legame » a un'equivalenza completa.
Quest'ultimo passaggio non è per nulla facile, perché il centraliz
zante di una involuzione è solo una piccolissima parte dell'intero
gruppo; è un po ' come tentare di capire il soggetto di un puzzle
da un solo pezzo .
Una parte del programma in 1 6 passi delineato da Gorenstein
nella conferenza di Chicago nel 1 97 2 adottava il metodo di Brauer.
Gorenstein pensava che l'impresa potesse essere ultimata per la
fine di questo secolo , e la maggior parte dell'uditorio giudicò la
previsione troppo ottimistica. Ma costoro ignoravano l'esistenza
di un giovane matematico che aveva appena completato gli studi
universitari; partendo da un risultato chiave conosciuto come il
teorema della componente, Michael Aschbacher del California Insti
tute of Technology si gettò a capofitto nel problema, ottenendo
risultati sorprendenti uno dopo l'altro . Nel 1 980, appena otto anni
dopo la conferenza di Gorenstein, Solomon riusd con un solo pic
colo passo a completare la dimostrazione. Aschbacher vinse il pre
mio Cole per l' algebra nel 1 980 per il suo lavoro .
Strada facendo, vennero alla luce i restanti gruppi sporadici .
Come per tutte le famiglie regolari tranne le prime due, questi con
sistono in determinati insiemi di matrici, a volte così complessi
che si rese necessario l'uso di un calcolatore per eseguire i calcoli .
Una volta ammesso che questi 26 gruppi, per il fatto di essere così
pochi rispetto alla quantità infinita dei gruppi semplici, sono dav
vero speciali, non ci si dovrebbe sorprendere del fatto che essi
abbiano relazioni con altri settori della matematica. Ad esempio,
la scoperta da parte di John Conway a C ambridge nel 1 968 dei
tre gruppi sporadici che oggi portano il suo nome era basata sul
reticolo di Leech, un modello matematico per la progettazione di
sistemi di codici autocorrettori, cioè di metodi per codificare le
informazioni in modo da compensare le distorsioni e le perdite
occasionali . Analogamente, due gruppi sporadici di Mathieu sono
collegati con il sistema autocorrettore di Golay, spesso usato a scopi
militari . Relazioni come queste giustificano l'interesse per il teo
rema di classificazione, ma ciò che lo rende degno di fama al di
fuori della teoria dei gruppi sta senza dubbio nell'incredibile lun
ghezza della sua dimostrazione. Per concludere cederò la parola
a Michael Aschbacher, l'uomo che tanto ha contribuito al successo
q6
CAPITOLO QUINTO
finale . Riguardando la dimostrazione subito dopo il suo comple
tamento nel 1 980, scrisse:
Molta della matematica in questione è stata introdotta solo recentemente
e sarà senza dubbio migliorata una volta che ci sarà tempo per approfondire
le tecniche . Tuttavia, è difficile immaginare una dimostrazione breve del
teorema. Io personalmente sono scettico sulla possibilità che possa mai appa
rire in futuro una dimostrazione breve di qualsiasi tipo.
Le dimostrazioni lunghe infastidiscono molti matematici . Da un lato, più
la dimostrazione è lunga, maggiore è la possibilità di un errore . La probabi
lità di errore nella dimostrazione del teorema della classificazione è virtual
mente pari a uno . D ' altro lato la probabilità che qualsiasi singolo errore possa
essere facilmente corretto è virtualmente zero , e poiché la dimostrazione
è finita, la probabilità che il teorema sia sbagliato è prossima a zero . Con
il passar del tempo e con la possibilità di assimilare la dimostrazione , il grado
di affidabilità può solo aumentare .
Forse è anche ora di considerare la possibilità che esistano teoremi naturali
fondamentali che possono essere formulati in modo conciso, ma che non
ammettono una dimostrazione breve e semplice . Ho la sensazione che il teo
rema di classificazione sia uno di questi. Man mano che la matematica diventa
più sofisticata, diventa sempre più probabile imbattersi in teoremi del genere .
C apitolo 6
Il decimo problema di Hilbert
Una breve rassegna storica
Nell' agosto 1 900 i più prestigiosi matematici del mondo si riu
nirono a Parigi per il secondo Congresso internazionale di mate
matica, un incontro importante che, tranne nei periodi di guerra,
si è sempre tenuto in località diverse del globo con cadenza qua
driennale. Tra i presenti c'era il trentottenne David Hilbert,
docente all'Università di Gottinga. Nelle vesti di uno dei massimi
matematici del tempo, Hilbert doveva tenere una delle conferenze
più importanti del convegno, cosa che avvenne 1 ' 8 agosto .
Poiché il congresso si teneva all'inizio del secolo (e non per puro
caso : era stato anticipato apposta di un anno) Hilbert, invece di
riferire sul lavoro svolto negli anni immediatamente precedenti,
come si è soliti fare in tali convegni, decise di guardare al futuro .
Esordì dicendo: « Tutti noi ripetiamo continuamente: " C ' è un
problema" . Bene, cercatene la soluzione! Riuscirete a trovarla con
la ragione, perché in matematica non esiste l'ignorabimus ». Per raf
forzare il suo appello presentò ai convenuti un elenco di ben ven
titré importanti problemi irrisolti, la soluzione di ognuno dei quali,
se trovata, avrebbe costituito un notevole passo avanti in mate
matica. Questi problemi erano per la maggior parte noti con nomi
specifici, come ad esempio il problema del continuo (il primo nella
lista di Hilbert, vedi cap . 2) o l'ipotesi di Riemann (vedi cap. 9) ,
ma uno in particolare prese il nome dalla posizione che occupava
nell'elenco di Hilbert: il decimo .
Il decimo problema di Hilbert ha le sue origini in un testo di
l'Aritmetica,
equazione diofantea
CAPITOLO SESTO
algebra,
scritto intorno al 250 d . C . da Diofanto di
Alessandria (vedi cap . 8) . In conformità con i tipi di problemi esa
minati in questo trattato, i matematici odierni usano il nome di
per indicare qualsiasi equazione a una o più
variabili, con coefficienti interi, per le quali si cerca una soluzione
costituita esclusivamente da numeri interi . È quest 'ultima condi
zione che differenzia in modo radicale la matematica delle equazioni
diofantee dalla matematica usata nella risoluzione delle equazioni con
numeri reali, o anche con numeri complessi . In verità, la nomen
clatura può creare qualche confusione. L'aggettivo « diofantea » non
si riferisce all'equazione, bensì al tipo di soluzione che si cerca.
Così l'espressione
2
3X - 5Y2
0
+ 2XY =
è detta semplicemente « equazione » se si cerca una soluzione con
numeri reali, « equazione diofantea » se si vuole una soluzione con
soli numeri interi .
Risolvere equazioni diofantee è molto diverso rispetto a risol
vere le medesime equazioni nell'insieme dei numeri reali. Ad esem
pio, l'equazione
r
- +
x= r, y =
x=x= +r,-r, y=y= +r;+r; x=x= +r,-r, y=y= -r;-r.
[r]
considerata come una normale equazione per i numeri reali, ha
infinite soluzioni; infatti, dato un qualsiasi numero reale com
preso tra
...{;, e
...{;, , posto
s=
�,
allora
s costituisce una soluzione . Invece, se la si consi
dera una equazione diofantea, ha solo quattro soluzioni :
Se si modifica leggermente l'equazione, ad esempio
x2 + y 2 = 3 ,
[2] [ r ]
[2]
allora esistono infinite soluzioni reali ma nessuna intera: come equa
zione diofantea, l'equazione
non può essere risolta. Quindi,
qual è la differenza tra le equazioni
e [2]? In termini più gene-
1 49
IL DECIMO PROBLEMA DI HILBERT
rali, è possibile dire se una qualsiasi equazione diofantea possa
essere risolta o no? Ad esempio, è possibile scrivere un programma
per calcolatore il quale, data un'equazione diofantea, ci dica se esiste
o no una soluzione? Questo è in sostanza quanto chiedeva Hil
bert al decimo punto del suo elenco . La risposta, data nel I 970
dal ventiduenne matematico russo Yurij Matjasevic, giunse solo
in seguito a un enorme lavoro che risale agli anni trenta e che
abbraccia risultati di logica matematica, di teoria della calcolabi
lità e di algebra.
Le equazioni diofantee e l'algoritmo euclideo
Il tipo più semplice di equazione diofantea è un'equazione lineare
a una sola incognita. Gli unici dati che conosciamo sulla vita di
Diofanto hanno la forma di una equazione di questo tipo, perché
un problema del quarto secolo asserisce che la sua fanciullezza
occupò un sesto della sua vita, la sua barba spuntò dopo un altro
dodicesimo, dopo un altro settimo si sposò, suo figlio nacque 5
anni dopo e visse fino a metà della vita del padre, morendo 4 anni
prima di lui. Se x indica l'età a cui Diofanto morì, questi dati danno
l'equazione
I x+I x + 4 = x,
I x+I x+5+2
I2
6
7
la cui soluzione è x = 84. Per essere precisi, questa non è un'equa
zione diofantea dal momento che i coefficienti non sono interi,
ma moltiplicandola per il minimo comune multiplo di tutti i denomi
natori dei coefficienti si ottiene un'equazione con coefficienti interi.
Indipendentemente dal fatto che Diofanto sia o no vissuto fino
all'età di 84 anni, è certo che la soluzione di una equazione diofan
tea lineare a una sola incognita è un problema banale . L'equazione
a,
a
x
=
b
a
ha una soluzione con numeri interi se, e solo se, b è esattamente
divisibile per nel qual caso la soluzione è l'intero bf . Essendo
questa condizione così semplice, è facile scrivere un programma
che permetta a un calcolatore di stabilire immediatamente se una
equazione diofantea di questo tipo ha o no una soluzione .
IjO
CAPITOLO SESTO
Che cosa possiamo dire per le equazioni diofantee a due inco
gnite? Anche in questo caso c'è un modo semplice per sapere se
esiste una soluzione . Per stabilire se l'equazione
a
ax+by=c
c d. c d, d,
6x+I5Y=I2 6 I 5
x = - 2.
ha una soluzione intera, si calcola per prima cosa il massimo comun
divisore di e b, che indicheremo con
Se è divisibile per
allora esiste una soluzione; se non è divisibile per non esiste
soluzione .
Ad esempio, l'equazione
I2
è risolvibile, perché il massimo comune divisore di e
è 3, e
è divisibile per 3 ; una soluzione è ad esempio = 7 , y
Si noti che, data un'equazione diofantea, stabilire se esista o
no una soluzione non equivale a calcolarla effettivamente. Può darsi
che si possa determinare con facilità l'esistenza di una soluzione,
che è però assai difficile da trovare . Viceversa, se si sa come tro
vare una soluzione, allora automaticamente si sa che una soluzione
esiste: se siamo in grado di trovare qualcosa, questa deve esistere,
mentre è possibile che determinate cose esistano senza che le si
trovi . Per le equazioni diofantee a due incognite, non solo c'è un
modo semplice per sapere se una soluzione esiste, ma c ' è anche
un procedimento automatico per trovarla, nel caso che esista. Det
tagli completi si possono trovare nei testi più elementari sulla teo
ria dei numeri.>'• La chiave per giungere alla soluzione è
per la determinazione dei massimi comuni divisori, che
ora descriveremo .
Dati due numeri e y, sia mody il resto che si ottiene divi
dendo per y (come nel cap.
Per calcolare il massimo comune
divisore di due numeri dati e b, con maggiore di b, procediamo
come segue. Sia mod b r1 , poi b mod r1 = r2 , r1 mod r2 r3 ; con
tinuiamo in questo modo, fino a ottenere come resto zero :
rn - l mod rn
Allora rn è il massimo comun divisore di e b .
euclideo
x
=O.
x I)x .
a
a
a =
l'algoritmo
=
a
* A d esempio D . Burton, Elementary Number Theory, Allyn and Bacon, Needham Heights
1 980.
IL DECIMO PROBLEMA DI HILBERT
Ad esempio, per trovare il massimo comune divisore di 1 3 3 e
56, si procederà in questo modo :
1 3 3 mod 56
56 mod 2 1
2 1 mod 1 4
1 4 m0d 7
=
=
=
=
21,
14,
7,
0.
Sicché il massimo comune divisore di 1 3 3 e 56 è 7 , l'ultimo resto
prima del resto zero . Il lettore può verificare da sé, ad esempio,
che i numeri 8 1 e 2 5 hanno 1 come massimo comune divisore .
Il procedimento appena descritto appare nel libro vn degli
di Euclide, scritti intorno al 3 5 0-300 a. C . , il che spiega per
ché oggi lo si denoti come algoritmo euclideo . Che cos 'è esatta
mente un
È una domanda decisiva per quanto riguarda
il decimo problema di Hilbert . Prima di cercare di rispondere,
vediamo brevemente che cos ' altro si sapeva sulla soluzione delle
equazioni diofantee ai tempi di Hilbert .
Si sapeva (e si sa) molto poco . Le equazioni lineari a più di due
variabili possono essere trattate con una estensione del metodo
basato sull' algoritmo euclideo . Per le equazioni di secondo grado
a una o due incognite, come ad esempio
menti
Ele
algoritmo?
X2 - 3 x + 4
o
=
3 X 2 - 5 XY + y 2
O
=
7>
u n procedimento per determinare s e una equazione data abbia
o no una soluzione è offerto da una straordinaria teoria elabo
rata da Gauss (la famosa teoria della reciprocità quadratica di
cui si è parlato a p . 8 2 ) . Ma, salvo casi particolari, in cui si pos
sono adottare certi accorgimenti, questo è pressappoco tutto ciò
che si sapeva. Prima di procedere, può essere interessante ricor
dare che uno dei casi particolari riguarda le equazioni diofantee
del tipo
dove
n
è almeno 2 . L'esistenza di soluzioni di queste equazioni
Ij2
n
Algoritmi e macchine di Turing
CAPITOLO SESTO
per maggiore di 2 è il famoso problema dell'ultimo teorema di
Fermat, dettagliatamente descritto nel capitolo 8 .
E ora affrontiamo il concetto di algoritmo .
Intorno all'anno 825 d. C . un matematico persiano di nome al
Khowarizmi scrisse un libro contenente le regole per l' aritmetica
di base usando numeri espressi nel sistema decimale indiano, come
quelli che usiamo noi oggi, con colonne per le unità, le decine,
le centinaia ecc . e la virgola per indicare quantità frazionarie .
L'odierna parola algoritmo viene dal suo nome.
Un algoritmo è un procedimento per l'esecuzione di un deter
minato calcolo, espresso punto per punto . Non ha importanza il
modo esatto in cui le istruzioni sono scritte o specificate; ciò che
importa è che siano complete e non ambigue, non lascino spazio
a interpretazioni diverse e siano applicabili a tutti i possibili dati
di partenza, non solamente a valori particolari. L'algoritmo euclideo
descritto prima è un buon esempio: le istruzioni ci dicono esatta
mente che cosa fare a ogni passo, e il procedimento funziona per
qualsiasi numero e b, con maggiore di b (per adattarlo a tutti
i casi si aggiunga semplicemente all'inizio l'istruzione che impone
di scrivere per primo il numero maggiore) . Altri esempi di algo
ritmi sono le regole per l' addizione, la sottrazione, la moltiplica
zione e la divisione di numeri scritti in notazione decimale date
da al-Khowarizmi nel suo libro .
Il decimo problema di Hilbert riguarda l'esistenza o meno di
un algoritmo per stabilire se una equazione diofantea data abbia
una soluzione. Per certe equazioni diofantee particolarmente sem
plici la risposta è affermativa: esistono in effetti algoritmi per
equazioni lineari e quadratiche al massimo a due incognite, come
abbiamo già detto . Ma esiste un algoritmo che funzioni in tutti
i casi? Se la risposta è affermativa, allora per provarlo basterebbe
scrivere l' algoritmo adatto . Si supponga invece che la risposta sia
negativa. Come si può dimostrarlo? L'idea di un « insieme non
ambiguo di istruzioni », sebbene adeguata per riconoscere come
tale un particolare algoritmo, è comunque troppo vaga per per-
a
a
IL DECIMO PROBLEMA DI HILBERT
153
metterei di dimostrare che non esiste un algoritmo che svolge un
determinato compito . Ci occorre quindi una rigorosa definizione
matematica.
Con l'odierna tecnologia dei calcolatori, si potrebbe formulare
una definizione di algoritmo sotto forma di programma scritto in
un linguaggio di programmazione specifico per una macchina spe
cifica; una definizione di questo tipo sarebbe sufficientemente pre
cisa. Sorgono tuttavia alcuni ovvi problemi. Per prima cosa, quale
linguaggio e quale macchina? E poi come la mettiamo con i limiti
alla dimensione dei numeri che la macchina può maneggiare o la
quantità di memoria a disposizione? Fortunatamente, risulta che,
ammesso che si sia disposti a idealizzare la situazione non ponendo
alcun limite alla dimensione dei dati, la scelta del linguaggio e della
macchina non ha alcuna importanza per quanto riguarda la defini
zione di algoritmo che ne deriva: tutti generano esattamente la
stessa collezione di funzioni calcolabili, e un calcolo è possibile
su una determinata macchina con un determinato linguaggio se,
e solo se, è possibile su qualsiasi altra macchina con qualsiasi altro
linguaggio . Questo è facilmente intuibile quando ci si rende conto
che, al livello più fondamentale di funzionamento, i calcolatori non
fanno altro che manipolare degli O e degli I .
In verità non è necessario ricorrere al calcolatore per ottenere
una definizione precisa di algoritmo. Negli anni trenta, prima del
l'era dell'elettronica, alcuni logici matematici (tra cui Emil Post,
Alonzo Church, Stephen Kleene, Kurt Godei e Alan Turing) for
mularono altre definizioni . Essi adottarono criteri differenti, tra
cui il « calcolo proposizionale », il calcolo delle « funzioni ricorsive »
e varie « macchine astratte ». Tutti quanti, però, portano alla mede
sima nozione di « funzione calcolabile » sicché qualsiasi di questi
criteri è valido per definire la nozione di algoritmo . Tanto vale
dunque seguire il metodo più semplice, che è quello ideato dal logico
inglese Alan Turing.
Turing postulò l'esistenza di una macchina di calcolo astratta,
oggi conosciuta come la
Essa consiste in una
testina di lettura e scrittura scorrevole, dentro cui passa un nastro,
diviso in celle, di lunghezza infinita nelle due direzioni (fig . 6 . 1 ) .
Le celle del nastro possono essere vuote o recare un simbolo preso
macchina di Turing.
154
CAPITOLO SESTO
L a testina legge una cella
del nastro alla volta; si troverà in
uno solo di un numero fisso di stati
Nastro di lunghezza infinita
nelle due direzioni, diviso in celle,
ciascuna in grado di recare un simbolo
Figura 6 . 1
Una macchina di Turing. Questo ipotetico dispositivo di calcolo fu inventato negli anni
trenta dal matematico inglese Alan Turing per fornire un modello astratto per lo studio
della calcolabilità. Nonostante la sua semplicità, si dimostra che essa può eseguire qualsiasi
calcolo di complessità arbitraria. Tale concetto consente di dare una definizione pre
cisa di algoritmo nei termini di programma per una macchina di Turing . A ogni istante
la testina di lettura e scrittura si trova in uno stato solo, scelto tra un numero finito e
fisso di stati. La macchina procede per passi distinti. Il passo da compiere a ogni istante
dipende dallo stato corrente della testina e dal simbolo contenuto nella cella che la testina
sta leggendo. Il funzionamento della macchina è controllato da un programma, che con
siste in una tavola che indica quale azione viene dopo ciascuna combinazione di stato
della testina e carattere della casella (vedi inserto B ) .
da un alfabeto stabilito (sono sufficienti O e r , ma la scelta del
l' alfabeto è ininfluente) . A ogni istante la testina si trova in uno
solo tra un numero finito di stati diversi; sono sufficienti due stati,
ma il numero esatto non ha importanza. La macchina funziona
sequenzialmente, e ciascuna fase consiste di tre azioni distinte .
A ogni istante la testina è posizionata su una cella, e la sua azione
dipende dal contenuto di quella cella e dallo stato della macchina.
In base a questi due elementi, la macchina cancella il simbolo
esistente nella cella, quindi lascia la cella vuota o vi scrive un
altro simbolo (o anche lo stesso di prima) , poi fa spostare il nastro
di un posto in una delle due direzioni e infine passa a un altro
stato (che può anche essere lo stesso) . Il comportamento comples
sivo della macchina è determinato da un insieme di istruzioni
che dice, per ciascuno stato e per ciascuno dei possibili simboli che
viene letto, esattamente quali tre azioni devono essere compiute .
I dati iniziali, se ce ne sono, vengono forniti scrivendoli sul nastro
(in base a un sistema di codifica, la cui scelta non ha importanza)
e la macchina viene messa in moto partendo dalla lettura della prima
cella contenente i dati. Se, e quando, il calcolo finisce, la mac
china entra in un particolare stato di « arresto » e cessa di ope-
IL DECIMO PROBLEMA DI HILBERT
155
rare. Sarà allora possibile leggere la risposta eventualmente pro
dotta sul nastro, incominciando dalla cella su cui la macchina si
è fermata.
In questi termini, un algoritmo consiste in una sequenza di istru
zioni che definiscono il comportamento della macchina di Turing
nel modo appena descritto. Ovviamente, con una macchina così
semplice persino il calcolo più elementare richiederà un algoritmo
molto dettagliato (vedi in proposito l'inserto B) . Ma la cosa più
importante è che questa macchina fornisce una definizione esatta
di algoritmo (e di calcolo) abbastanza semplice da poter essere uti
lizzata in matematica e, allo stesso tempo, adeguata per l' esecu
zione di qualsiasi calcolo algoritmico . Non è detto che si debba
materialmente costruire un congegno di questo tipo, anche se nume
rosi appassionati lo hanno fatto !
Insiemi calcolabili
insieme calcolabile
Un concetto fondamentale per la soluzione del decimo problema
di Hilbert è quello di un
di numeri interi . Que
sto è un insieme S di numeri interi per il quale esiste un metodo
automatico, ossia algoritmico, per determinare quali numeri vi
appartengano e quali no. Nei nostri termini, un insieme S di numeri
interi è detto calcolabile se esiste un programma per una macchina
di Turing che, dato un numero intero qualsiasi in ingresso, si ferma
con il valore di uscita 1 se l'intero è un elemento di 5, e con O
se non lo è . Per esempio, l'insieme dei numeri interi pari è calco
labile : il programma presentato nell'inserto B ne è una prova. In
verità, questo programma considera solo numeri interi positivi .
Per adattarlo a numeri interi negativi bisogna ricorrere a una con
venzione per la codifica dei numeri positivi e negativi, come ad
esempio quella di usare il primo simbolo come segno . Il lettore
potrebbe provare per esercizio a modificare il programma dell'in
serto B per adattarlo a questo caso più generale.
Si noti che nella definizione data di insieme calcolabile il pro
gramma per la macchina di Turing produce una risposta per ogni
numero; non può, come accade spesso con programmi reali che
CAPITOLO SESTO
Inserto Un semplice programma per macchina di Turing
n
n
B-
la
Per il nostro esempio adottiamo solo i simboli O e I . I
numeri interi positivi sono rappresentati da una sequenza inin
terrotta di I , con simboli I che denotano il numero (così
i numeri interi positivi sono indicati da: I , I I , I I I , I I I I , . . . ) .
Ci sono cinque stati, etichettati con I , 2 , 3 , 4 e A , per lo
stato speciale di arresto . Lo scopo del programma è decidere
se un numero intero dato sul nastro in entrata è pari o dispari.
Se è pari, la macchina dovrebbe produrre un I e fermarsi;
se è dispari, dovrebbe produrre uno O e fermarsi . Questa
risposta deve apparire sul nastro dopo il numero intero,
lasciando una cella vuota prima della soluzione. Si suppone
che il numero intero dato in ingresso sia allineato con la testina
inizialmente posizionata sulla prima cifra a sinistra.
Nel sottostante riquadro che contiene il programma, v
indica che la cella del nastro è vuota, mentre D sta ad indi
care lo spostamento della testina verso destra. Programmi più
complessi probabilmente comporterebbero anche dei movimenti verso sinistra.
C ondizione
S tato
I
Azione
Entrata
I
I
v
2
2
3
v
4
I
Uscita
S tato
Movimento
I
2
3
D
D
D
D
v
I
v
I
o
I
4
A
A
Le operazioni di questo programma per il dato di ingresso 3 ,
cioè I I I sul nastro, sono rappresentate sotto una per una.
La freccia mostra la posizione della testina e a fianco è indi
cato lo stato corrente della macchina.
157
IL DECIMO PROBLEMA DI HILBERT
(a )
Stato
I
(b)
Stato
2
( c)
S tato
I
(d )
S tato
2
( e)
Stato 4
( /)
Arresto
Può darsi che il lettore desideri seguire il modo di operare di que
sto programma per qualche altro valore di ingresso, o voglia scrivere
altri programmi che eseguono semplici compiti, come ad esempio
l ' addizione di due numeri interi positivi rappresentati nel modo su
indicato .
insieme ricorsivamente enu
operano su macchine reali, entrare in un ciclo infinito o avviare
una ricerca senza fine di dati inesistenti . Un concetto più debole,
che tiene conto di tutto ciò, è quello di
di interi . In termini di macchina di Turing, un insieme S
di interi è detto ricorsivamente enumerabile se esiste un pro
gramma che, dato un intero qualsiasi, si ferma, con risultato r se
e solo se l'intero appartiene a S. Se· l'intero non appartiene a 5,
merabile
CAPITOLO SESTO
il programma può fermarsi con risultato O o non fermarsi affatto .
Così, se applicassimo il programma a un numero intero N dato,
esso ci darebbe una risposta certa solo se N appartenesse a S ; se
N non appartenesse a S, la risposta potrebbe non venire mai, per
ché il calcolo potrebbe continuare all'infinito (sebbene si potrebbe
sempre rimanere nel dubbio che fosse proprio sul punto di inter
rompersi) . Ci si viene così a trovare in una situazione alquanto
sbilanciata.
Come il lettore può immaginare, c'è una stretta relazione tra
il concetto di insieme calcolabile e quello di insieme ricorsivamente
enumerabile. Un insieme S di numeri interi è calcolabile se e solo
se, sia S sia S sono ricorsivamente enumerabili, dove S è il
di S, cioè l'insieme di tutti i numeri interi non apparte
nenti a S. È abbastanza facile capire perché sia così: se S è calcola
bile allora qualsiasi programma P che lo provi proverà pure che
S è ricorsivamente enumerabile, e per ottenere un programma
che dimostri che S è ricorsivamente enumerabile possiamo prendere
il programma P e aggiungervi un passaggio finale che sostituisce
un valore di uscita O con I , e uno di uscita I con O. Viceversa,
se S e S sono ricorsivamente enumerabili, allora per ottenere un
programma che dimostri che S è calcolabile, procediamo a questo
modo : siano P e Q due programmi che, rispettivamente, ci dicono
se S e S sono ricorsivamente enumerabili . Se adesso prendiamo
due macchine di Turing, una che usi il programma P e l' altra il
programma Q, e se immettiamo un numero intero N contempora
neamente nelle due macchine, allora se N appartiene a S il pro
gramma P si arresterà con il valore di uscita I , e se N appartiene
a S il programma Q si arresterà con il valore di uscita I . Quindi,
considerate insieme, le due macchine di Turing ci offrono un modo
automatico per decidere se un intero dato è o non è in S, e questo,
intuitivamente, ci fa capire che S è calcolabile . Per rendere questa
idea più precisa, è sufficiente costruire un solo programma che fac
cia il lavoro dei due programmi P e Q. Un modo ovvio consiste
nello scrivere un programma R che per un dato intero in ingresso
attivi alternativamente P e Q (ad esempio I oo istruzioni di cia
scuno, a turno) finché uno dei due si ferma con risultato 1 . Se
R si ferma eseguendo P, allora R produce I e si ferma; se si ferma
eseguendo Q , allora R produce O e si ferma. Ovviamente il pro
gramma R dimostrerà la calcolabilità di S.
mentare
comple
I 59
IL DECIMO PROBLEMA DI HILBERT
Questo risultato è il migliore che si possa raggiungere nello sta
bilire la relazione tra calcolabilità ed enumerabilità ricorsiva. È da
escludere tassativamente che i due concetti si equivalgano: tutti
gli insiemi calcolabili sono ricorsivamente enumerabili, ma esistono
insiemi ricorsivamente enumerabili che non sono calcolabili . Per
far vedere un esempio di un insieme di questo tipo occorre, come
intuì Turing, una
cioè un unico pro
gramma in grado di simulare il funzionamento di ogni possibile
programma. Turing dimostrò che un tale programma può esistere;
sebbene i dettagli per la sua realizzazione siano piuttosto tecnici,
l'idea di base è semplice. Si consideri un elenco di tutti i programmi
per una macchina di Turing : P1 , P2 , P3 ,
Il programma univer
sale funziona così: come prima cosa si immette un numero natu
rale N sul nastro di ingresso; quando il programma universale
legge N, allora esegue il programma PN , prendendo come dati di
ingresso ciò che trova sul nastro dopo N.
Ecco ora come costruire un insieme S ricorsivamente enumera
bile ma non calcolabile . Sia S l'insieme di tutti quei numeri natu
rali N tali che il programma PN si fermi con risultato I quando
ha in ingresso il numero N (P 1 , P2 , P3 ,
è l'elenco di tutti i pro
grammi per una macchina di Turing visto prima per la macchina
universale) . Usando il programma universale, si dimostra facilmente
che S è ricorsivamente enumerabile: si aggiunge semplicemente all'i
nizio del programma universale un piccolo programma che prende
qualsiasi numero intero sul nastro e lo sostituisce con due sue copie
identiche, riposizionando la testina all'inizio della prima copia (il
lettore può scriverselo da solo) .
Per dimostrare che S non è calcolabile si supponga, per assurdo,
che lo sia. Allora, per quanto detto prima, S sarebbe ricorsivamente
enumerabile, e dovrebbe esistere un programma che lo enumera.
Questo programma dovrà apparire nell'elenco P1 , P2 , P3 ,
di
tutti i programmi: chiamiamolo Pk. Ora, k farà parte di S o non
ne farà parte . Se k appartiene a S, allora k non appartiene a S,
quindi poiché Pk enumera S, Pk calcolato su k non potrà fermarsi
con risultato I . Quindi k non soddisfa la condizione che definisce S,
e non può appartenere a S : se k è in S, allora non è in S ! D' altro
canto, che cosa accade se k non è in S ? Sarà un elemento di S,
quindi Pk calcolato su k si fermerà con risultato I , sicché k sod-
macchina di Turing universale,
• • •
• • •
• • •
1 6o
CAPITOLO SESTO
disferà la proprietà che definisce 5, il che significa che k è ele
mento di 5. Vale a dire: se k non appartiene a 5, allora vi appar
tiene ! Suona familiare tutto questo? Si riveda il capitolo 2 , in par
ticolare il paradosso di Russell e la dimostrazione del teorema di
C antor. Essendo giunti a una contraddizione, la conclusione ine
vitabile è che 5 non può in effetti essere calcolabile, come si era
prima ipotizzato .
Disponendo di quest'ultimo risultato, possiamo ora passare alla
risoluzione del decimo problema di Hilbert.
Il decimo problema di Hilbert
A dire il vero, Hilbert non chiese di dimostrare l'esistenza di
un algoritmo per stabilire la risolubilità di un'equazione diofan
tea data, ma piuttosto di scrivere materialmente un tale algoritmo .
Per citare le sue parole:
Data un'equazione diofantea con un numero qualsiasi di incognite e con coef
ficienti espressi da numeri interi razionali, ideare un processo in base al quale
si possa stabilire , con un numero finito di operazioni, se l ' equazione è risol
vibile con numeri interi razionali .
D ' altro canto, in un altro punto del suo intervento, parlando di
problemi in generale, egli dice:
T al volta succede che non troviamo la soluzione perché partiamo da ipotesi
insufficienti o procediamo in una direzione sbagliata. Sorge allora il pro
blema di dimostrare l ' impossibilità della soluzione sotto le ipotesi date o
nel senso previsto.
È proprio quanto è accaduto con il decimo problema: nel 1 9 7 0
Matjasevic dimostrò che un tale algoritmo non esiste .
Il primo tentativo serio per ottenere questo risultato fu fatto
da Martin Davis nel 1 95 0 . Ecco la strategia da lui adottata (ci si
aiuti eventualmente con l'esempio che segue) : dimostrare che a
ogni insieme ricorsivamente enumerabile 5 corrisponde un poli
nomio Ps (x, y, , y 2 , , yJ con coefficienti interi, tale che un nu
mero intero positivo k appartiene a 5 se e solo se l'equazione
diofantea
Ps (k, y 1 , y 2 , , y. ) = O
ha una soluzione. Il grado di P5 è ininfluente, così come il nu• • •
• • •
IL DECIMO PROBLEMA DI HILBERT
mero di variabili implicate . Quando finalmente il problema fu
risolto sulla base delle indicazioni date da Davis, risultò che non
è necessario che Ps abbia grado maggiore di 4 e non occorre che
n sia maggiore di 1 4 .
Ad esempio, sia S l'insieme di tutti i numeri interi positivi che
non siano della forma 4 k + 2 , per qualche k. Quindi:
S = { I , 3 , 4, 5 , 7 , 8 , 9 , I I , . . . } ·
In effetti, S è esattamente l'insieme di numeri che possono essere
espressi come differenza di due quadrati, cioè numeri della forma
a 2 - b 2 • Così:
r = r 2 - Q 2,
3 = 2 2 - r 2 - r 2,
4 = 2 2 - 02,
5 = 3 2 - 2 2,
ma non esistono due numeri a e b per i quali
6 = a2 - b2•
La dimostrazione generale procede in questo modo . Se n è in S,
deve avere una delle forme 4 k, 4 k + r , o 4 k + 3 · Nel primo caso :
e negli altri due casi:
D' altro canto, ogni quadrato è un multiplo di 4, o un multiplo di 4
aumentato di un'unità, a seconda che si tratti del quadrato di un
numero pari o di un numero dispari; quindi, la differenza di due qua
drati non può essere un multiplo di 4 più due, e di conseguenza i
numeri che non appartengono a S non sono esprimibili come diffe
renza di due quadrati.
Supponiamo ora di associare all'insieme S, che è ricorsivamente
enumerabile, il polinomio
Ps (x,
Y1 , Y 2 ) = Yi - Yi - x.
Allora, come il lettore può constatare, un numero intero positivo
CAPITOW SESTO
k sarà un elemento di S se e solo se l'equazione diofantea
P5 (k , y 1 , y 2 ) = O
è risolvibile, vale a dire se e solo se è possibile risolvere con numeri
interi l'equazione
Y i - y� - k = O
.
Naturalmente, l'esempio di prima funziona grazie alla partico
lare proprietà di S di cui si è detto . Davis si propose di associare
un appropriato polinomio P5 a ogni insieme S ricorsivamente enu
merabile. Per capire perché questo comporterebbe la non esistenza
di un algoritmo del tipo richiesto da Hilbert, supponiamo invece
che un tale algoritmo esista. Sia S un insieme ricorsivamente enu
merabile, ma non calcolabile, di numeri interi, come si è visto nel
precedente paragrafo . Poiché supponiamo che esista un algoritmo
per stabilire la risolvibilità di equazioni diofantee, ci sarà allora
un programma H per la macchina di Turing che, con un valore
di entrata k, si ferma con risultato r se l'equazione diofantea
Ps ( k, Y 1 , Y2 , . . . Yn ) = O
è risolvibile, e si ferma con risultato O se non lo è. Ma a causa
del rapporto tra S e P5 , l'esistenza di H confermerebbe la calco
labilità di 5, contrariamente alle nostre ipotesi; perciò un tale pro
gramma H non può esistere. In altre parole, non può esistere un
algoritmo del tipo richiesto da Hilbert .
Sfortunatamente, sebbene la strategia in linea di principio fun
zioni, Davis non riusd a dimostrare che un polinomio del tipo P5
esiste sempre . La chiave per risolvere il problema era contenuta
nel lavoro iniziato da Julia Robinson, che studiò i tipi di insiemi
che possono essere definiti tramite equazioni diofantee, riuscendo
a sviluppare varie tecniche per trattare equazioni la cui soluzione
aumentava esponenzialmente . Nel 1 960, Robinson collaborò con
Davis e Hilary Putnam per dimostrare che se si fosse riusciti a
trovare una sola equazione diofantea con soluzioni dal comporta
mento appropriato dal punto di vista esponenziale, allora sarebbe
stato possibile descrivere tutti gli insiemi ricorsivamente enume
rabili con una equazione diofantea, come aveva cercato di fare
Davis, e quindi risolvere il decimo problema di Hilbert . Tuttavia,
visto che non riuscivano a trovare tale equazione, furono a loro
IL DECIMO PROBLEMA DI HILBERT
volta costretti a interrompere le ricerche. Solo dieci anni dopo Yurij
Matjasevic riuscì dove avevano fallito i tre americani, usando una
famosa sequenza di numeri collegata ad un problema vecchio di
dodici secoli riguardante i conigli.
I
conigli di Fibonacci e risoluzione di Matjasevic
I 202
Liber Abacifi, lius Bonacci,
la
Nel
il matematico italiano Leonardo Pisano, noto anche
come Fibonacci (dal latino
cioè « figlio di Bonac
cia ») , scrisse il
opera autorevole che introdusse il
sistema indo-arabico dei numeri decimali nell'Europa occidentale .
Tra i problemi esaminati nel libro compare anche il seguente:
Un uomo mette u n a coppia di conigli in un luogo cintato da un muro . Quante
coppie di conigli si produrranno in un anno, se ogni mese ciascuna coppia
ne mette al mondo un' altra la quale a sua volta incomincia a riprodursi a
partire dal secondo mese di vita?
Se si ipotizza che trascorra un mese prima che la coppia iniziale
incominci a prolificare, che non si verifichino morti nella colonia
di conigli e che ciascuna coppia continui a prolificare con regola
rità, non si tarda a vedere che il numero di coppie di conigli adulti
presenti di mese in mese è dato dalla successione
I,
I, 2 ,
3 , 5 , 8,
I3, 2 I,
34, . . . ,
che segue la semplice regola secondo cui ogni numero, dopo i primi
due, si ottiene sommando tra di loro i due numeri che lo precedono.
5=
3 , 8 = 3 5 e così via.
Quindi = I I , 3 = I
Questa successione elementare ha di per sé parecchie proprietà in
teressanti, nonché alcune sorprendenti applicazioni (ad esempio,
compare nella teoria delle basi di dati e anche nello studio dell'effi
cienza computazionale dell'algoritmo euclideo) . Per quanto concerne
il decimo problema di Hilbert, l'importanza della successione di Fi
bonacci sta nel fatto che presenta una crescita esponenziale. L'n-esi
mo numero della successione è approssimativamente uguale a
2 +
+ 2, 2 +
+
� ( I +2�r
n.
L' approssimazione migliora con l'aumentare di
Ciò significa che,
CAPITOLO SESTO
in virtù del risultato conseguito da Davis, Robinson e Putnam di
cui si è già detto, per risolvere il decimo problema di Hilbert è
sufficiente trovare un'equazione diofantea le cui soluzioni siano
legate ai numeri di Fibonacci . È proprio quanto fece Matjasevic .
Per giungere all' equazione diofantea da lui scoperta, considerò le
dieci seguenti equazioni polinomiali:
u + w - v - 2 = O,
l - 2 v - 2 a - I = O,
f2 - lz - Z1 - I = O ,
g - b/2 = o,
g1 - gh - h1 - I = O ,
m - c (2 h + g) - 3 = 0,
m - /l - 2 = O,
x1 - mxy + y1 - I = O ,
(d - I ) l + u - x - I = O,
x - v - (2 h + g) (l - I ) = O.
In queste equazioni esiste una relazione tra i valori di u e v, per
ché v è il 2 u-esimo numero di Fibonacci; questo basta per soddi
sfare i requisiti del teorema di Davis, Robinson e Putnam. Se adesso
si eleva al quadrato ciascuna di queste dieci equazioni e le si som
mano tutte insieme per formare un'unica grande espressione, si
ottiene quell'unica equazione desiderata che risolve il decimo pro
blema di Hilbert .
Vista alla luce della domanda di Hilbert, la soluzione di Davis,
Robinson, Putnam e Matjasevic è negativa, perché dimostra che
non esiste un algoritmo adatto. In realtà, questo è un risultato mate
matico altamente positivo . Come visto prima, infatti, ogni insieme
di numeri interi ricorsivamente enumerabile può essere descritto
da un'equazione diofantea: se S è un insieme ricorsivamente enu
merabile, allora ci sarà un polinomio P5 (x, y,, y 2 , yJ a coeffi
cienti interi tale che un numero k appartiene a S se e solo se l'equa
zione diofantea
• • •
ha una soluzione .
IL DECIMO PROBLEMA DI HILBERT
L'insieme dei numeri primi, ad esempio, è un insieme ricorsi
vamente enumerabile (in realtà è un insieme calcolabile. È molto
semplice scrivere un programma che verifichi la primalità, sebbene,
come abbiamo visto nel cap. I , non è così facile scriverne uno che
lo faccia in modo efficiente) . Essendo ricorsivamente enumerabile,
l'insieme dei primi può essere descritto con una equazione dio
fantea. Con un qualche calcolo algebrico si trova un polinomio
P(x1, , x. ) i cui valori positivi (poiché le variabili x1, , x. assu
mono valori su tutti gli interi) , sono esattamente i numeri primi.
Questo dà risposta a un annoso quesito, se cioè i numeri primi
si possano ottenere come valori di una funzione polinomiale. Si
noti, tuttavia, che non tutti i valori della funzione sono primi; la
funzione produce anche valori negativi che possono essere o non
essere dei primi negativi . Ma i valori positivi della funzione sono
tutti e soli i numeri primi .
Sfortunatamente, il risultato di Matjasevic implica semplice
mente l'esistenza di un polinomio di questo tipo che genera numeri
primi, ma non dà indicazioni su come produrlo . Occorse un note
vole sforzo prima che, nel I 977, James Jones, Daihachiro Sato,
Hideo Wada e Douglas Wiens ne trovassero finalmente uno . Il
loro polinomio ha 26 variabili e grado 25. Eccolo :
• • •
• • •
(k + 2) ( I - [wz + h + j - qF
- [(gk + 2g + k + I ) (h + j ) + h - zF
- [2 n + p + q + z - eF
- [I 6 (k + I ) l (k + 2) (n + I) 2 + I - / 2 F
- [e 3 (e + 2) (a + I ) 2 + I - o 2 F
- [(a 2 - I) y 2 + I - x 2 F - [I 6 r2 y 4 (a 2 - I ) + I - u 2 F
- [((a + u 2 (u 2 - a )) I ) ( n + 4 dy) 2 + I - (x + cu) 2 ] 2
- [n + l + v - yF - [(a 2 - I) f2 + I - m 2 F
- [ai + k + I - l - iF
- [p + l(a - n - I ) + b (2 an + 2 a - n 2 - 2 n - 2) - mF
- [q + y (a - p - I ) + s (2 ap + 2 a - p 2 - 2p - 2) - x] 2
- [z + pl(a - p) + t(2 ap - p 2 - I ) - pmF } .
l -
(Si noti l' apparente paradosso per cui la formula sembra dividersi
r 66
CAPITOLO SESTO
in due fattori. Il fatto è che essa produce solo valori positivi quando
il fattore k + 2 è primo e il secondo fattore è uguale a 1 ) .
Ecco un bel risultato positivo con cui concludere questo capitolo!
C apitolo 7
Il problema dei quattro colori
La matematica con il calcolatore diventa adulta
Nel 1 976 due matematici dell'Università dell' Illinois, Kenneth
Appel e Wolfgang Haken, annunciarono di aver risolto un pro
blema vecchio di un secolo riguardante la colorazione delle mappe:
il problema dei quattro colori. Questo era già di per sé un evento
degno di attenzione, perché tale problema era probabilmente, dopo
l'ultimo teorema di Fermat (vedi cap. 8) , il secondo tra i più famosi
problemi irrisolti della matematica. Ma per i matematici l' aspetto
davvero sorprendente dell'intera questione era il modo in cui si
era giunti alla dimostrazione, parti ingenti e cruciali della quale
furono svolte da una macchina, utilizzando risultati ottenuti a loro
volta grazie ai calcolatori . La quantità di calcoli richiesta era tale
da rendere impossibile il controllo di ogni passaggio da parte di un
matematico umano. Ciò significava che l'intero concetto di « dimo
strazione » matematica era improvvisamente cambiato, e che un'e
ventualità profilatasi minacciosamente fin dall'epoca dei primi svi
luppi degli elaboratori elettronici, all'inizio degli anni cinquanta,
si era finalmente concretizzata: il calcolatore aveva soppiantato
il ricercatore nella costruzione di una parte di una dimostrazione
matematica.
Fino ad allora, una dimostrazione consisteva in un ragionamento
logicamente corretto mediante il quale un matematico poteva con
vincere un altro della verità di una qualche asserzione. Leggendo
una dimostrazione, un matematico poteva persuadersi della verità
dell' affermazione in questione e anche arrivare a capire le ragioni
1 68
CAPITOLO SETTIMO
che ne sostenevano la validità: una dimostrazione era tale proprio
per il fatto che forniva quelle precise ragioni.
Dimostrazioni molto lunghe come il teorema di classificazione
dei gruppi semplici (descritto nel cap. 5) tendono a dilatare in
qualche misura questa visione semplicistica delle cose, dal momento
che il matematico medio, posto di fronte a una dimostrazione che
occupa due volumi di 500 pagine, sarebbe tentato di sorvolare su
molti dettagli . Ma questo in realtà è solo un problema di rispar
mio di energie . Sicuro del fatto che altri abbiano controllato le
diverse parti dell' argomentazione, il matematico indaffarato può
fare a meno di esaminare scrupolosamente ogni passaggio . Tali
dimostrazioni sono ancora il prodotto della sola opera dell'uomo;
anche se i calcolatori sono stati impiegati nella dimostrazione di
parti del teorema di classificazione, i risultati prodotti potevano
essere tutti controllati a mano, e il ruolo della macchina non era
in alcun modo essenziale .
Invece, nella dimostrazione della congettura dei quattro colori
l'uso del calcolatore era assolutamente indispensabile: la prova era
imperniata proprio su questo. Per accettare la dimostrazione occorre
essere convinti che il programma impiegato esegua ciò che i suoi
autori affermano . Quando Appel e Haken presentarono la loro
dimostrazione perché fosse pubblicata nell' « Illinois Journal of
Mathematics », i curatori della rivista fecero in modo di control
lare la parte della dimostrazione svolta dal calcolatore mediante
l'esecuzione su di un' altra macchina di un programma scritto in
maniera indipendente. Una parte critica della dimostrazione rima
neva così nascosta agli occhi umani .
Sulle prime, molti matematici si dimostrarono scettici. « Un pro
cedimento di questo tipo, che si basa essenzialmente sui risultati
ottenuti da una macchina, risultati che pet loro natura non pos
sono essere verificati dall'uomo, non può essere considerato una
dimostrazione matematica », sostenne un critico . Per costoro il pro
blema dei quattro colori rimaneva irrisolto; e �n effetti, il problema
di stabilire se si possa ottenere una dimostrazione « manuale »
rimane a tutt'oggi aperto . Data l'estrema complessità dei calcoli
implicati, persino i sostenitori delle dimostrazioni assistite dal cal
colatore devono ammettere che gli oppositori dispongono di qual-
IL PROBLEMA DEI QUATTRO COLORI
che ragione a sostegno delle loro opinioni. Ancora oggi, una decina
d'anni dopo il primo annuncio della dimostrazione, sorgono perio
dicamente voci a proposito di sottili errori rinvenuti nel programma,
che renderebbero inaccettabile la dimostrazione. Ma nel complesso,
con il passare del tempo e con l' affermazione sempre crescente dei
calcolatori nella società, il numero dei matematici che rifiutano
di accettare la dimostrazione del problema dei quattro colori è gra
dualmente diminuito . La maggioranza ora riconosce che l'intro
duzione del calcolatore ha modificato non solo il modo in cui molte
ricerche matematiche vengono condotte, ma anche il concetto stesso
di ciò che viene considerato una dimostrazione . Il controllo del
programma che origina la dimostrazione è ora uno strumento con
sentito di argomentazione matematica valida.
Qual è questo problema la cui soluzione ha avuto un effetto
così profondo sulla natura stessa della matematica? La vicenda inizia
un centinaio di anni prima della nascita dei primi calcolatori com
merciali .
Il problema di Guthrie
Un giorno dell'ottobre r 85 2 , poco dopo aver terminato gli studi
allo University College di Londra, il giovane matematico Francis
Guthrie (che sarebbe diventato professore di matematica alla South
African University di Città del Capo) stava colorando una mappa
che rappresentava le contee dell' Inghilterra . Nel corso dell'opera
si rese conto che, per colorare una qualsiasi mappa (disegnata su
di un piano) rispettando l'ovvio requisito di non assegnare a due
regioni (paesi, contee ecc . ) confinanti lo stesso colore, il massimo
numero di colori necessari pareva essere quattro (fig. 7 . r ) . Inca
pace di dimostrare questo risultato, comunicò il problema al fra
tello Frederick, studente di fisica allo University College, il quale
lo sottopose a un suo professore, il grande matematico inglese Augu
stus de Morgan .
Come Guthrie, de Morgan non ebbe difficoltà a dimostrare che
sono necessari almeno quattro colori, esibendo un esempio di mappa
per cui tre colori non bastano (fig. 7 . 2) . Egli dimostrò anche (si
veda più avanti) che non è possibile trovare cinque paesi in una
CAPITOLO SETTIMO
Figura 7 . 1
Mappa degli Stati Uniti. Usando quattro colori è possibile colorare tutti gli Stati in
modo tale che non risultino due confinanti dello stesso colore. Cosl, ad esempio, il Colo
rado e il New Mexico devono essere di colore diverso, anche se il Colorado e l'Arizona
possono essere dello stesso colore, poiché si toccano solo in un punto. In uno studio
matematico, stati quali il Michigan, che consiste in due regioni fisicamente separate
tra di loro, devono essere considerati entità distinte. Anche il lettore potrà facilmente
verificare che la mappa non può essere colorata nel modo specificato usando solo tre colori.
Figura 7 . 2
Tre colori non bastano. Per colorare questa mappa i n modo che non s i abbiano due
paesi adiacenti dello stesso colore, i paesi A, B, C, D devono essere colorati con quat
tro colori diversi.
IL PROBLEMA DEI QUATTRO COLORI
171
posizione tale per cui ciascuno sia adiacente agli altri quattro, fatto
che sembrerebbe implicare che quattro colori sono sempre suffi
cienti. In realtà questa deduzione è errata (fig. 7 .3), come de Mor
gan stesso pare essersi reso conto . Molte tra le « pseudodimostra
zioni » della congettura dei quattro colori, apparse tra il r 85 2 e
il 1 976, cadevano proprio su questo punto . (Sembra che anche
Guthrie abbia commesso lo stesso errore) .
Non riuscendo a risolvere il problema, de Morgan lo sottopose
ai suoi studenti e ad altri matematici, tra i quali Sir William Hamil
ton del Trinity College di Dublino, l'inventore dei quaternioni (vedi
cap . 3), riconoscendo a Guthrie il merito di aver sollevato il caso .
Ma tutto sommato il problema non sembra aver suscitato grande
interesse, fino a quando, il 1 3 giugno r 878, il matematico inglese
Arthur Cayley chiese ai membri riuniti della London Mathemati
cal Society se ne conoscessero la soluzione. L'intervento di Cay
ley fu pubblicato negli atti della Società, e fu la prima menzione
scritta del problema: la sfida stava per incominciare.
Figura 7 · 3
U n ragionamento errato. Osservando che i n una mappa non può verificarsi l'eventua
lità che ciascuno di cinque paesi abbia un confine comune con gli altri quattro, molti
hanno concluso che per colorare la mappa bastano quattro colori. L'inferenza non è
valida. Nella mappa qui presentata, non c'è una configurazione in cui ciascuno di quat
tro paesi ha un confine in comune con i tre ad esso adiacenti: tuttavia la mappa non
può essere colorata con tre soli colori. Di conseguenza il numero di colori occorrenti
per colorare una mappa non coincide con il numero massimo di paesi confinanti.
CAPITOLO SETTIMO
Mappe, grafi e topologia
La prima grande difficoltà che incontra chi si accinge a dimo
strare la congettura dei quattro colori è che questa si riferisce a
tutte le mappe: non solo a tutte le mappe in tutti gli atlanti del
mondo, ma a tutte le mappe immaginabili, mappe con milioni o
più di paesi di ogni forma e dimensione. Sapere che si può colo
rare una mappa particolare usando quattro colori non aiuta per
niente: occorre trovare una prova valida in tutti i casi. Questo signi
fica che abbiamo ben poco in mano. E in effetti, da cosa possiamo
partire? A questo punto è opportuno sincerarsi di avere ben chiare
le caratteristiche generali del problema.
Ai fini del problema di Guthrie, una mappa consiste in un
numero arbitrario di regioni del piano (« Stati », se si preferisce)
separate le une dalle altre da linee (o « confini ») . Questa defini
zione generale comprende mappe del mondo reale, come quella
della figura 7 . I , e mappe artificiali, come quelle « matematiche »
delle figure 7 . 2 , 7 · 3 e 7 - 4 · La mappa degli Stati Uniti della figura
7 . I può creare problemi, per il fatto che alcuni Stati occupano due
regioni distinte: per esempio, il Michigan consiste di due regioni
separate sulla mappa, divise dal lago Michigan. Siccome si tratta
di regioni fisicamente distinte, dovrebbero essere considerate sepa
rate per quanto riguarda il processo di colorazione; allo stesso modo
Long Island dovrebbe essere considerata un'entità separata dal resto
dello Stato di New York. Così, dal momento che è in causa uno
studio matematico delle mappe, la geometria prevale sulla politica.
La congettura dei quattro colori riguarda la colorazione delle
regioni (geografiche, non politiche! ) di una mappa in modo tale
che le regioni che condividono un confine non abbiano lo stesso
colore. Le regioni che si toccano solo in un punto, come l'Arizona
e il Colorado nella figura 7 . I , non sono considerate confinanti, e
quindi possono avere lo stesso colore . Il problema è identificare
il numero minimo di colori necessario per colorare tutte le regioni
della mappa in questa maniera. Qui ci si trova di fronte a un' altra
difficoltà rilevante, perché ogni singola mappa può essere colorata
in moltissimi modi diversi, e ciò che importa non è il numero di
colori richiesto da una colorazione particolare, bensì il minimo
numero di colori con i quali si può attuare una colorazione qualsiasi.
IL PROBLEMA DEI QUATTRO COLORI
1 73
Figura 7 · 4
Una mappa complessa, difficile (ma non impossibile) d a colorare con soli quattro colori.
Perché non provarci? Questa mappa faceva parte di un << pesce di aprile » apparso nella
rivista « Scientific American >> del 1 ° aprile 1 9 7 5 . Comparve in un articolo di Martin
Gardner, famoso curatore di rubriche matematiche che, mentendo spudoratamente,
la definiva un esempio di mappa che confuta l'antica congettura dei quattro colori.
Se ci si ferma a riflettere un momento, ci si renderà conto che
le forme e le misure reali delle diverse regioni della mappa non
sono rilevanti per il problema della colorazione, ma che lo sono
le relazioni tra le singole regioni; ad esempio, tutte le mappe della
figura 7 · 5 sono equivalenti dal punto di vista della colorazione.
1 74
CAPITOLO SETTIMO
Figura 7 · 5
Equivalenza topologica. Tutte l e mappe raffigurate sono equivalenti relativamente al
problema dei quattro colori: dal punto di vista topologico non c'è differenza tra loro .
I matematici esprimono questo fatto tirando in ballo la struttura
topologica della mappa.
La topologia è un campo della matematica assai simile alla geo
metria: la geometria studia le proprietà degli oggetti in due, tre,
o più dimensioni (il termine « oggetti » assume un significato molto
astratto, naturalmente, quando si hanno quattro o più dimensioni) ,
e lo stesso fa la topologia. La differenza tra le due discipline sta
nel tipo di proprietà considerate. In topologia, la distanza e la gran
dezza non sono importanti, come non lo sono la linearità o la cir
colarità o gli angoli . In realtà, la topologia ignora quasi tutte le
proprietà che sono fondamentali per la geometria, mentre studia
quelle proprietà degli oggetti che rimangono invariate in presenza
di trasformazioni continue, come la torsione, l'allungamento, la com
pressione o la deformazione . La topologia a due dimensioni è tal
volta chiamata « geometria delle membrane elastiche », perché ha
a che fare con le proprietà che si conservano quando le figure sono
disegnate su di una membrana perfettamente elastica che viene
allungata e variamente deformata (fig. 7 . 6) .
Chiunque si accosti per la prima volta alla topologia può avere
l'impressione che sia poco adatta a uno studio matematico ragio-
1 75
IL PROBLEMA DEI QUATTRO COLORI
{a)
{e)
{b)
{f)
{c)
{g)
{d)
{h)
Figura 7 . 6
Proprietà topologiche nel piano. Gli oggetti d a (a) a (d ) sono topologicamente equiva
lenti; altrettanto dicasi per gli oggetti da (e) a (h) , ma nessuno del primo gruppo è equi
valente ad alcuno del secondo .
nevole dei problemi, ma ciò non è affatto vero : la topologia è una
vasta e profonda area della matematica (vedi cap. r o) . Anche il
problema dei quattro colori è, per la sua natura, un problema di
topologia, sebbene la sua soluzione non utilizzi nessuna delle tec
niche più avanzate della materia. La figura 7. 5 illustra perché ciò
sia vero : le forme e le dimensioni dei paesi che costituiscono una
mappa non sono importanti, mentre lo sono le loro configurazioni.
Sarà utile per comprendere quanto segue cercare di tenere a mente
che ciò che conta è la struttura topologica di una mappa, e non
la sua forma particolare.
Chiarito questo punto, introduciamo un'idea utile per iniziare
ad affrontare il problema in modo ragionevole: il grafo duale. Il
grafo duale di una mappa è ottenuto nel modo seguente (fig. 7 . 7) .
All'interno di ogni regione della mappa si ponga un punto, chia
mato nodo (si può pensare a questi punti come alle capitali degli
Stati) . Si congiungano quindi i nodi a formare una rete (in modo
assai simile al collegamento di città mediante una rete ferroviaria)
secondo questa regola: due nodi sono uniti se, e solo se, le rispet
tive regioni sulla mappa condividono un confine; il segmento che
CAPITOLO SETTIMO
Figura 7 · 7
Grafi duali. Per ottenere i l grafo duale d i una mappa assegnata, s i ponga u n punto all'in
terno di ogni regione della mappa, quindi si congiungano i nodi con linee che attraver
sano solamente le due regioni interessate. Ciò è possibile solo quando i due nodi si
trovano in regioni che hanno un confine comune, nel qual caso la linea di collegamento
intersecherà il confine. Quindi i collegamenti mettono in luce l'esistenza di confini
comuni. Colorare la mappa in modo che nessuna coppia di paesi adiacenti sia dello stesso
colore equivale a colorare i nodi del grafo duale in modo che nessuna coppia di nodi
congiunti da una linea della rete sia dallo stesso colore. Nell'esempio mostrato è possi
bile collegare ciascun nodo con linee rette, ma sono ammessi anche collegamenti con
linee curve (dal punto di vista topologico non c'è differenza tra linea retta e linea curva) .
li congiunge deve attraversare solamente le due regioni, interse
cando il confine comune (in termini di collegamenti ferroviari ciò
significherebbe che la linea non può attraversare il territorio di
un terzo Stato) .
Il grafo duale mostra immediatamente la struttura topologica
della mappa che rappresenta. Inoltre, il problema della colora
zione della mappa, nel senso del problema di Guthrie, può essere
riformulato in termini di colorazione del grafo : si colorino i nodi
in modo tale che ciascuna coppia di nodi connessi abbia colori dif
ferenti. Se tutti i grafi possono essere colorati in questo modo uti
lizzando quattro colori, ciò vale anche per le mappe e viceversa.
Così la formulazione in termini di grafi del problema dei quattro
colori fornisce un punto di vista alternativo sulla questione, del
IL PROBLEMA DEI QUATTRO COLORI
1 77
tutto equivalente alla formulazione originale; vale la pena, allora,
dare uno sguardo a questi grafi .
Abbiamo ricondotto il problema ad una branca della matema
tica nota come teoria dei grafi. Si osservi che, come conseguenza
della definizione di grafo duale, due suoi segmenti non possono
mai intersecarsi . Un grafo generico è un oggetto matematico iden
tico al grafo duale, senza però questa restrizione sulle intersezioni.
(La parola « grafo » non va confusa con quella simile « grafico », usata
in matematica per riferirsi a curve rappresentanti equazioni dise
gnate su carta) . Sebbene gran parte della spinta iniziale nel campo
della teoria dei grafi sia stata offerta dal problema dei quattro colori
(Hamilton, cui de Morgan comunicò il problema, fu un pioniere
della teoria dei grafi) , essa è oggi un settore ampio e pienamente
autonomo .
La formula di Eulero
Un'osservazione molto importante sui grafi fu fatta, in un con
testo leggermente diverso, da Eulero . È opportuno soffermarsi un
po' sulla terminologia, di cui adesso si spiegherà l'origine. Consi
dereremo solo grafi in cui è possible passare da un qualsiasi nodo
a un qualsiasi altro seguendo un percorso costituito interamente
da linee di raccordo del grafo . Questo esclude strutture « patolo
giche », come ad esempio un insieme di nodi senza linee di colle
gamento, ma comprende tutti i grafi che saranno necessari per il
nostro studio sulla colorazione delle mappe . Ciascun grafo di que
sto tipo divide la parte di piano che occupa in un certo numero
di regioni, dette facce; i nodi della rete, soprattutto in questo con
testo, sono detti vertici della rete; le linee che collegano i vertici
sono detti spigoli (o più in generale lati ) .
A questo punto, proviamo a tracciare u n certo numero di grafi,
e per ciascuno contiamo il numero di vertici ( V ) , il numero di lati
(E ) e il numero di facce (F) , come nella figura 7 . 8 . Fatto questo,
calcoliamo la quantità V - E + F in ciascun caso . Troveremo che
il risultato è sempre r . La relazione
V-E + F= r
CAPITOLO SETTIMO
Figura 7 . 8
L a formula d i Eulero. Per qualsiasi grafo i l numero d i vertici ( V ) , i l numero d i lati
(E ) e il numero di facce (F) sono tali che V- E + F = r .
vale per qualsiasi grafo, come fu dimostrato per la prima volta da
Eulero .
In realtà, Eulero era interessato non tanto ai grafi quanto ai
poliedri, il che spiega l'uso delle parole « vertice », « spigolo » e « fac
cia ». Per qualsiasi poliedro, si ha che
V-E + F= 2
dove V, E e F hanno il loro ovvio significato nell'ambito dei polie
dri. Per mostrare che questi due risultati sono equivalenti, notiamo
che se rimuoviamo una faccia di un poliedro e poi « stiriamo »
ciò che rimane della figura per adagiarla su di un piano, quelli che
prima erano gli spigoli del poliedro formeranno un grafo, i cui nodi
sono i vertici del poliedro stesso; viceversa, un grafo qualsiasi può
essere deformato dandogli la sagoma di un poliedro mancante di
una faccia: la faccia del poliedro rimossa o mancante spiega la dif
ferenza tra la formula per i grafi e quella per i poliedri.
La dimostrazione della formula di Eulero offre un ottimo esem
pio del tipo di argomentazione usato sia nella teoria dei grafi sia
nello studio del problema dei quattro colori . Supponiamo di inco
minciare con un grafo arbitrario . Che cosa accade se rimuoviamo
un lato esterno del grafo (ammesso che ce ne sia uno) ? E dimi
nuisce di I , come pure F, mentre V rimane invariato (fig. 7 . 9) .
IL PROBLEMA DEI QUATTRO COLORI
Figura 7 · 9
L a rimozione d i u n lato esterno d a u n grafo riduce d i r sia E sia F , m a lascia invariato
V. Questa operazione non altera il valore della quantità V- E + F.
Quindi la quantità V - E + F non risulta alterata da questa ope
razione . Proseguiamo : che cosa accade se il grafo ha un vertice
libero (fig. 7 . I O) e noi rimuoviamo sia il vertice sia il lato che
lo collega al resto del grafo? V diminuisce di I , così come E,
mentre F rimane invariato, e anche in questo caso la quantità
V - E + F è immutata. In questo modo, se partiamo dal grafo ori
ginale e, come il mare che erode un'isola, continuiamo a rimuo
vere lati esterni e vertici liberi ogni volta che è possibile, ci ritro
veremo alla fine con un solo vertice. Avremo così ridotto il nostro
grafo ad un « grafo banale » in cui V = I , E = O, F = O, e quindi
Figura 7 . 1 0
L a rimozione d i u n vertice « libero >> d a u n grafo riduce di r sia V sia E , m a lascia inva
riato F. Questa operazione non altera il valore della quantità V- E + F.
1 80
CAPITOLO SETTIMO
V - E + F = I . Ma poiché nessuna delle operazioni che abbiamo
eseguito ha alterato la quantità V - E + F, il valore di questa espres
sione doveva essere I anche nel grafo originario, e questo prova
il teorema. Il lettore può verificarlo da sé, incominciando da un
grafo disegnato arbitrariamente e continuando a rimuovere lati
esterni e vertici liberi, calcolando i valori di V, E, F e V - E + F
mentre procede.
Il
teorema di de Morgan
L'unico risultato positivo che de Morgan riuscì a ottenere sul
problema di Guthrie fu la dimostrazione del fatto che in nessuna
mappa può verificarsi il caso di cinque paesi, ciascuno confinante
con gli altri quattro . Usando il grafo duale e la formula di Eulero
lo si può verificare abbastanza facilmente. In termini di grafi, il
risultato di de Morgan consiste nel provare che non è possibile
disegnare un grafo con cinque vertici in modo che ciascun vertice
sia collegato agli altri quattro . Se tentiamo di farlo (fig. 7 . I I ) tra-
Figura 7 - I I
Non è possibile disegnare un grafo con cinque vertici in modo che ogni vertice sia col
legato agli altri quattro. In qualunque modo si cerchi di collegare i vertici, ne rimar
ranno sempre due (A ed E nel disegno) che non possono essere collegati senza interse
care una delle linee già tracciate.
IL PROBLEMA DEI QUATTRO COLORI
veremo sempre due vertici che non possono essere collegati senza
intersecare uno dei lati già tracciati; questo, naturalmente, non
dimostra nulla dal momento che è possibile che i collegamenti di
prima siano stati tracciati in modo sbagliato . L'argomentazione
che segue non dipende da un disegno particolare e quindi costi
tuisce una prova rigorosa.
Supponiamo che sia possibile disegnare un grafo con cinque ver
tici tale che ciascun vertice sia collegato a tutti gli altri. Se la super
ficie circostante il grafo è considerata come una faccia supplemen
tare, allora ciascun lato separerà due facce. Inoltre, poiché adesso
c'è una faccia in più, la formula di Eulero da applicare è
V - E + F = 2.
Noi sappiamo che il valore di V qui è 5 ; inoltre, poiché ogni ver
tice è collegato da un lato a tutti gli altri, E = I o , e quindi F = 7 ,
grazie alla formula di Eulero .
Fin qui nessun problema. Adesso eseguiamo un altro calcolo .
Dal momento che ciascuna faccia sarà delimitata da almeno tre
lati (questo è vero anche per la « faccia » che abbiamo introdotto
poco fa, ma teniamo in mente che in questo caso la parola « deli
mitato » è usata in senso topologico) , moltiplicando i lati per le
facce si ottengono almeno 3 x 7 = 2 I lati. Ma se calcoliamo i lati
in questo modo (moltiplicandoli per le facce) , ciascuno di essi, poi
ché separa due facce, sarà conteggiato due volte. Cosl la rispo
sta corretta è che devono esserci almeno -} X 2 I = ro -} lati, il che
(non esistendo i « mezzi lati ») significa che ce ne sono almeno I I ;
ma, come abbiamo osservato prima, E deve essere uguale a r o .
Così siamo arrivati a una contraddizione, e , come sempre accade
in questi ragionamenti, la conclusione è che l'ipotesi di partenza
deve essere falsa: non è possibile disegnare una rete con cinque
vertici in modo che ciascun vertice sia collegato con tutti gli altri .
Questo dimostra il teorema di de Morgan sulle mappe.
Il teorema dei cinque colori
Nel r 879, un anno dopo la presentazione di Cayley del pro
blema alla London Mathematical Society, uno dei soci, un avvo-
CAPITOLO SETTIMO
cato di nome Alfred Bray Kempe, pubblicò una memoria in cui
sosteneva di aver dimostrato la congettura dei quattro colori. Si
sbagliava, e undici anni dopo Percy John Heawood segnalò un
errore rilevante nella dimostrazione. Tuttavia Heawood riuscì a
recuperare dallo scritto di Kempe alcune tecniche che lo aiutarono
a provare che cinque colori sono sempre sufficienti; la dimostra
zione di questo « teorema dei cinque colori » è abbastaza facile per
poterla proporre qui.
Innanzitutto si noti che, ragionando come abbiamo fatto prima
per mettere la formula di Eulero per i grafi in relazione con quella per
i poliedri, possiamo concludere che non ha importanza, per quanto
riguarda il teorema dei quattro o dei cinque colori, se disegnarne
le nostre mappe su di un piano o sulla superficie di una sfera. Se
incominciamo con una mappa su una sfera possiamo deformarla
in una mappa equivalente sul piano praticando un foro nel mezzo
di una delle regioni e stirando la mappa fino ad appiattirla, cosic
ché la regione perforata diventa una regione che circonda il resto
della mappa. Al contrario, se ci viene data una mappa su un piano
possiamo considerare la regione che circonda la mappa come un
altro paese, e piegare l'intera mappa dandole la forma di una sfera,
facendo sì che anche la regione circostante aggiunta formi una
regione chiusa come tutte le altre. Questa procedura dimostra che
se N colori sono sufficienti per le mappe planari, lo sono anche
per quelle sferiche e viceversa.
In effetti noi dimostreremo il teorema dei cinque colori per
mappe disegnate sulle sfere. Ci serviremo della formula di Eulero,
che per le mappe sferiche è
V - E + F = 2.
Il nostro uso di questa formula sarà in relazione alla mappa in sé,
piuttosto che al grafo duale associato, come avveniva nella dimo
strazione del teorema di de Morgan. Quindi una faccia sarà una
regione della mappa, un lato sarà un confine e un vertice sarà sem
plicemente un punto in cui si incontrano tre o più confini.
L'idea è quella di partire da una mappa assegnata, del tutto arbi
traria, disegnata su di una sfera, per poi modificarla gradualmente
« fondendo » due o più paesi adiacenti in uno solo, fino ad otte
nere una mappa con cinque paesi al massimo, che ovviamente pos-
IL PROBLEMA DEI QUATTRO COLORI
sono essere colorati usando cinque colori (o meno) . Ammesso che
i passaggi usati nel processo di modificazione non riducano il
numero di colori necessari per colorare la mappa, questo dimo
strerà che cinque colori sono sufficienti per la mappa originale.
Il punto cruciale della dimostrazione è quindi la descrizione dei
singoli procedimenti usati per ridurre una mappa data in una più
semplice (cioè con un minor numero di paesi) senza ridurre il
numero di colori necessari per colorarla. Ci sono sei diversi pro
cessi di riduzione, ciascuno dei quali si applica in una situazione
differente a seconda delle particolari configurazioni dei paesi sulla
mappa.
Innanzi tutto, se una regione è interamente circondata da un'altra
(fig. 7 . r za) , allora la regione interna può essere fusa con quella
circostante. Qualsiasi colorazione della nuova mappa che usa
almeno due colori può essere estesa alla colorazione della mappa
originale usando gli stessi colori : per la regione interna si utilizza
semplicemente un colore diverso da quello usato per colorare l'in
tera regione ottenuta con la fusione sulla mappa modificata.
La successiva operazione di riduzione si attua ogniqualvolta ci
sia un vertice a cui convergono più di tre regioni. Se vi conver
gono almeno quattro regioni, allora due tra loro non hanno un con
fine comune in qualche altro punto della mappa, e queste due
regioni possono essere fuse in una sola (fig. 7 . r zb) . Data una qual
siasi colorazione della mappa modificata, quella originale può essere
colorata usando lo stesso numero di colori, poiché è possibile asse
gnare lo stesso colore alle due regioni che sono state fuse e colo
rare il resto allo stesso modo nelle due mappe. Attuando ripetuta
mente questa riduzione la mappa può essere modificata in modo
che in ogni vertice convergano al massimo tre regioni, fatto che
assumeremo vero per le restanti riduzioni.
Una regione che confina solo con altre due (fig. 7 . r zc) può essere
rimossa fondendola con una delle confinanti . Se la nuova mappa
può essere colorata usando almeno tre colori, quella originale può
essere colorata usando gli stessi colori semplicemente colorando
la regione centrale nata dalla fusione in modo diverso dalle due
aree circostanti.
Qualsiasi regione avente tre confinanti può essere rimossa fon
dendola con una di quelle limitrofe (fig. 7 . 1 2d ) , e, come nel caso
(a)
(b)
(c)
(d)
(e)
(/)
Q
R
u
T
s
R
u
T
Figura 7 . 1 2
Riduzioni usate nella dimostrazione del teorema dei cinque colori.
IL PROBLEMA DEI QUATTRO COLORI
precedente, se la nuova mappa può essere colorata usando almeno
quattro colori allora l'originale può essere colorata usando gli stessi
colori .
Allo stesso modo, qualsiasi regione avente quattro confinanti
può essere fusa con una di queste (fig. 7. r u) , il che non compor
terà alcuna variazione nella colorabilità quando abbiamo a dispo
sizione cinque colori .
Applicando i procedimenti di riduzione di cui sopra ogni volta
che sia possibile, ne risulterà una mappa in cui nessuna regione
è circondata da un'altra, in cui ciascun vertice è alla confluenza
di tre lati, e in cui tutte le regioni hanno almeno cinque lati . In
effetti, almeno una regione avrà esattamente cinque lati, come
adesso dimostreremo .
Ci sono V vertici, E lati, F regioni. Sia a il numero medio di
lati che circoscrivono ciascuna regione (a può essere anche frazio
nario) . Poiché ciascun lato giace tra due regioni,
2E
= aF.
Inoltre, ciascun vertice giace su tre lati e ciascun lato unisce due
vertici, quindi
3 V = 2 E.
Dunque
Sostituendo
3 V = 2 E = aF.
V = j aF e
= -} aF nella
E
.l aF
3
-
.l a F
2
+
formula di Eulero si ha:
F=
2,
quindi
a = 6 - __!3_ ·
p
Allora a è minore di 6 . Poiché il numero medio di lati per ciascuna
regione è inferiore a 6, alcune regioni devono avere meno di 6 lati.
Ma poiché tutte le regioni hanno almeno 5 lati, alcune di esse ne
avranno esattamente 5, come volevasi dimostrare.
Adesso consideriamo una regione P con cinque lati e le sue con
finanti Q, R, S, T, U, come nella figura 7 . 1 2 f. Due delle confi-
1 86
CAPITOLO SETTIMO
nanti di P non si toccano, ad esempio Q e S; uniamole con P come
in figura. Se la nuova mappa può essere colorata con cinque colori,
altrettanto vale per l'originale: in quella nuova Q e S hanno lo stesso
colore, quindi sono quattro i colori che circondano P, lasciando
il quinto libero per P .
Così si completa il procedimento di riduzione. Poiché ciascun
passaggio riduce il numero di regioni, applicandolo ripetutamente
giungeremo infine ad avere una mappa con cinque o meno regioni.
Poiché qualsiasi mappa di questo tipo può ovviamente essere colo
rata con cinque colori, altrettanto può essere fatto per la mappa
originale. Anzi, procedendo all'indietro attraverso i vari passaggi
riduttivi, in realtà è possibile eseguire una colorazione con cinque
colori in modo del tutto meccanico (il lettore può sperimentarlo
su una mappa non troppo complicata) .
L'idea di ridurre una mappa progressivamente, come visto sopra,
è stata sfruttata in quasi tutti i tentativi seri di dimostrazione della
congettura dei quattro colori dopo quello di Kempe, e anche in
quello risolutivo. Poiché la soluzione non è altro che un'estensione,
seppur notevole, del metodo di Kempe, vale la pena considerare
più attentamente le sue tesi.
Il
metodo di Kempe
La dimostrazione del teorema dei cinque colori vista prima, data
da Heawood sullo spunto delle argomentazioni fallaci di Kempe,
è molto più semplice di quella che Kempe riteneva adatta al teo
rema dei quattro colori. Ovviamente i procedimenti usati nelle ridu
zioni illustrate nelle figure 7 . r 2e e f non funzionano quando si
dispone solo di quattro colori . Ecco all'incirca come ragionava
Kempe .
Partiamo assumendo l'esistenza di una mappa per la quale accor
rano cinque colori (cioè quattro colori non siano assolutamente suf
ficienti), e cerchiamo di giungere a una contraddizione. Prima, però,
dobbiamo dare la definizione di mappa normale: è una mappa in
cui nessun paese è interamente circondato da un altro e non più
di tre paesi si incontrano in un punto qualsiasi. Applicando i primi
due procedimenti di riduzione sopra descritti, partendo da una
IL PROBLEMA DEI QUATTRO COLORI
mappa che richiede cinque colori possiamo ottenere una mappa
normale che richiede cinque colori . A vendo supposto l'esistenza
di una mappa che richiede cinque colori, ne segue che esisterà una
mappa normale che richiede cinque colori. Naturalmente potranno
essercene molte, ognuna con un numero diverso di paesi. Tra queste
ce ne sarà almeno una con il minor numero di paesi possibili per
questa configurazione: Kempe tentò di giungere a una contraddi
zione lavorando con una mappa normale minimale di questo tipo
che richiede cinque colori .
La ragione per cui si usa una mappa minimale sta nel fatto che
qualsiasi mappa normale con meno regioni può essere colorata ser
vendosi di quattro colori, cosl se si riesce a trovare un'operazione
di riduzione che riduca la dimensione della nostra mappa anche
solo di un paese, senza alterare il numero di colori, avremo subito
una contraddizione, dal momento che la mappa ridotta non può
allo stesso tempo essere colorabile con quattro colori e non colo
rabile con meno di cinque colori.
Kempe, giustamente, dimostrò che in qualsiasi mappa normale
deve esserci un paese con al massimo cinque confinanti, cioè in
qualche parte della mappa deve verificarsi almeno una delle confi
gurazioni mostrate nelle figure 7 . 1 2c, d, e. Poi egli sostenne, a torto,
che se una mappa normale minimale che richiede cinque colori ha
un paese con al massimo cinque confinanti, allora può essere ridotta
a una mappa normale con meno paesi che richiede ancora cinque
colori, giungendo cosl alla contraddizione vista prima. Le sue argo
mentazioni erano perfettamente corrette per quanto riguarda paesi
con due, tre o quattro confinanti. Il metodo di Kempe per i casi
di due e tre confinanti è stato visto prima nella dimostrazione del
teorema dei cinque colori; nel caso di quattro confinanti occorre
un ragionamento diverso e più sottile, perché occorre esaminare
la parte di mappa che circonda la configurazione ed eventualmente
cambiare i colori di qualche paese circostante. Non è eccessiva
mente difficile, ma richiede notevole riflessione e abilità. Dove
Kempe sbagliò fu, come rilevò Heawood, nel caso di un paese con
cinque confinanti (fig. 7 . r 2/) .
Ciò nonostante, il lavoro di Kempe conteneva due idee chiave
che sarebbero poi state utilizzate nella risoluzione del problema.
Una è la nozione di insieme inevitabile di configurazioni, un insieme
1 88
CAPITOLO SETTIMO
di configurazioni tale che qualsiasi mappa normale minimale ri
chiedente cinque colori deve contenerne almeno una (l'insieme
inevitabile di Kempe consisteva nelle configurazioni mostrate nelle
figg. 7 . r 2 c , d, e, f) ; l'altra è la nozione di riducibilità: se una deter
minata configurazione compare in una mappa normale minimale
che richiede cinque colori, allora è possibile ridurre il numero di
paesi nella mappa sì da creare la situazione contraddittoria di una
mappa normale richiedente cinque colori che abbia meno paesi di
quella minimale. Se riusciamo a dimostrare che ogni configurazione
in un insieme inevitabile è riducibile, allora siamo in grado di dimo
strare il teorema dei quattro colori. Kempe fallì perché egli non
riuscì a ridurre una delle configurazioni del suo insieme inevita
bile. La prova di Appel e Haken ebbe esito positivo perché com
prendeva un' analisi dettagliata di quest'ultimo caso, nell' ambito,
però, di un diverso insieme inevitabile . Possiamo incominciare a
farci un'idea delle difficoltà che dovettero affrontare considerando
che il loro insieme inevitabile finale conteneva quasi 1 500 confi
gurazioni. Come tale insieme sia stato scoperto sarà spiegato a suo
tempo; ora esaminiamo i progressi compiuti nella soluzione di que
sto problema negli anni intercorsi tra la dimostrazione errata di
Kempe e la risoluzione di Appel e Haken.
La formula di Heawood
Si è già accennato al lavoro di Heawood; egli, dopo aver indivi
duato il punto debole della dimostrazione di Kempe nel r 89o, spese
i successivi sessant' anni della sua vita a lavorare al problema, senza
successo . Riuscì tuttavia a risolvere il problema analogo per le
mappe disegnate su superfici diverse da piani o sfere . La sua solu
zione implica il concetto di caratteristica di Eulero di una superfi
cie. Se prendiamo una qualsiasi superficie, ad esempio una sfera,
un toro o anche un doppio toro (fig. 7 . 1 3), e disegnarne una mappa
che occupi l'intera superficie, la quantità V - E + F risulterà essere
la stessa comunque sia disegnata la mappa, proprio come accade
per le mappe disegnate su una sfera (nel qual caso la risposta è
2 ) . Tale quantità, che pertanto non dipende dalla mappa (dal
momento che in questo caso una mappa vale l'altra) , bensì dalla
IL PROBLEMA DEI QUATTRO COLORI
Figura 7 . 1 3
U n toro e un doppio toro.
superficie (poiché superfici diverse danno risultati differenti) , è
detta caratteristica di Eulero della superficie . Si tratta di un inva
riante topologico, cioè di una quantità che rimane invariata per tutti
i tipi di deformazioni topologiche . Per il toro la caratteristica di
Eulero è O; per il doppio toro è 2 ; per la bottiglia di Klein, una
superficie curiosa senza lati e con una sola faccia, che può essere
costruita nello spazio tridimensionale solo se si ammette l' autoin
tersezione (fig. 7 . 1 4) , la caratteristica di Eulero è O, la stessa del
toro . Si noti tuttavia che, sebbene abbiano la stessa caratteristica
di Eulero, il toro e la bottiglia di Klein non sono equivalenti dal
punto di vista topologico : non è possibile far assumere a uno la
forma dell'altra. Anche se tutte le superfici topologicamente equi
valenti hanno la stessa caratteristica di Eulero, non è detto che
superfici topologicamente diverse abbiano caratteristiche diverse.
-
Figura 7 . 1 4
L a bottiglia d i Klein, una figura topologica consistente i n una superficie senza lati e
con una sola faccia. La si può costruire nello spazio tridimensionale solo se si ammette
che la superficie << intersechi se stessa >>.
CAPITOLO SETTIMO
Impiegando sostanzialmente lo stesso tipo di ragionamento usato
per dimostrare il teorema dei cinque colori per le mappe disegnate
su una sfera, Heawood dimostrò che per una superficie con caratte
ristica di Eulero pari a n, con n :::;;; I , il numero di colori sufficienti
per colorare tutte le mappe disegnate sulla superficie è uguale a
� (7 + -../ 4 9 - 2 4 n) .
Sfortunatamente, l'unica superficie per la quale n è maggiore di I
è la sfera, per la quale n = 2 ; il pur notevole risultato di Heawood
non comprendeva proprio il caso di interesse più generale. (Osser
viamo che se poniamo n = 2 nella formula di Heawood, otteniamo
proprio 4) .
Così per il toro, per il quale n = O, sono sufficienti sette colori,
e poiché non è difficile disegnare una mappa sul toro che non possa
essere colorata con sei colori, questo conferma il « teorema dei sette
colori » per mappe disegnate su un toro: sette colori sono suffi
cienti e meno colori non lo sono . In effetti, nel I 968 Ringel e
Youngs dimostrarono che la formula di Heawood dà l'esatto
numero minimo di colori richiesti in ogni caso tranne che per la
sfera, per la quale allora non si conosceva la risposta, e per la bot
tiglia di Klein, per la quale n = O e la formula dà 7, ma si è dimo
strato che in realtà occorrono solo sei colori . *
Verso il teorema dei quattro colori
Dopo il lavoro di Heawood, numerosi matematici e un numero
ancor maggiore di dilettanti studiarono il problema dei quattro
colori, sviluppando nel corso delle ricerche numerose tecniche che
si rivelarono poi applicabili in altri settori della matematica. Col
senno di poi, si può ritenere che parte dello sforzo compiuto abbia
contribuito alla risoluzione finale del problema. Ecco in breve che
cosa accadde.
Nel I 9 I 3 George Birkhoff migliorò la tecnica della riduzione
di Kempe riuscendo a dimostrare che determinate configurazioni
* Come conseguenza del teorema dei quattro colori oggi si sa che la bottiglia di Klein è
la sola superficie per la quale la formula di Heawood non dà la risposta minima esatta.
IL PROBLEMA DEI QUATTRO COLORI
maggiori di quelle di Kempe sono riducibili. Nel 1 9 2 2 Franklin
si servì di alcuni dei risultati di Birkhoff per dimostrare che ogni
mappa con 2 5 o meno paesi può essere colorata con quattro colori.
Nel 1 9 2 6 Reynolds superò questo risultato portando i paesi a 2 7 ,
e nel 1 93 8 Franklin s i aggiudicò nuovamente il « primato » arri
vando a 3 1 paesi. Nel 1 940 Winn giunse a quota 3 5 , e qui ci si
fermò fino al 1 970, quando Ore e Stemple dimostrarono il teo
rema dei quattro colori per tutte le mappe con meno di 40 paesi.
Si arrivò a 96 prima che la dimostrazione finale di Appel e Haken
rendesse superflui tutti questi risultati.
Anche se questo lavoro ha mostrato che molte configurazioni
sono riducibili, l'insieme di tutte le configurazioni che entro il 1 970
erano risultate riducibili era ben lontano dal formare un insieme
inevitabile, condizione indispensabile per provare la congettura
dei quattro colori . Erano stati costruiti svariati insiemi, ma nes
suno sembrava potesse condurre a un insieme inevitabile di confi
gurazioni riducibili: la riducibilità escludeva l'inevitabilità e vice
versa. Nel 1 950 il matematico tedesco Heinrich Heesch, che
lavorava al problema dei quattro colori dal 1 93 6 , stimò che un
insieme inevitabile di configurazioni riducibili avrebbe dovuto con
tenere circa r o ooo configurazioni distinte. Sebbene questa stima
dovesse infine risultare eccessiva, Heesch aveva ragione nel segna
lare che il problema sarebbe stato risolto solo con l' aiuto di calco
latori molto potenti in grado di trattare una sterminata quantità
di dati. Rendendosi conto che la chiave per arrivare alla soluzione
stava nella capacità di maneggiare grandi insiemi di configurazioni,
Heesch fu il primo a sostenere la necessità di affrontare il pro
blema con l'aiuto di un calcolatore e a sperimentare questo metodo .
Egli incominciò col formalizzare i vari metodi conosciuti per
la dimostrazione di configurazioni riducibili e rilevò che almeno
uno di questi (una semplice generalizzazione del metodo di Kempe)
era sufficientemente meccanico per essere eseguito da un calcola
tore. Karl Durre, uno studente di Heesch, scrisse un programma
per dimostrare la riducibilità, usando la rappresentazione della
mappa in termini di grafo duale, che costituiva un modo più sem
plice per affrontare il problema al calcolatore .
C 'era un problema da superare: se un metodo per provare la
riducibilità di una particolare configurazione avesse dato esito nega-
CAPITOLO SETTIMO
tivo, ciò non avrebbe necessariamente implicato la non riducibi
lità della configurazione; un altro metodo avrebbe potuto riuscire
là dove il primo aveva fallito. Per superare questa difficoltà si ren
deva necessario sviluppare quello che potremmo chiamare un pic
colo « arsenale » di tecniche per provare la riducibilità. Entro la
fine degli anni sessanta, Heesch aveva attrezzato un arsenale abba
stanza vasto perché Appel e Haken lo usassero quando partirono
all' assalto del problema nel I 976.
Nella costruzione di un insieme inevitabile di configurazioni,
però, il progresso non era stato altrettanto consistente . Heesch
tentò un metodo che prendeva spunto dallo spostamento di una
carica su un circuito elettrico, ma non lo adottò per molto . Forse
avrebbe fatto bene a insistere, perché era quello lo stratagemma
che avrebbe portato alla risoluzione finale .
Il metodo della carica di Heesch
Il grafo duale associato a una mappa normale minimale che
richiede cinque colori (in conformità con il lavoro di Kempe) è
un grafo in cui ogni faccia è un triangolo e in cui in ciascun ver
tice convergono almeno cinque lati (il numero di lati convergenti
in un vertice è detto grado del vertice) . L'idea consiste nel consi
derare la rete come un circuito elettrico e assegnare una carica a
ciascun vertice secondo questa regola: se un vertice ha grado k,
gli si dà carica 6 - k. Così i vertici di grado 5 hanno una carica
positiva pari a + I , i vertici di grado 6 non hanno carica, i vertici
di grado 7 hanno carica - I e così via. Dal lavoro di Kempe deriva
che la somma delle cariche sull'intero circuito è sempre I 2 . Non
è importante il valore di I 2 in sé, quanto il fatto che la somma
delle cariche sia sempre positiva.
Ora supponiamo di incominciare a muovere le cariche positive
lungo il circuito, anche in quantità frazionarie . Questo non por
terà ad alcuna perdita o guadagno netti nella carica totale del cir
cuito, ma alcuni vertici di grado 5 potranno finire per perdere tutta
la loro carica, cioè diventare scarichi, mentre alcuni vertici di grado
superiore a 6 potranno finire con una carica positiva, cioè diven
tare carichi . L'esatta situazione finale dipenderà solo dalla proce-
1 93
IL PROBLEMA DEI QUATTRO COLORI
dura di scaricamento adottata. Tuttavia (e qui sta il nocciolo della
questione) , poiché è possibile determinare la disposizione di pic
cole porzioni di una mappa senza conoscere l'intera mappa, allora,
data una determinata procedura di scaricamento, è possibile gene
rare un elenco finito di tutte le configurazioni che risulteranno
con carica positiva netta.
Ora, poiché la carica totale sul circuito è positiva, ci sarà sem
pre qualche vertice con carica positiva. Così, poiché tutti i possi
bili accettori di carica positiva sono compresi nell'elenco finito di
configurazioni generato dalla procedura di scaricamento, ogni cir
cuito del tipo che stiamo considerando deve contenere almeno una
di queste configurazioni. In altre parole, l'elenco di configurazioni
generato costituirà un insieme inevitabile, che è quanto stiamo cer
cando . L'insieme inevitabile originario di Kempe può essere con
siderato come l'insieme derivato dalla procedura « banale », che con
siste nel non muovere affatto alcuna carica. Così il metodo dello
scaricamento è una generalizzazione del metodo di Kempe, ed es
sendo più generale dovrebbe avere maggiore probabilità di successo.
Un semplice esempio dovrebbe aiutare a chiarire le idee, anche
se è probabile che il lettore dovrà riflettere un po ' per capire che
cosa accade . Si parta dal presu pposto che la procedura di scarica
mento consista nel trasferire 5 dell'unità di carica da ogni vertice
di grado 5 a ciascun vertice contiguo avente grado uguale o mag
giore di 7 . Allora l'insieme inevitabile consiste nelle due sole con
figurazioni della figura 7 . I 5 . Per vedere come ci si giunge, si tenga
presente per prima cosa che un vertice di grado 5 può risultare
positivo solo se ne ha almeno uno contiguo di grado 5 (fig. 7 . I 5a)
o di grado 6 (fig . 7 . I 5 b) . Un vertice di grado 6 parte senza nes
suna carica, e non ne riceve nessuna con questo procedimento . Un
vertice di grado 7 può diventare positivo solo se ne ha almeno sei
contigui di grado 5; se questo si verifica, allora, poiché ogni faccia
è un triangolo, due di questi contigui sono uniti da un lato (quindi
la fig. 7 . I 5a si riferisce a quella coppia di contigui) . Un vertice di
grado uguale o maggiore di 8 non può diventare positivo anche se
tutti i suoi contigui hanno grado 5 . Muovere solo -} di carica
non basterà: ad esempio, per un vertice di grado 8 con otto con
tigui di grado 5 la carica originaria sarà 2 , la carica ricevuta sarà
8 X -} = f unità, lasciando una carica finale di f.
-
1 94
CAPITOLO SETTIMO
(a)
(b)
Figura 7 . 1 5
L'insieme inevitabile generato dalla semplice procedura d i scaricamento descritta nel
testo. L' insieme inevitabile è costituito dalle configurazioni (a) e (b) . In (a) la configu
razione è costituita da due vertici di grado 5 collegati tra loro, in (b) da un vertice di
grado 5 collegato a un vertice di grado 6. Le coppie di vertici sono raffigurate da tondi
neri collegati da una linea marcata. Il resto di ciascuna delle due configurazioni è deter
minato dal grado dei vertici della coppia d'origine e dal fatto che il grafo è triangolare.
Non esiste alcuna limitazione per il grado dei vertici esterni, raffigurati da cerchi bian
chi . « Inevitabile >> significa che si troverà sempre almeno una delle due reti (a) e (b) .
Quindi le due configurazioni mostrate in figura formano un in
sieme inevitabile, cioè si troveranno sempre in qualsiasi tipo di
grafo .
L'idea di usare il metodo della carica per dimostrare la conget
tura dei quattro colori è motivata dalla speranza di trovare una
procedura di scaricamento tale che l'insieme inevitabile che ne
deriva sia costituito esclusivamente da configurazioni riducibili.
Se questo si può fare, ne consegue immediatamente il teorema.
(Detto per inciso, nessuna delle due configurazioni presentate nel
l'esempio di prima è riducibile) .
La dimostrazione del teorema dei quattro colori
Nel 1 970 Wolfgang Haken si imbatté per caso in alcuni nuovi
metodi per migliorare le procedure di scaricamento e, sebbene l'im
presa sembrasse ardua e tale da richiedere un tempo di calcolo
immenso, egli incominciò a sperare che si sarebbe infine arrivati
alla dimostrazione della congettura dei quattro colori . Nel 1 9 7 2 ,
IL PROBLEMA DEI QUATTRO COLORI
1 95
insieme a Kenneth Appel, si mise a lavorare seriamente nel tenta
tivo di trasformare questa speranza in realtà.
Il loro scopo era individuare un procedimento che portasse a
un insieme inevitabile di configurazioni riducibili . Questo com
portava due cose: trovare la procedura di scaricamento e dimo
strare che le configurazioni inevitabili così originate erano riduci
bili . In un primo tempo lavorarono su tipi di grafi molto limitati
che, in base al precedente lavoro di Heesch e altri, dovevano essere
più facili da trattare . La strategia di massima era chiara: partire
da una procedura di scaricamento che sembrasse promettente e
cercare di dimostrare che ciascuna delle configurazioni inevitabili
risultanti era riducibile . Se una o più configurazioni dell'elenco
non fossero risultate riducibili, si sarebbe dovuta modificare la pro
cedura di scaricamento in modo che quella configurazione, o quelle
configurazioni, non comparissero più. Sebbene si tratti di una stra
tegia semplice da descrivere, attuarla non fu affatto un'impresa
facile. Occorsero molte settimane di « dialogo » uomo-macchina per
provare uno dopo l' altro vari procedimenti di scarica, ma gradual
mente si fecero progressi . Un simile metodo « sperimentale » al cal
colatore, costellato di interventi umani, fu adottato simultanea
mente dai due ricercatori nel tentativo di trovare metodi sempre
più perfezionati per la dimostrazione della riducibilità . Dopo tre
anni di lavoro di questo tipo, e cioè all'inizio del 1 976, essi final
mente capirono di avere sufficienti informazioni per affrontare il
problema nella sua interezza. Il risultato di tutto il loro lavoro spe
rimentale fu lo sviluppo di una procedura di scaricamento che sem
brava in grado di produrre un insieme inevitabile di configurazioni
riducibili, e la stesura di una sequenza di passaggi per la dimostra
zione della riducibilità che sembrava funzionare sui tipi di confi
gurazioni che avrebbero incontrato. Il loro programma era in grado
di automodificarsi in modo che, quando si fosse imbattuto in una
configurazione di cui non poteva dimostrare la riducibilità, avrebbe
mosso una carica positiva lungo il circuito per ovviare alla diffi
coltà. Ma il tutto avrebbe funzionato? Il solo modo per verificarlo
consisteva nel far partire il programma e vedere che cosa sarebbe
successo, e questo è quanto fecero .
Sei mesi dopo, nel giugno 1 976, ottennero la risposta. Il loro
programma era riuscito, con notevole aiuto da parte dei suoi due
CAPITOLO SETTIMO
ideatori ormai molto esperti, a dimostrare il teorema dei quattro
colori . Erano occorsi quattro anni di intenso lavoro e I 200 ore
di impiego del calcolatore. La procedura iniziale di scaricamento
aveva subìto circa 500 modifiche prima di giungere a quella finale,
modifiche suggerite man mano dal risultato dei vari tentativi. I
due matematici dovettero analizzare a mano qualcosa come I O ooo
vertici dotati di carica positiva, e il calcolatore dovette esaminare
oltre 2ooo configurazioni e dimostrare la riducibilità di un totale
di 1 482 configurazioni dell'insieme inevitabile. Tutto funzionò .
Gli sforzi di cent' anni di ricerche erano giunti al termine .
La matematica, da quel momento, non sarebbe mai più stata
la stessa.
C apitolo 8
L' ultimo teorema di Fermat
Il
problema più famoso della matematica*
All'inizio del 1 983 , Gerd Faltings, un matematico tedesco di
ventinove anni, ha dimostrato un risultato che rappresenta il primo
importante passo avanti compiuto negli ultimi cento anni verso
la soluzione del più famoso problema matematico irrisolto. Si tratta
naturalmente dell'ultimo teorema di Fermat, che da trecento anni
costituisce un rompicapo famoso, e non solo in campo matema
tico: qualsiasi persona istruita ne avrà perlomeno sentito parlare.
La sua origine risale a un' annotazione scarabocchiata nel margine
di un libro .
Quando morì, il 1 2 gennaio 1 665 , Pierre de Fermat era uno
dei matematici più famosi d'Europa. Sebbene oggi il suo nome
sia sempre associato alla teoria dei numeri, gran parte del lavoro
da lui svolto in quell' ambito era così avanzato per quel tempo che
i contemporanei lo conoscevano piuttosto per i suoi studi sulla geo
metria delle coordinate (che egli inventò indipendentemente da
Cartesio) , sul calcolo infinitesimale (portato a termine da Newton
e Leibniz) e sulla teoria delle probabilità (le cui basi furono get
tate essenzialmente da Fermat e da Pascal) . Malgrado tutto, egli
non era un matematico di professione, bensì avvocato e magistrato
presso il parlamento provinciale di Tolosa, posizione da lui rag
giunta nel 1 63 1 all'età di trent' anni.
* [L'intero capitolo va letto alla luce del fatto che, nel giugno 1 993 , il matematico inglese
Andrew Wiles ha reso pubblica una sua dimostrazione del teorema di Fermat. Sebbene molti
dettagli restino da chiarire, come ha ammesso lo stesso Wiles nel gennaio 1 994, gli esperti sono
convinti in massima parte dell'esattezza della dimostrazione di Wiles , che risolverebbe defini
tivamente la questione] .
CAPITOLO OTTAVO
Fermat incominciò a dedicare il suo tempo libero alla mate
matica dopo aver accettato la carica di giurista. Pur non avendo
ricevuto una preparazione specifica in questa materia, rivelò pre
sto una predisposizione innata. Non rivelò invece predisposizio
ne a presentare il suo lavoro in forma sistematica: salvo qual
che eccezione di poca importanza, non pubblicò praticamente
nulla durante tutta la sua attività di matematico . Tenne invece
una copiosa corrispondenza con i più grandi matematici del suo
tempo . In un'epoca popolata da giganti della matematica quali
Desargues, Cartesio, Pasca!, Wallis e Jacques Bernoulli, il fran
cese Pierre de Fermat, il « principe dei dilettanti », per il quale la
matematica era un passatempo, poteva considerarsi pari a chiun
que altro .
Il percorso che condusse alla formulazione di questo famoso teo
rema è lungo e interessante. Quando Costantinopoli cadde sotto
i turchi nel 1 453 , gli studiosi bizantini fuggirono in Occidente,
recando con sé antichi manoscritti greci, tra cui una copia di quanto
era rimasto dell'Aritmetica di Diofanto . Quest'opera si salvò, ma
fu poco letta fino al 1 62 1 , quando Claude Bachet pubblicò una
nuova edizione del testo originale greco, unitamente a una tradu
zione in latino contenente note e commenti. Il libro si impose allora
all' attenzione dei matematici europei, e pare che proprio la let
tura dell'Aritmetica abbia suscitato in Fermat il primo interesse
per la teoria dei numeri .
L'Aritmetica, l'opera principale di Diofanto, risale al secolo m
d. C . , ed è uno dei primi libri di algebra mai scritti . La maggior
parte del trattato riguarda le soluzioni razionali di equazioni a due
o più variabili aventi coefficienti interi. I matematici odierni,
quando lavorano a questo tipo di problemi, di solito si limitano
a trovare radici intere, ma le due cose spesso si equivalgono . Ad
esempio, per un'equazione lineare a tre variabili come
2 X + 3 Y + 4Z = 0,
l a soluzione razionale x = { , y = 1� , z= f può essere conver
tita nella soluzione intera x = 5 , y = 2 , z = 4 moltiplicando tutto
per 20, minimo comune multiplo di 4, I o e 5 · Un procedimento
simile può essere adottato in molti altri casi per convertire una
-
-
1 99
L' ULTIMO TEOREMA DI FERMAT
soluzione razionale in una costituita esclusivamente da numeri
interi. Quanto detto vale sicuramente per tutte le equazioni esa
minate in questo capitolo, quindi, in linea di massima, anche qui
si prenderanno in considerazione soltanto radici intere.
Durante la lettura della sua copia dell'Aritmetica nell'edizione
di Bachet, Fermat aveva l' abitudine di fare brevi annotazioni in
margine. Quando, cinque anni dopo la sua morte, il figlio Samuel
si accinse a raccogliere tutte le annotazioni e le lettere del padre
per pubblicarle, si imbatté nella copia annotata dell'Aritmetica e
decise di pubblicare una nuova edizione del libro, includendo le
note scritte in margine da Fermat sotto forma di appendice . La
seconda di queste Osservazioni su Diofanto, come Samuel le chiamò,
era stata scritta da Fermat nel libro 11 , di fianco al problema 8 :
« Dividere u n quadrato dato i n due quadrati ». L' annotazione di
Fermat, in latino, diceva:
N o n è, invece, possibile dividere un cubo i n due cubi, o u n biquadrato in
due biquadrati, né, in generale, dividere alcun ' altra potenza di grado supe
riore al secondo in due altre potenze dello stesso grado : della qual cosa ho
scoperto una dimostrazione veramente mirabile , che non può essere conte
nuta nella ristrettezza del margine . *
I n termini algebrici, il problema di Diofanto chiede di trovare
tre numeri razionali x , y , z che soddisfino l'equazione
x2 + y 2 = z2,
cosa che risulta abbastanza facile . Il commento scritto in margine
da Fermat sostiene che, se n è un numero naturale maggiore di
2 , allora l'equazione
non ha radici razionali . Come si è detto nel capitolo 3 , al tempo
di Diofanto, e in certo qual modo anche al tempo di Fermat, lo
zero non era considerato un numero, sicché le radici ottenute
ponendo una delle variabili uguale a O sono in questo caso escluse.
Il problema riguarda solo le radici razionali positive .
Si noti che, grazie alla semplice osservazione fatta prima, non
cambia nulla se restringiamo il problema di Diofanto e di Fermat
*
[P. de Fermat, Osseroazioni su Diofanto, Boringhieri, Torino 1 95 9 , p . 1 8] .
200
CAPITOLO OTTAVO
per riferirlo a radici intere (in realtà a radici intere positive) piut
tosto che a radici razionali, poiché qualsiasi radice razionale por
terà immediatamente a una radice intera e, viceversa, qualsiasi
radice intera è chiaramente una radice razionale. Così l'ultimo teo
rema di Fermat (come viene chiamata l'annotazione da lui fatta
in margine) può essere inteso come l' asserzione che, per qualsiasi
numero naturale n maggiore di 2 , l'equazione
xn
+
yn
=
zn
non ha soluzioni intere positive.
Perché si parla di « ultimo teorema di Fermat »? L'origine di que
sta denominazione è abbastanza oscura. Sebbene non si sappia per
certo quando Fermat abbia scritto la famosa annotazione, sembra
probabile che l' abbia fatto nel periodo in cui per la prima volta
si accostava all'opera di Diofanto intorno al 1 63 0 , all'inizio cioè
della sua attività matematica, per cui quel teorema non fu certa
mente il suo ultimo . Molto più probabilmente la denominazione
deriva dal fatto che, di tutte le congetture che lasciò formulate
alla sua morte, questa è l'ultima che rimane da dimostrare, ammesso
che sia dimostrabile .
Questo fatto potrebbe spiegare l'uso della parola « ultimo ». Come
si spiega la parola « teorema »? Fermat aveva davvero la « dimo
strazione veramente mirabile » di cui parlava? Sebbene glielo si
debba concedere come possibilità, l'evidenza dei fatti suggerisce
che egli fosse in errore, anzi, che lui stesso più tardi se ne sia
reso conto . Gli altri suoi teoremi compaiono con formulazioni
diverse nelle numerose lettere con le quali sollevava problemi pro
'
ponendoli ad altri matematici, e i due casi particolari x 3 + y ' z
e x 4 + y 4 z 4 dell'ultimo teorema si trovano anche altrove, men
tre l'ultimo teorema vero e proprio è menzionato esclusivamente
in quella breve nota scritta in margine. Molto probabilmente egli
capì come dimostrarlo per n = 4, e probabilmente anche per n 3
(due esponenti per i quali oggi è definitivamente accertata la verità
del teorema) e pensò che il procedimento potesse essere generaliz
zato a tutti gli altri numeri interi n, ma in seguito si rese conto
che le cose non stavano così. Poiché non prevedeva che le note
scritte in margine venissero pubblicate, non ritenne il caso di
doverle rivedere e modificare . Anzi, è probabile che abbia com
pletamente dimenticato di aver scritto quella annotazione .
=
=
=
201
L' ULTIMO TEOREMA DI FERMAT
Nonostante tutto, qualcuno ancora crede che Fermat conoscesse
la dimostrazione . Dopo tutto è una storia affascinante: un dilet
tante del secolo XVII arriva a un risultato che per i successivi 350
anni è destinato a vanificare gli sforzi d i matematici di professione.
Il fatto che si tratti di un problema così facile da enunciare rende
la storia ancora più piacevole, naturalmente, e c'è sempre la possi
bilità che Fermat avesse ragione.
Avesse o no Fermat una dimostrazione, rimane il fatto che nes
sun altro è riuscito in qualche modo a risolvere questo problema
allettante e apparentemente semplice. E gli sforzi sono stati impo
nenti: molti matematici di fama hanno trascorso anni cimentan
dosi con questa congettura, e il lavoro svolto a tale proposito ha
fatto sviluppare settori totalmente nuovi della matematica (si veda
più avanti) . Sull' argomento sono stati scritti libri interi. A dire
il vero, i risultati conseguiti nel tentativo di dimostrare l'ultimo
teorema superano di molto il teorema stesso per l'importanza che
essi hanno per la matematica. Se l'ultimo teorema di Fermat dovesse
essere dimostrato domani, di fatto non ne deriverebbe alcun risul
tato matematico nuovo . La sua importanza poggia unicamente su
due fattori: la sua fama e il fatto che nessuno sia riuscito a risolverlo.
Che cosa si sa dell'ultimo teorema e in cosa consiste l'impor
tante avanzamento compiuto da Faltings nel r 983 ? Le risposte si
troveranno in questo capitolo .
Le teme pitagoriche
Il problema emerso dall'Aritmetica di Diofanto che ha portato
alla formulazione dell'ultimo teorema di Fermat consiste nel tro
vare un metodo per risolvere l'equazione
x2
+
y 2 = z2
nell' ambito dei razionali, sebbene noi ci limiteremo a considerare
radici intere. A causa dell'evidente rapporto con il teorema di Pita
gora, tre numeri interi x, y, z qualsiasi che soddisfino la prece
dente equazione sono detti una tema pitagorica. Ad esempio, i
numeri 3 , 4 , 5 formano una terna pitagorica perché
32
+
42 = 52·
202
CAPITOLO OTTAVO
Da una terna pitagorica se ne possono ottenere infinite altre mol
tiplicando i tre numeri della terna originaria per un coefficiente
qualsiasi: ad esempio, moltiplicando la terna 3 , 4, 5 per 2 si ottiene
6, 8, I o , che è una terna pitagorica perché
62 + 8 2 = I o 2 ;
moltiplicandola per 3 si ha la terna pitagorica 9 , I 2 , I 5 , e così via.
In un certo senso la soluzione è una sola, cioè 3 , 4 , 5 , mentre le
altre sono solamente « variazioni sul tema ». La terna 5 , I 2 , I 3 ,
d'altro lato, è una soluzione completamente diversa (che a sua volta
darà origine a una famiglia infinita di soluzioni) . Ciò che distin
gue le soluzioni 3 , 4, 5 e 5, I 2 , I 3 dalle infinite soluzioni che da
queste derivano moltiplicandole per una costante è il fatto che que
ste soluzioni originarie non hanno fattori comuni : 3 , 4 e 5 non
hanno alcun divisore comune, così come non lo hanno 5 , I 2 e I 3 .
In generale, se a , b, c è una qualsiasi terna pitagorica, allora
lo è anche qualsiasi multiplo ma, mb, mc; viceversa, se u, v, w è
una qualsiasi terna pitagorica e se d è un fattore comune di u, v,
w, allora anche ufd, v/d, w/d è una terna pitagorica. Per sottoli
neare la natura particolare delle terne di base come 3 , 4, 5 e 5 ,
I 2 , I 3 , i matematici chiamano primitive le terne pitagoriche che
non hanno alcun fattore comune (diverso da I ) . Dunque il pro
blema di Diofanto consiste nel trovare un metodo per determi
nare tutte le terne pitagoriche primitive.
Un ragionamento matematico molto semplice porta alla seguente
formula per generare tutte le possibili terne pitagoriche primitive
x, y , z:
x = 2 st,
y = s 2 - t2,
z = s 2 + t2,
dove s e t sono numeri naturali qualsiasi tali che s è maggiore di
t, s e t non hanno alcun fattore comune, uno dei due è pari e l' al
tro dispari . Così, ad esempio, s = 2 e t = I danno la terna x = 4 ,
y = 3 , z = 5 ; s = 3 e t = 2 danno x = I 2 , y = 5 , z = I 3 ; s = 4 e t = I
danno x = 8, y = I 5 , z = I 7 e così via.
Questa soluzione completa del problema di Diofanto appariva
già negli Elementi di Euclide .
203
L' ULTIMO TEOREMA DI FERMAT
Il caso
n=4
Chiarito il problema di Diofanto, che cosa si può dire sull' ul
timo teorema di Fermat? Questo asserisce che per ogni numero
naturale n maggiore di 2 , l'equazione
x• + y • = z•
non ha radici intere (positive) . Come si può procedere per dimo
strare, o piuttosto per tentare di dimostrare, una asserzione di que
sto tipo?
Un primo passo ragionevole è considerare alcuni casi partico
lari, come ad esempio n = 3 , n = 4 e n = 5 ; se si riesce a risolvere
questi, è probabile che si riesca a capire come dimostrare l'intero
teorema. Sembra che questo sia proprio il modo in cui Fermat abbia
affrontato la questione. L'unica testimonianza concreta che ci
rimane è il lavoro da lui compiuto su un problema strettamente
collegato al caso n = 4· In pratica, è l'unico ragionamento mate
matico di Fermat che ci sia pervenuto, ed è contenuto in un' altra
nota a margine dell'Aritmetica . Sorprende il fatto che, come la
nota in cui è enunciato l'ultimo teorema, anche questa finisca con
le parole: « L'esiguità del margine impedisce di inserirvi una dimo
strazione completa e più ampiamente spiegata » . *
Prima di vedere il ragionamento di Fermat e i n che modo que
sto risolva il caso n = 4, è probabile che il lettore si chieda come,
in termini generali, potrebbe affrontare il problema. Magari inco
minciare provando alcuni valori per x, y , z per vedere se qualcuno
di essi soddisfa l'equazione corrispondente, cioè
x4 + y 4 = z4 .
Presumibilmente, egli si aspetterà di non trovare alcuna soluzione,
come sostenne anche Fermat . Dopo aver provato diversi valori,
senza peraltro trovare una soluzione, potrebbe essere tentato di
scrivere un programma per ampliare la ricerca di soluzioni e con
durre la medesima in modo più sistematico, ad esempio provando
tutti i valori di x, y , z da r a r oo . Dopo parecchie ore di lavoro
*
[P. de Fermat, op. cit. , pp. r o6 sg. ] .
204
CAPITOLO OTTAVO
al calcolatore, non approderebbe a nessun risultato positivo, il che
dimostra l'inefficacia di questo tipo di tentativi. Per quanto potente
la macchina e per quanto valido il metodo, questa strategia non
riuscirà mai a dimostrare l'asserzione di Fermat (nel caso speci
fico n = 4) . Il caso n = 4 del teorema, infatti, prevede che nessuna
terna possa essere la soluzione di x 4 + y 4 = z\ asserzione che si
riferisce a una collezione infinita di terne: nessuna quantità di cal
coli potrà permettere di trattare un numero infinito di casi . Que
sto tipo di strategia potrebbe riuscire a confutare l'ultimo teorema,
dal momento che la scoperta di una sola soluzione dell'equazione
di Fermat avrebbe questo effetto, ma non potrebbe mai dimostrare
il teorema stesso . Per dimostrare l'ultimo teorema o qualsiasi suo
caso singolo occorre un metodo matematico più sofisticato .
Come accade spesso in matematica, il modo migliore consiste
nel cercare una dimostrazione per assurdo . Se si vuole dimostrare
che non c'è soluzione per l'equazione x 4 + y 4 = z 4 , si inizia col
supporre l'esistenza di una soluzione X, Y, Z, e poi, sulla base di
questo assunto, si procede con un ragionamento matematico per
dedurne una contraddizione. Una volta trovata la contraddizione,
lo scopo è raggiunto, dal momento che conclusioni contradditto
rie si ottengono solo da assunti falsi (nel nostro caso, l'assunto che
una soluzione esista davvero) .
Il problema è ora come arrivare a una contraddizione. Un metodo
particolarmente utile per i problemi che, come l'ultimo teorema,
implicano i numeri naturali è il cosiddetto metodo del regresso all'in
finito, inventato da Fermat e, come egli sosteneva, da lui usato
come base di tutte le sue dimostrazioni nella teoria dei numeri .
Una illustrazione del metodo è costituita proprio dalla dimostra
zione che Fermat scarabocchiò in un margine dell'Aritmetica . Que
sto metodo implica i cosiddetti triangoli pitagorici. Vedremo subito
quale relazione esista con il caso n = 4 dell'ultimo teorema.
Per ovvi motivi, un triangolo è detto pitagorico se è rettangolo
e se tutti e tre i lati hanno una lunghezza esprimibile con numeri
interi: in altre parole, un triangolo pitagorico è un triangolo i cui
lati formano una terna pitagorica. Fermat dimostrò che l' area di
un triangolo di questo tipo non può mai essere un quadrato, cioè
il quadrato di un numero intero. Il suo ragionamento procede come
segue.
205
L ' ULTIMO TEOREMA DI FERMAT
Supponiamo che esista un triangolo pitagorico che abbia per
area un quadrato . Siano x , y , z le lunghezze dei lati del triangolo
e sia z l'ipotenusa (fig . 8 . r ) . Così, per il teorema di Pitagora,
x, y , z soddisfano l'uguaglianza
x2 + y 2
=
z2 .
Sia u 2 l' area del triangolo, dove u è u n numero intero . Usando
la formula secondo la quale l' area di un triangolo è metà del pro
dotto della base per l' altezza, troviamo che
u 2 = __!__
2 xy .
Con un ragionamento davvero geniale, * Fermat riuscì a rica
vare un altro insieme di numeri interi positivi X, Y, Z e U tale che
U 2 = __!__
2 XY'
Z < ...."" .
La contraddizione ricercata ne deriva facilmente . I numeri X, Y,
Z, U hanno tutte le proprietà possedute da x, y, z , u, sicché si può
ripetere lo stesso ragionamento per ottenere un altro insieme di
Figura 8 . r
I l risultato di Fermat per i triangoli pitagorici. Grazie al teorema di Pitagora, s i ha che
x2 + y 2 = z2; l' area del triangolo è u = ..!.. xy . Fermat usò il metodo del regresso all'in2
finito per dimostrare che, se x, y, z sono interi, u non può essere il quadrato di un intero.
* Per i dettagli, si veda il cap. r di H. M. Edwards . Fermat's Last Theorem, Springer, New
York 1 97 7 .
206
CAPITOLO OTTAVO
quattro numeri interi positivi X 1 , Y1 , Z1 , U1 tale che
X 12 + Y12 = z l2 ,
ul2 = 2I xl Yl >
zl
< z;
allo stesso modo, deve esistere un altro insieme di quattro numeri
interi positivi X2 , Y2 , Z2 , U2 tale che
X22 + Y22 = z22 ,
u22 = 2I x2 Y2 >
z2 < z l ;
e così via ad infinitum. Questo processo è noto come regresso all'in
finito perché i numeri interi positivi z, Z, Z1 , Z2 , diventano ogni
volta più piccoli (cioè z > Z > Z 1 > Z2 > . . . ) . Ed ecco la contraddi
zione: non può esistere una sequenza decrescente infinita di numeri
interi positivi, perché prima o poi si arriverà a I e ci si dovrà fer
mare. La conclusione è che non può esistere un triangolo pitago
rico la cui area sia il quadrato di un numero intero .
Sebbene non esista alcuna prova concreta che Fermat abbia vera
mente rilevato la connessione, sembra probabile che egli abbia usato
questa dimostrazione per provare il caso n = 4 del suo ultimo teo
rema. Per collegare le due cose è sufficiente un'idea semplice sep
pur ingegnosa.
Supponiamo che esista una soluzione intera per l'equazione
4
x + y 4 = z 4 . Si pongano a = y 4 , b = 2 x 2 z 2 , c = z 4 + x\ d = y 2 xz.
Allora, usando ripetutamente la nota identità algebrica
• • •
(r + s) 2 = r2 + 2 rs + s 2 ,
si ottiene, come il lettore potrà verificare da sé,
Così pure,
a 2 + b 2 = (z 4 - x 4 ) 2 + 4 X 4 z 4
= z s - 2 X4 z4 + xs + 4 X4 z4
= (z 4 + x 4 ) 2
= c2 .
Ma allora, a 2 + b 2 = c 2 , e -} ab = d 2 , e abbiamo appena dimostra-
L' ULTIMO TEOREMA DI FERMAT
to che questa relazione è impossibile. Quindi l'ipotesi che l'equa
zione x 4 + y 4 = Z 4 abbia una soluzione è falsa, e questo completa
la dimostrazione.
Come conseguenza immediata, si ha la validità dell'ultimo teo
rema per n uguale a qualsiasi multiplo di 4· Infatti se l'equazione
x4k
+
y 4 k = z4 k
avesse una soluzione x = a, y = b, z = c, allora a k , b k , c k sarebbe
una soluzione dell'equazione x 4 + y 4 = z\ ma abbiamo appena
dimostrato che questo è impossibile.
In termini più generali, se l'ultimo teorema è dimostrabile per
qualsiasi esponente dato m, allora sarà vero per tutti i multipli di
m. Così, poiché ogni numero intero maggiore di 2 è divisibile per
un numero primo maggiore di 2 o per 4, o per entrambi, allora
quando si tenta di dimostrare l'ultimo teorema si devono conside
rare solo quei casi per i quali n è un numero primo maggiore di
2 , cioè un primo dispari, oppure n = 4· Dal momento che il caso
n = 4 è appena stato risolto, il problema si riduce al caso in cui
n è un numero primo dispari p .
Esaminando il problema, spesso s i scinde il caso del numero
primo dispari in due sottocasi. Innanzitutto si noti che, come per
n = 2 (terne pitagoriche) , se x, y , z è una soluzione dell'equazione
x• + y• = z•,
allora qualsiasi multiplo di x, y, z sarà anch'esso una soluzione;
quindi il vero nocciolo della questione è se, per un n dato, esista
o no una soluzione primitiva, cioè una soluzione in cui x, y, z, non
hanno un fattore comune . Ora, per un numero primo dispari p
dato, il primo sottocaso dell'ultimo teorema afferma che non esi
ste una soluzione primitiva per l'equazione
Xp + yP = zP
per cui nessuno dei numeri x, y , z sia divisibile per p. Il secondo
sottocaso afferma che non esiste una soluzione primitiva per cui
p divida uno dei numeri x, y, z. Ovviamente, per un p dato, la
validità dell'ultimo teorema per quel p è equivalente a quella di
entrambi i sottocasi . La scissione del problema in due sottocasi
consente notevoli progressi (con una strategia di divide et impera) ,
come vedremo più avanti in questo stesso capitolo .
208
CAPITOLO OTTAVO
Come si è già detto, non abbiamo la prova che Fermat abbia
dimostrato l'ultimo teorema per n = 4 · La sua dimostrazione rela
tiva ai triangoli pitagorici a cui abbiamo accennato lascia sup
porre che probabilmente lo abbia fatto: ne aveva le capacità, e i
più sono propensi a riconoscergli questo merito . Anche la dimo
strazione del caso n = 3 è avvolta da una nube di incertezza. Quan
tunque sia universalmente accreditata a Eulero, l'unica versione
pubblicata della sua dimostrazione contiene anch'essa un'inesat
tezza .
Il
caso n = 3
In una lettera a Christian Goldbach del 4 agosto I 75 3 , Eulero
sosteneva di essere riuscito a provare l'ultimo teorema di Fermat
per n = 3, senza tuttavia fornire la dimostrazione esplicita. La prima
versione comparirà solo nel suo libro Wollstéindige Anleitung zur
Algebra, pubblicato nel I 7 70 a Pietroburgo . Non sappiamo se la
dimostrazione di cui egli parla nel I 7 53 fosse o no corretta, ma
è certo che la dimostrazione apparsa nel I 770 conteneva un grave
errore . Come risultò poi, per n = 3 lo sbaglio è rimediabile, ma
in altri casi si rivela un ostacolo insormontabile . Sebbene le argo
mentazioni di Eulero siano troppo lunghe per esporle per intero,
vale la pena di accennarvi per sommi capi, tanto da far capire in
che cosa consistesse l'errore e perché doveva rivelarsi così grave
nei successivi tentativi fatti per dimostrare altri casi dell'ultimo
teorema.
Come nella dimostrazione di Fermat del caso n = 4, Eulero si
servì del metodo del regresso all'infinito . Partendo dall'ipotesi che
esista una soluzione x, y , z dell'equazione
x3
+ y3 = z\
egli riuscì a dedurre l'esistenza di un' altra soluzione X, Y, Z tale
che Z < z. Il punto centrale del suo ragionamento è dato dalla
seguente proposizione: se p e q sono due numeri privi di fattori
comuni, e se p 2 + 3 q 2 è un cubo, allora devono esistere due nu
meri a e b tali che p = a 3 - 9 ab 2 e q = 3 a 2 b - 3 b 2 • Questo è un
fatto vero, e può essere dimostrato applicando alcune tecniche
L' ULTIMO TEOREMA DI FERMAT
209
che compaiono altrove nel lavoro di Eulero . Nella dimostrazione
dell' ultimo teorema che Eulero pubblicò, egli decise di impiegare
un'originale argomentazione che comportava i numeri della forma
a + b� (dove a e b sono interi) , e qui commise un errore .
Possiamo capire perché Eulero trovò utili i numeri a + b�
se sviluppiamo l'espressione (a + b�) 3 • Essa equivale a
a 3 + 3 a 2 b � - 9 ab 2 - 3 b 3 �,
che possiamo riscrivere come
(a 3 - 9 ab2) + (3 a 2 b - 3 b 3) �.
Così se p = a 3 - 9 ab2 e q = 3 a 2 b - 3 b2 (come nella proposizione
citata prima) , allora
p + q � = (a + b �) 3 .
Se p 2 + 3 q 2 è un cubo, allora lo è anche (p + q�) (p - q�);
quindi la proposizione precedente può essere riformulata come s �e:
se p e q non hanno fattori comuni, e se (p + q�) (p - qv - 3)
è un cubo, nel sistema dei numeri a + b�, allora p + q�
deve essere u n cubo, cioè p + q� = (a + b�) 3 per qualche
coppia di interi a, b.
Per dimostrare la proposizione riformulata in questo modo,
Eulero ragionò così. I numeri a + b� formano un sistema di
numeri molto simili agli interi (per una spiegazione esaustiva di
questo argomento si veda il cap . 3) . Se m e n sono due numeri
interi dati senza un fattore comune, e se mn è un cubo, allora m
e n sono due cubi . Per analogia, Eulero sostenne la stessa cosa per
il sistema dei numeri a + b� . Poiché, come Eulero corretta
mente dimostrò, l'ipotesi che p e q non abbiano fattori comuni
comporta che anche i numeri p + q� e p - q� non ne abbiano tra i numeri di tipo a + b� , ne conseguiva immediata
mente la validità della proposizione.
Il grosso neo di questa argomentazione è che l' analogia con i
numeri interi non è completa. Solo perché il sistema numerico
a + b� assomiglia per molti versi ai numeri interi (tutti e due
i sistemi formano un dominio di integrità, come si ricorderà dal
cap . 3), non vuoi dire che questo sistema ne abbia tutte le pro-
210
CAPITOLO OTTAVO
prietà. Una proprietà determinante per la dimostrazione di Eulero,
che vale per i numeri interi in virtù del teorema fondamentale del
l' aritmetica, è la fattorizzazione unica: ogni intero è un prodotto
di un unico insieme di numeri primi (a cui è possibile aggiungere
anche r ) . Chi ha letto il capitolo 3 sa che il sistema numerico
a + br-3 possiede questa proprietà, e quindi la conclusione di
Eulero è valida. Ma nel capitolo 3 si è anche appreso che r-3
è una tra le sole nove radici di numeri interi che portano alla pro
prietà della fattorizzazione unica; quindi fu solo per un colpo di
fortuna che il ragionamento analogico di Eulero portò a una conclu
sione corretta. Se egli avesse tentato di dimostrare il caso n= 5
dell'ultimo teorema, usando i numeri a + br-5 , questo metodo
non avrebbe funzionato . Come si vedrà adesso, la mancanza della
fattorizzazione unica doveva far crollare molti tentativi di dimo
strazione.
-
Altri due casi: n = 5 e n = 7
Nel r 8 25, l' appena ventenne Peter Gustav Lejeune Dirichlet
e il settantenne Adrien-Marie Legendre dimostrarono l'ultimo teo
rema per il caso n= 5 . Il metodo da loro usato era sostanzialmente
un'estensione di quello usato da Eulero per il caso n = 3 , in cui
l' analoga dell'equazione
era data da:
p + q r-3 = (a + b r-3P
p + q r-5 = (a + b r-5) 5.
dimostrare che p + qr-5 è una potenza di grado 5
Tuttavia, per
(per cui il ragionamento per analogia con i numeri interi non è
certamente valido) dovettero non solo assumere che p 2 5 q 2
fosse una potenza di grado 5 e che p e q non avessero fattori comuni
(come è per n = 3 ) , ma anche che solo uno tra p e q fosse pari e
che q fosse divisibile per 5 . La proprietà della scomposizione unica,
peraltro non valida in questo caso, non viene utilizzata.
Risolto il caso n = 5 , il metodo usato fino ad allora incominciò
a mostrare qualche crepa, poiché richiedeva tecniche algebriche
-
211
L' ULTIMO TEOREMA DI FERMAT
sempre più complesse . Nel I 83 2 , Dirichlet, che non era riuscito
a far funzionare il metodo per n = 7, vi riuscì con n = I 4, risul
tato molto meno significativo, naturalmente. Quando nel I 839
Gabriel Lamé finalmente dimostrò il caso n = 7, dovette ricorrere
ad alcuni espedienti molto ingegnosi, strettamente legati alle pro
prietà specifiche del numero 7 . Sembrava quasi impossibile che
si potesse passare al caso successivo, n = I I , se non adottando tec
niche radicalmente diverse. Fu proprio Lamé a proporre, nel I 847,
questa linea di azione.
Gli interi ciclotomici e l'annuncio di Lamé
La proposta di Lamé consisteva nel tentare di dimostrare l'in
tero ultimo teorema utilizzando una radice n-esima complessa del
l'unità, cioè un numero complesso r per cui r• = I ma rk * I per
qualsiasi numero intero positivo k inferiore a n (tutto questo vale
per qualsiasi primo n dispari) . Per qualsiasi primo n dispari (anzi per
qualsiasi numero dispari n) , il numero I ha n - I radici n-esime
complesse: ad esempio, per n = 3 le due radici cubiche complesse
di I sono
I ../3 .
-2 + 2 1'
--
I
../3 .
-2 1
2 - --
(lo si può verificare elevando al cubo ciascuno di questi numeri
complessi) .
Lo scopo di introdurre queste radici complesse è il seguente.
Le dimostrazioni dei casi n = 3, 4, 5, 7 a cui si era giunti fino a
quel momento dipendevano tutte da una scomposizione algebrica,
come ad esempio, per n = 3 ,
x 3 + y 3 = (x + y ) (x 2 - xy + y 2 ) .
Lamé intuì che la difficoltà aumentava col crescere di n , perché
in questo tipo di scomposizione uno dei fattori diventa di grado
sempre maggiore . Introducendo r, è possibile scomporre comple
tamente x• + y • in n fattori ciascuno di grado I .
Per ottenere la scomposizione, si noti che i numeri complessi
I , r, r2 , . . . , r• - l sono le radici dell'equazione complessa
z• - I =
O
212
CAPITOLO OTTAVO
così che
z• - r = (z - r ) (z - r) (z - r 2)
• • •
(z - r• - 1 ) .
S e adesso poniamo z = - x/y e moltiplichiamo tutti e due i mem
bri dell'equazione per y•, con n dispari, otteniamo
x• + y • = (x + y ) (x + yr) (x + y r 2 ) (x + y r• - 1 ) .
• • •
Ciascuno dei fattori complessi di x " + y • nella precedente espres
sione è un numero avente la forma generale
a 0 + a1 r + a 2 r 2 + . . . + a. _ 1 r• - t ,
dove a0, a 1 , , a. _ 1 sono interi . Numeri di questo tipo, c10e
numeri costituiti da interi e da potenze di r, oggi sono conosciuti
come interi ciclotomici. C ome gli interi gaussiani o i numeri della
forma a + br-j di cui si è già parlato, gli interi ciclotomici danno
origine a un sistema numerico che per certi versi assomiglia ai
numeri interi ordinari, perché forma un anello (si consulti il cap. 3
per le relative definizioni) .
Il r 0 marzo r 84 7 , rivolgendosi ai membri dell'Accademia fran
cese, Lamé sostenne con vigore di essere riuscito a dimostrare
l'ultimo teorema di Fermat . Il suo lavoro si fondava sull'uso degli
interi ciclotomici, il che gli permise di fornire una dimostrazione
basata sul regresso all'infinito, con un ragionamento molto simile
a quello di Eulero per il caso n = 3 · Un passaggio critico nel suo
procedimento era quello di dimostrare che se i fattori (x + y ) ,
(x + y r) , . . . , (x + y r" - 1 ) di x• + y • non hanno fattori comuni, allora
l'eguaglianza x" + y • = z• implica che ciascuno dei fattori debba
essere un'n-esima potenza.
Dopo aver descritto per intero la sua presunta dimostrazione,
Lamè concluse ammettendo che l'idea di usare i numeri complessi
in quel modo gli era stata suggerita dal collega Joseph Liouville
qualche mese prima. Dopo Lamé fu proprio Liouville a parlare,
chiedendosi come il collega potesse concludere che ciascun fattore
di x" + y " fosse una potenza n-esima, dal momento che era riu
scito a dimostrare solo che nessuna coppia di questi fattori aveva
un divisore comune. Fece notare che la veridicità di questo pas
saggio per i numeri interi ordinari dipendeva dal teorema della
scomposizione unica, mentre non gli risultava che si potesse giun
gere a tale conclusione per gli interi ciclotomici .
• • •
L' ULTIMO TEOREMA DI FERMAT
213
Non s i s a s e Liouville sapesse già dell' analogo errore d i Eulero .
Comunque, la sua osservazione colpì proprio il nocciolo del ragio
namento di Lamé che, dopo strenui tentativi di salvare la sua dimo
strazione, dovette infine ammettere, suo malgrado, l'enormità del
l'errore. Al suo amico Dirichlet che si trovava a Berlino scrisse:
« Se solamente tu fossi stato a Parigi o io fossi stato a Berlino, tutto
questo non sarebbe accaduto ». In realtà, Lamé avrebbe potuto evi
tare quella situazione imbarazzante se solo fosse stato al corrente
di un lavoro pubblicato circa tre anni prima da un certo Ernst
Eduard Kummer, anche se, a dire il vero, questi aveva scelto di
pubblicare il suo saggio nell'oscura rivista « Gratulationschrift der
Universitat Breslau zur Jubelfeier der Universitat Konigsberg ».
Kummer e i numeri ideali
Nel suo scritto del 1 844, Kummer aveva dimostrato che la scom
posizione unica è solitamente falsa per gli interi ciclotomici, con
clusione che distruggeva completamente la presunta dimostrazione
di Lamé . Nel 1 84 7 , quando Lamé e gli altri matematici vennero
a conoscenza di questi risultati, Kummer aveva sviluppato una
nuova teoria in base alla quale era possibile modificare il concetto
di scomposizione unica, tanto da ottenere una ragionevole « teo
ria dei numeri » per gli interi ciclotomici. La base della sua teoria
consisteva nell'introdurre nell' aritmetica degli interi ciclotomici
quelli che egli chiamò i fattori ideali primi, qualcosa di analogo all'in
troduzione del numero immaginario « i » nell' aritmetica dei numeri
interi ordinari. Usando i numeri ideali di Kummer, molte delle con
seguenze della scomposizione unica per gli interi possono essere
dimostrate per gli interi ciclotomici e per altri sistemi numerici,
quali a + b� , che emergono nella dimostrazione dei vari casi
dell'ultimo teorema di Fermat .
Il lavoro di Kummer segnò il maggiore passo avanti compiuto
nello studio dell'ultimo teorema di Fermat dal suo nascere, fino
al risultato del 1 983 di cui si è fatto cenno all'inizio del capitolo .
I risultati da lui ottenuti nel I 84 7 dimostrarono l'ultimo teorema
per tutti gli esponenti primi minori di 3 7 (anzi per tutti gli espo
nenti minori di 3 7 ) , e per tutti gli esponenti primi minori di 1 00
214
CAPITOLO OTTAVO
ad eccezione di 3 7 , 59 e 67. Tutto questo accadeva pochi anni
dopo che i matematici si erano cimentati con ardue dimostrazioni
relative a n = 5 e n = 7 .
Inoltre, il suo nuovo concetto di numeri ideali s i rivelò molto
importante e con vaste possibilità di applicazione; esso diede vita
al concetto più generale di ideale e ad un'intera branca della mate
matica, la teoria degli ideali, i cui rudimenti oggi rientrano nei pro
grammi universitari degli studenti di matematica. Per quanto rivo
luzionaria sia stata l' applicazione dei numeri ideali di Kummer
all'ultimo teorema di Fermat, l' aspetto più importante del suo
lavoro, per quanto riguarda gli altri settori della matematica, è pro
prio costituito dal concetto di ideale .
In effetti, il lavoro di Kummer non è rilevante per l'ultimo teo
rema di Fermat, e non scaturiva neppure da un tentativo di dimo
strarlo. Come Gauss (si veda il cap. 3 ) , anche Kummer si era dedi
cato al problema delle leggi di reciprocità di grado superiore per
generalizzare la legge di reciprocità quadratica di Gauss, lavoro
che si sarebbe concluso nel r 859 con la conferma di un risultato
generale sul problema. Detto questo, si dovrebbe rilevare che c ' è
una stretta relazione tra l'ultimo teorema d i Fermat e l e leggi di
reciprocità di grado superiore.
I numeri primi regolari
Il lavoro di Kummer fu particolarmente importante, in quanto
egli giunse a una condizione aritmetica che un numero primo dispari
p deve soddisfare perché l'ultimo teorema sia vero per l'esponente
p. Se p soddisfa la cosiddetta « condizione di Kummer », allora
l'equazione
Xp + yP = zP
non ha soluzione . Oggi i numeri primi che soddisfano la condi
zione di Kummer sono conosciuti come primi regolari. Tra i primi
inferiori a r oo, solo 3 7 , 59 e 67 non sono regolari, come dimostrò
Kummer nel r 84 7 .
Che cos'è dunque un primo regolare? È un concetto strettamente
collegato con quello di numero di classi, descritto nel capitolo 3 .
Un primo regolare è un primo che non divide il numero di classi
215
L' ULTIMO TEOREMA DI FERMAT
del campo di numeri ciclotornici associato. Tale definizione richiede
rebbe una spiegazione complessa, ma per fortuna esiste una defini
zione alternativa ed equivalente che comporta concetti molto più
semplici. Si ricordi dal capitolo 3 che e è una costante matematica
con una espansione decimale infinita, pari a 2 , 7 I 828 . . . , tale che
per qualsiasi numero t il valore di et è dato dalla somma infinita
et = I + _L + _f_ + _l!_ + . . .
I!
2!
3!
I numeri di Bernoulli, Bk, sono definiti come i coefficienti della
somma infinita
t2 + B) t = I + Bit +B t} + . . .
2
et - I
I!
2!
3!
I numeri di Bernoulli hanno un comportamento del tutto irrego
lare: Bk è zero per tutti i k dispari tranne che per k = I , per il
quale B 1 = - -} . I primi valori di Bk per k pari sono
--
B 4 = _ _I_ ,
B s = - _I_ '
B 2 = __!__ '
B 6 = -I- ,
42
30
6
30
7
_1_
- - � ' B i4 = - .
B 12 B IO =
6
2730
66 '
36I7
B 16 - .
5IO
Con le definizioni precedenti, si può dire che un primo p è regolare
se non divide i numeratori di ciascuno dei numeri B 2 , B 4 , , Bp - J ·
Così p sarà irregolare s e divide il numeratore di almeno uno dei
numeri di Bernoulli .
La definizione di regolarità in termini di numeri di Bernoulli
costituisce un modo per verificare per mezzo di calcoli la regola
rità di un primo dato, anche se l'uso diretto della definizione pre
cedente non è molto efficace: in pratica, si usano vari aspetti del
comportamento dei numeri di Bernoulli per ricavare metodi più
efficienti. Un problema che si presenta nella verifica della regola
rità è il fatto che i numeratori dei numeri di Bernoulli possono
essere molto grandi . Ad esempio,
• • •
2 5 7 7 687 858 367
6
si può ancora calcolare a mano, ma B 22 0 ha 250 cifre.
B 34 =
zr6
CAPITOLO OTTAVO
Come abbiamo già detto, Kummer stesso eseguì i primi calcoli
per determinare i primi regolari e irregolari. Arrivò fino a I 64 e
trovò che i soli primi irregolari al di sotto di questo numero erano
3 7 , 5 9 , 6 7 , I O I , I 03 , I 3 I , I 49 e I 5 7 · In ciascun caso Kummer
dovette dimostrare che il primo in questione divideva il numera
tore di un numero di Bernoulli appropriato: ad esempio, 3 7 divide
il numeratore di B 3 2 , 59 divide il numeratore di B 44 , I 5 7 divide il
numeratore di B 62 e di B 11 0 •
Negli anni trenta Stafford e Vandiver usarono le calcolatrici
(nonché alcuni nuovi metodi per verificare la regolarità e l'irrego
larità) per controllare tutti i primi fino a 6 I 7 . Nel I 954, con l' ar
rivo dei calcolatori elettronici, Lehmer e Vandiver spinsero il cal
colo fino a 400 I , e altri in seguito contribuirono ad arrivare a
30 ooo . Nel I 976, usando un IBM 3 60-65 e un IBM 3 70 , Samuel
Wagstaff dell'Università dell'Illinois determinò la regolarità o meno
di tutti i primi al di sotto di I 25 ooo .
Basandosi sui risultati ottenuti finora, pare che circa il 6o per
cento dei primi sia regolare. Per l'esattezza, per un valore elevato
di N il rapporto osservato è
Numero di primi irregolari inferiori a N
= 0,39 ·
Numero dt prtmt mfertort a N
.
.
.
.
.
.
Nel I 964 Siegel addusse un ragionamento plausibile, anche se poco
rigoroso, in base al quale quel rapporto dovrebbe essere pari a
I - I/....le , valore che, con una approssimazione di due cifre deci
mali, risulta essere 0,39.
Nonostante l' apparente predominanza d i primi regolari, non si
sa ancora per certo se ne esista un numero infinito . Si sa invece
che esistono infiniti primi irregolari, come ha dimostrato Jensen
nel I 9 I 5 . Così l'insieme apparentemente più grande potrebbe risul
tare finito, mentre è accertato che l'insieme apparentemente più
piccolo è infinito .
La situazione attuale
Il risultato di Kummer del I 847 mostrò che l'ultimo teorema
di Fermat è vero per tutti gli esponenti primi regolari. Cosa accade
2!7
L' ULTIMO TEOREMA DI FERMAT
quando p è un primo irregolare? I n questo caso il risultato di Kum
mer non ci è di nessun aiuto. Questo non significa naturalmente
che l'ultimo teorema sia falso in questo caso; semplicemente, non
si può più applicare l'argomentazione specifica addotta da Kum
mer, anche se il risultato in sé potrebbe ancora essere vero, per
qualche altra ragione. Più tardi Kummer trovò condizioni più gene
rali rispetto alla regolarità, anche se meno concise, le quali impli
cano comunque l'ultimo teorema. Queste condizioni sono soddi
sfatte dai primi irregolari 3 7, 59 e 67, sicché Kummer, poté
giustamente rivendicare tutti i casi dell'ultimo teorema fino a I oo .
Da allora s i sono trovate condizioni ancora più generali, tanto che
i calcoli eseguiti da W agstaff nel I 976 in realtà verificarono l' ul
timo teorema per tutti i primi, e quindi per tutti gli esponenti,
fino a I 2 5 ooo .
Sappiamo che ciascun caso dell'ultimo teorema è suddiviso in
due sottocasi, come si è già detto: dato un primo dispari p, nel
primo sottocaso si sostiene l'impossibilità di una soluzione primi
tiva x, y, z per l'equazione
Xp + y P = z P
tale che nessuno dei numeri x, y , z sia divisibile per p, mentre nel
secondo sottocaso la soluzione primitiva è tale che uno dei tre
numeri della soluzione sia divisibile per p. Nel corso degli anni si
sono fatti progressi di una certa importanza per il secondo sottocaso.
Nel I 83 2 , ben prima che Lamé e Kummer lavorassero a questo
problema, la studiosa francese Sophie Germain dimostrò che se
p è un primo dispari tale che 2 p + I è anche primo, allora il primo
sottocaso dell'ultimo teorema vale per p. (Questo significa che
l'equazione di Fermat per p potrebbe avere una soluzione, ma p
dovrebbe dividere uno dei numeri della soluzione) . Sebbene ci siano
molti primi p per cui 2 p + I è primo (ad esempio p = 3 , 5 , I I ) ,
ai quali si può applicare il teorema di Germain, non s i s a s e ce
ne siano un numero infinito .
In seguito, Legendre sviluppò le idee di Germain per dimostrare
il primo sottocaso per qualsiasi primo p tale che uno dei numeri
4P + I ,
8p + I ,
I op + I ,
I 4P + I ,
I 6p + I
sia primo . Questo era sufficiente per provare definitivamente il
218
CAPITOLO OTTAVO
primo sottocaso per ogni esponente p primo minore di I oo, risul
tato che fu però superato da Kummer.
Altri risultati conseguiti nel corso degli anni mostrano che il
primo sottocaso vale per tutti i primi che soddisfano vari criteri.
Uno di questi, ottenuto nel I 9 I O da Mirimanoff, è che p sia della
forma 2 " 3 h ± I o della forma ± 2 " ± 3 h , dove a e b sono interi non
negativi . Poiché questo comprende il caso dei primi di Mersenne
(vedi cap. I ) , sappiamo che il primo sottocaso vale per il piu grande
numero primo conosciuto, il numero 2 2 1 6 09 1 - I di 65 050 cifre.
Nel I 98 2 Lehmer aveva già dimostrato che il primo sottocaso
vale per tutti i primi al di sotto dei 6 miliardi.
Nel I 985 l' americano Adleman, il francese Fouvry e l'inglese
Heath-Brown, usando una generalizzazione del criterio di Germain,
dimostrarono per la prima volta che il primo sottocaso dell'ultimo
teorema vale per un numero infinito di primi. Ma, nonostante tutti
i progressi fatti, è tuttora possibile che l'ultimo teorema valga solo
per un numero finito di esponenti .
Che dire poi dell'eclatante risultato di Faltings del I 983 men
zionato all'inizio del capitolo? Questi dimostrò che per ogni espo
nente n maggiore di 2, l'equazione di Fermat
ha al massimo un numero finito di soluzioni primitive . La dimo
strazione gli valse una medaglia Fields nel I 986.
Rimane da vedere se questa serie di scoperte condurrà infine
a una dimostrazione completa dell'ultimo teorema, ma l'essere pas
sati da una quantità infinita di soluzioni a un numero finito, anche
se sconosciuto, costituisce un enorme passo avanti . Si noti l'uso
della parola « sconosciuto »: il risultato di Faltings non indica il
numero massimo di soluzioni possibili, ma dice solo che si tratta
di un numero finito .
In realtà il risultato di cui abbiamo appena parlato è un caso
particolare di un'ipotesi più generale dimostrata da Faltings, nota
come la congettura di Mordell. Nel I 9 2 2 Lewis Mordell ipotizzò
che qualsiasi polinomio irriducibile in due variabili con coefficienti
razionali, di genere maggiore o uguale a due, avesse al massimo
un numero finito di soluzioni razionali (l'uso della parola « genere »
fa capire che la congettura di Mordell appartiene alla topologia,
219
L' ULTIMO TEOREMA DI FERMAT
trattata nel cap. I o) . Poiché il polinomio
x" + y " = I ,
[I]
con n ;;::: 3 , soddisfa l'ipotesi della congettura di Mordell, n e segue
immediatamente che questa equazione ha al massimo un numero
finito di soluzioni razionali . Ma poiché qualsiasi soluzione intera
dell'equazione
produrrà una soluzione razionale dell'equazione [ I ] (si dividano
entrambi i membri dell'equazione [2] per z•), con soluzioni pri
mitive diverse per l'equazione [2] che danno soluzioni razionali
diverse per l'equazione [ I ] , questo comporta che l'equazione [2]
ha solo un numero finito di soluzioni intere primitive.
Il futuro
A che punto ci troviamo, dunque? L'ultimo teorema di Fermat
è vero per tutti gli esponenti fino a I 2 5 ooo, ma non sappiamo
se lo sia per un numero infinito di esponenti, tranne che nel primo
sottocaso, peraltro estremamente restrittivo. Al di là dei limiti noti,
è possibile che esistano uno o più esponenti p, maggiori di I 2 5 ooo ,
per i quali esso è falso; sappiamo però che per un tale p può esserci
solo un numero finito di soluzioni primitive. Se p è minore di
6 miliardi, allora, poiché il primo sottocaso vale per un tale p,
almeno uno dei numeri di una qualsiasi soluzione sarà divisibile
per p, cosa che comporta numeri maggiori di I 2 5 ooo 1 2 5 000; d ' al
tro canto, se p è maggiore di 6 miliardi allora emergeranno numeri
ancora più astronomici . Per tutti gli scopi pratici l'ultimo teorema
è dunque « vero ». Naturalmente per il matematico questo non signi
fica che la questione sia chiusa: il problema dell'ultimo teorema
non sarà risolto finché non si otterrà una prova rigorosa o una con
futazione altrettanto rigorosa. Al momento non sembra che le cono
scenze di cui disponiamo possano portare al raggiungimento di que
sta meta. Può darsi che il problema debba essere affrontato in un
modo completamente nuovo, nel qual caso l'ultimo teorema
potrebbe ancora una volta portare a sviluppi significativi in altri
campi della matematica.
220
CAPITOLO OTTAVO
Sembra molto probabile, anche se nulla è certo, che se mai si
troverà una soluzione essa richiederà ben altro che considerazioni
elementari. Questo significa che i molti matematici dilettanti (come
Fermat?) , che regolarmente sostengono di aver dimostrato l'ultimo
teorema, sbagliano immancabilmente. In effetti, se si esaminano
attentamente tali prove, di solito risulta che le argomentazioni
addotte non bastano neppure per risolvere il caso n = 3 , che Eulero
provò nel I 75 3 · Eppure ogni anno compaiono nuove « dimostra
zioni »: l'ultimo teorema detiene senz' altro il primato per la quan
tità di dimostrazioni false.
Molte di queste arrivano all'Istituto di Matematica dell'Uni
versità di Gottinga, in Germania. Oltre a una medaglia d'oro e
al premio di 3000 franchi offerti dall'Accademia francese nel I 8 I 6,
la prima persona che riuscirà a dimostrare l'ultimo teorema di Fer
mat vincerà il premio Wolfskell. Quando fu offerto per la prima
volta nel I 9o8 dall'Accademia reale delle scienze di Gottinga, con
formemente alla volontà di un certo Paul Wolfskell, ammontava
a I oo ooo marchi; in seguito ai vari mutamenti della moneta tede
sca, il premio oggi è di I O ooo marchi .
Malgrado le numerose e rigide clausole che regolano la parteci
pazione al premio, l'Istituto di matematica di Gottinga continua
a ricevere in media una soluzione alla settimana, che è costretto a
valutare . La situazione è comunque migliorata rispetto all'anno
in cui fu istituito il premio, quando i concorrenti furono 62 I !
Le probabilità di successo per un dilettante inesperto sono quasi
nulle. Tuttavia pochi matematici oserebbero scoraggiare chiunque
dal tentare: cimentarsi con la matematica è soprattutto un diver
timento, e chi vorrebbe negare ad altri la soddisfazione che lui
stesso prova? Se uno tenta e fallisce, può almeno consolarsi sapendo
che anche molti matematici famosi non sono riusciti a risolvere
questo allettante problema. Se invece uno tenta e ci riesce . . .
C apitolo 9
Problemi difficili sui numeri complessi
Un argomento complesso
Per molti lettori questo sarà il capitolo più difficile del libro,
non perché la matematica sia intrinsecamente più difficile che
altrove, ma per il grado di astrazione che comporta. Parleremo di
numeri, sia naturali che complessi. Il compito essenziale dell' ana
lisi complessa (si usa anche parlare di teoria delle funzioni complesse)
e del campo strettamente affine della teoria analitica dei numeri
(che è l' applicazione dei risultati e delle tecniche dell'analisi com
plessa allo studio dei numeri naturali) è di studiare la struttura pro
fonda e le interconnessioni nascoste sotto una nozione apparente
mente semplice, come può sembrare quella di numero complesso
data nel capitolo 3 . Portare avanti queste ricerche richiede alcune
tecniche matematiche molto astratte, poco familiari ai non addetti
ai lavori. Sfortunatamente non ci si può neppure aiutare con i dise
gni: l' analisi complessa è poco visualizzabile, diversamente dalla
topologia (argomento del cap. 1 0 ) , in cui è possibile trasmettere
idee altrettanto difficili e astruse (almeno nei casi semplici) con
l' ausilio di disegni e diagrammi . Si tratta nondimeno di un campo
importante, in cui in questi ultimi anni si sono fatti alcuni passi
avanti significativi, sicché non lo si può più ignorare. Inoltre, pro
cedendo in questo capitolo vedremo emergere dall'astrazione nuove
prospettive su concetti familiari, quali le frazioni e i numeri primi.
Si dà per scontato che si sia letto il cenno introduttivo sui numeri
complessi dato nel capitolo 3 .
Benché i tre problemi che costituiscono il nucleo di questo capi-
222
CAPITOLO NONO
tolo siano tutti altamente astratti, non si deve pensare che l' ana
lisi complessa non abbia applicazioni al di fuori della matematica,
anzi: dopo il primo lavoro di Augustin Cauchy del 1 8 2 5 sull' argo
mento, le connessioni con il mondo « reale » non sono mai man
cate. Il lavoro di Riemann, immediatamente successivo a quello
di Cauchy, mostrò quanto la teoria delle funzioni complesse potesse
essere di aiuto nella soluzione di problemi di fisica, e un ulteriore
lavoro sulle cosiddette « trasformate integrali » (come la onnipre
sente trasformata di Fourier) rese la connessione ancora più
evidente .
La natura bidimensionale dei numeri complessi (si veda il cap. 3
per una trattazione del piano complesso) fa sì che essi possano essere
usati per risolvere problemi a due dimensioni, proprio come i pro
blemi a una dimensione possono essere trattati con i numeri reali.
Poiché molti problemi della vita reale a tre dimensioni di natura
simmetrica (come il flusso di liquido in un condotto) si riducono
a problemi matematici a due dimensioni, l' analisi complessa è
importante sia per i fisici sia per gli ingegneri .
Il matematico russo N . Y . Jukovskij ( 1 847- 1 9 2 I ) usò l' analisi
complessa per specificare la forma di un profilo alare (la sezione
trasversale di un'ala d'aereo) e studiare la dinamica del flusso d'aria
circostante, rivoluzionando così il design dell' aereo . Da allora, la
teoria delle funzioni complesse ha assunto un'importanza fonda
mentale nella descrizione di tutti i tipi di flusso di fluidi e nella
progettazione di automobili e di navi . Nel 1 9 2 0 alcuni scienziati
dei laboratori Beli negli Stati Uniti fecero un uso sistematico della
teoria delle funzioni complesse nella progettazione di filtri e di
amplificatori ad alto rendimento, che resero possibili i collegamenti
telefonici su grandi distanze . Un ingegnere elettronico ben cono
sce l'importanza del criterio di Nyquist per la stabilità degli ampli
ficatori di risposta, e anche tale criterio è un' applicazione diretta
dell' analisi complessa . In bre v e, oggi non si può rinunciare all ' a
nalisi complessa, perché ben poco della scienza e della tecnologia
moderne può in qualche modo fare a meno dei numeri complessi.
Ma allora, cos 'è poi l' analisi complessa? Come primo tentativo
di risposta la si potrebbe definire un'estensione dei metodi dell' a
nalisi (differenziazione, integrazione, somme infinite e così via)
dal più familiare insieme dei numeri reali al dominio dei numeri
223
PROBLEMI SUI NUMERI COMPLESSI
complessi. Come ogni approssimazione, questa risposta è allo stesso
tempo stimolante e ingannevole, poiché l'intero apparato dell ' a
nalisi prende una forma completamente diversa quando è appli
cato ai numeri complessi . Concetti che con i numeri reali sembrano
completamente distinti possono risultare fortemente èorrelati
quando si introducono i numeri complessi; un esempio, già ripor
tato nel capitolo 3 , è l'identità di Eulero
e"; = - I .
Un altro esempio molto pertinente è fornito dall'equazione
e" ; = cosx + i sinx
che collega e, i e le funzioni trigonometriche usuali seno e coseno .
In efetti, nulla ci impedisce di applicare le funzioni seno e coseno
ai numeri complessi, anche se non si può calcolare, ad esempio,
sin (3 + 4i) in termini di triangoli rettangoli come si può fare con
i numeri reali . Una volta stabilito di lavorare con i numeri com
plessi, bisogna essere disposti a lasciarsi guidare dalla teoria, e per
le funzioni trigonometriche questo significa entrare nel campo delle
serie infinite. Così come la relazione
anche le due seguenti
cosx = I -
x2 + x4 - x6 . . .
-
2!
-
4!
-
6!
sono valide sia per gli x reali che per gli x complessi. S e x è reale,
ognuna di queste somme infinite darà esattamente la stessa rispo
sta che si otterrebbe dalla usuale definizione geometrica, ammesso
che l' angolo x sia misurato in radianti e non in gradi (un radiante
equivale a I 8o/'ll gradi, cioè circa a 5 7 , 3 gradi) ; ma niente impedi
sce di usare queste equazioni quando x è complesso .
Con una semplice manipolazione algebrica delle tre espressioni
224
CAPITOLO NONO
precedenti, si possono ottenere le formule
sinx = � (e ix - eix) ,
21
I ( e'x + e - •x)
cosx = '
2
.
.
dove, di nuovo, x può essere reale o complesso .
Uno dei primi compiti dell'analisi complessa è verificare che tutti
i calcoli eseguiti prima con le serie infinite siano legittimi. Come
è stato chiarito nel capitolo 2 , l'infinito deve essere maneggiato
con cautela, soprattutto quando abbiamo a che fare con numeri
complessi.
L'integrazione* risulta molto diversa dal caso reale quando è
eseguita per funzioni complesse. Naturalmente, poiché i numeri
complessi sono bidimensionali, non si può semplicemente integrare
tra un numero a e un numero b come avviene con i numeri reali,
come ad esempio
l
x 2 dx = _!._
3 '
o
Bisogna invece integrare lungo una curva nel piano complesso, ad
esempio lungo un cerchio . Quale potrebbe essere allora la risposta
se si dovesse integrare la funzione complessa (x - a) - I , dove a è
una costante complessa, lungo la traiettoria circolare C? L'inte
grale è scritto come
c
1 dx
x -a
(tali integrali sono chiamati talvolta integrali curvilinei o di linea) ,
e ha un risultato del tutto inaspettato, specialmente per chi sa
quanto possa essere difficile l'integrazione per le funzioni reali.
Se il numero a corrisponde a un punto nel piano complesso interno
al cerchio C , la risposta è 2 n i ; se il numero a è esterno al cerchio,
la risposta è O . La cosa sorprendente è che la dimensione e la posi
zione del cerchio sono ininfluenti, e il solo modo in cui la costante
a condiziona la risposta è dato dalla sua relazione con il cerchio .
* Il lettore che non avesse dimestichezza con questo concetto nell'ambito dei numeri reali
può tralasciare il resto di questo paragrafo e gli altri riferimenti occasionali all'integrazione
presenti nel capitolo.
PROBLEMI Sill NUMERI COMPLESSI
Sebbene questo esempio particolare sia stato scelto proprio come
caso limite, è indicativo di come le funzioni complesse assumano
una loro vita propria, diversamente da quanto ci si aspetterebbe
dopo lo studio dei numeri reali .
La teoria delle funzioni complesse, quando è applicata allo stu
dio dei numeri naturali, ci riserva altre sorprese, come risulterà
chiaro andando avanti in questo capitolo . C ' è da notare che l'in
tegrale menzionato prima assume un ruolo significativo in questo
contesto, anche se non merita di essere approfondito qui.
Divertimenti con i numeri
Una frazione hfk è chiamata frazione propria se è compresa tra
O e I , e se h e k non hanno fattori comuni . Ad esempio I/2 , 3/4
e 7/8 sono frazioni proprie; 2/4 , 3/9 e 3/2 non lo sono . Per qual
siasi numero n la successione di Farey di ordine n, F., è la succes
sione di tutte le frazioni proprie con denominatore minore o uguale
a n e della « frazione » I/ I , poste in ordine crescente. Così, ad esem
pio, F5 è la successione
I I I 2 I 3 2 3 4 I
5' 4' 3' 5 ' 2 ' 5 ' 3' 4 ' 5 ' I '
e F7 è la successione
I
I
I
I
2
I
2
7' 6' 5' 4' 7' 3' 5'
3 I 4 3
7 ' --:; ' 7 ' 5
2
' 3'
5 3 4 5 6 I
7 ' 4 ' 5 ' 6 ' 7 ' �·
Non è chiaro chi abbia avuto per primo l'idea di prendere in
considerazione tali successioni, ma il primo a raggiungere dei risul
tati matematici veri e propri sembra sia stato Haros nel I 8o2 . Farey,
in un articolo del I 8 I 6, esplicitò formalmente uno dei risultati di
Haros, senza fornirne la dimostrazione, e quando in seguito Cau
chy, esaminato l' articolo, trovò una dimostrazione del risultato ne
attribuì l'idea a Farey dando così origine alla denominazione.
Il risultato di Haros sviluppato da Farey consiste in questo: date
tre qualsiasi frazioni successive comprese in una successione di Farey,
a/d, b/e, c//, allora bfe = (a + c)/(d + /) . Ad esempio, il decimo,
226
CAPITOLO NONO
l'undicesimo e il dodicesimo termine di
6
IO
F7
sono 4/7 , 3/5 , z/3 e
3
5
L'altro risultato dimostrato da Haros è che se afe, b/d sono ter
mini successivi di una successione di Farey, allora be - ad = r . Pren
dendo di nuovo F7 come esempio, il sesto e il settimo termine
sono I/3 e 2/5 e
2 X 3 - I X 5 = 6 - 5 = r.
È possibile ricavare le precedenti proposizioni l'una dall' altra,
il che significa che basta provare una delle due per provarle
entrambe. È un esercizio di alta abilità algebrica; se non è di vostro
gusto, potete divertirvi a verificare le formule per altre sequenze.
Per un qualsiasi numero n, denotiamo con A (n) il numero di
termini nella successione di Farey Fn : ad esempio, A (5) = I O e
A (7) = I 8 . Supponiamo ora di prendere l'intervallo da O a I sulla
retta reale e dividerlo in A (n) segmenti uguali (fig . 9 . I ) . I punti
che dividono l'intervallo in questo modo sono i punti I/A(n) , z/A(n) ,
3/A (n) e così via fino a (A (n) - I )/A (n) . Poiché i termini nella suc
cessione di Farey sono situati a intervalli disuguali tra O e I , molti
numeri della successione non coincideranno con i punti situati a
distanze uguali nell'intervallo . Ammettiamo che d1 sia la diffe
renza tra il primo termine della successione F" di Farey e I/A (n) ,
d2 sia la differenza tra il secondo termine e z/A (n) , e così via fino
a dA(nl - 1 ; non ha importanza quale sia il più grande in ciascuna
coppia, ciò che conta è la differenza presa in valore assoluto. Indi
chiamo con D(n) la somma di tutti i numeri d1, d2 , , dA(nl - 1 •
• • •
Figura 9 . 1
La successione di Farey F4 I termini d i questa successione sono indicati dalle frecce
che mostrano la loro posizione rispettto ai cinque punti che dividono l' intervallo da
O a r in sei segmenti uguali. I numeri d t. d2, , d5 misurano la differenza tra le fra
zioni di Farey e i rispettivi punti di divisione. D (4) è la somma di queste differenze.
•
• • •
227
PROBLEMI Sill NUMERI COMPLESSI
Per fare un esempio semplice, F4 è costituita dai numeri
I I I 2 3 I
4 ' 3 ' 2 ' 3 ' 4 ' I '
quindi A (4) = 6 . I punti che dividono l'intervallo da O a I in sei
segmenti uguali sono I/6, 2/6, 3/6, 4/6, 5/6; allora d, è la diffe
renza tra I/4 e I/6, cioè I/4 - I/6 = I/1 2 ; d2 è la differenza tra
I/3 e 2/6 che è O; d} è la differenza tra I/2 e 3/6, che è anche O;
così pure d4 = O ; d5 = 5/6 - 3/4 = I/I 2 . In definitiva:
D (4) = _I_ +
I2
o
+
o
+
o
+ _I_ = __!__ .
I2
6
Si può calcolare D (5) allo stesso modo .
In un lavoro pubblicato nel I 9 24 , J . Frane! e E . Landau studia
rono il comportamento della funzione D (n) al variare di n tra tutti
i numeri naturali, usando tecniche algebriche e non calcolando arit
meticamente grandi quantità di successioni di Farey. In partico
lare, essi partirono dall' affermazione che se r è un qualsiasi numero
reale maggiore di I/2 , allora esiste una costante C tale che D(n)
è sempre minore di Cn'. Essi provarono che questa affermazione
apparentemente semplice è equivalente alla congettura più impor
tante, come riconoscono i matematici professionisti, tra tutte quelle
irrisolte fino ad oggi: l'ipotesi di Riemann.
Il più importante tra i problemi irrisolti
Per il lettore medio, il più famoso problema matematico irrisolto
è certamente l'ultimo teorema di Fermat, presentato nel capitolo 8 .
L a fama, tuttavia, non sempre v a di pari passo con l'importanza.
Se si domanda a un ricercatore matematico qual è l'unico problema
veramente importante ancora aperto in matematica, ci si può tran
quillamente aspettare di sentirsi rispondere : « L'ipotesi di Rie
mann ». Non c'è dubbio che il grande matematico inglese Godfrey
H . Hardy (vedi cap . 4) la pensasse così. Dovendo affrontare una
traversata dalla Scandinavia all'Inghilterra in condizioni atmosfe
riche particolarmente difficili, mandò una cartolina a un collega
(certo pensando all'origine dell'ultimo teorema di Fermat) con il
CAPITOLO NONO
messaggio: « <potesi di Riemann dimostrata. Vostro G . H . Hardy ».
Secondo Hardy, Dio non avrebbe potuto !asciarlo morire con il
credito immeritato di aver raggiunto un risultato così importante,
e gli avrebbe perciò concesso di tornare incolume a casa. Hardy
(che tra l' altro era un ateo convinto ! ) arrivò sano e salvo, «l'ul
timo teorema di Hardy » non venne alla luce e l'ipotesi di Riemann
rimase indimostrata.
La storia comincia intorno al I 740, quando Eulero introdusse
nella matematica la cosiddetta funzione zeta , definita per numeri
reali s maggiori di I dalla somma infinita
C(s) = __!_ + __!_ + __!_ + __!_ + . . .
'
'
I'
2'
3
4
(C è la lettera greca « Zeta », che dà anche il nome alla funzione) .
Per s minore o uguale a I , la somma infinita dà un valore infinito,
per cui C(s) non è definita per un tale s. Per qualsiasi s maggiore
di I , invece, la somma infinita dà un valore finito e determinato .
Eulero provò che per tutti questi s, il valore di C(s) è uguale al pro
dotto infinito
I
I
I
I
X
X
X
X
I - ( I/2) '
I - ( I/3) '
I - ( I/5) '
I - ( I/7) '
I
x ...,
x
I - ( I/ I I ) '
dove il prodotto
è
esteso a tutti i numeri della forma
I
I - ( I /p) '
con p numero primo . Questo risultato è sorprendente per due
motivi: innanzitutto, esso mostra che la funzione C è strettamente
correlata con entità basilari e concrete quali i numeri primi; in
secondo luogo, la relazione tra la funzione e i numeri primi coin
volge l'infinito in maniera essenziale . Senz' altro i numeri primi
sono qualcosa di più di quello che appaiono a prima vista.
Ora lasciamo temporaneamente da parte la funzione zeta e occu
piamoci della distribuzione dei numeri primi . Man mano che si
procede all'interno dei numeri naturali, essi dapprima sembrano
molto numerosi (ad esempio, sono la metà dei primi dieci numeri
maggiori di I ) ma in seguito cominciano a diradarsi . Il loro anda-
229
PROBLEMI SUI NUMERI COMPLESSI
mento sembra comunque essere irregolare: ad esempio tra 9 999 900
e I O ooo ooo ci sono nove numeri primi, ma nei successivi cento
interi, da I O ooo ooo a I o ooo I oo, ce ne sono solamente due:
I O ooo O I 9 e I o ooo 07 9. In realtà, esistono serie di interi di ogni
lunghezza che non contengono numeri primi; ad esempio, per ogni
valore di N la serie compresa tra N! + 2 e N! + N non può inclu
dere alcun primo, come si può facilmente vedere. Un' altra mani
festazione del modo apparentemente casuale in cui i primi ricor
rono è data dai molti esempi di coppie di « gemelli », cioè di primi
che differiscono di 2 , come ad esempio 3 e 5 , I I e I 3 , I O oo6 4 2 7
e I O oo6 4 2 9 , che sembrano ricorrere i n modo casuale. S i pensa
che ce ne siano infinite, ma ciò non è stato mai provato .
Nonostante tutto, la distribuzione apparentemente caotica dei
numeri primi nasconde un certo ordine, dato dal comportamento
della funzione :n (n) che esprime il numero di primi minori o uguali
a n (vedi cap. I ) . Nel suo libro Essai sur la Théorie des Nombres
del I 798, Legendre osservò che :n (n) è approssimativamente uguale
al numero
n
ln n - I ,o8 366 ·
(In questo capitolo, ln n denoterà il logaritmo naturale, o in base
e, di n) . Non c'è niente di particolare nel numero I ,o8 366: Legen
dre ottenne questo risultato esaminando le tavole dei numeri primi
fino a 400 ooo e scelse questo numero semplicemente per dare
un' approssimazione il più precisa possibile.
Più o meno nello stesso periodo in cui Legendre lavorava al suo
libro, il quattordicenne Gauss cominciava a studiare la funzione
:n (n) . Egli osservò (anche se non rese pubblico il fatto fino al I 863)
che :n (n) è approssimata dal numero n/ln n e anche dal numero
Li (n) =
l
"
2
I dx.
1 nx
-
La funzione Li è detta logaritmo integrale. La tabella 9 . I fornisce
i valori delle diverse funzioni approssimanti per valori di n fino
a I OO milioni; risulta che Li (n) è una approssimazione di :n (n) di
gran lunga migliore delle altre due . Nel I 896 Charles de la Vallée
230
CAPITOLO NONO
Tabella 9· I La distribuzione dei numeri primi. Questa è una espansione della tabella r . I
che dimostra il numero di primi ,. (n) minori di n, insieme alle tre classiche funzioni
che approssimano ,. (n)
n
,. (n)
n
ln n - I ,o8 3 66
n
In n
Li (n)
I OOO
I O OOO
! 00 000
I 000 000
! 0 000 000
1 00 000 000
I68
I 2 29
95 9 2
7 8 498
664 579
5 76 1 455
I72
1231
9588
78534
665 I 3 8
5 769 3 4 1
I45
r o86
8686
72 382
620 4 2 0
5 4 2 8 68 r
n8
1 2 46
9630
78628
664 9 1 8
5 762 209
Poussin mostrò che questo è vero per tutti i valori di n a partire
da un dato punto .
In effetti, e questa è una digressione interessante, dalla tabella
9 . 1 sembra che Li (n) , sia sempre lievemente maggiore di n (n) , e
se si dovesse proseguire nella tabulazione è probabile che si conti
nuerebbe a notare la stessa cosa. Sarebbe da scettici non conclu
dere che Li (n) approssima sempre n (n) per eccesso . Ma se si arri
vasse a tale conclusione si sarebbe in errore, poiché nel 1 9 1 4 il
matematico inglese J. E . Littlewood (un collega di G. H. Hardy)
dimostrò che la differenza Li (n) - n (n) passa da un valore posi
tivo a uno negativo infinite volte all' aumentare di n negli interi
positivi. Così, ci saranno certamente valori di n per i quali Li(n)
è minore di n (n) , e S . Skewes mostrò nel 1 955 che un tale n dovrà
apparire prima del cosiddetto numero di Skewes:
e/'
(approssimativamente 1 0 1 0 '" \
'
un valore incomprensibilmente grande . Molto più piccolo, ma
ancora ben al di fuori della nostra immaginazione, è il numero
1 ,65 X I 0 1 165 ; nel 1 966 Lehman mostrò che esso sostituisce il
numero di Skewes , nel senso che Li (n) - n (n) cambierà segno per
qualche valore inferiore a quel numero . Più piccolo ancora è il
numero 6,69 x I o m, e nel 1 986 Hermann J . J . te Riele dimostrò
che un cambiamento di segno avverrà per qualche n al di sotto
di questo limite. Ma questi sono ancora numeri estremamente
grandi, e ciò ha portato a concludere che è possibile che non si
arrivi mai a scoprire un numero n per il quale Li (n) sia effettiva-
23 1
PROBLEMI SUI NUMERI COMPLESSI
mente minore di n (n) (quel che è certo è che una ricerca al calcola
tore fatta fino a un miliardo non è approdata a nulla) .
Torniamo ora all' argomento principale . Nel I 896 i francesi
]. Hadamard e C . de la Vallée Poussin, indipendentemente, riu
scirono a dimostrare formalmente ciò che l'evidenza suggeriva: al
crescere di n, il valore di n/ln n si avvicina sempre più a n (n), appros
simandolo con qualunque grado di precisione richiesta, per n abba
stanza grande. Ne consegue che anche Li (n) diventa arbitrariamente
vicino a n (n) al crescere di n. Questo famoso risultato, che mostra
una volta per tutte che i numeri primi appaiono secondo un modello
matematico definito, è noto come teorema dei numeri primi. È da
notare tuttavia che tale modello implica la nozione di infinito e
i concetti dell' analisi . Il lavoro di entrambi i matematici era sca
turito da un importante saggio di otto pagine, pubblicato dal tede
sco Bernhard Riemann nel I 85 9 , dal titolo Sul numero di primi
minori di una grandezza data . In questo scritto, l'unico di Riemann
sulla teoria dei numeri, egli suggerì alcune linee di ricerca che ancora
oggi risultano estremamente produttive. Si potrebbe addirittura
affermare che la pubblicazione di questo scritto ha segnato l'ini
zio di tutta la teoria analitica dei numeri, nella quale le tecniche
dell' analisi sono applicate a problemi relativi ai numeri naturali .
L'idea chiave introdotta da Riemann nello studio della distri
buzione dei primi era di considerare l'estensione della funzione
C(s) ai numeri complessi della forma s = a + ib (escluso s = I ) , anzi
ché la sua restrizione ai numeri reali maggiori di I . Ciò non può
essere fatto ammettendo semplicemente che s possa assumere valori
complessi nella formulazione originale di Eulero
"1" (s) = I + I ' + I + I +
-
I'
-
2
-
3'
-
4'
. . .
Si deve invece fare uso di una tecnica piuttosto sofisticata, nota
come prolungamento analitico , che non sarà descritta qui. A bene
ficio di quei lettori che sono in grado di capire le varie nozioni
implicate, la formula che Riemann ottenne per la sua funzione zeta
estesa è il seguente integrale curvilineo
C(s) =
II ( - s)
.
2 n1
c
( - x) ' dx
ex - I X '
CAPITOLO NONO
calcolato sulla curva C che procede verso sinistra a partire dall'in
finito lungo l'asse dei reali positivi, si ferma poco prima dell'ori
gine, le gira intorno in direzione antioraria e poi torna lungo l'asse
dei reali positivi fino all'infinito . Il prodotto II(s) è dato da
!
:...:.---..:...
'(s) = lim ----'N
(N + I ) ' ,
N - oo
(s + I ) (s + 2 ) . . . (s + N)
per tutti gli s che non sono interi negativi .
La funzione estesa, nota come la funzione zeta di Riemann, risulta
di importanza fondamentale in tutta la teoria dei numeri, e le sono
stati dedicati libri interi; * ma, come si può facilmente intuire dalle
definizioni date sopra, si tratta di opere riservate agli esperti.
Per s uguale a uno qualsiasi dei numeri - 2 , - 4 , - 6 e così
via, '(s) vale O ; un altro modo di esprimere la stessa cosa consiste
nel dire che gli interi negativi pari sono zeri della funzione zeta.
Ci sono infiniti altri numeri complessi s per i quali '(s) = O, tutti
con la parte reale compresa tra O e I (cioè della forma s = a + i b ,
con O < a < I ) . L'ipotesi di Riemann è una congettura riguardante
gli zeri complessi della funzione zeta che Riemann formulò nel suo
saggio. Egli ipotizzò, senza quasi nessuna prova concreta, che tutti
gli zeri complessi della funzione zeta abbiano la parte reale esatta
mente uguale a -} (cioè se '(s) = O, allora s = -} + ib per qualche
numero b) .
Perché questa ipotesi è così importante? Come Riemann dimo
strò nel suo saggio, c'è una relazione molto stretta tra gli zeri della
funzione zeta e le proprietà della funzione n (n) , relazione che portò
Hadamard e de la Vallée Poussin alle loro rispettive dimostrazioni
del teorema dei numeri primi. Osserviamo che le loro dimostrazioni
dipendevano dalla connessione, che è vera, e non dalla ipotesi di
Riemann sugli zeri, di cui ancora oggi non si sa nulla. Detta connes
sione, inoltre, è alla base di molte proprietà note dei primi, e anche
del lavoro sul numero di Skewes di cui si è già detto . Se l'ipotesi
di Riemann fosse vera e gli zeri della funzione zeta fossero davvero
ben ordinati, allora la connessione con la funzione n (n) permettereb
be di conoscere ancora più informazioni sui numeri primi di quelle
note al momento, e proprio questo rende il problema così impor* Fra cui si segnala H . M. Edwards, Riemann's Zeta Function, Academic Press, London 1 974.
233
PROBLEMI SUI NUMERI COMPLESSI
Tabella 9 . 2 La distribuzione dei primi. Questa tabella
comincia dove finisce la tabella 9· I . Per grandi valori
di n la funzione R (n) , di cui si dà la definizione usando
la funzione zeta di Riemann, fornisce un'ottima appros
simazione della funzione di distribuzione dei primi :n (n)
n
:n (n)
R (n)
I OO OOO OOO
200 000 000
300 000 000
400 000 000
500 000 000
6oo ooo ooo
700 000 000
8oo ooo ooo
900 000 000
I 000 000 000
5 76I 455
I I 078 9 3 7
I 6 2 5 2 3 25
2 1 3 3 6 3 26
26 355 867
3 I 3 2 4 703
3 6 25 2 93 I
4 I I 46 I 79
46 009 2 I 5
50 847 534
5 76 I 5 5 2
I I 079 090
I 6 25 2 3 5 5
2 I 3 3 6 I 85
2 6 35 5 5 I 7
3I 3 2 4 6 2 2
36 252 7 I 9
4 I I 4 6 248
46 009 949
50 847 455
tante per i tutti matematici. Dunque cosa si sa sulla probabilità
che l'ipotesi di Riemann sia vera?
Prima di presentare tutto il lavoro fatto sull'ipotesi di Riemann
dal momento in cui questa venne avanzata, vale forse la pena di
citare una particolare approssimazione di :n (n) che coinvolge espli
citamente la funzione zeta, nella forma originale che ne diede
Eulero :
..
I
(ln n) k
R (n) = I + �
k = t k C(k + I )
k!
----
---
(Chi non capisce le notazioni può semplicemente ignorare questa
formula) . La somma nell'equazione è una somma infinita, da k = I
a k = oo .
Dalla tabella 9 . 2 risulta evidente che la quantità R (n) è un'ec
cellente approssimazione di :n(n) .
L 'ipotesi di Riemann
Qual è la motivazione che sostiene la congettura di Riemann
secondo la quale se C(s) = O per un numero complesso s, allòra neces
sariamente s è della forma -} + i b? Come è già stato detto, è certo
che qualsiasi zero complesso avrà la sua parte reale tra O e I , e
234
CAPITOLO NONO
-}
si trova a metà tra questi due estremi, ma sicuramente Riemann
aveva una motivazione più forte. Nessuno oggi sa su quale fonda
mento poggiasse la sua asserzione: come si vedrà, egli non era nella
condizione di potersi sedere a tavolino e calcolare molti zeri, e,
anche se lo fosse stato, l'esempio che riguarda il segno dell'espres
sione Li (n) n (n) rivela quanto poco affidabile possa essere il
metodo « sperimentale » in matematica. Hardy riuscì a dimostrare,
cosa tutt'altro che facile, che esistono infiniti zeri con la parte reale
uguale a -} , ma questo non impedisce che ce ne siano infiniti altri
per i quali ciò non avviene . In realtà c'è poco altro da dire, oltre
al fatto che l'evidenza numerica, accumulata quale risultato di cal
coli prodigiosi nel corso degli anni, è sempre favorevole alla con
gettura. Anche se questo lavoro non potrà mai dimostrare l'ipo
tesi, rimane sempre la possibilità, peraltro minima, che il calcolo
numerico sveli un numero in grado di dimostrarne la falsità: per
confutare l'ipotesi di Riemann basterebbe scoprire un solo zero
la cui parte reale non sia uguale a -} . Questo costituisce una prima giustificazione al tentativo di risolvere il problema con il cal
colo. Un' altra ragione è che tale metodo fornisce un eccellente ter
reno di prova per nuovi algoritmi numerici che possono risultare
utili per altri impieghi .
Sono state sviluppate molte tecniche per calcolare i valori di b
per cui il numero complesso -} + i b è uno zero della funzione
zeta. Esistono anche modi per calcolare il numero totale di zeri
(opposto al calcolo degli zeri stessi) la cui parte immaginaria si trova
entro un campo assegnato. Con la combinazione di queste due tecni
che risulta allora possibile verificare l'ipotesi di Riemann per qual
siasi intervallo numerico. Il primo a usare metodi numerici per l'ipo
tesi di Riemann fu J. P. Gram. N el I 90 3 , utilizzando una tecnica
standard, detta serie di Eulero-Maclaurin, per calcolare gli zeri,
Gram trovò i primi quindici valori di b per i quali '(-} + i b) = O.
Calcolò i primi dieci con sei cifre decimali (il primo è b = I 4 , I 3 4 725
e il decimo è b = 49,773 83 2) e gli altri cinque con una sola cifra
decimale (l'undicesimo è b = 5 2 , 8 e il quindicesimo è b = 65 ,0) .
Sapendo che qualsiasi zero complesso deve avere la sua parte reale
compresa tra O e I , egli andò oltre, e arrivò a dimostrare che esisto
no esattamente dieci zeri la cui parte immaginaria si trova tra O e 50.
-
PROBLEMI SUI NUMERI COMPLESSI
235
Poiché la sua lista precedente di zeri della forma -} + ib ha esat
tamente dieci valori la cui parte immaginaria si trova tra O e 5 0 ,
ne deriva che questa lista comprende tutti gli zeri aventi l a parte
immaginaria entro quell'intervallo. In altre parole, i suoi calcoli
dimostrarono che l'ipotesi di Riemann è vera per quanto attiene
all'intervallo compreso tra O e 5 0 . (« <ntervallo » in questo conte
sto si riferisce sempre alla dimensione della parte immaginaria
dello zero) .
Usando tecniche simili, anche se perfezionate, nel 1 9 1 8 R. Back
lund dimostrò l'ipotesi di Riemann per tutti gli zeri con parte
immaginaria compresa tra O e 2 oo; con ulteriori perfezionamenti
del metodo, nel 1 9 25 ] . ] . Hutchinson elevò il limite a 300. Nel
1 93 6 Titchmarsh e Comrie si servirono di un metodo ideato da
Cari Siegel per calcolare 1 0 4 1 zeri, tutti della forma ipotizzata
da Riemann .
Dopo la seconda guerra mondiale, il problema fu affidato ai
calcolatori elettronici . Negli anni cinquanta, usando il metodo di
Siegel per calcolare gli zeri della forma -} + i b unitamente a un
nuovo metodo proposto da Alan Turing per determinare il numero
di zeri in un intervallo dato, D . H . Lehmer portò la ricerca molto
più avanti, e nel 1 966 R. S . Lehman giunse a calcolare 250 ooo
zeri. Pochi anni dopo ] . B . Rosser con i suoi colleghi arrivò a cal
colarne 3 500 ooo . Nel 1 983 , in seguito al lavoro di ] . van de Lune
e H .].]. te Riele, tutta la regione da O a I 1 9 590 809 , 2 8 2 era stata
studiata in dettaglio, e ne era emerso che i 300 ooo oo i zeri di que
sta regione erano del tipo previsto da Riemann. Nel 1 985 gli stessi
due studiosi giunsero a calcolare il primo miliardo e mezzo di zeri,
senza mai trovarne uno in contrasto con l'ipotesi di Riemann.
Quindi tutti i calcoli numerici convalidano l'ipotesi di Riemann.
Se questa è falsa, deve esserlo per numeri ben più grandi di quelli
generalmente presi in considerazione da chiunque non sia un mate
matico puro, il che pone il problema sullo stesso piano dell'ultimo
teorema di Fermat (si veda il cap. 8) . A dispetto di tutto il lavoro
compiuto e dell'evidenza dei fatti, nessuno sa realmente se l'ipo
tesi sia vera o no . Quasi ad ammonirci ancora una volta contro
la tentazione di basare le conclusioni sulle prove numeriche, negli
ultimi anni è stata chiarita una congettura strettamente correlata
con quella di Riemann, in cui i dati sperimentali si sono rivelati
CAPITOLO NONO
del tutto fuorvianti . Il destino toccato alla congettura di Mertens
dovrebbe servire da monito a tutti coloro che danno per scontato
che l'ipotesi di Riemann sia vera.
La congettura di Mertens
Un numero naturale n qualsiasi, grazie al teorema fondamen
tale dell'aritmetica, è primo o può essere espresso come il prodotto
di un unico insieme di primi. Ad esempio, per i primi cinque numeri
composti,
6 = 2 x 3. 8 = 2 x 2 x 2,
4 = 2 x 2,
9 = 3 X 3,
IO = 2 X
5·
Di questi, 4, 8, 9 hanno scomposizioni in cui almeno un fattore
primo ricorre più di una volta, mentre nella scomposizione di 6
e di I o ciascun fattore primo ricorre una volta sola. I numeri che
sono divisibili per il quadrato di un numero primo (come ad esem
pio 4, 8, 9) sono detti divisibili da quadrati, quelli che non lo sono
sono detti liberi da quadrati. Quindi nella scomposizione di un
numero libero da quadrati, nessun fattore primo ricorrerà più di
una volta.
Se n è un numero naturale composto libero da quadrati allora
è il prodotto di un numero pari o di un numero dispari di primi:
ad esempio, 6 = 2 X 3 è il prodotto di un numero pari di pri
mi, mentre 42 = 2 x 3 x 7 è il prodotto di un numero dispari di
primi . Nel I 83 2 A. F. Mobius introdusse la semplice funzione che
segue (espressa dalla lettera greca p, e chiamata funzione di Mobius)
per indicare il tipo di scomposizione in fattori primi di un nu
mero n. Per n = I , sia p, (n) = I , come caso particolare . Per tutti
gli altri n, p, (n) è definita come segue:
se n è divisibile per un quadrato, allora p, (n) = O;
se n è libero da quadrati ed è il prodotto di un numero pari di
primi, allora p, (n) = I ;
se n è primo, oppure è libero da quadrati ed è il prodotto di un
numero dispari di primi, allora p, (n) = I .
-
237
PROBLEMI SUI NUMERI COMPLESSI
Così ad esempio ,u (4) = O, ,u (5) = - I , ,u (6) = I , ,u (42) = - I e così
via.
Ora, per qualsiasi numero n indichiamo con M(n) il risultato
dell' addizione di tutti i valori di ,u (k) per k minore o uguale a n .
A d esempio :
M( I ) = ,u ( I ) = I ,
M(2) = ,u ( I ) + ,u(2) = I + ( - I ) = O ,
M(3) = ,u ( I ) + ,u (2) + ,u (3 ) = I + ( - I ) + ( - I ) = - I ;
M(4) = ,u ( I ) + ,u (2) + ,u (3) + ,u (4) = I + ( - I ) + ( - I ) + O = - I ,
M(5) = I + ( - I ) + ( - I ) + O + ( - I ) = - 2 .
Si può vedere che
M(6) = - I ,
M(7) = - 2 ,
M(8) = - 2 ,
M(9) = - 2 ,
M( I o) = - I ,
M( I I ) = - 2 ,
M( I 2) = - 2 ,
M( I 3) = - 3 ,
M( q ) = - 2 ,
M( I 5) = - I ,
M( I 6) = - I ,
M( 1 7) = - 2 ,
M( I 8) = - 2 ,
M( I 9) = - 3 ,
M(2o) = - 3 ·
C i si potrebbe domandare: qual è il primo valore di n per il quale
M(n) è di nuovo zero oppure di nuovo positivo?
Il lettore potrebbe pensare che queste semplici uguaglianze
abbiano poco a che fare con il più importante problema irrisolto
della matematica. Invece, come sarà chiaro tra poco, il comporta
mento della funzione M(n) risulta essere strettamente collegato con
la posizione degli zeri della funzione zeta di Riemann .
Questa relazione era senz' altro nota a T.J. Stieltjes . Nel I 885 ,
in una lettera al collega C . Hermite, egli sostenne di aver dimo
strato che, per ogni n, il valore di M(n) , indipendentemente dal
segno, è sempre minore di ..fn:
l
(le due linee
standard, il
preso senza
così via) . Se
M(n)
l < .Jn
verticali qui stanno a indicare, secondo la notazione
valore numerico dell'espressione in esse contenuta
alcun segno; ad esempio, 1 - IO l = I O , l 5 I = 5 e
fosse stato vero ciò che sosteneva Stieltjes, sarebbe
CAPITOLO NONO
stata vera anche l'ipotesi di Riemann; infatti quest'ultima si può
dedurre dall'esistenza di una costante A tale che la disuguaglianza
I M(n) l < A -Jn
valga per ogni n. Inutile dire, dopo quanto detto nel paragrafo pre
cedente, che Steltjes era in errore, anche se a quel tempo la cosa
non era affatto chiara. Ad esempio, quando Hadamard nel I 896
scrisse il suo saggio, oggi divenuto un classico , in cui dimostrava
il teorema dei numeri primi, disse di aver capito che Stieltjes aveva
già ottenuto lo stesso risultato servendosi della disuguaglianza [ I ] .
Per giustificare l a pubblicazione del suo studio, addusse il fatto che
la dimostrazione di Stieltjes non era ancora apparsa, e il fatto
che Stieltjes non abbia mai reso pubblica tale dimostrazione può
ben far pensare che egli si sia reso conto dell'errore . Comunque,
nel I 897 F. Mertens pubblicò una tabella di 50 pagine di valori
di ,u (n) e M(n) per n minore di I O ooo, sulla base della quale egli
era portato a concludere che la disuguaglianza [ I ] fosse « molto pro
babile ». Di conseguenza questa congettura è oggi nota come con
gettura di Mertens.
In una serie di saggi apparsi tra il I 897 e il I 9 I 3 , von Sterneck
calcolò altri valori di M(n) per vari n fino a 5 milioni, trovando che
verificavano tutti la congettura di Mertens . In verità, per n > 200
essi soddisfano la disuguaglianza più forte
I M(n) l <
�
-Jn
ma la sua ipotesi che ciò fosse sempre vero fu smentita da Jurkat
nel I 96o. Il valore più piccolo di n per il quale I M(n) l � -} .Jn
è n = 7 7 2 5 0 3 8 6 2 9 , che dà M(n) = 43 947 ·
Nel I 979 Cohen e Dress calcolarono M(n) per tutti gli n fino
a 7 ,8 miliardi, e rilevarono che tutti i loro valori soddisfacevano
la disuguaglianza
I M(n) l < o,6 -Jn,
il che ancora una volta sembrava indicare che la congettura di Mer
tens potesse essere vera (per correttezza, si dovrebbe dire che molte
altre prove indicavano il contrario ! ) . In realtà non è vera, come
dimostrarono nell'ottobre del I 983 Hermann te Riele e Andrew
Odlyzko, terminando così con successo un lavoro di otto anni .
239
PROBLEMI SUI NUMERI COMPLESSI
Questo risultato era il frutto di tecniche matematiche classiche
combinate con calcoli eseguiti da potenti calcolatori. Inoltre, la
loro collaborazione era tipica di una prassi sempre più frequente
tra i ricercatori dei nostri tempi; per la maggior parte del tempo
ognuno dei due lavorava a casa propria (te Riele presso il Cen
tro matematico di Amsterdam e Odlyzko presso i Laboratori
Beli nel New Jersey) , comunicando con l' altro grazie alla posta
elettronica.
Come fu confutata la congettura di Mertens? Non certo trovan
do un numero n per il quale I M(n) l ?:. ..fn: fino a oggi un tale
numero non è stato trovato , e le prove di cui disponiamo indicano
che un tale n deve essere maggiore di I o �o. La chiave per la loro
dimostrazione fu fornita da un risultato ottenuto da A. E . Ingham
nel I 942 .
Innanzitutto, si noti che la disuguaglianza l M(n) l < ..fn può anche
essere scritta come
I M(n) l
.Jn < I .
Ingham indicò come definire una certa funzione h(x) avente la pro
prietà per cui, per ogni x reale, nessun numero minore di h(x) può
superare in valore I M(n) 1 /..fn. Quindi per smentire la congettura
di Mertens si deve trovare un numero x tale che h(x) > I . Suppo
niamo ad esempio, che si trovi un x tale che h(x) = I ,o6. Allora,
grazie al risultato di Ingham, nessun numero minore di I ,o6 supera
in valore I M(n) 1 /..fn: in particolare I , che è più piccolo di I ,o6,
non è maggiore di I M(n) 1 /..fn. Questo contraddice la congettura
di Mertens, ma non fornisce un valore di n per il quale la disugua
glianza di Mertens non sia valida.
Così te Riele e Odlyzko si misero alla ricerca di un valore di
x per cui h(x) fosse maggiore di I , impresa che si rivelò alquanto
difficile .
La definizione della funzione h(x) comporta concetti matema
tici molto astratti, compresa la funzione zeta di Riemann . In par
ticolare, il calcolo di h(x) per un valore dato di x comporta il cal
colo rigoroso di un numero considerevole di zeri della funzione
zeta. Inoltre il risultato di Ingham per la funzione h(x) dipende
dal fatto che tutti gli zeri calcolati sono conformi all'ipotesi di Rie-
CAPITOLO NONO
mann; tuttavia, quest'ultima è stata verificata per valori ben mag
giori di quelli necessari per smentire la congettura di Mertens . Cer
tamente questi calcoli richiedono troppo tempo per poter essere
eseguiti con qualsiasi altro strumento che non sia un potente cal
colatore . Anche così, quando si sia scritto un programma in grado
di eseguire il calcolo di h(x) per qualsiasi x dato, ci si troverà di
fronte alla difficoltà di trovare un x per il quale il risultato sia mag
giore di I . Questo compito è ancora più difficile, perché la fun
zione h(x) mostra una scoraggiante tendenza ad assumere valori
che restano quasi sempre al di sotto di I . In verità, nel I 979 il
valore più alto che te Riele era riuscito a raggiungere era o,86.
Trovare un x adatto era apparentemente come cercare un ago nel
pagliaio, e te Riele concluse che il problema era al di là delle possi
bilità dei calcolatori esistenti .
Il progresso che portò alla risoluzione del problema non venne
dalla nuova tecnologia elettronica, bensì da un nuovo algoritmo,
potente e di vasta applicabilità, scoperto da Lenstra, Lenstra e Lovasz
nel I 98 I . Questa nuova tecnica (che qui non sarà descritta) , applica
ta alla congettura di Mertens, costituì lo strumento di calcolo occor
rente per trovare un valore appropriato di x. A quel punto te Riele
e Odlyzko avevano un metodo per proseguire nella loro impresa.
La prima parte della dimostrazione consisteva nel calcolare gli
zeri della funzione zeta che sarebbero stati richiesti nel corso della
loro ricerca. Per fare questo fu tenuto in funzione per 40 ore un
coc CYBER 750 al Centro di matematica di Amsterdam, ottenendo
2ooo zeri con una precisione di I oo cifre decimali. Poi, usando
l' algoritmo efficiente di cui sopra, nei laboratori Beli fu fatto fun
zionare per I o ore un CRAY- I finché si trovò un valore di x per
il quale h(x) era maggiore di I , per la precisione h(x) = I ,o6 I 545 ·
La congettura di Mertens era finalmente stata confutata. A titolo
di cronaca, il valore risolutivo di x era questo gigante con 65 cifre
prima della virgola:
Naturalmente questo risultato non solo smentisce la congettura
di Mertens, ma mostra anche che la disuguaglianza
I M(n) l
< I ,o6 ..fn
PROBLEMI SUI NUMERI COMPLESSI
non è sempre valida. E che cosa si può dire della disuaglianza
I M(n) l < A .Jn
per altri valori della costante A ? Se fosse vera per qualche valore
di A allora l'ipotesi di Riemann ne conseguirebbe automaticamente.
Per dimostrare che una disuguaglianza di questo tipo è falsa, adot
tando il metodo usato da te Riele e Odlyzko, si dovrebbe trovare
un valore di x per il quale h(x) è maggiore di A . Sia te Riele che
Odlyzko sono convinti che questo sia teoricamente possibile, indi
pendentemente dalla grandezza di A, cioè sono convinti che la fun
zione h(x) assuma valori arbitrariamente grandi. Comunque fanno
presente che in pratica, con gli algoritmi e la tecnologia di cui si
dispone oggi, si può al massimo sperare di trovare un valore di
x per il quale h(x) è intorno a r ,5 , e concludono dicendo che attual
mente non è possibile neanche arrivare a 2 .
Con la dimostrazione della falsità della congettura di Mertens,
l'ipotesi di Riemann rimane al punto in cui era. Se la congettura
di Mertens fosse stata vera (come aveva pensato Stieltjes) , auto
maticamente sarebbe stata vera anche la congettura di Riemann.
Sapere che la congettura di Mertens è falsa non dice nulla né in
un senso né nell' altro sull'ipotesi di Riemann: le due congetture
non sono equivalenti .
C ' è comunque una versione più debole della congettura di Mer
tens che è equivalente all'ipotesi di Riemann: per qualsiasi numero
reale r maggiore di -} esiste una costante A tale che la disugua
glianza
I M(n) l < An '
è vera per ogni n . I n altre parole, s i prenda qualsiasi potenza d i n
maggiore dell' -} che appare nella congettura di Mertens, e si otterrà
una disuguaglianza del tipo appropriato . La falsità di questa pro
posizione implicherebbe naturalmente la falsità dell'ipotesi di Rie
mann (come del resto la verità della medesima implicherebbe la
verità dell'ipotesi di Riemann) . Questo problema, comunque, non
ha niente a che fare con la congettura di Mertens .
CAPITOLO NONO
La congettura di Bieberbach
La matematica, come viene solitamente presentata ai comuni
mortali, è un insieme di conoscenze freddo e impersonale. La verità
matematica, unicamente, non cambia di minuto in minuto, da luogo
a luogo, da persona a persona. Ma lo sviluppo della matematica
è una conquista dell'uomo, ed è perciò soggetto a una vasta gamma
di influssi . Anche se, in fondo, non si può negare la natura asso
luta della verità matematica, talvolta occorre tempo per arrivarci.
Il lettore immagini per un momento di essere uno dei matema
tici più eminenti del mondo, di aver per molti anni lavorato sodo
a un problema particolare e di essere più volte arrivato vicino alla
sua soluzione. Un giorno riceve un testo di 3 85 pagine dattiloscritte
che pretende di fornire la soluzione di quel problema. Il mittente
risulta essere un matematico degno di rispetto: non si tratta di uno
dei tanti scritti approssimativi che gli giungono con regolarità e
che egli cestina senza esitazione. L'autore ha cinquantadue anni,
e l'esperienza e una certa evidenza statistica ci dicono che di norma
un matematico dà il meglio di sé prima dei quarant' anni . Inoltre,
questo studioso ha sostenuto in passato di aver risolto altri pro
blemi, e si sono spesso trovati gravi errori nelle sue argomenta
zioni. Ora egli si attribuisce la risoluzione di un problema che nei
settant'anni trascorsi dal suo nascere ha sconfitto non solo il nostro
lettore, esperto di fama mondiale in questo settore specifico, ma
molti altri grandi matematici in diverse parti del mondo, alcuni
dei quali si sono illusi, seppur per breve tempo, di aver trovato
la soluzione . Un'occhiata rapida al manoscritto gli fa capire che
lo scrivente ha usato un metodo di cui chiunque si sia occupato
di questo problema dubiterebbe .
Davanti a una simile situazione e con molte altre cose interes
santi di cui occuparsi, che cosa avrebbe fatto il lettore? Ecco davanti
a quale dilemma si venne a trovare nella primavera del r 984 il mate
matico americano Cari FitzGerald. Possibile che il suo connazio
nale Louis de Branges avesse davvero ragione, che avesse risolto
la congettura di Bieberbach, riuscendo là dove molti altri avevano
fallito? A FitzGerald la cosa sembrò improbabile. Più tardi scrisse:
« Speravo che la dimostrazione non fosse corretta. Due dei miei
PROBLEMI SUI NUMERI COMPLESSI
243
studi migliori dimostravano che la congettura di Bieberbach per
lomeno si avvicinava alla verità (. . . ) Non volevo che questi risul
tati fossero superati ». Il manoscritto di de Branges suscitò lo stesso
scetticismo negli altri matematici a cui ne era stata mandata una
copia, e nessuno lo lesse.
Ma il caso volle che de Branges visitasse l'uRss nell' ambito
di un programma di scambi; durante la sua permanenza gli fu
chiesto di tenere una conferenza per i matematici dell'Università
di Leningrado . Era il luogo ideale in cui esporre la sua presunta
dimostrazione, perché tra il pubblico erano presenti l. M. Milin,
E . G. Emel'anov e G . V. Kuz'mina, tre esperti universalmente rico
nosciuti di quel problema specifico. De Branges sosteneva di aver
dimostrato una congettura avanzata nel 1 9 7 1 proprio da Milin,
da cui derivava la congettura di Bieberbach. I matematici russi
si rivelarono un pubblico paziente, anche se scettico, e ascolta
rono una serie di cinque conferenze di quattro ore l'una sulla pre
sunta dimostrazione, pensando che prima o poi sarebbe saltato fuori
un errore.
Ma si sbagliavano : l'errore non c'era, la dimostrazione era cor
retta. Si trattava adesso di riuscire a semplificarla, a ridurne la
lunghezza spaventosa. La cosa era possibile; con un po' di lavoro ,
il gruppo riuscì ad apportare alcune modifiche significative alla dis
sertazione, fino a ridurre lo scritto a tredici pagine. Quando que
ste tredici pagine furono diffuse, i ricercatori di tutto il mondo
lo esaminarono e se ne convinsero . Molti matematici sognano di
fare ciò che fece de Branges, ma pochi ci riescono. Egli aveva risolto
un problema aperto da lungo tempo, che tutti erano concordi nel
ritenere difficile.
Era diventato un problema famoso proprio a causa della sua dif
ficoltà. Per quanto se ne sa, la congettura di Bieberbach non porta
a molti altri sviluppi significativi, come ad esempio l'ipotesi di Rie
mann, ma la sua conferma è uno di quei bei risultati che « met
tono ordine », che servono a dimostrare la natura sistematica della
matematica in generale, e dell' analisi complessa in particolare .
Vedremo ora di che si tratta.
Si supponga di avere una serie infinita della forma
B
= x + a2 x 2 + a 3 x 3 + . . . ,
244
CAPITOLO NONO
dove x è una variabile complessa e i coefficienti a 2 , a 3 , • • • sono
tutti numeri complessi (non si parla di au dal momento che il
coefficiente di x è I ) . Per un valore fissato della variabile x, la serie
infinita può dare un risultato finito, ossia una « somma ». Perché
questo accada, comunque, i termini successivi della serie dovranno
decrescere molto in fretta, così in fretta da neutralizzare l'effetto
della presenza di un numero infinito di addendi.
Ad esempio , la serie per sinx data prima è della forma di B :
.
x7 + . . .
xl + x5 - sinx = x - 3!
5!
4!
con a 2 = O, a 3 = J1 , a 4 = O, a 5 = i, , a6 = O ecc . Questa serie infi
nita dà un risultato finito per qualsiasi valore di x, perché i coeffi
cienti a. decrescono molto velocemente . Lo stesso è vero per la
serie che definisce ex, anche se questa non è della forma di B poi
ché comincia con I ; ma se si sottrae questo I iniziale allo scopo
di ottenere ex - I , allora si ha una serie nella forma di B che,
come sinx, dà una somma finita per qualsiasi valore di x.
Tuttavia, se i coefficienti non decrescono così rapidamente, l'esi
stenza di una somma finita può dipendere dal valore di x. Valori
piccoli di x possono portare a un risultato finito, valori più grandi
a un risultato infinito, in qualche caso addirittura a nessun risul
tato . In particolare, se x è minore di I , allora x• diminuisce al
crescere di n, e di conseguenza c'è la possibilità che si ottenga un
risultato finito; tutto dipende dalla dimensione dei coefficienti a .
•
Quando i matematici studiano serie della forma di B, spesso si occu
pano solo del comportamento delle serie per quegli x per cui x•
diminuisce con il crescere di n , vale a dire che essi considerano
solo gli x con valore assoluto minore di I . Il valore assoluto di un
numero complesso x, indicato con l x l , è la sua distanza dall'origine
sul piano complesso . Questa notazione è già stata introdotta per
i numeri reali, dove stava a significare la soppressione di qualsiasi
segno negativo . Se ci si pensa un attimo ci si renderà conto che
non c'è contraddizione, perché l'uso che se ne fa qui per i numeri
complessi è semplicemente un'estensione di quello precedente. Con
una semplice applicazione del teorema di Pitagora per i triangoli
rettangoli, se x = a + i b, allora l x i = ..Ja 2 + b 2 •
PROBLEMI SUI NUMERI COMPLESSI
245
Pensato sul piano complesso, l'insieme dei numeri complessi x
per cui l x l < I formerà un disco circolare di raggio I con il centro
nell'origine, che di solito è detto semplicemente disco unitario .
Quindi dire che x giace nel disco unitario equivale a dire, in lin
guaggio geometrico , che l x l < r .
Ora il lettore supponga di avere una serie della forma di B e
che questa serie dia un risultato complesso finito (che indicheremo
con f(x)) per tutti i valori di x del disco unitario . Così la serie deter
mina una funzione f che a ciascun x appartenente al disco unita
rio assegna un valore /(x) . È possibile che la funzione f abbia lo
stesso valore per due diversi x; ad esempio, si immagini che la serie
B abbia a2 = I e che tutti gli altri coefficienti an siano zero, così
che f(x) = x + x 2 ; allora, come il lettore potrà verificare da sé,
/(- j ) e /( - -} ) valgono entrambi - -} . Se questo non accade
(cioè, se valori diversi di x danno sempre risultati diversi) , allora
la funzione /(x) si dice iniettiva : ogni valore /(x) proviene da un
solo valore di x. I matematici danno un nome a questa proprietà
particolare, perché è molto utile (un po ' come la monogamia nelle
società moderne) .
Supponiamo d'ora in poi che la nostra serie B , qualunque essa
sia, generi una funzione inietti va f che ha valori finiti per ogni
x appartenente al disco unitario . Allora è possibile raffigurare geo
metricamente l' azione di / nel piano complesso: a ogni punto x del
disco unitario è associato un altro punto /(x) in qualche parte
del piano complesso . L'insieme di tutti i valori di /(x) ottenuti in
questo modo sarà un sottoinsieme del piano complesso, ed è natu
rale chiedersi quanto sarà grande questa regione . Poiché i valori
di x con cui si parte devono provenire dal disco unitario, e poiché
questo è piccolo in confronto all'intero piano complesso che si
espande all'infinito in tutte le direzioni, si potrebbe essere tentati
di pensare che la regione dei valori /(x) sia soltanto una piccola
parte del piano . Ma si ricordi che sia il disco unitario che l'intero
piano complesso contengono infiniti punti e, come è stato ampia
mente dimostrato nel capitolo 2 , gli insiemi infiniti non si com
portano affatto allo stesso modo dei più familiari insiemi finiti .
Qui ne abbiamo una riprova: la risposta alla domanda posta prima
è che la regione dei valori di /(x) può essere praticamente l'intero
piano complesso ! Perché ciò si verifichi non occorre una funzione
CAPITOLO NONO
particolarmente strana. La cosiddetta funzione di Koebe ne è un
esempio . Essa può essere definita tramite la formula
K (x) =
(r
x
-
x) 2
oppure tramite la serie
K(x) = x + 2 X 2
+ 3 x3 + 4x4 + 5 x5 + . . .
Poiché la funzione di Koebe proviene da una serie infinita nella
forma di B e poiché è iniettiva, è proprio il tipo di funzione che si
cercava. L'insieme di tutti i valori della funzione di Koebe per x
appartenente al disco unitario è costituito da tutti i numeri com
plessi, tranne quelli posti sull ' asse reale a sinistra di
{ . Geo
metricamente, questa funzione è senz' altro la più grande possi
bile (dove « grande » si riferisce alla dimensione della regione di
valori) .
Poiché la funzione di Koebe è una sorta di « funzione record »,
è naturale domandarsi se questa proprietà si rifletta nei singoli coef
ficienti della sua serie B . Ad esempio, ciascun coefficiente è il più
grande coefficiente possibile? Vale a dire: supposto che si prenda
una qualsiasi serie della forma di B che determina una funzione
iniettiva/ a valori finiti per tutti i numeri x del disco unità, è vero
che
l a2 l � 2 , l a 3 l � 3 , l a 4 l � 4 , . . . ?
-
Oppure, per capovolgere la domanda, se una data serie B ha uno
o più coefficienti che non soddisfano la disuguaglianza data sopra
(ad esempio, se l a1 6 1 l = r 6 3 ,5) ne segue allora che / non è una
funzione iniettiva oppure, ancor peggio, che esiste un qualche valore
x del disco unitario tale che B (x) non è finito?
Questa è la domanda che il matematico tedesco Ludwig Bie
berbach si era posto all'inizio di questo secolo, e per la quale, in
uno scritto del r 9 r 6, ipotizzò che la risposta fosse positiva. Però
l'unico coefficiente per cui riuscì a confermare la sua ipotesi fu
il primo; dimostrò cioè che l a 2 1 � 2 .
A questo punto ebbe inizio la storia. La congettura sembrava
abbastanza ragionevole, proprio il tipo di risultato « ordinato » a
cui così spesso porta l' analisi complessa, e si poteva dare per sco n-
247
PROBLEMI SUI NUMERI COMPLESSI
tato che non sarebbero mancati matematici disposti a tentare una
dimostrazione. Sarebbe comunque trascorso molto tempo prima
che si giungesse alla soluzione .
Dopo Bieberbach, il primo risultato fu ottenuto da un altro tede
sco, Charles Lowner, che nel 1 9 2 3 sviluppò un metodo che gli per
mise di confermare la congettura per il coefficiente a 3 , dimostran
do che l a 3 1 � 3 · Solo nel 1 955 Garabedian e Schiffer, che lavo
ravano negli Stati Uniti, riuscirono a dimostrare la congettura per
il coefficiente successivo, a 4 • Poi, nel 1 968, Pederson e Ozawa
tralasciarono a5 per dimostrare la congettura per a6, e nel 1 9 7 2
Pederson e Schiffer insieme riuscirono a risolvere il caso a5 che
era stato tralasciato . Lo stesso anno Ozawa e Kubota dimostra
rono che l a8 1 � 8, tralasciando a71 risultato che segnò la fine di
questi progressi a piccoli passi .
L'avanzamento era davvero lento, senza contare che con un pro
cedimento di questo tipo che esamina i coefficienti a uno a uno
non è possibile dimostrare la congettura nella sua completezza, poi
ché essa vale per ognuno degli infiniti coefficienti . C ' era comun
que sempre la probabilità che tale metodo riuscisse a portare alla
intuizione che occorreva per risolvere questo complesso problema.
Così avvenne: quando Louis de Branges nel 1 984 finalmente dimo
strò la congettura, il suo metodo si basava in parte sul lavoro pre
cedente compiuto nel 1 9 2 3 da Lowner, il primo a dedicarsi al pro
blema dopo Bieberbach . Ma siamo andati troppo in fretta; mentre
si progrediva lentamente con il metodo che affrontava un coeffi
ciente alla volta, allo stesso tempo si stava seguendo anche un' al
tra strategia .
L'idea era di studiare disuguaglianze della forma
l an l � Cn,
dove C è una costante, e vedere quanto poteva essere reso piccolo
C, pur restando la disuguaglianza valida per tutti i valori di n. Per
dimostrare la congettura di Bieberbach, bastava provare che C = r
era accettabile; ma quanto ci si poteva avvicinare a questo valore?
Il primo risultato di questo tipo fu trovato da } . E. Littlewood,
che nel 1 9 2 5 dimostrò che C = e andava bene (si ricordi che e è
quasi uguale a 2 , 7 1 8) . In seguito parecchi studiosi continuarono
ad abbassare costantemente questo valore : nel 1 956 Milin dimo-
CAPITOLO NONO
strò che si può prendere C = 1 , 243 ; nel 1 97 2 FitzGerald (il desti
natario delle 3 85 pagine manoscritte di cui si è parlato all'inizio
di questo capitolo) abbassò il limite a C = 1 ,08 1 ; e nel 1 978 un
suo studente, David Horowitz, lo fece scendere a 1 ,066 . Si sta
vano avvicinando, ma non abbastanza. Finalmente, nel 1 984 si
giunse alla risoluzione completa della congettura di Bieberbach,
che, come si è già detto, si basava non sul metodo della « ridu
zione del C », bensì sul lavoro originario di Lowner del 1 9 2 3 .
Per dimostrare la congettura per a 3 , Lowner introdusse un'e
quazione differenziale alle derivate parziali le cui soluzioni appros
simano una qualsiasi funzione iniettiva sul disco unitario . A que
sto punto, il trucco stava nel tradurre la matematica in termini
fisici, come ad esempio il flusso dell'acqua lungo un fiume. L'equa
zione differenziale rappresenta un flusso in espansione lungo il quale
è possibile trasmettere informazioni, in particolare stime della gran
dezza dei coefficienti nella serie B per la funzione. Per la sua dimo
strazione, de Branges introdusse certe funzioni ausiliarie, t1 , t2 ,
per conservare l'informazione desiderata, dove ciascun tk era
definito da una equazione differenziale che implicava tutte le fun
zioni precedenti fino a tk - I · La dimostrazione della congettura di
Bieberbach (o meglio, della congettura più forte di Milin, di cui
si è detto) si ridusse quindi alla dimostrazione che queste funzioni t
soddisfacevano determinate condizioni . Tutto sommato, si rivelò
un modo « antiquato » di affrontare il problema, simile a un grande
esercizio da giocoliere, in cui de Branges tentava di tenere molte
palle contemporaneamente in aria. Ma funzionò .
• • •
C apitolo
10
Nodi e altre questioni topologiche
Boy scout, fisici e un altro libro
Come possiamo distinguere un nodo « piano » da un nodo « vac
caio »? Un boy scout non avrebbe difficoltà a rispondere, ma cosa
direbbe un matematico? Il 1 984 ha visto alcuni sviluppi significa
tivi che hanno avuto ripercussioni su questo problema.
I fisici usano il modello matematico giusto per studiare l'uni
verso spazio-tempo quadridimensionale in cui viviamo? Fino al
1 982 tutti i matematici avrebbero detto: « Sì, certo, è il solo modello
possibile ». Ma oggi ne sappiamo di più . Esistono tipi di matema
tica completamente diversi che si applicano all'universo quadridi
mensionale, ma solo a questo : per due dimensioni, o per tre, o per
cinque, sei e oltre non occorre questo trattamento particolare. Lo
spazio quadridimensionale è singolare non soltanto perché il nostro
universo risulta essere quadridimensionale: lo è anche dal punto
di vista matematico, ma in modo del tutto inaspettato .
Questi sono soltanto due tra i problemi affrontati negli ultimi
anni in quel vasto settore della matematica conosciuto come topo
logia, argomento oggi così ampio che si potrebbe scriverei sopra
un libro intero, anziché quest'unico capitolo . La topologia (perlo
meno in certi suoi aspetti) pervade la maggior parte della matema
tica dei nostri giorni, per non parlare dei suoi profondi collega
menti con la fisica moderna. L' argomento è già emerso in modo
esplicito nel capitolo 7 , nel corso della discussione sul teorema dei
quattro colori (in altri capitoli non sono stati menzionati i collega
menti con gli argomenti in questione, sebbene ne esistano) . Eppure
CAPITOLO DECIMO
la topologia non ha neanche un secolo di vita. Sebbene alcune delle
idee risalgano a Eulero e a Gauss, fu solo negli ultimi anni del secolo
XIX, con il lavoro di Henri Poincaré e altri, che la topologia ebbe
inizio.
Questo capitolo tratterà solo di due aspetti della topologia: la
teoria dei nodi, un settore affascinante, sebbene altamente specia
lizzato, e la teoria delle varietà, lo studio delle proprietà delle figure
geometriche e delle loro generalizzazioni . La maggior parte degli
esperti in topologia considererebbe la teoria delle varietà come il
cuore della loro disciplina. Un tema che non sarà trattato, seb
bene soddisfi tutti i criteri per essere incluso in questo libro, è
la teoria delle catastrofi, un' applicazione della teoria delle varietà
che fu sviluppata a metà degli anni sessanta dagli studiosi di topo
logia René Thom e Christopher Zeeman (è disponibile un valido
trattato divulgativo sull' argomento) . *
Sebbene la topologia sia un argomento estremamente difficile
da penetrare, l'unica cosa che si richiede a un profano interessato
alla materia per poterne cogliere i princìpi generali è una certa faci
lità a visualizzare gli enti geometrici. Per questo motivo il reso
conto che segue ha un'impostazione essenzialmente geometrica.
Cos 'è la topologia?
La topologia è una parte della matematica che è a un tempo
facile da descrivere e molto difficile da capire a fondo . La si può
definire semplicemente come lo studio di quelle proprietà degli
enti geometrici che rimangono inalterate quando questi vengono
sottoposti a trasformazioni continue. A livello intuitivo, una tra
sformazione continua (nota anche come trasformazione topologica)
può essere vista come un processo che piega, tende, comprime,
torce l'oggetto, o come qualsiasi combinazione di queste azioni
(dando per scontato che l'oggetto sottoposto a deformazione sia
idealmente elastico e suscettibile di manipolazioni di qualsiasi
entità) ; il tutto, però, a condizione che i punti dell'oggetto che
* A . Woodcock e M. Davis, Catastrophe Theory , Penguin, London 1 980 [trad . i t . La teoria
delle catastrofi, Garzanti, Milano 1 98 2 ] .
NODI E QUESTIONI TOPOLOGICHE
sono tra loro vicini prima della trasformazione rimangano vicini
nell'oggetto trasformato . Se formulata matematicamente, cosa per
nulla facile, questa condizione non è, come potrebbe sembrare,
in contraddizione con il fatto che l'oggetto può essere sottoposto
a una tensione di qualsivoglia grado : semplicemente, impedisce
qualsiasi taglio, lacerazione o incollamento dell'oggetto. Questo
almeno in termini generali: è concesso tagliare l'oggetto per ren
dere possibile una manipolazione altrimenti impossibile, e poi incol
lare nuovamente le estremità tagliate, in modo che i punti che erano
originariamente vicini tornino a essere vicini . Ad esempio, per tra
sformare l'oggetto illustrato nella figura 1 0 . 1 a in quello della figura
{b)
(a)
{c)
Figura 1 0 . 1
Un enigma con gli anelli. Si immagini l'oggetto in (a) costituito da un materiale perfet
tamente elastico. Si riesce a deformarlo in modo da separare i due anelli, come appaiono
in (b)? La soluzione più ovvia consiste nel praticare un taglio a uno degli anelli, come
si può vedere in (c) , separare i due anelli, quindi unire nuovamente le due estremità
tagliate. Dando per scontato che i due capi liberi vengano ricongiunti in modo da ritor
nare ad essere esattamente come erano prima del taglio (cioè senza ruotare uno dei
due capi), questo procedimento è una trasformazione topologica legittima di (a) in (b) .
Ma in realtà è possibile trasformare (a) in (b) senza praticare alcun taglio, manipolando
semplicemente l'oggetto in modo appropriato . Chi non sapesse farlo, troverà la solu
zione nella figura 1 0 . 1 5 .
CAPITOLO DECIMO
I o. I b mediante una trasformazione continua, si può tagliare uno
dei due anelli incastrati e separarlo dall' altro, come da figura I O . I C,
quindi riattaccare i due capi tagliati . Poiché i due oggetti sono tra
sformabili in questo modo l'uno nell' altro, essi sono detti topolo
gicamente equivalenti. In effetti, per questo esempio specifico non
è necessario eseguire un taglio, ma è possibile trasformare la figura
I o . Ia nella figura I o . I b solo stirando e piegando . (Riesce il let
tore a capire come si fa? La soluzione è data nella fig . I O . I 5 ,
alla fine del capitolo) . Questo esempio serve a dimostrare che
anche un semplice stiramento è un concetto abbastanza complesso
da afferrare .
Uno dei motivi per cui la definizione della topologia in termini
di « stiramento-taglio-incollamento » è inadeguata è che in realtà
tale descrizione è applicabile solo allo studio delle superfici (cioè
di oggetti bidimensionali) , mentre la topologia ha a che fare con
oggetti di qualsiasi numero di dimensioni : tre , quattro, cinque e
oltre . Ma esistono difficoltà anche per le superfici . Abituati come
siamo a pensare in termini di oggetti bidimensionali situati nello
spazio tridimensionale, è molto facile confondere le proprietà del
l' oggetto con le proprietà dello spazio che lo circonda. Anzi, pro
prio il concetto stesso di dimensione crea confusione : ad esempio ,
la sfera è considerata in questo capitolo una superficie sferica bidi
mensionale, non una palla solida, e un punto su questa superficie
può muoversi solo in due direzioni indipendenti. Tuttavia, la costru
zione fisica di una sfera si può eseguire solo in uno spazio ad almeno
tre dimensioni .
Per fare un altro esempio : la sfera e il toro * della figura I 0 . 2
sembrerebbero topologicamente distinti, e in effetti lo sono . Per
quanto stirati, piegati, o tagliati e riattaccati, risulta impossibile
trasformare uno nell' altro . Si ricordi che il procedimento che con
siste nel tagliare e riattaccare è ammesso solo a condizione che ven
gano attaccati insieme tutti i punti separati mediante il taglio ,
quindi non possiamo trasformare un toro in una sfera tagliandolo
in modo da formare un cilindro e poi incollare insieme le due estre
mità. La differenza fondamentale tra le due superfici sembrerebbe
consistere nel fatto che il toro ha un foro, eppure non è esatta* Come la sfera, anche questo deve essere pensato come una superficie vuota.
253
NODI E QUESTIONI TOPOLOGICHE
(a)
(b)
Figura 1 0 . 2
L a sfera (a) e il toro (b) . I n topologia sono viste come superfici (vuote), non come oggetti
solidi. È evidente che non è possibile deformare una delle due figure nell'altra con mezzi
topologici, e che quindi esse non sono topologicamente equivalenti. Per dimostrarlo
bisognerebbe provare che esiste una proprietà topologica non comune a entrambe . D
« foro » del toro sembrerebbe fare al nostro caso . Purtroppo esso non è una proprietà
della superficie, ma dello spazio circostante. La proprietà topologica che differenzia
queste due figure è la caratteristica di Eulero, che, quantunque sia una proprietà della
superficie, corrisponde fedelmente al foro del (o meglio « dello spazio intorno al ») toro.
mente cosl . Il toro è una superficie liscia del tutto priva di fori :
se fossimo costretti a viverci sopra, potremmo vagare su tutta la
superficie senza incentrarne uno. n foro dipende, invece, dal modo
in cui questa particolare superficie è situata nello spazio tridimen
sionale : per dirla in altre parole, il foro è qualcosa nello spazio cir
costante, non nella superficie . Questo non significa che il foro sia
irrilevante nella topologia del toro, bensl che non è una proprietà
della superficie . Esiste una proprietà topologica del toro che è stret
tamente collegata con l'esistenza del foro nello spazio circostante,
cosa che si vedrà tra breve, e che è utile per distinguerlo dalla sfera.
La distinzione tra le proprietà di una superficie e le proprietà
dello spazio circostante è sottile . Il concetto può risultare un po '
più chiaro quando lo si raffronti con la nozione topologica di bordo.
Né la sfera né il toro hanno bordi: sono entrambi superfici chiuse,
cioè prive di bordi . Un disco ha un solo bordo; un disco conte
nente un foro (come ad esempio uri disco da grammofono) ne ha
due. Se prendiamo una striscia di carta e incolliamo insieme le estre
mità a formare una fascia cilindrica (fig. I O . Ja) otteniamo una
superficie con due bordi . Se diamo un mezzo giro alla striscia
prima di incollare le estremità (fig . I O . Jb) , otteniamo una super-
2 54
CAPITOLO DECIMO
(a)
(b)
Figura 1 0 . 3
L a fascia cilindrica (a) e i l nastro d i Mobius (b) . L a fascia cilindrica è un esempio di
superficie orientabile con due bordi; il nastro di Mobius è una superficie non orienta
bile con un solo bordo. Per costruire un nastro di Mobius con una striscia di carta,
è sufficiente dare una mezza torsione alla striscia prima di incollare insieme le due estre
mità. Il nastro di Mobius possiede alcune curiose proprietà. Ad esempio, si potrebbe
indagare che cosa accade quando il nastro di Mobius viene tagliato a metà lungo la
linea tratteggiata indicata. Il risultato non è affatto quello che ci si potrebbe aspettare.
Si potrebbe anche praticare un taglio simile su un altro nastro di Mobius , ma questa
volta a un terzo dal bordo.
fide con un solo bordo conosciuta con il nome di nastro di Mobius
(è lo stesso Mobius che abbiamo incontrato nel cap . 9) .
Se dovessimo prendere due nastri di Mobius e incollarli bordo
con bordo, la figura che ne risulterebbe sarebbe una bottiglia di
Klein (vedi fig. 7 · 1 4) . Tuttavia, lavorando nello spazio tridimen
sionale questa costruzione non è possibile, e la si può raffigurare
soltanto permettendo alla superficie di passare attraverso se stessa.
Detto per inciso, asserzioni del tipo: « <l nastro di Mobius (o la
bottiglia di Klein) è una superficie con una sola faccia » sono un
po' ambigue quando sono usate per esprimere le idee fondamen
tali della topologia delle superfici, dal momento che anche il con
cetto di faccia dipende dal fatto che l'oggetto è considerato in uno
spazio di tre o più dimensioni dal cui punto di osservazione è pos
sibile guardar sulle facce della superficie. Scoprire che è impossi
bile colorare quelle che appaiono come le due facce di un nastro
di Mobius o una bottiglia di Klein usando due colori diversi (si
provi a farlo, almeno per un nastro di Mobius, e si veda che cosa
accade) certamente aiuta a rendersi conto della natura insolita di
queste superfici, ma non fa emergere la vera proprietà topologica
che le distingue, che in questo caso non è il concetto di faccia,
ma di orientabilità. Quindi, d'ora innanzi, cercate di non pensare
alle superfici come dotate di facce.
2 55
NODI E QUESTIONI TOPOLOGICHE
Si dice che una superficie è orientabile se il « senso orario » e
il « senso antiorario » sono distinguibili nel modo che segue. Suppo
niamo di disegnare un piccolo cerchio sulla superficie, meglio ancora
«nella » superficie (ricordiamo che non ci sono facce) , e di dargli
una direzione, come nella figura 1 0 . 4 . Allo ra, comunque muoviamo
il cerchio sulla - o meglio « nella » superficie - non riusciremo
mai a invertire la direzione del cerchio (qui « piccolo » riferito al
cerchio significa abbastanza piccolo per poter essere mosso libe
ramente su tutta la superficie senza rimanere impigliato in qual
che foro, protrusione o altro) . La banda cilindrica (fig. r o . 3a ) è
orientabile; il nastro di Mobius (fig. r o . 3b ) è non orientabile. Per
rendersene conto da solo, il lettore dovrebbe costruirsi le fasce
con un materiale trasparente (ottimi allo scopo sono i lucidi per
lavagne luminose) , cosicché quando disegna i cerchi orientati questi
possano essere visti da entrambi i lati e possano quindi conside
rarsi « nella » superficie. Ora, partendo da un piccolo cerchio su
cui è stata indicata la direzione con una freccia, disegnato in qual
che punto della fascia, lo si trasli lungo la superficie, riprodu
cendolo, freccia compresa, in successione a intervalli regolari.
Con il nastro di Mobius (fig. r o . 5 ) , quando ritorniamo al punto
di partenza (si potrebbe erroneamente pensare di essere sulla fac
cia opposta a quella iniziale) scopriremo che il cerchio ha la free-
(a)
(b)
Figura r o - 4
Orientabilità. Una superficie è detta orientabile se è impossibile trasformare un cer
chio orientato in senso antiorario (a) in uno orientato in senso orario (b) spostandolo
su di essa. L' orientabilità è la proprietà topologica delle superfici che corrisponde alla
nozione intuitiva di << dotato di due facce » (come nella fascia cilindrica) ; la non orien
tabilità corrisponde a << dotato di una sola faccia >> (come nel nastro di Mobius) .
CAPITOLO DECIMO
Figura 1 0 . 5
L a non orientabilità del nastro d i Mobius. Si costruisca un nastro d i Mobius con una
striscia di materiale trasparente e si veda cosa accade quando si sposta lungo il nastro
un cerchio su cui è stata indicata la direzione.
eia puntata nel verso opposto : la sequenza di cerchi mostra come
il senso orario e il senso antiorario possano essere invertiti senza
mai abbandonare la superficie; questo significa essere non orien
tabile. Con la fascia cilindrica, tale inversione non è possibile; que
sto significa essere orientabile.
Come si fa topologia?
Una risposta scherzosa e anche pertinente sarebbe: « Con molta
cura ». I tipi di trasformazione ammessi in topologia implicano che
la maggior parte delle proprietà correnti delle figure geometriche
non sono più applicabili. Nella geometria classica, che possiamo
descrivere come lo studio delle proprietà di oggetti che rimangono
invariati se sottoposti a trasformazioni rigide (traslazione, rotazione
e riflessione) , si usano concetti quali linearità, circolarità, angolo,
lunghezza, area e perpendicolarità. Nessuna di queste espressioni
ha senso in topologia, dal momento che tutto può essere distrutto
o alterato per mezzo di trasformazioni continue .
Nella geometria classica, per verificare se due oggetti sono uguali
si vede se è possibile, in senso astratto, spostare uno dei due con
una trasformazione rigida in modo che venga a occupare esatta
mente la stessa posizione dell'altro . Questo vuoi dire trasformare
un oggetto in un altro. Se questa trasformazione è possibile, allora
si dice che i due oggetti sono « uguali » o « identici » o, in termini
NODI E QUESTIONI TOPOLOGICHE
257
più formali, geometricamente equivalenti. Per dimostrare che due
oggetti non sono uguali, si può trovare una proprietà geometrica
specifica differente per i due, ad esempio che uno è più grande
dell' altro o che un angolo è diverso . Tutto questo è così familiare
da sembrare troppo banale per essere ricordato : noi confrontiamo
continuamente oggetti in questo modo. In topologia si adotta esatta
mente lo stesso procedimento, ma con la differenza che le trasfor
mazioni e i concetti usati sono diversi e non altrettanto familiari .
Per dimostrare che due oggetti sono topologicamente equiva
lenti* cerchiamo una trasformazione topologica, cioè continua, che
porti l'uno nell'altro . Ad esempio, un triangolo e un cerchio sono
topologicamente equivalenti, essendoci un modo del tutto ovvio
di deformare l'uno nell' altro . Per dimostrare che due oggetti sono
topologicamente distinti, cioè non equivalenti, si cerca una pro
prietà topologica che solo uno dei due possiede: l' avere un bordo,
ad esempio . Il disco ha un bordo, la sfera no, quindi i due oggetti
sono topologicamente differenti: non è possibile deformare in modo
continuo un disco in una sfera e viceversa. Per distinguere dal punto
di vista topologico due superfici chiuse (cioè prive di bordi) come
una sfera e un toro, occorre trovare qualche altra proprietà topo
logica. Il foro del toro non servirà, dal momento che, come abbiamo
visto, questo non è una proprietà topologica della superficie in sé;
né servirà il fatto di essere orientabile, poiché tutte e due le superfici
sono orientabili. Questo concetto servirà tuttavia a distinguere sia
la sfera sia il toro dalla bottiglia di Klein, che è non orientabile .
Uno dei primi compiti della topologia è perciò quello di trovare
proprietà topologiche sufficienti per poter distinguere due oggetti
non equivalenti, dimostrando che uno ha una proprietà specifica
che l' altro non ha. Queste proprietà, naturalmente, devono essere
comuni a tutti gli oggetti topologicamente equivalenti tra di loro,
cioè non devono mutare con trasformazioni continue. (Se mutassero,
non sarebbero proprietà topologiche ! ) Per questo motivo tali pro
prietà sono spesso chiamate invarianti topologici, termine migliore
di « proprietà », dal momento che molti sono invarianti numerici.
L'essere orientabile è un invariante topologico, come lo è anche
* I matematici usano le parole << uguale » e « identico >>, ma per il principiante esse hanno
una connotazione geometrica troppo forte, quindi qui , per quanto possibile, verranno evitate.
CAPITOLO DECIMO
il numero di bordi di una superficie: una superficie con un solo
bordo non può essere equivalente a una con tre bordi. Esiste un
ulteriore invariante topologico che, insieme ai due già menzionati,
è sufficiente a distinguere tra loro tutte le superfici non equiva
lenti . Ma prima di parlarne, è d'obbligo chiarire l'uso di espres
sioni quali « la » sfera o « la » bottiglia di Klein. Poiché due sfere
qualsiasi, per esempio, sono topologicamente equivalenti (possono
differire solo per posizione e per dimensione, nessuna delle quali
è un invariante topologico) dal punto di vista dell'esperto in topo
logia esse sono identiche; di conseguenza ha senso usare il termine
« la sfera », anche se l'oggetto che si sta osservando assomiglia a
una lunga salsiccia. Naturalmente se le sfere che si stanno consi
derando fossero due, tale uso dell' articolo determinativo sarebbe
inappropriato, ma quando si voglia semplicemente dare l'idea di
una sfera, l'espressione « la sfera » ha senso .
Veniamo ora al terzo invariante delle superfici . In realtà l'ab
biamo già incontrato nel capitolo 7, dove abbiamo visto che per
qualsiasi superficie il numero V E + F, ottenuto dal numero dei
vertici (V) , dei lati (E ) e delle facce (F) in una mappa o in un grafo
che ricopra l'intera superficie, è indipendente dalla rete scelta e
dalla sua posizione sulla superficie. Inoltre, si può dimostrare (ed
è certamente facile da credere) che questa quantità non viene alte
rata da alcuna trasformazione continua della superficie, ed è quindi
un invariante topologico, detto caratteristica di Eulero .
Per la sfera la caratteristica di Eulero è 2 , cioè V - E + F = 2
per ogni grafo che ricopre la superficie di qualsiasi oggetto topo
logicamente equivalente a una sfera. Per il toro è O, e quindi il
toro e la sfera, dal punto di vista topologico, sono distinti. (A pro
posito: la caratteristica di Eulero è in relazione con il foro del toro;
il doppio toro, che ha due fori, ha caratteristica di Eulero
2 , il
toro triplo ha caratteristica di Eulero - 4 e così via; una formula
generale sarà data più avanti) . Per la bottiglia di Klein la caratte
ristica di Eulero è, come per la sfera, O; quindi questo invariante
non le differenzia, ma, come si è già detto, in questo caso entra
in gioco l' orientabilità. I tre invarianti, numero di bordi, orienta
bilità e caratteristica di Eulero, sono sufficienti per distinguere
tutte le superfici bidimensionali .
-
-
NODI E QUESTIONI TOPOLOGICHE
2 59
Topologia dei nodi
Qualche esperto potrebbe sostenere che la topologia dei nodi
non è vera topologia e, in un certo senso, avrebbe ragione. La teo
ria dei nodi è, sì, un tipo di topologia, ma un tipo molto partico
lare. Nella teoria dei nodi gli enti che interessano sono necessaria
mente oggetti dello spazio tridimensionale . In due dimensioni
sarebbe impossibile costruire un nodo : non c'è abbastanza spazio
per avvolgere lo spago su se stesso . In quattro o più dimensioni
c'è « troppo » spazio: qualsiasi nodo si scioglierebbe immediatamente
per lasciare uno spago non annodato . Inoltre, il tipo di deforma
zioni topologiche che si possono praticare sui nodi escludono in
modo specifico il procedimento di taglio e incollamento che è lecito
in una trasformazione topologica generale (il motivo di tale limi
tazione è ovvio) .
Quindi che cos' è la teoria dei nodi? Proprio ciò che il nome
suggerisce: uno studio matematico dei nodi . Due esempi semplici
di nodi sono raffigurati nelle figuré I o . 6a, b: il nodo semplice e
il nodo a otto . Se prendiamo un pezzo di spago ed eseguiamo uno
o l' altro di questi due nodi, scopriremo che essi lo annodano vera
mente, non lo aggrovigliano solamente. La differenza è che un nodo
può essere disfatto solo tirando un'estremità libera attraverso un
laccio, mentre un groviglio si può districare anche se le due estre
mità sono fisse. Inoltre, il nodo semplice e quello a otto sembrano
abbastanza diversi: non è possibile trasformare uno nell' altro se
non infilando o sfilando un capo libero . Se tutti e due i capi sono
fissi, sarà materialmente impossibile far diventare a otto un nodo
semplice .
Fino a questo punto le cose sembrano facili, ma ci si muove
già su un terreno pericoloso . Si potrebbe giocare con un pezzo di
spago per mezz'ora e finire per non riuscire a slegarlo o a trasfor
mare un nodo nell'altro . Tuttavia, questo fatto non prova certo
che lo spago sia annodato o che due nodi siano veramente diffe
renti. Può darsi semplicemente che non si sia trovata la sequenza
corretta dei movimenti da compiere (si veda il puzzle della fig. I o . I ) .
Che cosa accadrà con configurazioni dall' aspetto molto complesso?
Quando un lungo pezzo di spago o di filo si aggroviglia, è impos-
CAPITOLO DECIMO
(a)
(b)
(c)
(d)
Figura 1 0 . 6
Nodi base: (a) semplice, (b) a otto, (c) semplice chiuso, (d ) quadruplo . I primi due tipi
si potrebbero costruire con un pezzo di spago . Comunque, per uno studio matematico
le estremità libere devono essere unite tra loro a formare un laccio chiuso. Unendo le
estremità di (a) si ottiene (c) ; unendo le estremità di (b) si ottiene (d ) . I disegni (c)
e (d ) sono esempi di diagrammi di nodi.
sibile dire se sia semplicemente aggrovigliato (nel qual caso lo si
può distendere tirando i due capi) o se sia proprio annodato . Il
groviglio di filo che si presenta molto complicato potrebbe benis
simo non nascondere alcun nodo o nascondere solo un nodo sem
plice; i prestigiatori usano spesso nodi che sembrano strabilianti,
ma che in realtà non annodano affatto la fune. È davvero una mate
ria che può creare notevole confusione e che va affrontata con cau
tela, cioè con un approccio matematico rigoroso . Questo è pro
prio quello che fa la teoria dei nodi .
Dovendo studiare le caratteristiche dei nodi, la prima cosa da
fare è sbarazzarsi dei capi liberi . Sebbene i capi liberi siano essen
ziali quando si voglia effettivamente legare un nodo, la loro pre
senza impedirebbe uno studio matematico, dal momento che sia
il legare sia lo slegare sono processi topologici che non richie
dono taglio . In altre parole, da un punto di vista topologico nes-
NODI E QUESTIONI TOPOLOGICHE
suno spago con capi liberi può essere annodato . La soluzione più
semplice consiste nell'unire insieme i capi liberi per formare un
laccio chiuso (e presumibilmente annodato) . Quando i capi liberi
dei due nodi delle figure r o . 6a , b vengono uniti, i nodi matema
tici che ne risultano sono quelli che compaiono nelle figure r o . 6c , d.
Un nodo, allora, è semplicemente un laccio chiuso di spago, filo
o simili. In via eccezionale, questa definizione comprenderà anche
il semplice laccio chiuso non annodato; noto come nodo « banale »,
è abbastanza simile al numero zero in aritmetica o all'insieme vuoto
nella teoria degli insiemi. Due nodi si dicono equivalenti quando
sono trasformabili uno nell' altro con un processo topologico che
non implichi alcun taglio . Lo scopo principale della teoria dei nodi
è di trovare un insieme di invarianti di nodo che serva a distin
guere due nodi qualsiasi non equivalenti, proprio come l'orienta
bilità e la caratteristica di Eulero servono a distinguere due super
fici chiuse qualsiasi non equivalenti. In particolare, dovrebbe essere
possibile stabilire se un nodo dato è veramente annodato o se è
equivalente al nodo banale, vale a dire a un semplice laccio di spago.
Il primo ad occuparsi di nodi sembra sia stato il solito Gauss. In
fatti, il suo allievo Listing dedicò all'argomento un'ampia parte della
sua monografia Vorstudien zur Topologie ( r 847) , studi che furono
in seguito sviluppati da altri . Tuttavia solo intorno al r 9 r o Dehn
riuscì a dimostrare l'esistenza di un nodo non banale: fino ad allora
era teoricamente possibile che non esistessero veri nodi da studiare!
Gran parte del lavoro iniziale, svolto da Kirkman, Tait, Little
e altri nel periodo tra il r 87o e il r 9oo, riguardava la classifica
zione dei cosiddetti nodi primari, che, come si può immaginare,
sono nodi che non possono essere spezzati in due nodi più piccoli.
Essi furono classificati in base al numero di incroci. Per ottenere
il numero di incroci di un nodo, innanzitutto lo si appiattisce su
di una superficie, fisicamente se si tratta di un nodo di spago,
oppure per mezzo di una proiezione se si tratta di un nodo ideale .
Quindi lo si manipola in modo che abbia meno incroci possibili
e che in un unico punto non ci siano tre o più sovrapposizioni (un
incrocio è un punto in cui lo spago si sovrappone a se stesso) . Allora
il numero totale di punti in cui lo spago incrocia se stesso è il numero
di incroci del nodo, che è un invariante del nodo . Ad esempio, i
nodi delle figure r o 6 c , d sono presentati conformemente al pro.
CAPITOLO DECIMO
cedimento descritto; osservandoli, possiamo dire che hanno rispet
tivamente 3 e 4 incroci. (Sono anche nodi primari) .
Essendo un invariante del nodo, il numero di incroci può essere
usato per distinguere i nodi non equivalenti: se due nodi hanno
un numero diverso di incroci, allora non possono essere equiva
lenti. Il concetto, tuttavia, non è utile come si potrebbe credere .
Da un lato, molti nodi differenti possono avere lo stesso numero
di incroci, cosi che spesso l'invariante non riesce a evidenziare la
non equivalenza. Dall' altro, può essere molto difficile calcolare il
numero di incroci, poiché si deve disporre il nodo in modo che
non ci siano lacci o sovrapposizioni superflue, cosa che non è cosi
semplice neppure per nodi abbastanza comuni.
Ciò nonostante, prima della fine del secolo XIX erano stati indi
viduati e tabulati molti nodi primari con un numero di incroci fino
a I o . Non si sapeva se le tavole contenessero tutti i nodi per ciascun
numero di incroci o se ci fossero delle ripetizioni: nodi apparente
mente diversi ma in realtà equivalenti potevano comparire come
voci separate . Nel I 9 2 7 , J. W . Alexander e G . B . Briggs studia
rono questo problema e riuscirono a dimostrare che le tabelle non
contenevano doppioni fino a 8 incroci compresi. I loro metodi por
tarono quasi a risultati positivi anche per nodi con 9 incroci; non
riuscirono a distinguere solo tre coppie, di cui si occupò in seguito
Reidemeister. Solo nel I 974 Perko riusd a distinguere tutti i nodi
tabulati con I O incroci . Per quanto riguarda la questione di tro
vare nuovi nodi non compresi nelle vecchie tavole del secolo XIX ,
si fecero ben pochi progressi prima del I 96o, quando John Hor
ton Conway di C ambridge inventò una nuova e più efficace nota
zione. Questa gli permise non solo di scoprire alcuni nodi primari
che erano sfuggiti ai ricercatori che lo avevano preceduto, ma anche
di ampliare le tavole in modo da inserirvi nodi primari con I I
incroci. Esistono, sembrerebbe, 8o i nodi primari con I I incroci
al massimo, tra i quali uno con 3 , uno con 4, due con 5 , tre con 6,
sette con 7 , ventuno con 8 , quarantanove con 9 , centosessanta
cinque con I O , cinquecentocinquantadue con I 1 . * Non è stato
* I nodi primari con 3 e 4 incroci sono quelli delle figure x o . 6c , d. Per esempi e figure di
nodi primari con incroci fino a 9 si veda J. W . Alexander e G . B . Briggs , On types o/ knotted
curves, << Annals of Mathematics >>, xxvm ( 1 9 2 7 ) , pp. 562-86. Per i nodi con x o intersezioni
si veda K. A. Perko, On the classification o/ knots, <<Procedings of the American Mathematical
Society », XLV ( 1 9 7 4 ) , pp. 262-66.
NODI E QUESTIONI TOPOLOGICHE
dimostrato in modo definitivo che le nuove tavole siano complete,
anche se si pensa che lo siano, né si può escludere che vi siano
delle ripetizioni . Quindi non è garantito che queste cifre siano
corrette.
Il risultato di gran lunga più significativo nella teoria matema
tica dei nodi fu la scoperta che a ogni nodo può essere associato
un certo gruppo, il cosiddetto gruppo del nodo (si veda il cap. 5
per un'introduzione al concetto matematico di gruppo) . Questa
è una di quelle belle occasioni in matematica in cui i concetti di
base e i risultati conseguiti in una parte della materia si rivelano
utili in un' altra: nel caso specifico, l' applicazione della teoria dei
gruppi alla teoria dei nodi .
La costruzione del gruppo del nodo è facile e si può darne un'i
dea prendendo come esempio il nodo semplice (fig. I o . 7) . Si inco
minci col scegliere un punto X non sul nodo (non importa dove
Figura 1 0 . 7
Costruzione del gruppo del nodo per i l nodo semplice.
CAPITOLO DECIMO
sia esattamente X, il gruppo finale che si otterrà sarà lo stesso
dovunque esso si trovi) . Ora, per costruire un gruppo si devono
fare tre cose: definire gli oggetti che costituiscono il gruppo, sta
bilire come due di essi si possano combinare insieme per produrre
un terzo oggetto che appartenga al gruppo e accertarsi che i vari
assiomi di gruppo (si veda p. 1 2 8) siano soddisfatti .
Gli oggetti che formeranno il gruppo del nodo sono i cammini
orientati, cioè dotati di frecce, che partono dal punto X, si avvol
gono attorno al nodo varie volte e ritornano al punto di partenza
(i cammini possono anche non passare materialmente attraverso
il nodo) . Non tutti questi cammini sono inclusi nel gruppo : si tra
scurano quelli con lacci superflui, che possono cioè essere elimi
nati senza alterare il modo in cui il cammino si avvolge attorno
al nodo; così il cammino g della figura I O . 7 non farà parte del
gruppo, mentre ne farà parte a. Inoltre, quando due cammini pos
sono essere deformati uno nell' altro (senza passare materialmente
attraverso il nodo) , come ad esempio i cammini a e b, solo uno
dei due è incluso nel gruppo . Ma si noti che i cammini c e d non
sono una coppia di questo tipo, poiché passano attorno al nodo
in direzione opposta, e la direzione è un elemento importante . Un
cammino particolare che è anche incluso nel gruppo è il « cammino
banale », di lunghezza O. Qualsiasi cammino che non si avvolga
affatto intorno al nodo, come il cammino h, è naturalmente defor
mabile in questo cammino banale, e quindi non è incluso nel gruppo.
Si noti che questa definizione darà origine a un gruppo che con
tiene un numero infinito di oggetti, poiché ci saranno infiniti cam
mini, tutti ben distinti (cioè non deformabili l'uno nell' altro) , che
si avvolgono intorno a una parte data del nodo un numero finito
di volte prima di ritornare al punto X.
Una volta stabilito che cosa sono gli oggetti del gruppo (e il fatto
che questi non siano proprio il tipo di oggetti che abitualmente
si pensa formino un gruppo dimostra quanto tale concetto sia anni
comprensivo) , il passo successivo consiste nel decidere come due
di tali oggetti possano essere combinati, o « moltiplicati ». Dati due
cammini orientati p e q, prendiamo il cammino formato da p seguito
da q. Sarà sempre possibile deformare questo cammino composto
in uno che è già stato messo nel gruppo, perché appartengono al
gruppo tutti i cammini tranne quelli deformabili in un altro che
NODI E QUESTIONI TOPOLOGICHE
già vi compare: questo cammino sarà il prodotto p * q dei due oggetti
p e q del gruppo . Per esempio, nella figura 1 0 . 7 , d * d = /, come
si può facilmente vedere. Combinando due cammini, può accadere
che due direzioni opposte si annullino e non lascino proprio nes
sun cammino: ad esempio, i cammini c e d si annulleranno, fatto
che può essere scritto come c * d = e, o d "�< c = e, se usiamo e per
indicare il cammino di lunghezza zero .
A questo punto si deve verificare (e lasciamo questo compito
al lettore) che queste definizioni diano un sistema che soddisfi gli
assiomi di gruppo . L'elemento neutro del gruppo è, ovviamente,
il cammino banale e. Osserviamo che il gruppo del nodo semplice
non è commutativo .
Il gruppo del nodo è un invariante del nodo, e questo sembra
scontato tenendo conto della definizione, che ammetteva defor
mazioni per tutti i cammini . Due nodi equivalenti daranno ori
gine allo stesso gruppo, cioè i gruppi associati saranno copie esatte
l'uno dell' altro per quanto concerne il loro comportamento glo
bale, sebbene i cammini specifici dei due gruppi saranno molto
probabilmente diversi . Per i gruppi finiti, un gruppo sarà la copia
esatta di un altro se ha uguale la legge di composizione (vedi cap. 5) .
Per i gruppi infiniti, come nel nostro caso, occorre la nozione mate
matica di isomorfismo per puntualizzare il concetto . Il gruppo del
nodo può, come il numero di incroci, essere usato per distinguere
i nodi non equivalenti, anzi: è un invariante molto più importante.
Infatti, esso riesce a « Catturare>> così bene la struttura del nodo,
come appare chiaro dalla sua definizione, che solo raramente due
nodi diversi risultano avere lo stesso gruppo associato . (Ma pro
prio i già citati nodo piano e nodo vaccaio sono una coppia di que
sto tipo, per cui non possiamo proprio dirci soddisfatti ! )
Quindi il gruppo del nodo sembra fornire u n ottimo sistema
per distinguere i nodi . C 'è tuttavia un problema: come ottenere
una descrizione algebrica del gruppo sufficientemente semplice?
Non si dimentichi che il gruppo del nodo è una struttura matema
tica astratta. Il modo che si è adottato per descriverlo non è certo
il più idoneo, essendo persino più complicato del nodo stesso ! For
tunatamente c'è una soluzione a questo problema: nel 1 9 1 0 Dehn
scoprì un modo per ottenere dal diagramma di un nodo qualsiasi
una descrizione algebrica semplice e concisa del gruppo associato .
CAPITOLO DECIMO
Ciò significa che il gruppo del nodo costituisce veramente un
ottimo e pratico mezzo di classificazione dei nodi; esso consente
di utilizzare le potenti tecniche della teoria dei gruppi per affron
tare il problema, portando talvolta all'individuazione di altri inva
rianti utili (uno dei quali, il polinomio di Alexander, sarà descritto
più avanti) . Nel frattempo, possiamo mostrare una semplice appli
cazione del gruppo del nodo . Soffermiamoci su questo quesito: è
possibile sciogliere un nodo dato (cioè far sì che diventi equiva
lente a un cerchio) aggiungendo un nodo supplementare allo spago
e poi districando ciò che ne risulta? La risposta è no . Praticare
un ulteriore nodo nello spago creerà un gruppo associato più grande
e più complesso di quello originario, mentre il gruppo del nodo
banale, cioè il cerchio, è isomorfo al gruppo dei numeri interi con
l'operazione di addizione. Essendo i loro gruppi diversi, i nodi non
possono essere equivalenti.
Un altro tipo di studio dei nodi si deve a Seifert, il quale nel
1 93 5 ideò un modo per costruire, per qualsiasi nodo dato, una
superficie orientabile che ha come solo bordo il nodo . Ora, un noto
risultato della topologia delle superfici (si veda il paragrafo seguente)
ci dice che qualsiasi superficie orientabile con un solo bordo è
topologicamente equivalente a un disco con un certo numero di
« manici ». Un manico viene aggiunto a un disco praticando due
fori nel disco stesso e tendendo un tubo cilindrico da un foro all'al
tro (vedi fig. r o . I 2 ) . Il numero di manici sul disco è detto genere
della superficie originaria, e, come la caratteristica di Eulero, è un
invariante topologico della superficie. Usando la costruzione di Sei
fert, è perciò possibile abbinare a qualsiasi nodo un determinato
numero naturale, cioè il genere della superficie di Seifert associata.
Questo numero è detto genere del nodo . In realtà c'è una piccola
complicazione, in quanto il metodo di Seifert può dare superfici
diverse, con generi diversi, partendo dallo stesso nodo; quindi biso
gna prendere il più piccolo numero di genere associato al nodo .
Come per il gruppo del nodo, calcolare il genere è un ottimo
modo per determinare se un nodo dato è proprio annodato o no .
Il genere del nodo banale è ovviamente zero, poiché il cerchio deli
mita un disco senza manici. Inoltre, sebbene non sia così scon
tato, il nodo banale è il solo con genere O. Così, per dimostrare
che un nodo è proprio un nodo, l'unica cosa da fare è dimostrare
NODI E QUESTIONI TOPOLOGICHE
che il suo genere è diverso da zero . Ma come si fa a calcolare il
genere di un nodo, dato ad esempio il suo diagramma, che è quanto
di solito ci viene presentato? Un metodo possibile fu proposto nel
I 96 2 da Wolfgang Haken, quello del teorema dei quattro colori
(si veda il cap. 7); in tempi più recenti, nel I 978, Geoffrey Hemion
utilizzò il risultati di Haken per costruire un algoritmo che stabi
lisce sempre se due diagrammi di nodi dati rappresentino nodi equi
valenti. Sfortunatamente, l' algoritmo non è abbastanza efficiente
per essere di grande utilità pratica (per una discussione sull'effi
cienza degli algoritmi si veda il cap. I I ) , ma ha il pregio di mostrare
che il problema della classificazione dei nodi, in linea di princi
pio, può essere risolto in modo meccanico .
Tra l' altro, sebbene la costruzione di Seifert fosse sviluppata da
un punto di vista geometrico piuttosto che algebrico, nel I 978 Char
les Feustel e Wilbur Whitten mostrarono come ottenere il genere
tramite il gruppo del nodo, sottolineando così ancora una volta
la natura fondamentale di tale gruppo .
A questo punto il lettore incomincerà a ·vacillare davanti alla
imponente mole delle tecniche matematiche che abbiamo tirato
in ballo per classificare i nodi, e potrà giustamente chiedersi se
non esista un modo più semplice per farlo . Ebbene, se si è dispo
sti ad accettare qualche imprecisione, un tale modo esiste. È offerto
dai cosiddetti polinomi del nodo , i più semplici dei quali sono i
polinomi di Alexander, scoperti da ]. W . Alexander nel I 9 2 8 . Seb
bene lo si possa ricavare dal gruppo del nodo, il polinomio di Ale
xander si può ottenere direttamente dal diagramma. Per il nodo
banale il polinomio di Alexander è il numero I , per il nodo sem
plice (fig. I o . 6c) è
x2 - x + I ,
per il nodo quadruplo (fig. I o .6 d ) è
x2 - 3 X + I .
Poiché questi due polinomi non sono chiaramente uguali, ne con
segue che il nodo semplice e il nodo quadruplo non sono equiva
lenti e che nessuno dei due è banale . Il polinomio di Alexander
di un nodo è un invariante molto utile: si presta a individuare tutti
i nodi primari con numero di incroci fino a 8, e tutti quelli con
9 incroci, tranne sei coppie .
CAPITOLO DECIMO
Due nodi che i polinomi di Alexander non sono in grado di
distinguere sono proprio il nodo piano e il nodo vaccaio. Entrambi
hanno 6 incroci, ma non sono primari, essendo ciascuno di loro
composto di due nodi semplici . Ciò che li distingue è il fatto di
essere l'uno sinistrorso e l' altro destrorso (fig. I o . 8) . Entrambi
hanno il polinomio di Alexander pari a
(x 2 - x + 1 ) 2
(non è casuale che questo sia proprio il quadrato del polinomio,
del nodo semplice, perché il polinomio di Alexander di qualsiasi
nodo composto è il prodotto dei polinomi dei nodi che lo com
pongono) . Non si incolpi il polinomio di Alexander per questa
impossibilità a distinguerli: come si è già detto, non ci riesce nep
pure l' assai più potente gruppo del nodo . Il problema sta nel distin
guere tra un nodo semplice sinistrorso e uno destrorso . Il gruppo
del nodo non può farlo, perlomeno non da solo : « arricchendolo »
in modo idoneo è possibile ottenere un invariante del nodo che
farà al caso , ma la soluzione richiede altri concetti assai astratti .
(a)
(b)
Figura r o . S
I l nodo piano (a) e i l nodo vaccaio (b) . L a differenza tra i due s t a nella conformazione
della parte destra. Il gruppo del nodo non riesce a distinguere tra questi due orientamenti.
NODI E QUESTIONI TOPOLOGICHE
Così, ciò che il comune boy scout sa fare senza alcuna diffi
coltà vede il matematico impegnato nella ricerca di tecniche tra
le più sofisticate di cui disponga. Questo perlomeno fino all' ago
sto r 984; da quel momento le cose si sono notevolmente semplifi
cate con la scoperta simultanea da parte di quattro gruppi di mate
matici che lavoravano ognuno per conto proprio (uno in Gran
Bretagna, gli altri negli Stati Uniti) di un nuovo tipo di polinomio
che in effetti è in grado di riconoscere un nodo semplice sinistrorso
da uno destrorso, e quindi un nodo piano da uno vaccaio . A causa
del modo in cui i nuovi polinomi furono scoperti , dar loro il nome
di chi aveva fatto il lavoro vorrebbe dire chiamarli « polino mi di
Conway-Jones-Freyd-Yetter-Hoste-Lickorish-Millett-Ocneanu »,
che sarebbe uno scioglilingua. Fortunatamente, i polinomi in sé
sono molto più semplici. Mentre i polinomi di Alexander hanno
solo una variabile, i nuovi polinomi ne hanno due . Essi implicano
anche potenze negative di queste variabili, sicché il lettore potrebbe
essere riluttante a chiamarli « polinomi ». Il nuovo polinomio per
il nodo semplice destrorso è
- x - 4 + x - zy + x - zy - \
e quello per il nodo semplice sinistrorso è
- x 4 + xz y + xz y - 1 .
Per il nodo quadruplo, il nuovo polinomio è
x - z + xz - y - y - l + r .
Come calcolare questi polinomi? Si ottengono direttamente dal
diagramma del nodo . Il procedimento, sebbene esuli dagli intenti
di un libro come questo, è abbastanza meccanico da poter essere
eseguito su un calcolatore in modo efficace .
I nuovi polinomi servono a distinguere tutti i nodi non equiva
lenti? No. La ricerca deve continuare. Nella teoria dei nodi c'è
ancora molto da chiarire, ma per noi è ora di passare a un altro
argomento .
270
CAPITOLO DECIMO
Oltre la superficie
Il progresso maggiore in topologia, a partire dalla metà degli
anni cinquanta, si è avuto senza dubbio nello studio delle varietà .
In pratica (una definizione esatta sarà fornita più avanti) , una
varietà è una generalizzazione della nozione di superficie per un
numero arbitrario di dimensioni. Quindi i tipi più semplici di
varietà sono quelle a una sola dimensione, che sono le vere e pro
prie curve (con la retta reale R come caso particolare) e quelle
a due dimensioni, le superfici (con il piano bidimensionale R 2
come caso particolare) . Le varietà a due dimensioni hanno il van
taggio di poter essere rappresentate graficamente o, meglio ancora,
tramite modelli fisici. Sfortunatamente per i lettori di questo libro,
praticamente tutto il lavoro fatto in questo campo fin dall'inizio
del secolo si riferisce a varietà di tre o più dimensioni, le quali
non possono essere disegnate. I diagrammi che compaiono su libri
che trattano varietà di dimensioni di ordine superiore sono sem
pre destinati agli esperti e richiedono una interpretazione molto
attenta. Naturalmente, se si tratta di una dimensione non troppo
elevata, diciamo tre o quattro, allora è possibile raffigurare varietà
semplici usando proiezioni o sezioni. Anche queste di solito richie
dono qualche spiegazione per essere capite. Ad esempio, il lettore,
senza l' aiuto della didascalia, avrebbe mai riconosciuto l'oggetto
tridimensionale che la figura 1 0 . 9 vuole rappresentare? Sono due
proiezioni di un ipercubo, l' analogo di un cubo a quattro dimen
sioni . Come un oggetto tridimensionale può essere raffigurato su
una pagina bidimensionale per mezzo di una proiezione, allo stesso
modo, in linea di principio, un oggetto quadridimensionale può
essere rappresentato riducendolo a un oggetto tridimensionale nello
spazio . Con un'ulteriore proiezione di questo oggetto tridimen
sionale su una pagina, è possibile ottenere un'immagine dell'og
getto quadridimensionale originario , che è ciò che vedete nella
figura 1 0 . 9 . Naturalmente occorre un considerevole sforzo men
tale per interpretare una tale proiezione . Con proiezioni piane di
oggetti tridimensionali, la mente umana ci riesce molto bene. In
effetti, certa arte inquietante del pittore olandese Maurits Escher
ottiene il suo effetto sfruttando tale possibilità per creare delle
NODI E QUESTIONI TOPOLOGICHE
Figura 1 0 . 9
L'ipercubo è u n politopo a quattro dimensioni l e cui facce sono costituite d a otto cubi
di uguale dimensione. Entrambe le illustrazioni sono proiezioni piane di una « proie
zione a tre dimensioni » di un ipercubo nello spazio tridimensionale.
figure « impossibili » come quella della figura I O . I O . Più difficile
è interpretare la proiezione di un oggetto a quattro dimensioni;
a che cosa assomiglia un ipercubo? Proprio come un cubo normale
ha sei facce, costituite da sei quadrati uguali, cosl un ipercubo ha
otto « facce », costituite da otto cubi uguali . Se guardiamo atten
tamente il diagramma di sinistra della figura 1 0 . 9 e cerchiamo di
visualizzare la proiezione tridimensionale che esso rappresenta,
vedremo che mostra otto cubi: uno grande all'esterno, uno più
piccolo all'interno e sei modificati a forma di piramidi tronche.
Le alterazioni di dimensione e forma sono tutte caratteristiche
della proiezione iniziale ridotta da quattro a tre dimensioni. Nella
« realtà » a quattro dimensioni, le otto facce cubiche sono uguali
e l'ipercubo è racchiuso tra queste facce .
Oltre che con le proiezioni, si può tentare di visualizzare oggetti
di dimensioni più elevate con una successione di sezioni . Ad esem
pio, quale oggetto quadridimensionale darà la sequenza di sezioni
tridimensionali della figura I O . I I ? Una successione di sezioni bidi
mensionali di una sfera darà origine a una sequenza di cerchi, che
inizia con alcuni molto piccoli per culminare con un massimo e
degradare di nuovo verso cerchi sempre più piccoli, come quando
si affetta una mela. Allo stesso modo, le successive sezioni di una
ipersfera quadridimensionale daranno origine a una sequenza di
sfere, come si può vedere nella figura I o . I I . A questo punto vien
da chiedersi: come sarà una sequenza di sezioni di un ipercubo?
Figura I O . I O
L'arte d i M . C . Escher: Ascesa e discesa ( I 96o) . L a capacità umana d i interpretare un
oggetto a tre dimensioni dalla sua proiezione bidimensionale è qui sfruttata per realiz
zare una figura impossibile.
Figura I o . I I
Sezioni di un'ipersfera a quattro dimensioni. Se si potesse affettare una mela a quattro
dimensioni si otterrebbe proprio questo: una sequenza di « fette » sferiche che diven
tano sempre più grandi fino a raggiungere un massimo per poi decrescere nuovamente.
NODI E QUESTIONI TOPOLOGICHE
T ali espedienti esemplificativi possono darci una vaga idea di
come appare un oggetto quadridimensionale . Non sono invece
di alcuna utilità quando si cerchi di immaginare oggetti a cinque o
più dimensioni . Sono tuttavia molto efficaci per mostrare come
si sviluppa la progressione da dimensioni minori a dimensioni di
ordine più elevato con un procedere graduale per analogia. Ad esem
pio, le facce che delimitano un quadrato a due dimensioni sono
quattro linee rette unidimensionali uguali, le facce che delimitano
un cubo a tre dimensioni sono sei quadrati bidimensionali uguali,
le facce che delimitano un ipercubo a quattro dimensioni sono otto
cubi tridimensionali uguali e cosl via .
Ma attenzione ! Non tutto è come sembra a prima vista. Nello
spazio tridimensionale ci sono, come ben sapevano gli antichi stu
diosi greci di geometria, solo cinque poliedri regolari : il tetraedro,
il cubo, l'ettaedro , il dodecaedro e l'icosaedro . L' analogo di un
poliedro a più di tre dimensioni è detto politopo (di questo con
cetto si fa anche cenno nel cap . I I , insieme a una sua applicazione
nel mondo reale a tre dimensioni) . Le facce di un politopo quadri
dimensionale sono poliedri a tre dimensioni . Per un politopo rego
lare, questi poliedri devono a loro volta essere regolari,, e la dispo
sizione delle facce deve essere la stessa a ciascun vertice. Ne risulta
che ci sono solo sei politopi quadridimensionali regolari : il sim
plesso, che ha per facce cinque tetraedri, l'ipercubo, con otto facce
cubiche, la z6-cella, delimitata da I 6 tetraedri, la 24-cella, con 2 4
ottaedri , l a I2o-cella, con I 2 0 dodecaedri e l a 6oo-cella, con 6oo
facce costituite da altrettanti tetraedri . Quindi le cose si compli
cano un po' passando da tre a quattro dimensioni . Poi accade qual
cosa di curioso: per qualsiasi numero di dimensione maggiore di
quattro, ci sono solo tre politopi regolari, analoghi rispettivamente
al tetraedro , al cubo e all' ettaedro . Che cosa succede? Perché per
dimensioni di ordine maggiore di quattro tutto dovrebbe diven
tare più semplice e con andamento costante? Nessuno è in grado
di rispondere a questa domanda; tuttavia sappiamo per certo che
il fenomeno non è limitato ai politopi regolari . Anche sotto molti
altri aspetti, gli spazi a cinque o più dimensioni risultano molto
più facili da trattare di quelli a tre e a quattro dimensioni .
Sebbene in dimensioni di ordine più elevato entrino in gioco
fattori del tutto nuovi, osservare che cosa succede con le varietà
2 74
CAPITOLO DECIMO
a due dimensioni può ancora offrire un'idea ragionevole del tipo
di problemi e metodi implicati nella teoria delle varietà, sicché vale
la pena di soffermarci un attimo sulla teoria topologica delle
superfici.
La classificazione di tutte le varietà bidimensionali, di cui si
è già fatto cenno, fu uno dei maggiori successi della topologia del
secolo XIX . Occorrono solo due invarianti per individuare tutte
le superfici chiuse: l' orientabilità e la caratteristica di Eulero. Come
si può realizzare questa classificazione? Le dimostrazioni moderne
di solito si sviluppano in due passi successivi. Innanzitutto, si dimo
stra che tutte le superfici chiuse possono essere topologicamente
deformate in una delle due forme standard; dopo, rimane solo da
dimostrare che bastano due invarianti, l'orientabilità e la caratte
ristica di Eulero, per individuare tutte le superfici standard.
La superficie orientabile standard di genere n consiste in una sfera
alla quale sono attaccati n manici. Per attaccare un manico a una
superficie, si praticano due fori nella superficie e poi si cuce un
tubo cilindrico per collegare i due fori (fig . r o . I 2) . Una sfera con
un numero n qualsiasi di manici è una superficie orientabile, e la
sua caratteristica di Eulero è 2 - 2 n . Questo non è difficile da
dimostrare: il trucco sta nell'incominciare con un grafo su una sfera
(per cui V - E + F = 2) e poi attaccarvi dei manici. Se lo si fa con
sufficiente cura, si vedrà che ogniqualvolta si aggiunge un manico
la caratteristica di Eulero diminuisce di due . *
Con un processo che consiste nel tagliare, separare e riassem
blare, noto (per evidenti ragioni) con il nome di chirurgia, non è
difficile deformare una qualsiasi superficie orientabile data in una
superficie orientabile standard di qualche genere; ad esempio, un
toro darà luogo a una superficie di genere r , un toro doppio ne
darà una di genere 2 e così via. Poiché c'è relazione tra il genere
e la caratteristica di Eulero per le superfici orientabili standard
(grazie alla formula 2 - 2n) , ne deriva che la caratteristica di Eulero
è utile per la classificazione di tutte le superfici orientabili.
La superficie non orientabile standard di genere n si ottiene pren
dendo una sfera e aggiungendo ad essa n calotte intersecantesi. Per
congiungere una calotta intersecantesi a una superficie, si pratica
* I dettagli (anzi, l'intera dimostrazione) si trovano in I. N. Stewart, Concepts o/ Modern
Mathematics, Pelican, London x 98 1 .
NODI E QUESTIONI TOPOLOGICHE
2 75
(a)
(b)
Figura 1 0 . 1 2
Manici. Per attaccare un manico a una superficie, si praticano due fori coll'le in (a)
e si cuce un tubo cilindrico ai due bordi per collegarli tra loro, come in (b) . Usando
una tecnica nota come « chirurgia >> è possibile dimostrare che dal punto di vista della
topologia tutte le superfici orientabili chiuse sono equivalenti a una sfera a cui sono
attaccati un certo numero di manici. Questo dà una forma standard per le superfici
chiuse orientabili.
un foro nella superficie e si cuce un nastro di Mobius facendo com
baciare il bordo del foro con quello del nastro . Nello spazio tridi
mensionale questo è fattibile solo se si fa in modo che il nastro
di Mobius si autointersechi (fig. 1 0 . 1 3 ) . Poiché un nastro di Mobius
permette di scambiare il senso orario e quello antiorario, una super
ficie con una calotta sarà non orientabile. La caratteristica di Eulero
di una sfera con n calotte è 2 - n; anche in questo caso lo si può
dimostrare partendo da un grafo su una sfera e osservando che
ogniqualvolta si aggiunge una calotta la quantità V - E + F dimi
nuisce di I . *
Praticando la chirurgia, è possibile deformare con relativa faci
lità qualsiasi superficie non orientabile in una non orientabile stan
dard di qualche genere . Per esempio, il piano proiettivo , che a
* Questo è spiegato per esteso in Stewart ( 1 9 8 1 ) , citato nella nota precedente.
CAPITOLO DECIMO
{a)
{b)
Figura I O . I J
L a calotta intersecantesi. Per attaccare una calotta a una superficie, s i pratica u n foro,
come in (a) e si cuce un nastro di Mobius facendo combaciare il bordo del foro con
quello del nastro. Nello spazio tridimensionale questo può essere visualizzato solo se
si fa in modo che il nastro di Mobius si autointersechi, come in (b) . Praticando la chi
rurgia topologica è possibile dimostrare che qualsiasi superficie chiusa non orientabile
è topologicamente equivalente a una sfera avente un certo immero di calotte. Questo
costituisce una forma standard per le superfici chiuse non orientabili.
dispetto del nome è una superficie chiusa, diventerà una superfi
cie non orientabile standard di genere I , e la bottiglia di Klein
si trasformerà in una di genere 2 . Poiché la caratteristica di Eulero
di una superficie non orientabile standard dipende dal genere
(secondo la formula 2 - n) , anche questo procedimento di stan
dardizzazione determina la classificazione per mezzo della carat
teristica di Eulero di tutte le superfici non orientabili. Le super
fici con bordi vengono classificate considerando le superfici
standard munite di fori.
Con quanto abbiamo fin qui appreso sulla topologia delle super
fici, possiamo ora dare un'occhiata a cosa si è scoperto negli ultimi
NODI E QUESTIONI TOPOLOGICHE
anni per le dimensioni di ordine più elevato. Partiamo esaminando
uno dei tipi più semplici di varietà: la sfera n-dimensionale, per
n uguale a 2 , 3 , 4 e oltre. Il più famoso problema della topologia
riguarda proprio queste varietà.
La congettura di Poincaré
La più semplice tra tutte le superfici bidimensionali chiuse è
la sfera, quella da cui si è partiti per il processo di classificazione
appena descritto. L'analogo n-dimensionale di una sfera è noto come
n-sfera (sicché la comune sfera è una 2 -sfera) . Come la 2 -sfera è la
superficie di una palla tridimensionale, così la n-sfera è la « super
ficie » di una « palla » di dimensione ( n + I ) . Quando il matema
tico francese Henri Poincaré, all'inizio del nostro secolo, comin
ciò a studiare varietà di dimensioni di ordine più elevato, dando
in sostanza avvio a quello che oggi si intende per topologia delle
varietà, si occupò in modo particolare delle n-sfere. Queste, dopo
tutto, dovrebbero essere molto particolari, proprio come la 2 -sfera
è particolare tra le varietà bidimensionali. Nel 1 904, non riuscendo
a dimostrare un' asserzione sulle n-sfere che egli riteneva ben fon
data, la formulò come una congettura destinata a diventare il pro
blema più famoso in quel campo. Come tutte le buone congetture,
è allo stesso tempo di fondamentale importanza e di facile formu
lazione .
Supponiamo di tracciare una curva chiusa su una 2 -sfera; que
sta si può contrarre fino a ridursi a un punto senza abbandonare
la sfera (fig. 1 0 . 1 4a) . Anzi, la sfera è la sola superficie chiusa
su cui è possibile farlo : se dovessimo, ad esempio, tracciare una
curva chiusa su un toro, in uno dei due modi indicati nella figura
I 0 . 1 4b, esso non potrebbe essere ridotto a un punto . Allo stesso
modo (fidandoci però della matematica astratta, senza l' aiuto di
figure) , se prendiamo una n-sfera per qualsiasi valore di n maggiore
di 2 e vi « disegnamo » una curva chiusa, essa può essere ridotta
a un punto senza lasciare la n-sfera. Tuttavia, e qui sta il grosso
enigma, è vero che la n-sfera è la sola varietà chiusa n-dimensionale
dotata di questa proprietà, come lo è in due dimensioni? Nella con-
CAPITOLO DECIMO
(a)
(b)
Figura 1 0 . 1 4
L a congettura d i Poincaré. S e s i disegna u n laccio chiuso s u una sfera, esso può essere
contratto senza lasciare la superficie, fino a essere ridotto a un punto, come in (a) . Su
un toro questo non è sempre possibile. Se il laccio è disegnato in uno dei due modi
indicati in (b) , non può essere contratto e ridotto a un punto senza lasciare la superfi
cie. Per le superfici chiuse, questa proprietà di poter contrare qualsiasi laccio chiuso
e ridurlo a un punto è una caratteristica esclusiva della sfera: nessun'altra superficie
chiusa le possiede. Secondo la congettura di Poincaré un risultato analogo vale per tutte
le dimensioni più elevate. Ad esempio, la sola varietà chiusa tridimensionale avente
la proprietà di cui sopra è l'ipersfera tridimensionale.
gettura di Poincaré la risposta è sl, anche se, a rigor di termini, a
Poincaré interessavano solo le varietà a tre dimensioni .
Nonostante i notevoli sforzi, il problema di dimostrare o di con
futare la congettura di Poincaré fu (parzialmente) risolto solo nel
1 960, quando il matematico americano Stephen Smale dimostrò
che la congettura è vera per tutte le dimensioni maggiori o uguali
a 5 . Questo risultato fu considerato cosl importante da meritare a
Smale una medaglia Fields per il suo lavoro . È anche un esem
pio del fenomeno di cui abbiamo già parlato, per cui le varietà si
comportano in modo diverso dalla quinta dimensione in poi : i
metodi di Smale non funzionavano per tre o quattro dimensioni .
Questo avveniva quasi vent' anni prima che fosse risolto il problema
per le quattro dimensioni ad opera di un altro americano; nel 1 9 8 1
Michael Freedman sfruttò l e idee d i Smale e i l lavoro d i Andrew
C asson per dimostrare la congettura di Poincaré per le 4-sfere .
Rimane il problema delle tre dimensioni, proprio quello per cui
la congettura era stata originariamente formulata. Qual è lo stato
attuale delle cose? Nonostante la notevole mole di lavoro di mate
matici di prim'ordine, il problema rimane tuttora insoluto . Ci si
NODI E QUESTIONI TOPOLOGICHE
279
può fare un'idea del grado delle difficoltà incontrate dal semplice
fatto che alcuni esperti impiegarono parecchi mesi per individuare
una falla in uno dei recenti tentativi di dimostrazione, pubblicato
all' inizio del 1 986. Ottant ' anni dopo la sua formulazione, la con
gettura di Poincaré rimane il maggiore problema irrisolto della
topologia.
La teoria delle varietà
Secondo la definizione astratta, una varietà n-dimensionale è
un oggetto avente la proprietà per cui qualsiasi sua parte assomi
glia molto al familiare spazio euclideo n-dimensionale, R n . Ad
esempio , stando a questa definizione, la 2 -sfera è una varietà bidi
mensionale : qualsiasi minima parte della sfera .si presenta esatta
mente come R 2 , cosa verificabile in pratica quando ci si muove
sulla superficie terrestre. Si noti che, per il solo fatto che una varietà
n-dimensionale debba assomigliare localmente a R n , non è detto
che ciò valga per l'intera varietà . Fu proprio per non aver capito
questo fatto circa le varietà bidimensionali che si giunse alla con
clusione che la Terra fosse piatta: lo è (quasi) localmente, pur non
essendolo nella sua globalità.
Ora, ciò che soprattutto interessa nello studio delle varietà è
il modo naturale in cui queste sorgono in relazione a problemi di
analisi matematica e di fisica. In questi casi non si ha più a che
fare con varietà pure e semplici, bensl con tipi di varietà su cui
è possibile sviluppare una delle tecniche più utili della matema
tica: il calcolo differenziale . Probabilmente il lettore conoscerà il
calcolo differenziale sulla varietà R, cioè il comune calcolo diffe
renziale per funzioni di una variabile reale che si insegna a scuola,
ed è probabile che conosca anche quello sulla varietà R 2 • Le
stesse tecniche ci permetteranno di sviluppare un calcolo differen
ziale per qualsiasi varietà R n a dimensioni di ordine superiore,
per n = 3 , 4 , 5 ecc .
Poiché qualsiasi varietà n-dimensionale assomiglia localmente
a R n , possiamo usare localmente i metodi del calcolo differenziale
su quella varietà. E globalmente? Almeno per la sfera, è possibile
sviluppare un calcolo differenziale che copra l'intera superficie,
CAPITOLO DECIMO
perché la transizione da un' area locale alla successiva avviene in
modo piano e uniforme. Per dirla in altre parole, supponiamo di
dover ricoprire tutta la superficie della sfera con meridiani e paral
leli: otterremo un sistema di coordinate che, localmente, non è dis
simile dal solito sistema di coordinate cartesiane, che sottende allo
sviluppo del calcolo differenziale su R 2 • Se usiamo queste coor
dinate per sviluppare il nostro calcolo localmente sulla superficie,
allora, visto che usiamo esattamente le stesse linee coordinate su
tutta la superficie, non ci sarà differenza tra ciò che succede in
un punto e ciò che si verifica in un altro : le transizioni saranno
tutte uniformi.
Il quesito di fondo che vien naturale porsi è per quante varietà
sia possibile sviluppare un calcolo differenziale globale, così come
si può fare per la sfera. Una tale varietà è detta varietà differenzia
bile (o anche liscia) . Un sistema di coordinate che copra tutta la
varietà e serva di base al processo di differenziazione, come ad
esempio i meridiani e i paralleli sulla sfera, è detta struttura diffe
renziabile. In realtà le cose sono un po' più complicate, ma l'idea
è pressappoco questa. La domanda sulle varietà lisce, ovvero a quali
varietà sia possibile dare una struttura differenziabile, porta con
sé un' altra domanda non meno interessante: si possono dare strut
ture differenziabili diverse ad una stessa varietà? E se sì, in quanti
modi? Poiché anche i fisici passano molto tempo a lavorare con
il calcolo differenziale su varietà diverse, le risposte a queste
domande non interessano solo gli studiosi di topologia.
Per le varietà a due o tre dimensioni le risposte a questi quesiti
si conoscevano fin dalla metà degli anni cinquanta: tutte le varietà
a due o tre dimensioni sono differenziabili, e a varietà di questo
tipo non si possono dare due strutture differenziabili diverse. Allora
sembrava che fosse solo una questione di tempo per poter esten
dere il risultato alle varietà multidimensionali . Tuttavia, nel 1 956
lo statunitense John Milnor, con grande stupore di tutti, scoprì
che la 7-sfera può avere 2 8 strutture differenziabili completamente
distinte, e subito dopo si trovò che ad altre sfere di dimensioni
più elevate si possono dare diverse strutture differenziabili. Occor
reva una gran mole di lavoro per capire che cosa stesse succedendo,
e i matematici capaci e disposti a farlo non mancavano. Il periodo
tra il 1 95 6 e il 1 97 0 è stato definito « età dell'oro della topologia
NODI E QUESTIONI TOPOLOGICHE
delle varietà ». In realtà fu l'età dell'oro dello studio delle varietà
a cinque o più dimensioni, poiché ancora una volta si rivelò impos
sibile affrontare il problema per le quattro dimensioni con i metodi
di cui si disponeva. In questo periodo, sfruttando il concetto mate
matico di omotopia, gli studiosi di topologia riuscirono a fare una
classificazione abbastanza sistematica di tutte le varietà a più di
quattro dimensioni, in particolare distinguendo tra quelle diffe
renziabili e non.
E per le quattro dimensioni? Forse tutte le varietà sono lisce
e ammettono un'unica struttura differenziabile, come per le dimen
sioni di ordine più basso? O magari c'è una vasta gamma di possi
bilità, per cui si rende necessaria una classificazione, come per le
dimensioni di ordine più elevato? La risposta giunse finalmente
nel 1 98 1 . Michael Freedman, oltre a trovare la soluzione alla con
gettura di Poincaré per le quattro dimensioni, dimostrò anche che
esiste una varietà a quattro dimensioni non differenziabile. (La
descrizione di Freedman di questa varietà, che per motivi tecnici
è nota come E8, è, come sempre nella topologia delle dimensioni
superiori, di tipo algebrico) . In effetti, sia la soluzione della con
gettura di Poincaré per le quattro dimensioni, sia il risultato rela
tivo alla varietà quadridimensionale non differenziabile furono la
conseguenza di un unico risultato di carattere molto generale, e
del tutto inatteso, conseguito da Freedman. Secondo tale risul
tato, per classificare qualsiasi varietà a quattro dimensioni occor
rono due sole informazioni « elementari », informazioni tuttavia
non cosl « elementari » da poter essere spiegate qui.
Le sorprese non finivano Il. Presto ne sarebbe seguita una che
interessava proprio il cuore dell'universo fisico in cui viviamo .
I risultati inattesi riguardanti le varietà possono sempre essere
giustificati dal fatto che si ha a che fare con nozioni astratte, che
nella migliore delle ipotesi sono comprensibili solo in parte. Anche
le varietà a due dimensioni possono essere a volte graziosi oggetti
di fantasia, in grado di sfidare l'immaginazione. Non si può certo
dire lo stesso per le varietà più concrete R , R2, R 3 ecc. Dopo
tutto, R 3 non è forse lo spazio fisico in cui viviamo, e R 4 il con
tinuum spazio-temporale? In verità, queste varietà concrete rive
lano un comportamento quasi esemplare. Tanto per cominciare,
sono tutte differenziabili; inoltre, per ciascun n esiste un unico
CAPITOLO DECIMO
Figura 1 0 . 1 5
Soluzione dell'enigma degli anelli (fig . 1 0 . 1 ) . L a sequenza d i immagini indica come la
configurazione originale di anelli concatenati può essere deformata in una di anelli non
concatenati.
modo per attribuire una struttura differenziabile a R n . . . tranne
che per n = 4 ·
Per una qualche strana ragione, i matematici non erano riusciti
a provare la unicità di una struttura differenziabile per R 4 • Que
sto insuccesso era tanto più imbarazzante in quanto riguardava
proprio il punto di maggior interesse per i fisici. Si pensava però
che fosse solo questione di tempo , e che prima o poi ci si sarebbe
arrivati . Non era forse inconcepibile che la differenziazione su
R 4 potesse farsi in modo non-standard?
Ma l'inconcepibile risultò vero . La notizia arrivò nell' estate
1 9 8 2 . Utilizzando il lavoro svolto da Freedman, che era essenzial
mente di tipo algebrico, unitamente a una grande quantità di ana
lisi e di geometria differenziale, Simon Donaldson, un ventiquat
trenne studente di Michael Atiyah a Oxford, consegul un risultato
che implicava l' esistenza di una struttura differenziabile su R 4
diversa da quella usuale . In altre parole, la struttura differenzia
bile usata da fisici e matematici di tutto il mondo non è l'unica!
Non solo : più tardi, Clifford Taubes dimostrò che la solita strut
tura differenziabile su R4 è solo una delle infinite che si possono
NODI E QUESTIONI TOPOLOGICHE
dare a questa varietà. Questa scoperta solleva domande affasci
nanti. Che cosa ha di così particolare la quarta dimensione da essere
l'unica a dar vita a questo fenomeno? Poiché esiste più di un modo
per eseguire la differenziazione su R\ come possiamo sapere qual
è quello appropriato per quanto riguarda la fisica? Dal momento
che le varietà a n dimensioni rientrano in un ordine preciso per
tutti i valori di n diversi da 4, il caso n = 4 ha suscitato sempre
maggior curiosità.
Ma allora, i fisici stanno usando su R 4 i procedimenti matema
tici giusti? Probabilmente sì. Tutte le infinite strutture differen
ziabili anomale su R4 che sono state scoperte hanno un compor
tamento molto singolare e artificioso, che ne esclude l'uso per
quanto attiene al nostro universo fisico . Nondimeno, la loro esi
stenza sta senz' altro a indicare che lo spazio a quattro dimensioni
è veramente molto particolare, e la loro scoperta fa sì che il nostro
tempo sia davvero l'età dell'oro della topologia.
C apitolo
II
L ' efficienza degli algoritmi
Ancora algoritmi
Il concetto di algoritmo ha già giocato un ruolo importante nel
capitolo 6 : d'ora innanzi si darà per scontato che il lettore lo cono
sca. Il decimo problema di Hilbert chiedeva, in sostanza, se un
particolare problema potesse essere risolto con un algoritmo . Era
in discussione solo l'esistenza (o meno) di un tale algoritmo, e non
ci si domandava affatto se esso fosse eseguibile praticamente. Que
sto era perfettamente legittimo, in tale contesto; quando si passa
al mondo reale, però, sapere che un algoritmo esiste non è suffi
ciente, ma costituisce solo un punto di partenza. Infatti, non serve
a nulla avere un metodo che, sebbene in teoria capace di risolvere
un certo problema, potrebbe richiedere migliaia di anni per farlo,
pur con un calcolatore molto veloce . Per i problemi che interes
sano il mondo degli affari e le scienze applicate, ciò che importa
è l'esistenza di un « buon » algoritmo . In campo economico, que
sto potrebbe voler dire risolvere il problema nel giro di qualche
ora, mentre per sistemi come quello di pilotaggio di un aereo i risul
tati devono essere disponibili nel giro di una frazione di secondo .
Per applicazioni di questo tipo, è chiaro che si deve dimostrare
che un particolare problema può o non può essere risolto con un
algoritmo efficiente. A questo scopo , il primo passo da compiere
consiste nel formulare un metodo adeguato per valutare l'efficienza
di un algoritmo .
Ovviamente la velocità con cui un programma dato può essere
eseguito su un calcolatore dipende da più fattori . La dimensione
L' EFFICIENZA DEGLI ALGORITMI
e la velocità della macchina, l'efficacia del linguaggio di program
mazione usato per scrivere il programma, nonché l'abilità del pro
grammatore sono tutti elementi che hanno la loro importanza. Tut
tavia, essendo fattori molto specifici, non fanno al caso di uno
studio generale. Ci serve piuttosto una divisione molto generica
che distingua gli algoritmi in due categorie: algoritmi efficienti e
algoritmi non efficienti. Questa classificazione dovrebbe essere tale
che eventuali variazioni dei fattori marginali, come la velocità del
calcolatore o il linguaggio di programmazione, non trasformino un
algoritmo non efficiente in uno efficiente e viceversa.
La classificazione introdotta da A. Cobham e }. Edwards a metà
degli anni sessanta costituisce attualmente la base per la maggior
parte degli studi sull'efficienza degli algoritmi. Sebbene essi adot
tassero il tempo come principale metro di valutazione, per evitare
la dipendenza dalla velocità di calcolo, la vera definizione è data
sulla base del numero di passaggi richiesti per l'esecuzione. Natural
mente neppure questo concetto ha valore assoluto, perché dipende
da che cosa si intende per « passaggio » e dal modo in cui i dati
sono rappresentati . Ma tutte le considerazioni di questo tipo risul
tano irrilevanti per quanto riguarda il concetto fondamentale di
efficienza. Per questo motivo è ormai subentrata la prassi di for
mulare le varie definizioni in termini di macchine di Turing (si
veda il cap. 6) , che sono sufficientemente semplici per consentire
una teoria matematica uniforme. Ciò nonostante, tutto ciò che vale
per una macchina di Turing è ugualmente valido nel nostro sistema
di calcolo preferito, qualunque esso sia.
Avendo scelto per la parte teorica la macchina di Turing come
sistema di base del calcolo, misuriamo l'efficacia di un algoritmo
in base al numero di passaggi, cioè dei passi che occorrono alla
macchina di Turing per completare il calcolo . Non serve chiedersi
in che modo l' algoritmo sia scritto come programma per una mac
china di Turing e come i dati siano codificati sul nastro, perché
considerazioni di questo tipo non modificano la frontiera tra algo
ritmi efficienti e algoritmi non efficienti . È invece importante la
dimensione dei dati introdotti: maggiore è il numero di dati, mag
giore è il numero di passi richiesti per maneggiarli. Per esempio,
nella moltiplicazione manuale di coppie di numeri interi, raddop
piando la lunghezza dei numeri il tempo richiesto diventa più del
CAPITOLO UNDICESIMO
quadruplo, tenendo anche conto dei riporti. Tenendo presenti que
ste osservazioni, diamo ora le definizioni fondamentali.
Si dice che un algoritmo, che ai fini della definizione possiamo
considerare come un programma per una macchina di Turing,
occupa un tempo polinomiale se esistono due numeri interi A e k
tali che, per dati di ingresso di lunghezza n, e per qualsiasi valore
di n, il calcolo è completato al massimo in An k passi.
Ad esempio, l' algoritmo standard per sommare a mano due
numeri interi occupa un tempo polinomiale . Se i numeri sono
espressi nella solita notazione decimale e l'operazione di base del
calcolo è l' addizione di due cifre, allora l' addizione di due numeri
di n/2 cifre ciascuno (dati in ingresso di lunghezza n) implica esat
tamente n passi, tenendo conto dei riporti, e la definizione vista
poc' anzi è soddisfatta con A e k uguali a I . Nella moltiplicazione
di due numeri di n/2 cifre ci sono n 2/4 moltiplicazioni più n/2
somme, per un totale di n 2/4 + n/2 passi; poiché n 2/4 + n/2 è
sempre minore di n 2 , prendendo A = r e k = 2 nella definizione
vediamo che la moltiplicazione di numeri interi con la tecnica usuale
è un algoritmo a tempo polinomiale.
Se gli esempi di prima fossero valutati in termini di macchine
di Turing piuttosto che di aritmetica decimale, si dovrebbero natu
ralmente usare valori della costante A più grandi, e forse anche
un k maggiore, ma si tratterebbe ancora di algoritmi a tempo poli
nomiale. In effetti, questo è il motivo per cui il concetto di algo
ritmo a tempo polinomiale è indipendente da qualsiasi variazione
nei dettagli della macchina e della programmazione: tali fatti pro
ducono variazioni solo nella dimensione delle due costanti, ma la
sostanza della definizione rimane valida.
Gli algoritmi che non occupano un tempo polinomiale si dicono
a tempo esponenziale. Per esempio, un algoritmo che richiede 2 •
(o 3 " , o n•, o n ! ) passaggi per trattare dati d'ingresso di lunghezza
n è un algoritmo a tempo esponenziale . Questo spiega l'impiego
della parola « esponenziale », sebbene il modo in cui è usato sia un
po' ambiguo, poiché include funzioni come n 108 " , che non è di
solito considerata esponenziale .
Come il lettore avrà ormai capito, « efficienti » sono gli algo
ritmi che occupano un tempo polinomiale, « non efficienti » sono
quelli che richiedono un tempo esponenziale. La discussione sulla
L' EFFICIENZA DEGLI ALGORITMI
crescita esponenziale nel capitolo I dovrebbe essere sufficiente a
convincere il lettore che gli algoritmi a tempo esponenziale sono
estremamente inefficienti; d' altra parte, potrebbe essere giustifi
cata una certa dose di scetticismo sul fatto che algoritmi a tempo
polinomiale siano necessariamente efficienti. La facoltà di sceglie
re le costanti A e k nella definizione di tempo polinomiale sem
brerebbe offrire un margine di possibilità persino troppo ampio:
è improbabile che un algoritmo polinomiale in cui A = I 0 10 e
k = I OO sia « efficiente » in senso reale. È bene puntualizzare due
cose: primo, capita che i problemi pratici siano risolubili con algo
ritmi a tempo esponenziale o con algoritmi a tempo polinomiale
dell'ordine, ad esempio, di 1 0n 3 passaggi, o forse anche meno;
secondo, la distinzione tra polinomiale ed esponenziale è soltanto
una classificazione preliminare e approssimativa, e in futuro si ren
derà necessaria una differenziazione più precisa. Queste due osser
vazioni sono messe bene in risalto nella tabella I I I .
•
Tabella I 1 . I Tempi polinomiali e tempi esponenziali . Si assume che un dispositivo di
calcolo esegua una sola operazione di base in o,ooooo i secondi. La tabella indica il tempo richiesto
per eseguire il calcolo, una volta assegnate le dimensioni dei dati e la funzione di complessità
(cioè il modo in cui il calcolo dipende dalla dimensione dei dati) . Si noti come i tassi di crescita
siano decisamente maggiori per le due funzioni esponenziali. Il tempo di calcolo per n = 50
e per una funzione di complessità 3 è superiore alle migliori valutazioni correnti dell'età del
l'Universo, e per n = 6o esso è circa I oo ooo volte più lungo
•
Funzione
di
complessità
n
Dimensione dei dati (n)
20
IO
30
40
0 ,0000 1 s 0,00002 s 0 ,00003 s 0,00004 s
50
0,00005 s
6o
o,oooo6 s
n>
0,000 1 s
0,000 4 s
0 ,0009 s
o,oo i 6 s
0,0025 s
0,003 6 s
n'
0,00 1 s
o,oo8 s
0,027 s
0,06 4 s
o, I 2 5 s
0,216 s
2"
0,00 1 s
I ,O
3"
0,059 s
S
58 min
1 7 ,9 min
6,5 anni
1 2 , 7 giorni 3 5 , 7 anni
3 855 secoli 2 x I 0 8 secoli
366 secoli
1 ,3 x 1 0 13 secoli
Per illustrare come i concetti appena esposti siano utilizzati per
classificare i problemi reali e gli algoritmi, ne esamineremo uno
famoso e molto importante in campo economico .
CAPITOLO UNDICESIMO
Il
problema del commesso viaggiatore
Immaginiamo che un commesso viaggiatore debba visitare una
cinquantina di località; non importa l'ordine in cui si reca nei vari
luoghi, purché li tocchi tutti. Naturalmente è nell'interesse suo
e di chi paga le spese di trasporto che il giro avvenga secondo un
criterio di economia di percorso . Sulla base di quali elementi sce
glierà il tragitto? Ovviamente, incomincerà disegnando uno schema
che evidenzi le distanze tra una località e l'altra. Dopo di che, come
procederà? Ad esempio, qual è il percorso più economico per visi
tare tutti i luoghi indicati nella figura I I . I ?
Un primo modo di affrontare il problema consiste nell'elencare
tutte le possibilità di percorso, calcolare la lunghezza totale di
ognuna e scegliere la più breve. Questo metodo senza dubbio
funzionerà, il che dimostra che il problema può essere risolto con
un algoritmo, dal momento che il procedimento può essere fa
cilmente eseguito da un calcolatore (perlomeno in linea di princi
pio) . Ma anche per un numero abbastanza limitato di luoghi, le
possibilità da esaminare sono decisamente troppe: se le località
IO
Figura 1 1 . 1
Il problema del commesso viaggiatore: trovare un itinerario attraverso tutte le località
indicate che minimizzi l'intera distanza coperta. Le distanze indicate sono quelle par
ziali tra un luogo e l'altro lungo i percorsi possibili. Ad esempio, l'itinerario ABEFDC
corrisponde a un viaggio di lunghezza 8 + 9 + 2 + 1 o + 3 = 3 2. Talvolta si richiede che
l'itinerario incominci e finisca nella stessa località, nel qual caso questo percorso speci
fico sarebbe incompleto.
L' EFFICIENZA DEGLI ALGORITMI
da visitare sono n, allora ci sono n ! itinerari possibili. Si ricordi che
n! (« n fattoriale ») è il prodotto di tutti i numeri n, n - I , n - 2 , . . . ,
3 , 2 , r . Poiché la funzione n ! è senza dubbio esponenziale (aumenta
più velocemente di 2 n o 3 n , sebbene non velocemente come la
funzione « Superesponenziale » n n) , l'elencazione di tutti gli itine
rari possibili porterà inevitabilmente a un algoritmo di comples
sità esponenziale. Per farsi un'idea della scarsa praticabilità di tale
metodo, si tenga presente che per I o località i percorsi possibili sono
Io!
=
3 6 2 8 8oo.
Siamo su ordini di grandezza affrontabili dai calcolatori moderni,
ma quando si arriva a 2 5 località il numero di percorsi da pren
dere in considerazione diventa I 6 seguito da ben 25 zeri . Un giro
che tocchi venticinque città è del tutto realistico per un commesso
viaggiatore, per non parlare di altre situazioni che corrispondono
allo stesso problema matematico, dove il numero di luoghi può
essere dell'ordine di centinaia.
Quindi il metodo di elencare tutte le possibilità risulta inattua
bile se non per un numero limitato di località. Quale altra via si
può tentare? Forse una soluzione dettata dal « buon senso »? Ad
esempio, guardando una mappa o una tabella delle distanze, si
potrebbe identificare un percorso che dapprima tocchi tutte le loca
lità prossime al punto di partenza, per poi allontanarsi progressi
vamente. Sebbene questa strategia, come qualsiasi altra che si voglia
sperimentare, possa essere efficace in certe situazioni particolari,
è stato dimostrato che non sempre funziona. Prendiamo ora in con
siderazione il comportamento complessivo dell' algoritmo . È pos
sibile che istanze particolari del problema del commesso viaggia
tore risultino avere soluzioni facili (se ad esempio le località si
trovano tutte su una linea retta il percorso sarà ovvio) , ma ciò che
noi vogliamo è un algoritmo applicabile in tutti i casi . Da quando
il matematico viennese Karl Menger sollevò il problema nel I 93 0 ,
sono stati intrapresi molti studi i n questa direzione ( e sono stati
pubblicati oltre trecento articoli) , ma una soluzione generale non
è ancora stata trovata. In effetti, come vedremo, è assai probabile
che non esista un algoritmo efficiente in grado di risolvere questo
problema .
Nel frattempo, è opportuno accennare ai notevoli progressi fatti
CAPITOLO UNDICESIMO
per alcuni casi particolari. Nel 1 962 Michael Held e Richard Karp
dell'IBM usarono una tecnica detta programmazione dinamica per
risolvere il problema per tutti i percorsi con un massimo di r 3 loca
lità ( r 3 ! = 6 2 2 702 oSo) . Nel 1 963 Little, Murty, Sweeney e Karp
inventarono una tecnica potente, detta branch and bound, che rese
possibile la soluzione del problema per percorsi fino a 40 località,
occupando un tempo di alcuni minuti su un mainframe IBM 7090 .
Nel 1 970 Held e Karp svilupparono un algoritmo branch and bound
in grado di risolvere una istanza del problema con n = 42 ; con que
sto algoritmo bastava esaminare 6 r dei numerosissimi percorsi pos
sibili (4 2 ! è pari a 33 seguito da 49 zeri) . (Questo problema, che
riguardava 42 città negli usA, era già stato risolto nel 1 954 da Dan
trig, Fulkeston e Johnson della RAND Corporation) . Nel 1 979 Crow
der e Padberg risolsero un problema specifico con n = 3 1 8 , senza
dubbio il massimo numero mai raggiunto fino ad allora. L'opinione
comune è che le tecniche di cui disponiamo dovrebbero essere in
grado di fornire la soluzione di qualsiasi caso con n corrispondente
a 500 circa in un tempo di calcolo ragionevole, che potrebbe essere
di alcuni giorni al massimo . Ma la struttura particolare di ciascun
caso è un fattore determinante. In linea di massima, i problemi
che nascono dalla vita reale risultano essere perlopiù trattabili, men
tre è possibile inventare esempi « artificiali » che resistono a tutti
i tentativi di soluzione conosciuti. Il paragrafo seguente spiega per
ché una soluzione generale che funzioni bene in tutti i casi è, molto
probabilmente, impossibile da ottenersi .
P e NP
Se si vuole discutere in astratto su come problemi trattabili pos
sano essere risolti con un algoritmo efficiente, risulta opportuno
riformulare tutti i problemi in modo che prevedano risposte del
tipo sì o no, il che permette di confrontare problemi differenti.
Ad esempio, il problema della moltiplicazione (dati due interi
a e b, qual è il loro prodotto?) potrebbe essere così espresso: dati
gli interi a, b e c, è vero che ab = c ? Al problema del commesso
viaggiatore potrebbe essere data questa forma: dato un insieme
di luoghi, nonché una tabella delle distanze, e dato un numero B ,
L' EFFICIENZA DEGLI ALGORITMI
esiste un percorso che tocchi tutti i luoghi e la cui lunghezza totale
sia al massimo B ? A prima vista non si direbbe che una tale for
mulazione possa cogliere l'essenza del problema, ma così è: se esi
ste un algoritmo che risolve il problema nella versione originale,
allora ne esiste uno che lo risolve nella versione « SÌ-no », e viceversa.
I problemi con risposte del tipo sì o no son detti problemi deci
sionali. Un problema decisionale è detto di tipo P se può essere
risolto con un algoritmo polinomiale. Ad esempio, il problema della
moltiplicazione visto poc' anzi è di tipo P: per verificare se ab = c,
si moltiplichino semplicemente a e b e si veda se il risultato è uguale
a c; questa operazione richiede un tempo polinomiale (anzi, qua
dratico) .
Finora non si sa con certezza se il problema del commesso viag
giatore sia di tipo P o no . Si sa solo che è di tipo NP, cioè a tempo
polinomiale non deterministico . Per capire questo concetto, si pensi
a una macchina di Turing, o a qualsiasi altro apparato di calcolo,
in grado di avanzare ipotesi casuali in vari stadi del suo funziona
mento . Non essendo possibile costruire una macchina con questi
requisiti, bisogna riuscire a immaginarla. Usando questo ipotetico
apparato, detto macchina di Turing non deterministica, il problema
del commesso viaggiatore può essere risolto con un algoritmo poli
nomiale. È un algoritmo semplice: scegliamo a caso il primo luogo
da visitare, poi il secondo, il terzo e così via, fino a completare
tutto il tragitto, calcoliamo il percorso totale e confrontiamolo con
il numero dato B . Ammesso che la macchina « indovini » a ogni
stadio (cosa improbabile nella realtà, essendoci r/n ! probabilità di
successo, dove n indica il numero dei luoghi da visitare) , il risul
tato ottenuto sarà corretto . L'essenza dei problemi di tipo NP è
proprio questa: l'essere risolubile in tempo polinomiale da una mac
china di Turing non deterministica che avanzi sempre ipotesi
corrette.
Un altro problema di tipo NP è dato dallo stabilire quali numeri
interi siano composti. Dato un intero n, supponiamo che gli interi
a e b siano minori di n e verifichiamo se ab = n. Avremo una
risposta con un algoritmo polinomiale, e un'ipotesi ottimale darà
la risposta corretta. Si noti che lo stesso tipo di algoritmo non è
sufficiente per stabilire se il problema complementare, che consiste
nel determinare se un numero intero dato n è primo, sia di tipo NP.
CAPITOLO UNDICESIMO
Per dimostrare che n è composto è richiesta un'unica ipotesi esatta
da parte della macchina, mentre per dimostrare che n è primo tutte
le ipotesi devono rivelarsi errate . In realtà, il test di primalità è
di tipo NP, ma per dimostrarlo dobbiamo usare un altro ragio
namento.
L'importanza del concetto (molto astratto) di problemi di tipo
NP deriva da due fattori . Per prima cosa, molti dei problemi per
i quali non si è ancora scoperto un algoritmo efficiente risultano
essere di tipo NP. Intuitivamente, si capisce che le cose stanno
così perché la difficoltà in tali problemi non sorge dal procedi
mento di calcolo richiesto, ma dal fatto che contengano un grande
numero di possibilità. Quando queste diverse possibilità sono abba
stanza simili tra loro da poter essere affrontate allo stesso modo,
è possibile adottare la strategia di ipotesi e prove descritta prima
per i problemi NP. Quindi il concetto di NP fornisce il quadro teo
rico per risolvere un grandissimo numero di problemi pratici reali.
Il secondo fattore nasce dal lavoro svolto nel 1 9 7 1 da Stephen
Cook sull'efficienza degli algoritmi. Utilizzando tecniche che risal
gono a Turing e ad altri, Cook riuscì a trovare un modo per dimo
strare che è molto improbabile, o meglio è impossibile, che certi
problemi di tipo NP si possano risolvere con un algoritmo polino
miale efficiente . Più specificamente, Cook dimostrò che un pro
blema particolare di tipo NP è, come egli lo definì, NP-completo :
se tale problema può essere risolto con un algoritmo polinomiale,
allora la stessa cosa è possibile per tutti gli altri problemi di tipo
NP. In altre parole, il problema considerato da Cook non è meno
difficile di tutti gli altri problemi di tipo NP. Facendo tesoro del
risultato di Cook, altri matematici dopo di lui dimostrarono che
molti altri problemi NP sono anche NP-completi, compreso il pro
blema del commesso viaggiatore (vedi inserto C) .
Così, il lavoro di Cook e di altri fornì un modo per dimostrare
che molti problemi NP che sorgono nel mondo reale sono altret
tanto difficili da risolvere quanto qualsiasi altro problema di tipo
NP. Ora, la maggior parte dei matematici concluderebbe dicendo
che è uno spreco di tempo cercare un algoritmo efficiente, cioè
polinomiale, per risolvere un problema non meno difficile di tutti
i problemi NP. Di conseguenza la prova che un dato problema è
NP-completo implica necessariamente che non può essere risolto
con un algoritmo polinomiale.
293
L' EFFICIENZA DEGLI ALGORITMI
Inserto C - Alcuni problemi NP-completi
Commesso viaggiatore (si veda il testo per i dettagli) .
Circuito hamiltoniano Data una rete di città e di strade
che le collegano, c'è un percorso che inizi e che termini nella
stessa città e tocchi tutte le altre una sola volta?
Allocazione di multiprocessori Dato un insieme T di pro
grammi da eseguire, unitamente a un elenco dei tempi richiesti
per eseguire ciascun programma su un determinato tipo di
elaboratore, e dato anche un numero specifico di elaboratori
di quel tipo, è possibile dividere i programmi dell'insieme
T e assegnare ciascun gruppo a un elaboratore, cosicché il
tempo totale occorrente per l'esecuzione di tutti i programmi
sia inferiore a un tempo dato? Ciascun processare funziona
sequenzialmente, sebbene nel loro insieme funzionino in
parallelo .
Colorazione di mappe (cap . 7) Data una mappa, è possi
bile colorarla usando solo tre colori e facendo sì che nessuna
coppia di paesi confinanti risulti dello stesso colore?
Residui quadratici Dati i numeri interi a, b, c, con a
minore di b, esiste un numero intero positivo x minore di
c tale che
x 2 mod b = a ?
Equazioni diofantee quadratiche (cap . 6) Dati i numeri
interi positivi a, b, c, esistono due numeri interi positivi x
e y tali che
ax 2 + by = c ?
2 94
CAPITOLO UNDICESIMO
C 'è comunque una difficoltà. Il risultato di Cook e i successivi
non precludono la possibilità che le classi P e NP siano in sostanza
le stesse, cioè che qualsiasi problema di tipo NP si possa di fatto
risolvere usando un algoritmo polinomiale, sebbene trovare tale
algoritmo non sia impresa facile. Se le cose stessero effettivamente
così, sapere che un problema è difficile quanto qualsiasi altro della
classe NP non sarebbe molto significativo (tutti i problemi NP
sarebbero « facili » nel senso che se ne dà ora) . Pochi esperti pren
dono in considerazione tale eventualità, perché la natura stessa
dei problemi NP, che implica un procedimento per tentativi assai
poco algoritmico, ne rende improbabile l'equivalenza a quelli di
tipo P. Di conseguenza, la possibilità teorica che le classi P e NP
coincidano è di solito negata in via di principio, e un problema
di cui si sia dimostrata l'NP-completezza è considerato definiti
vamente « insolubile ».
Naturalmente, per risolvere in modo definitivo la questione
sarebbe sufficiente trovare un unico problema di tipo NP che si
possa dimostrare essere anche di tipo P. Nonostante la differenza
tra P e NP sembri evidente, non si è finora giunti a nessun risul
tato in questo senso, e tutte le prove di cui disponiamo mostrano
quanto il problema sia difficile. Noto come congettura P = NP, esso
è considerato uno dei problemi aperti più significativi della moderna
matematica computazionale. Parte della sua importanza deriva
naturalmente dal fatto che esso ha attinenza con molti problemi
pratici (ma bisogna essere cauti, poiché tali questioni non sono mai
semplici) . È dunque tempo di tornare alla realtà.
Ritorno alla realtà: la programmazione lineare
La teoria appena descritta, sebbene fornisca informazioni pre
ziose, non offre sempre un quadro accurato dei campi a cui è appli
cata. In teoria, un algoritmo può essere esponenziale, cioè « inef
ficiente », ma nella pratica, con dati semplici, può funzionare molto
bene . L' andamento esponenziale può manifestarsi solo per deter
minati tipi di dati che non si incontrano comunemente; in un certo
senso il problema del commesso viaggiatore rientra in questa cate
goria. I metodi di cui disponiamo, che sono senza dubbio espo-
L ' EFFICIENZA DEGLI ALGORITMI
295
nenziali per quanto riguarda il tempo di funzionamento, possono
dare buoni risultati quando siano applicati a configurazioni reali
di città e strade . Un esempio ancora più sorprendente del poten
ziale abisso tra la teoria e la pratica è offerto dal problema della
programmazione lineare, problema che ha dato vita alla cosiddetta
ricerca operativa, e che ne costituisce ancora oggi uno dei temi cen
trali. Questa disciplina, che ebbe origine con la seconda guerra
mondiale, usa metodi matematici per affrontare problemi complessi
che implicano la direzione e la conduzione di grandi sistemi di
uomini, macchine, materiali e denaro nel campo dell'industria, del
commercio, del governo e della difesa.
La programmazione lineare è una tecnica usata per fornire una
descrizione matematica, ovvero un modello, di un problema della
vita reale in cui qualcosa deve essere massimizzato (ad esempio
i profitti o la sicurezza) o minimizzato (ad esempio i costi o i rischi) .
L' ottimizzazione richiesta si raggiunge con una opportuna scelta
di valori di un certo numero di parametri, ovvero di variabili.
Entrambi i fattori da ottimizzare e alcuni o tutti i parametri saranno
passibili di uno o più vincoli. La parola « lineare » indica che tutte
le espressioni matematiche del modello sono lineari, cioè non com
portano la moltiplicazione di due o più variabili tra di loro o il
loro elevamento a potenza. Nella pratica, questa limitazione non
è rilevante, dal momento che la maggior parte dei problemi incon
trati nella vita reale sono intrinsecamente lineari, o possono essere
supposti tali senza generare errori di qualche entità.
Un primo esame del problema rivela che i vincoli lineari hanno
una rappresentazione geometrica naturale. I valori delle variabili
che soddisfano tutti i vincoli corrispondono ai punti che giacciono
entro una determinata figura geometrica: se le variabili sono due,
quella figura sarà un poligono il cui numero di lati corrisponde al
numero dei vincoli; se le variabili sono tre, sarà un poliedro; se
sono n, sarà un politopo in uno spazio n-dimensionale (vedi cap. r o) .
Naturalmente è impossibile disegnare u n politopo a quattro o più
dimensioni, ma i procedimenti matematici restano semplici qua
lunque sia la dimensione.
Basterà un esempio elementare per chiarire quanto si è detto .
Immaginiamo una ditta che produca due tipi di tessuti, A e B ,
usando lana di tre colori diversi. L a quantità di lana occorrente
CAPITOLO UNDICESIMO
Tabella 1 1 . 2 Quantità di lana rossa, verde e gialla occorrente per la fabbricazione
di pezze unitarie di tessuto A e B, e quantità totale di cui si dispone per ciascun colore
Quantità occorrente per unità di lunghezza
Colore
della lana
Tessuto A
Tessuto B
Quantità
disponibile
Rosso
4 kg
4 kg
1 400 kg
Verde
6 kg
3 kg
1 8oo kg
Giallo
2 kg
6 kg
1 8oo kg
per una pezza di lunghezza unitaria per ciascun tipo di tessuto e
la quantità totale di lana di cui si dispone per ciascun colore sono
indicate nella tabella I I . 2 . Il profitto del fabbricante è di I 2 ster
line su ciascuna pezza unitaria di tessuto A e di 8 sterline per il
tessuto B . La domanda che ci poniamo è come debba essere usata
la lana disponibile per realizzare il maggior profitto globale pos
sibile.
Siano x e y rispettivamente il numero delle unità di tessuto A
e B che vengono prodotte. Il profitto P, espresso in lire sterline,
sarà dato da
P = I 2X + By.
(I ]
Quali sono i vincoli sui valori di x e y ? Poiché s i hanno solo I 400 kg
di lana rossa e tutti e due i tipi di tessuto richiedono 4 kg di lana
rossa per ciascuna unità di lunghezza, dovrà essere
4X + 4Y � 1 400.
[2]
Allo stesso modo, considerando la lana verde e gialla di cui si
dispone, si avrà
6x + 3 Y � I 8oo,
2x
+
6 y � I 8oo .
Infine, poiché né x né y dovrebbero essere negativi (vincolo che
è ovvio quando si considera il problema reale, ma che deve essere
reso esplicito nella rappresentazione matematica) , valgono le con
dizioni
x ;;a: o, y ;;a: o .
L a figura I I . 2 offre una rappresentazione grafica dei vincoli imposti
dalle disuguaglianze [2], [3] e [4] . Qualsiasi coppia di valori
L ' EFFICIENZA DEGLI ALGORITMI
297
Figura 1 1 . 2
Programmazione lineare. La soluzione del problema della fabbricazione di tessuto.
di x e y che soddisfi tutti questi vincoli costituirà le coordinate
di un punto all'interno dell' area tratteggiata, e viceversa qualsiasi
punto in quest'area avrà coordinate che soddisfano le disuguaglianze
[2], [3] e [4] (lo verifichi il lettore, leggendo le coordinate di vari
punti interni ed esterni a quest'area) . Quindi ora dobbiamo tro
vare un punto dentro l' area tratteggiata che renda la quantità P
dell'equazione [ I ] più grande possibile.
Tutte le rette con equazioni della stessa forma della [ I ] , per un
valore fissato di P, sono parallele tra loro (due di queste, per
P = I 200 e P = 2400, sono indicate nella fig. I 1 . 2 ) . È dunque abba
stanza chiaro che cosa si deve fare per massimizzare P: spostare
la retta del profitto (data dalla [ I ]) il più lontano possibile dal
l' origine senza uscire del tutto dalla zona tratteggiata. Questo ci
porta al punto indicato con B . Le coordinate di B si ottengono
CAPITOLO UNDICESIMO
facilmente con l' algebra elementare, come soluzione di un sistema
di due equazioni: (250, I oo) . Quindi il fabbricante deve produrre
250 unità di tessuto A e I oo di tessuto B per ottenere il massimo
profitto possibile, che è di 3 8oo lire sterline. Verrà così usata tutta
la lana rossa e tutta la verde, mentre ne avanzeranno 700 kg di
quella gialla (e risulterà quindi che il fabbricante non ha fatto bene
i suoi calcoli prima) .
Ora che il problema è stato risolto, vediamo di analizzarlo. I
vincoli erano rappresentati nella figura I I . 2 tramite la regione poli
gonale ABCDO del piano . Il punto di massimo era uno dei vertici
del poligono, e rimaneva da stabilire quale dei cinque . In questo
semplice esempio non era difficile da trovare, eppure è proprio
questo il punto che rende difficoltosi i problemi di programma
zione lineare più complessi, e di conseguenza più realistici . In un
problema con tre variabili, i vincoli daranno origine a un poliedro
tridimensionale; con n variabili si otterrà un politopo n-dimen
sionale, che non si può disegnare ma che può ancora essere trat
tato algebricamente . In ogni caso il problema si riduce a trovare
il vertice della regione vincolare (poligono, poliedro o politopo)
in cui si verifica l'ottimizzazione. Come si può fare? Potrebbero
esserci milioni di vertici, per cui una ricerca sistematica è di solito
fuori discussione, proprio come per il problema del commesso viag
giatore. Occorre quindi un metodo diverso .
Nel I 947 il matematico americano George Dantzig ne ideò uno:
l'algoritmo del simplesso. In pratica, con questo metodo si parte
da un vertice (qui non diremo come si trova questo vertice ini
ziale) e poi ci si sposta sulla superficie del politopo, lungo i lati,
da vertice a vertice. Ogni volta che si arriva a un vertice, ci saranno
varie direzioni in cui procedere e vari criteri per decidere quale
di queste scegliere. Il più ovvio consiste nel portarsi a un vertice
che aumenta la quantità da massimizzare, o la diminuisce se è da
minimizzare.
A causa dell'enorme numero di percorsi possibili intorno ai ver
tici di un politopo, si sa che l' algoritmo del simplesso, in teoria,
è un algoritmo esponenziale, ma quando viene usato praticamente,
su problemi che implicano centinaia o addirittura migliaia di varia
bili, funziona molto bene, puntando direttamente verso il vertice
ottimale con relativamente pochi passaggi. In verità, pare che tenda
L ' EFFICIENZA DEGLI ALGORITMI
299
ad occupare un tempo lineare: il numero di passaggi sembra essere
direttamente proporzionale al numero di variabili implicate. I tipi
di vincoli e i politopi ad essi associati che rendono l'algoritmo inef
ficiente non si presentano molto spesso in pratica; devono essere
« inventati » di proposito con lo scopo di sconfiggere il metodo del
simplesso . A dire il vero, sono cosl innaturali che l'esistenza di
questi problemi « artificiali » non esclude minimamente che alcune
versioni dell'algoritmo del simplesso siano immediatamente uti
lizzabili ogniqualvolta venga immmesso sul mercato un nuovo
sistema applicativo a uso industriale o commerciale. Detto in ter
mini semplici, il metodo funziona.
E siste un metodo più veloce non solo nella maggior parte dei
casi, ma in tutti i casi, cioè un algoritmo polinomiale? Lasciandosi
guidare dall'intuito, si potrebbe pensare che, invece di trovare il
vertice ottimale del politopo seguendo i lati sulla superficie del
politopo stesso, dovrebbe essere più veloce « prendere una scor
ciatoia » attraverso l'interno . Qui il problema è che, poiché non
si sa in anticipo quale sia il vertice ottimale, non si sa in quale
direzione procedere. Stando sulla superficie del politopo, se non
altro, abbiamo un metodo per decidere da che parte andare a ogni
passo . C ' è un modo per orientarsi una volta che si è abbandonata
la superficie e ci si è inoltrati all'interno?
In effetti c'è. Nel 1 970, il matematico sovietico Shor intul che
una vecchia tecnica, nota come metodo di Newton, poteva essere
applicata al problema della programmazione lineare, e ulteriori
modifiche apportate a questa idea da Levin, Judin e Nemirovski
(sempre in Unione Sovietica) condussero nel 1 976 alla formulazione
del cosiddetto metodo ellissoidale. In questo metodo, la direzione del
percorso da seguire attraverso l'interno del politopo viene stabi
lita con l' aiuto di una sequenza di elissoidi che lo approssimano .
Nel 1 979, il sovietico Khachian dimostrò che il metodo ellissoi
dale funziona in tempo polinomiale. Sfortunatamente, sebbene in
teoria fosse migliore del metodo del simplesso, il nuovo metodo
applicato a problemi del mondo reale non presentava vantaggi
rispetto al vecchio .
Il lettore potrebbe dire: « Questo concetto di efficienza inte
ressa solo i teorici, perché in realtà il metodo teoricamente ineffi
ciente ha spesso prestazioni migliori di quello teoricamente effi-
300
CAPITOLO UNDICESIMO
dente ». Questo è proprio quanto hanno detto molti non mate
matici. Dopo tutto, il problema della programmazione lineare forse
era (e tuttora è) l'unico problema veramente importante della vita
reale. Se vogliamo un esempio che incrini la validità della classifi
cazione polinomiale/esponenziale, questo è proprio il peggiore che
si possa immaginare dal punto di vista matematico.
Ma all'inizio del 1 984 un altro teorico venne in soccorso della
matematica. Narendra Karmarkar, un ventottenne che lavorava
presso i laboratori Beli negli Stati Uniti, scoprì un algoritmo per
la programmazione lineare in tempo polinomiale, che funzionava
veramente bene anche nella pratica e che in molte occasioni risul
tava decisamente più efficiente del metodo del simplesso (in una
prova con un problema a 5000 variabili, l' algoritmo di Karmarkar
risultava 50 volte più veloce) . Fu un avanzamento notevole e del
tutto inaspettato . Per ottenere il suo nuovo algoritmo, Karmar
kar aveva dovuto usare tecniche matematiche altamente sofisti
cate, che implicano una sequenza di manipolazioni del politopo
volte a dargli una nuova forma, allo scopo di trovare le direzioni
preferite da seguire una volta che ci si trovi all'interno . Tuttavia,
proprio come avviene nei programmi per calcolatore basati sull' algo
ritmo del simplesso, dove la macchina si serve di operazioni arit
metiche e non utilizza direttamente le proprietà geometriche soggia
centi, nell' algoritmo di Karmarkar si tralasciano i concetti geo
metrici più sofisticati a favore di una serie di operazioni su matrici.
L'idea teorica di efficienza, dopo tutto, si è rivelata fondata.
Inoltre, il nuovo algoritmo offre un esempio lampante di come certi
concetti matematici astratti assai sofisticati, che implicano analo
ghi multidimensionali di poliedri e strane deformazioni geometri
che, possano portare a un prodotto concreto di importanza deter
minante nel mondo reale degli affari, dell'industria e della difesa.
È una fusione esemplare del puro e dell' astratto da un lato, e del
mondo in cui viviamo dall' altro, nonché un buon modo per con
cludere un saggio sulla << nuova » matematica.
Letture di approfondimento
Capitolo
r
Numeri primi, scomposizione in fattori e codici segreti
Beker H . e Piper F . , Cipher Systems, Northwood 1 98 2 ; tratta diffusamente
la crittografia e, sebbene arduo in molti punti, costituisce un ottimo riferimento.
Burton D . , Elementary Number Theory, Allyn and Bacon, Needham
Heights 1 98 0 ; un ottimo testo sulla teoria dei numeri, che trascura però
gli aspetti computazionali.
Capitolo
2
Gli insiemi, l'infinito e la non-decidibilità
Crossley J. N . , What is Mathematical Logic?, Oxford University Press,
Oxford 1 9 7 2 [trad . it. Che cos 'è la logica matematica?, Boringhieri , Torino
1 98 5 ] ; una buona introduzione alla logica matematica.
Devlin K., Fundamentals of Contemporary Set Theory, Springer, New York
1 98 o ; semplice ma esauriente introduzione alla teoria degli insiemi .
Hodges W . , Logic, Pelican, London r97 7 ; tratta perlopiù gli aspetti non
matematici dell ' argomento, ma può essere utile .
Kilmister C . W . , Language, Logic and Mathematics, English University
Press 1 96 7 ; di livello simile al testo di C rossley .
Capitolo
3
I sistemi numerici e il problema del numero di classi
Burill C . , Foundations of Real Numbers, McGraw-Hill, New York 1 96 7 .
Cohen L . e Ehrlich G . , The Structure of the Real Number System, V an
Nostrand, New York 1 963 ; due studi completi sull ' argomento .
Flegg G . , Numbers: Their History and Meaning, André Deutsch, London
1 98 3 ; un resoconto storico dello sviluppo dei sistemi numerici.
Niven I . , Numbers: Rational and Irrational, Random House , New York
1 9 6 1 [trad. it. Numeri razionali e numeri irrazionali, Zanichelli, Bologna 1 966] ;
una breve descrizione dei sistemi numerici.
S tark H . , An Introduction to Number Theory, Markham, C hicago 1 9 7 0 ;
si veda soprattutto i l capitolo 8 .
302
LEITURE D I APPROFONDIMENTO
S tewart I. N. e Tall D. 0 . , Algebraic Number Theory, Chapman and H all,
London 1 9 7 9 ; uno studio teorico approfondito .
Z agier D . , L-serie of elliptic curves, the Birch-Swinnerton-Dyer conjecture
and the class number problem o/ Gauss, « Notices of the American Mathema
tical Society », XXXI ( 1 984) , pp. 7 3 9-43 ; articolo di altissimo livello tecnico,
destinato agli specialisti.
Capitolo
4
Bellezza dal caos
Mandelbrot B. B . , The Fractal Geometry o/ Nature, W. H. Freeman , New
York 1 98 2 [trad. i t. La geometria della natura. Sulla teoria dei frattali, Imago,
Milano 1 987]; un testo base sulla geometria dei frattali e sulle sue applicazioni.
Peitgen H. O . e Richten P. H . , The Beauty of Fractals, Springer, New
York 1 986 [trad . it. La bellezza dei frattali, Bollati Boringhieri, Torino 1 987];
ottima raccolta di illustrazioni a colori e in bianco e nero .
Capitolo
5
I gruppi semplici
Gorenstein D . , Finite Simple Groups, Plenum, New York 1 98 2 ; uno stu
dio dettagliato e approfondito dell ' argomento .
- The Classification of Finite Simple Groups, 2 voll . , Plenum, New York
1 98 2 ; un resoconto completo, molto tecnico .
S tewart I. N . , Concepts of Modern Mathematics, Pelican, London 1 98 1 ;
il capitolo 7 è un' ottima introduzione alla teoria dei gruppi.
Capitolo 6
Il decimo problema di Hilbert
Browder F. (a cura di) , Mathematical Developments Arising /rom Hilbert
Problems, American Mathematical Society, Providence 1 9 74; contiene il testo
della conferenza di Hilbert del
Capitolo
7
I
900 e la soluzione del decimo problema.
Il problema dei quattro colori
Appel K. e H aken W . , The solution of the four-colour problem, « Scienti
fic American », ccxxxvn (1 9 7 7 ) , pp . 1 08 - 2 I [trad . i t. Il problema dei quattro
colori, « Le Scienze », xx ( 1 9 7 8 ) , 1 3 3 ] ; un resoconto abbastanza facile e com
prensibile .
- The four-colour proof suffices, « The Mathematical Intelligencer », VIII
( 1 986) , pp . 1 0- 2 0 ; articolo di carattere più matematico del precedente , ma
sempre espositivo, scritto in risposta alle critiche circa la dimostrazione .
Biggs N . , Lloyd E . e Wilson R . , Graph Theory I 7J 6 -I9J 6 , Oxford Uni
versity Press, Oxford 1 97 6 ; una rassegna ampia ed esauriente sullo sviluppo
della teoria dei grafi .
Saaty T. L. e Kainen P. C . , The Four Colour Problem, McGraw-Hill , New
York 1 9 7 7 ; un resoconto particolareggiato del problema e della soluzione .
LETTURE DI APPROFONDIMENTO
Capitolo
8
L 'ultimo teorema di Fermat
Burton, op. cit. (vedi cap . 1 ) ; testo di livello universitario .
Edwards H . M . , Fermat's Last Theorem, Springer, New York 1 97 7 ; un'in
troduzione graduale all' argomento .
Ribenboim P. , Thirteen Lectures on Fermat's Last Theorem, Springer, New
York 1 98o; meno semplice del precedente, ma ricco di informazioni .
S tewart e Tali, op. cit. (vedi cap . 3 ) ; testo a livello universitario, tratta
anche l'ultimo teorema di Fermat .
Capitolo
9
Problemi difficili sui numeri complessi
Chandrasekharan K . , Introduction to Analytical Number Theory, Springer,
Berlin 1 96 8 ; testo di livello superiore .
Devlin K . , Sets, Functions and Logic, C hapman and H all , London 1 98 1 ;
contiene un' introduzione ai numeri complessi .
Edwards H . M . , Riemann 's Zeta Function, Academic Press, London 1 9 74;
è il testo classico sulla funzione zeta.
FitzGerald C . , The Bieberbach conjecture: retrospective, « Notice of the
American Mathematical S ociety », XXXII ( 1 98 5 ) , pp . 2 - 6 .
Fomenko O . M . e Kuz'mina G . V., The last r o o days o/ the Bieberbach
conjecture, « The Mathematical lntelligencer », VIII ( 1 986) , pp . 40-4 7 ; due
brevi articoli sulla congettura di Bieberbach .
Jameson G . ] . , First Course on Complex Functions, Chapman and Hall,
London 1 97 0 ; corso a livello universitario.
Odlyzko A . M . e te Riele J . ] . , Disproof of the Mertens Conjecture, «Jour
nal fiir die reine und angewandte mathematik », CCCLVII ( 1 985 ) , pp. q 8-6o;
contiene la confutazione della congettura di Mertens .
Capitolo
IO
Nodi e altre questioni topologiche
C rowell R. e Fox R . , Introduction to Knot Theory, Gimm and C o . , Ayles
bury 1 963 ; rassegna di alto livello .
Freed D . e Uhlenbeck K . , Instantons and Four-Manifolds, Springer, Ber
lin 1 98 4 ; opera di altissimo livello tecnico sulle varietà non standard .
Neuwirth L . , The Theory of Knots, « Scientific American », CCXL ( 1 9 7 9 ) ,
p p . 8 4 - 9 6 [trad . i t . La teoria dei nodi, « Le Scienze », XXIII ( 1 9 7 9 ) , 1 3 2 ] ; un
articolo divulgativo sulla teoria dei nodi .
S tewart, op. cit. (vedi cap . 5 ) ; i capitoli 1 0- 1 4 sono una introduzione ele
mentare ma completa alla topologia.
Thistlethwaite M . , Knot Tabulations and Related Topics, in I. M . James
e E. H. Kronheimer (a cura di) , Aspects of Topology , C ambridge University
Press, C ambridge 1 985 ; un buon saggio sull ' argomento.
3 04
LETTURE DI APPROFONDIMENTO
Capitolo
II
L 'efficienza degli algoritmi
G arey M . e Johnson D . , Computers and Intractability, W. H . Freeman,
New York 1 97 9 ; il testo classico sull 'efficienza degli algoritmi .
Karmarkar N . , A new polinomial-time algorithm /or linear programming,
« Combinatoric a » , IV ( 1 984), pp. 3 73 -9 2 ; l ' articolo originale di Karmarkar .
Lewis H. e Papadimitrou C . , The efficiency of algorithms, « Scientific Ame
rican », ccxxxvm ( 1 9 7 8 ) , pp . 9 6- 1 09 ; articolo breve e di facile lettura.
Lighthill ] . , Newer Uses of Mathematics, Penguin, London 1 9 7 8 ; un'in
troduzione alla programmazione lineare e all ' algoritmo del simolesso.
Indice dei nom1
Abel N. H . , n 6 , 1 2 8
Adleman L. M . , I 9 , 3 8 , 2 I 8
Alembert J.-B. d ' , 79
Alexander J. W., 2 6 2 , 267
al-Khowarizmi a.J. M . i . M . , I ) 2
Appel K . , I 6 7 , I 9 4
Argand J.-R., B I
Aschbacher M . , I 45
Atiyah M . , 2 8 2
Bachet C . , I 9 8
Backlund R . , 2 3 5
Baker A . , 8 4
Barlow P . , 3 2
Bernoulli J . , I 9 8
Bieberbach L . , 2 4 6
Birkhoff G . , I 90 sg.
Bombelli R., 76
Branges L. de, 2 4 2 sg.
Brauer R . , I 40 , I 4 3 sg.
Brent R. P . , 2 9
Briggs G . B . , 2 6 2
Brillhart } . , 2 9
Burnside W . , I 4 3
Cantor G . , 50 - 5 2 , 5 4 - 59, 6 I -64
Cardano G . , n 6
Cartesio, vedi Descartes
Casson A . , 2 7 8
Cauchy A . , 2 2 2
Cayley A . , 1 7 1
Cesare, 3 5
Chevalier A . , I I 9
Church A . , I ) 3
Cobham A . , 2 85
Cohen H . , I 9 , 2 3 8
Cohen P. J . , 6 o sg.
Cole F. N . , 2 5
Conway J. H . , I 4 ) , 2 6 2 , 2 69
Cook S . , 292
Crowder H . P . , 290
Dantzig G., 290, 298
Davis M . , 1 60-62
Dehn M . , 26 I , 265
Desargues G . , I 9 8
Descartes R . , 74, I 9 7 sg.
Deuring M., 86
Diffie W., 3 8
Diofanto d i Alessandria, 1 4 8 , I 9 8 , 2 0 1 -03
Dirichlet G . L., 2 I o sg.
Donaldson S . , 28 2
Diirre K . , I 9 I
E dwards } . , 2 85
Emel 'anov E . G . , 2 43
Escher M. C . , 270 , 2 7 2
Euclide, I ) , 3 2 , I ) I , 202
Eulero (L. Euler) , 2 8 , 32, 66 sg. , 7 4 , 79, I I6,
I77 sg. , 208 sg. , 2 2 8, 250
Fa!tings G . , I 9 7 . 2 I 8
Farey J . , 2 25 sg.
Fatou P., 99, I 07
Feit W . , I 4 I , I 4 3 sg.
Fermat P. de, I9 sg. , 26-30, I 9 7 - 2 0 I
Fermat S . de, I 99
Ferrari L . , I I 6
Ferro S . de, I I 6
Feustal C . , 267
Fibonacci (Leonardo Pisano) , I 63
FitzGerald C . , 2 4 2 , 2 48
306
Fontana N . , I I 6
Fourier ].-B.-] . , 1 1 7
Fouvry E . , 2 1 8
Fraenkel A . A . , 5 3 sg.
Frane! J . , 2 2 7
Franklin P . , 1 9 1
Freedman M . , 2 7 8 , 2 8 1
Frege G . , 5 1 sg.
Freyd P., 269
Fulkeston D . R., 290
Galois É ., r r 6 - r 9
Garabedian P . , 2 4 7
Gardner M . , 1 7 3
Gauss K . F . , 30 sg. , 6 6 , 7 9 , 8 r -8 7 , 1 5 1 , 2 29 ,
250, 261
Germain S . , 2 1 7
Gillies D . , 24
Girard A., 79
Godei K. , 42, 49 sg. , 6o, 1 5 3
Goldbach C . , r 8
Goldfeld D . , 86
Gorenstein D . , 1 4 1 , 1 45
Gram J. P . , 2 3 4
Griess R . , 1 40
Gross B . , 66, 86
Guthrie F . , r 69 , 1 7 1
Hadamard J . , 2 3 1 sg . , 2 3 8
Haken W . , r 6 7 , 1 94 , 2 6 7
Hall M. j r , 1 3 9
Hamilton W . R . , 8 r , 1 7 1 , 1 77
Hardy G. H . , 34, 88, 2 2 7 sg. , 2 3 4
Haros C . , 2 2 5 sg.
Heath-Brown D . R., 2 1 8
Heawood P. ] . , r 8 2 , r 87 sg. , 1 90 e n .
Hecke E . , 85 sg.
Heegner K . , 84
Heesch H . , 1 9 1 -94
Heilbronn I L A . , 84, 86
Held M., 290
Hellman M., 3 8
Hemion G . , 2 6 7
Hermite C . , 2 3 7
Higman G . , 1 3 9
Hilber t D . , 4 9 , 5 9 , 6 4 , 1 4 7
Horowitz D . , 2 4 8
Hoste ] . , 2 69
Hurwitz A . , 2 3
Hutcheson F . , 1 4
Hutchinson J. ] . , 2 3 5
Ingham A. E . , 2 3 9
INDICE D E I NOMI
Janko Z . , 1 3 8 sg.
Jensen K . L . , 2 1 6
Johnson S . , 290
Jones ]., 1 65
Jones V. F. R . , 2 69
Jukovskij N . Y . , 2 2 2
Judin D . B . , 299
Julia G., 99, 107 sg.
Jurkat W. B., 2 3 8
Karmarkar N . , 3 0 0
Karp R . , 290
Kempe A. B . , r 8 2 , 1 86-88
Khachian L. G . , 299
Kirkman T . P . , 2 6 r
Kleene S . C . , 1 5 3
Koch H . von, 9 1
Kronecker L . , 1 4
Kummer E . E . , 2 1 3 sg . , 2 r 6- r 8
Kuz'mina G . V . , 243
Laff M . , 99
Lagrange J.-L., I I 6
Lamé G . , 2 1 I - r 3 , 2 1 7
Landry F . , 29
Legendre A.-M. , 2 1 0 , 2 1 7 , 2 2 9
Lehman R . S . , 2 3 0 , 2 3 5
Lehmer D . H . , 2 4 sg . , 2 9 , 2 1 6, 2 1 8, 2 3 5
Leibniz G . , 74, 1 97
Lenstra A. K . , 240
Lenstra H . W. jr, 19, 240
Levin L. A . , 299
Lickorish W. B . R . , 2 69
Liouville J . , I I 9 , 2 1 2 sg .
Little C. N . , 26 r
Little J . D . C . , 290
Littlewood J . E . , 230, 247
Lorenz E . N., 103
Lovasz L., 240
Léiwner C . , 247 sg.
Lucas É . , 2 4 sg.
Lune J . van de, 2 3 5
Mandelbrot B . , 89 sg. , 9 7 , 99 sg. , 1 05- 1 3
Mathieu É . , 1 3 8
Matjasevic Y . , 1 49 , r 6o, r 63 -65
McKay ] . , 1 3 9
Menger K . , 2 89
Mersenne M . , 2 2
Mertens F . , 2 3 8
Milin I . M . , 2 4 3 , 2 4 7 sg.
Millett K . , 269
Milnor J . , 2 8o
INDICE DEI NOMI
Mirimanoff D . , 2 I 8
Mobius A . F . , 2 3 6 , 2 5 4
Moldave P . , I oo
Mordell L. J . , 86, 2 1 8 sg.
Morehead ] . C . , 29
Morgan A. de, I 69 , I 7 I
Morrison M . A . , 2 9
Murty K . G . , 2 9 0
Myrberg P. ] . , 106
Nemirovski A . S . , 299
Newton I . , I97
Nickel L. , 2 4
Nicomaco, 3 2
Noli C . , 2 4
Ocneanu A . , 2 6 9
Odlyzko A ., 2 3 8·4I
Ore 0 . , I 9 I
Ozawa M . , 2 4 7
Padberg M. W . , 290
Pasca! B., 74, I 9 7 sg.
Pederson R. N., 247
Pitagora di Samo, 3 I
Poincaré H . , 2 5 0 , 2 7 7 sg.
Poisson R . , I I 8
Pollard J. M . , 2 9
Post E . L . , I 5 3
Powers R. E . , 2 9
Putnam H . , I 6 2
Ree R . , I 3 9
Reidemeister K ., 2 6 2
Reynolds C . N . , I 9 I
Riele H . ]. ]. te, 2 3 0 , 2 3 5 , 2 3 8 - 4 I
Riemann B . , 2 2 2 , 2 J I
Riese! H . , 2 3
Ringel G . , I 90
Rivest R . , 3 8
Robinson ] . , I 6 2
Robinson R . , 2 3
Rosser J. B . , 2 3 5
Rumely R. S . , I 9
Russell B . , 5 2 , 64 , 8 8
Sato D . , I 65
Schiffer M . , 2 4 7
Seifert H . , 2 66 sg.
Shamir A . , 3 8
Shor N . Z . , 299
Siegel C., I I I , 2 I 6 , 2 3 5
Simmons G . , 3 9
Skewes S . , 2 3 0
Slowinski D . , 24
Smale S . , 2 7 8
Solomon R . , 1 1 5 , I 4 5
Stafford E . , 2 I 6
Stark H . , 84
Steinmetz C . , 79
Stemple G . ] . , I 9 I
Sterneck R. D . von, 2 3 8
Stieltjes T. J . , 2 3 7 sg.
Sweeney D . W., 290
T ai t P. G., 2 6 r
Taubes C . H . , 283
Talete, 7I
Thom, R . , 2 5 0
Thompson ] . , I 4 I , 1 4 3 sg.
Titchmarsh E . C . , 2 3 5
Tuckerman B . , 2 4
Turing A . M . , I 53 sg. , 2 3 5
Vallée Poussin C . d e l a , 2 29-3 2
Vandiver H. S . , 2 1 6
Verhulst P . F . , I OJ
Wada H . , I 65
Wagstaff S . , 2 I 6
Wales D . , I 3 9
Wallis J . , I 9 8
Warnock A . , 3 9
Wessel C . , 8 I
Western A. E . , 2 9
Whitten W . , 267
Wiens D., I 65
Winn C . E . , I 9 I
Yetter D . , 269
Zagier D . , 66, 86
Zeeman C . , 2 50
Zermelo E . , 53 sg.
Indice analitico
Accademia francese delle Scienze, I I 7- 1 9 , 22 0
Aleph, 58 sg.
Alexander, polinomi di, 267 sg.
Algoritmo(i) , 1 5 2 , 1 5 5
branch and bound, 290
del simplesso, 298 sg.
efficienza degli, 2 84-87
euclideo, 1 5o
non deterministico, 2 9 1 sg.
Analisi complessa, 2 2 2- 2 4
Anello, 4 7 , 2 1 2
Argand, diagramma di, Bo sg.
Aritmetica (di Diofanto) , 1 4 8 , 1 98 sg. , 2 0 1 ,
2 0 3 sg.
Ars Magna (di Cardano) , 1 1 6
Assioma/Postulato, 43-45
Attrattore, 1 04, 1 07
Bordo di una superficie, 2 5 3
Bottiglia d i Klein, 1 89 , 254, 276
Calotta intersecantesi, 2 74-76
Campo, 75
Carica, metodo della, 1 9 2 -94
Catastrofi, teoria delle, 2 50
Centralizzante, 1 3 9 , 1 44
Chirurgia, 2 7 4
Codice(i) :
cesareo, 3 5
chiave del, 36 sg.
segreti, 3 4-40
sistema in, 3 6 sg.
Cole, premio per l'algebra, 1 43 , 1 45
Complementare di un insieme, 1 5 8
Completezza d i u n sistema assiomatico, 4 8
Congettura:
di Bieberbach, 2 4 2 -48
di Goldbach, 1 8
d i Mertens, 2 3 6-4 1
di Mordell, 2 1 8
d i Poincaré, 2 7 7-79
P = NP, 294
Continuo:
ipotesi del, 6o
problema del, 4 1 , 1 4 7
Consistenza d i u n sistema assiomatico, 4 8
Coseno, 2 2 3
Costruzioni con riga e compasso, 3 1
Crescita esponenziale, 1 0 3
Crittografia a chiave pubblica, 3 7 sg.
Curva ellittica, 86n.
DES
(Data Encryption Standard) , 3 7
Dimensione, 94-98
frazionaria, 97
Dinamica:
caotica, 89, 1 0 2
classica, 1 o 2
dei sistemi complessi, 90
Disco unitario, 245
Discriminante, 68
Disquisitiones Arithmeticae (di Gauss), 30 ,
85-87
Divisibile, 1 5
Divisione per tentativi , 1 8 sg.
Dodecaedro, 1 3 0
Dominio di integrità, 47 sg.
e, 69-7 1 , 2 2 3
É cole Polytechnique, 9 9 , 1 1 7
Elementi (di Euclide) , 1 5 , 3 2 , 1 5 1 , 2 0 2
3IO
Elemento neutro:
additivo, 45
di un gruppo, 1 2 8
moltiplicativo, 45
Ellissoidale, metodo, 299
Equazione:
cubica, I I 6
diofantea, I 48
di quarto grado, I I 6
di quinto grado, I I 6 , I 4 3
quadratica, 6 7 , I I 6
Equivalenza:
geometrica, 2 57
topologica, 2 5 2 , 2 5 7
Eulero:
caratteristica di, I 88 sg. , 2 5 8 , 2 74-76
formula di, I 77-80
Eulero-Maclaurin, serie di, 2 34
Faccia di un grafo/poliedro, I 7 7 sg.
Farey, successione di, 2 2 5 sg.
Fatou, polvere di, I I 2
Fattori, 2 5 , 39
ideali, 2 I3
Fattori primi, I 5
scomposizione in, I 5
Feedback/circuiti retroattivi, I O I
Fibonacci :
conigli d i , I 63
numeri di, I 64
successione di, I 63 sg.
Fields , medaglia, 4 I , 27 8
Forcing, metodo d i , 6 I
Frattali, 97
Frazione propria, 2 2 5
Frazioni continue, metodo delle, 2 9
Funzione:
di Koebe, 246
di Mobius, 2 36
iniettiva, 245
zeta, 228, 2 3 I -36, 2 4 I
Funzioni complesse, teoria delle, 2 2 I - 2 5
Genere:
di una superficie, 266, 2 7 4
d i u n nodo, 266
Geometria frattale, 97
Grado di un vertice, 1 9 2
Grafo(i) , I 75-77
duale, I 7 5 sg.
nodo di un, I 75
teoria dei, I 75-77
Grecia antica, matematica nella, 7 I -73
INDICE ANALITICO
Gruppi semplici, I 3 0, I 3 5-38
problema di classificazione dei, I 3 8-46
Gruppo(i) , I I 9 , I 2 8
abeliano, I 2 8
alterno, I 4 2 sg.
assiomi di, I 2 8
ciclico/dell'orologio, I 3 5
commutativo, I 2 8
del « gigante amichevole >>, I 40
delle simmetrie, I 2 2- 2 7 , I 3 0
immagine omomorfaftelescopica d i un, I 36
immagine puntuale di un, I 36
« mostro », 1 40
sporadico, I 3 8
teoria dei, I 3 o
Heawood, formula di, I 88-9o
Heegner, punti di, 87
Herman, anello di, I I 1
Hilbert:
albergo di, 57
decimo problema di, I 47-49 , I 6o-63
programma di, 49
i, unità immaginaria, 7 I
Ideali, teoria degli, 2 I 4
India antica, matematica nell ' , 7 3 sg.
Insieme(i), 5 I
calcolabile, I 5 5
di Julia, I 05-o8
di Mandelbrot , I 08- I 4
elemento d i un, 5 I sg.
inevitabile, I 87
infiniti, 54 sg.
numerabile, 57
potenza/delle parti, 62
ricorsivamente enumerabile, 1 5 7 sg. , I 65
teoria degli, 50-64
vuoto/nullo, 62
Integrali di linea/curvilinei, 2 2 4
Integrazione nel piano complesso, 2 2 4
Interi, 45-47
ciclotomici, 2 1 2
di Gauss, 8 2 sg.
irriducibili , 83
Introductio Arithmeticae (di Nicomaco) , 32
In variante topologico, 1 89 , 2 5 7 sg.
Inverso in un gruppo, I 2 7 sg.
Involuzioni , 1 44
Ipercubo, 2 70 sg .
Ipersfera, 2 7 I sg.
Isomorfismo, 2 65
311
INDICE ANALITICO
Koch:
curva di, 94
isola di, 9 1 -94
Lato di un grafo/poliedro, 1 77 sg.
Legge:
di cancellazione, 45
di reciprocità quadratica, 8 2 , 2 1 4
dinamica, 1 0 2
Liber Abaci (di Fibonacci) , 1 6 3
Logaritmo integrale, 2 2 9
Logica dei predicati, 5 1
Macchina d i Turing, 1 5 3- 5 7 , 285 sg.
universale, 1 59
Manico, 266, 2 74 sg.
Mappa, 1 7 2-74
riduzione di una, 1 83
Mappa normale, r 86
minimale, I 8 7
Matrice(i) , I 3 I - 3 3
identica, 1 3 3
invertibile/non singolare, 1 3 4
non invertibile/singolare, 1 3 4
ordine della, I 3 1
quadrate, 1 3 1
Modulo, 2 1
Monte Carlo, metodi, 2 9
Nastro d i Mobius , 2 54 sg. , 2 7 5 sg.
Nodo(i), 2 5 9-69
a otto, 2 5 9
diagramma di , 2 6 o
equivalenti, 2 6 1
gruppo del, 263 sg .
invarianti di, 2 6 1
piano, 268
polinomi del, 267-69
primario, 2 6 1
quadruplo, 2 6o sg . , 2 67
semplice, 259 sg.
semplice chiuso , 2 60 sg . , 267 sg.
teoria dei, 2 50, 2 59-69
vaccaio, 268
Non-decidibilità di proposizioni matematiche,
4 1 sg.
n-sfera, 2 7 7
Numeri primi, 1 5 , 67
di Mersenne, 2 3 , 3 2 Sg . , 2 1 8
distribuzione dei, 2 2 9-3 3
formula generatrice di, 1 65 sg.
infinità dei, r6 sg.
irregolari, 2 1 4- I 6
regolari, 2 1 4 - 1 6
teorema dei, 2 3 1
Numero(i) :
complessi, 48, 7 1 , 76-8 I
composti, I 5
d i Bernoulli, 2 I 5
di Feigenbaum, 1 06
di Fermat, 2 7-30
di Fibonacci, vedi Fibonacci
di incroci, 2 6 1 sg.
di Mersenne, 2 5 , 3 3
d i Skewes , 2 3 0 , 2 3 2
divisibili d a quadrati, 2 3 6
ideali, 2 1 3 sg.
immaginario, 7 1 , 76 sg.
irrazionale, 68, 76
liberi da quadrati, 2 3 6
naturali, 1 4 , 7 1
negativi, 7 3 sg .
perfetti, 3 1
razionali, 48, 7 2
reali , 48, 74-76
teoria analitica dei, 67, 2 2 1 sg.
teoria dei, 30
transfiniti, 5 5
triangolare, 3 3
Numero d i classi, 85
problema del, 83-87
Omotopia, 2 8 1
Ottonioni , 8 2
n:, 6 8
n:(n), r 6 , 2 2 9-33
Parte:
immaginaria, 77
reale, 7 7
Permutazione, 1 4 1
dispari , 1 4 1
pari , 1 4 1
Piano:
complesso, So sg.
proiettivo , 2 7 5
Pitagorici, 3 1
Poliedri regolari, 2 7 3
Poligono, 3 1 , 2 9 7 sg.
regolare, 3 1
Politopo, 2 7 3 , 298
Pollard, metodo di fattorizzazione di, 2 9
Postulato, vedi Assioma
Problema:
dei quattro colori, 1 67-7 1
del commesso viaggiatore, 2 88-90
3I2
del continuo di Cantor, 4 I , 5 S-6 I
NP, 2 9 I sg.
NP-completo, 2 9 2 -94
P, 2 9 I
Problemi decisionali, 2 9 I
Programmazione lineare, 2 9 3 , 295
Prolungamento analitico , 2 3 I
Proprietà:
commutativa, 44 sg.
distributiva, 45
Proprietà associativa:
dei gruppi, 1 26, 1 2 8
dei numeri, 44 sg.
Pseudoprimi , 20
Quaternioni , S I -S3
Radianti, 2 2 3
Radicali, u 6 , I J I
soluzione per, u 6 , I 4 3
Radice numerica, 3 3
Regresso all'infinito, 2 04-06
Retta reale, 59, So
Riducibilità, I SS
Riemann:
ipotesi di, I 47 , 2 2 7 sg. , 2 3 2-36, 2 4 I
ipotesi generalizzata di, S6
Riflessione, I 2 0 sg .
Russell, paradosso di, 5 2 sg.
Scaricamento, procedura di, I 9 2 -94
Scuola:
ionica, 7 I
pitagorica, 7 I
Seno, 2 2 3
Serie infinite, 2 2 3
Setacciatura, 2 7
Siegel, disco di, I I I
Sierpinski :
spugna d i , 97 sg.
tappeto di, 97
Simmetria(e) , I 2 o- 2 2
asse di, I 2 I
assiale, I 2 I
di rotazione, I 2 2
Sistema:
crittografico, 35
dinamico, I 0 2
RSA, 3 S
Sottogruppo, I 3 0
Sottoinsieme, 62
Spigolo, I 77 sg.
INDICE ANALITICO
Struttura differenziabile, 2 So
Superficie/Faccia, 2 5 2-54
chiusa, 253
non orientabile, 2 55
orientabile, 2 5 5
standard, 274 sg.
Tempo:
esponenziale, 2S6 sg.
polinomiale, 2 S6
Teorema:
dei cinque colori, I SI -S6
della fattorizzazione unica, S3
di C antor, 6I sg.
di classificazione dei gruppi finiti semplici,
I I5
di Feit-Thompson, I 4 3 sg.
di incompletezza di Godei, 49 sg.
di Pitagora, 73
di Proth, 2 S
fondamentale dell' algebra, 7 9
fondamentale dell' aritmetica, I 5 , S 3
Teorema ultimo d i Fermat, I 9 7
primo sottocaso del, 2 0 7
secondo sottocaso del, 2 0 7
Terna pitagorica, 2 0 I
primitiva, 2 0 2
Test:
ARCL, I9
di Fermat, I 9 sg.
di Lucas-Lehmer, 2 4 , 33
di primalità, 1 S- 2 2
Topologia, 249-S3
Trasformazione:
continua/topologica, 250
identica, I 2 3
rigida, 256
Triangolo:
isoscele, I 2 o
pitagorico, 204
Varietà, 270, 279
differenziabile/liscia, 2So
teoria delle, 2 5 0 , 2 79-S3
Verhulst, processo di, I03 sg.
Verità in matematica, 47 sg.
Vertice, I 77
Wolfskell, premio, 2 2 0
Zermelo-Fraenkel, teoria degli insiemi di,
5 3 sg.
È difficile, per il profano, pensare alla matematica come a una
disciplina in continua evoluzione: la scienza esatta per eccellenza,
immutabile dai tempi di Newton (o forse di Euclide), non sembra
ammettere al suo interno né ricerca, né progresso. Scopo dichia
rato di Keith Devlin è sfatare questo luogo comune, mostrando
al pubblico dei non specialisti in quali direzioni si sia mossa la
ricerca matematica negli ultimi decenni.
Il panorama è ampio e differenziato: ad argomenti ormai classici,
come il teorema di Fermat o la teoria dei frattali, Devlin non esita
ad affiancare settori meno conosciuti della disciplina. Ecco quindi
fare la loro comparsa i «gruppi finiti semplici», la «funzione zeta
di Riemann» e altri affascinanti oggetti matematici, che si pre
stano a essere «scoperti» anche dal lettore munito di un bagaglio
essenziale di conoscenze.
Scritta da un matematico professionista con grandi doti di divul
gazione, quest'opera tenta di colmare la distanza tra il linguaggio
della ricerca e il bisogno di informazione del pubblico, in un'epo
ca in cui la matematica sembra permeare di sé, con i suoi metodi
e modelli, l'intero discorso della scienza.
Keith Devlin, matematico assai attivo nel campo della ricerca, ha insegnato in
varie università inglesi e nordamericane. Al suo lavoro scientifico ha sempre
affiancato un'intensa attività di divulgazione, apparendo alla
BBC e
scrivendo
per vari quotidiani (tra cui il «Guardian», dove ha una rubrica fissa). Questo è
il suo nono libro.
ISBN 88-339-0840-2
9
Il 1111111
788833 908403