Dalla geometria elementare alla geometria degli iperspazi

l
Dipartimento di Matematica “Guido Castelnuovo”
Università degli Studi di Roma “La Sapienza”, a.a. 2009-2010
Appunti del corso
FONDAMENTI DELLA GEOMETRIA
Prof. Pier Vittorio Ceccherini
Parte Prima:
Dalla geometria elementare alla geometria degli iperspazi
1
Il problema dei fondamenti della geometria come parte di quello
dei fondamenti della matematica
Il problema dei fondamenti della geometria non può prescindere da quello più generale dei fondamenti della
matematica. Per semplicità ci si limiterà a considerare principalmente la posizione assunta al riguardo da
tre giganti della matematica – Euclide, Hilbert e Gödel – tre giganti che hanno segnato altrettante tappe
fondamentali nella storia della matematica.
Tra l’epoca di EUCLIDE (III sec. a.C.) e quella di David HILBERT (1862-1943) e di Kurt GÖDEL
(1906-1978) corre un periodo di oltre duemila anni. È perciò impossibile dare conto delle numerose ed
importanti conquiste del pensiero matematico che sono maturate in un cosı̀ ampio lasso di tempo e che sono
state esse stesse determinanti anche per il problema dei fondamenti.
1.1
La matematica di Euclide
1.1.1. Matematica pre-ellenica È oggi universalmente riconosciuto che ancor prima della civiltà
greca fosse notevolmente sviluppata una matematica di rilievo. Nei documenti più antichi che ci sono
pervenuti dall’Egitto e dalla Caldea sono largamente utilizzate le nozioni, già fortemente astratte, di numero
intero e di misura delle grandezze. Una ancor più significativa documentazione ci proviene dalla successiva
civiltà babilonese, che ci mostra un’”algebra” che utilizza metodi eleganti e sicuri e che è qualcosa di più
di una semplice raccolta di problemi risolti in modo empirico. Sebbene non vi sia presente niente che possa
essere assimilato ad una dimostrazione, si può riconoscere - nella ripetizione dei metodi risolutivi utilizzati
- il prodotto di precedenti concatenazioni logiche, sviluppate forse in modo inconscio, del tipo di quelle che
precedono ancor oggi la sistemazione logica e la messa in chiaro di una verità matematica o di una formula
che si comincia ad intuire.
1.1.2. L’innovazione della matematica greca È merito precipuo dei Greci di aver effettuato
uno sforzo del tutto cosciente volto ad organizzare le dimostrazioni matematiche attraverso una sequenza
di passaggi logici che non lasciassero alcun dubbio e che potessero essere riconosciuti come assolutamente
validi da tutti. Questo canone ideale – probabilmente rispettato fin dai primi contributi conseguiti tra
il VI ed il IV sec. a.C. ed attribuiti a TALETE, a PITAGORA e a EUDOSSO – trova poi una sua piena
realizzazione in epoca alessandrina (III sec. a.C.) nell’opera della famosa triade di EUCLIDE, ARCHIMEDE
e APOLLONIO, per i quali la nozione di dimostrazione non differiva in nulla dalla nostra.
È interessante notare come tutto questo fiorire della matematica greca si fosse accompagnato a quello della
filosofia, che aveva raggiunto il suo culmine con l’opera di PLATONE e di ARISTOTELE. Le prime riflessioni
sul carattere astratto degli enti matematici e sul procedere della matematica per successive deduzioni si
trovano espresse proprio in Platone ed in aristotele. Di essi è ben noto linteresse per la matematica e per la
logica, tanto che Platone aveva fatto scrivere all’ingresso della sua Accademia di Atene la celebre frase Non
entri chi non sa la geometria.
Il fenomeno del sorgere e dell’affermarsi della matematica greca – una matematica non soltanto ricca di
risultati ma impostata su basi metodologiche completamente nuove – si comprende soltanto alla luce del
contemporaneo fiorire della filosofia. All’origine della filosofia greca troviamo la ricerca di una spiegazione
della natura, il tentativo di ricondurre la materia a pochi elementi fondamentali. Quasi certamente questa
stessa motivazione – il voler sviluppare un’indagine razionale sulla natura – fu per i greci il motivo ispiratore
della ricerca matematica, riconosciuta come necessario strumento propedeutico.
Non siamo a conoscenza di esplicite dichiarazioni fatte in tal senso dagli autori, tranne che nel caso di
TOLOMEO (II sec. d.C.), il quale in un suo passo dichiara di aver sviluppato la trigonometria in vista delle
sue applicazioni all’astronomia. Fin dalle origini, la matematica doveva essere presso i greci tutt’altro che
una disciplina isolata; EUDOSSO era principalmente un astronomo, e lo stesso EUCLIDE scrisse i Fenomeni
(opera di astronomia, che trattava la geometria della sfera in vista dello studio del moto della sfera celeste),
l’Ottica (un trattato che consiste di varie definizioni e postulati e di 58 proposizioni), la Catottrica (teoria
della riflessione e degli specchi), gli Elementi di musica e alcuni saggi di meccanica. L’intento di applicare la
matematica alla fisica si trova notoriamente nell’opera di Archimede (autore di opere di ottica e di meccanica,
quali Catottrica, Sui baricentri, Sui corpi galleggianti, Sulle leve, Sull’equilibrio dei piani ); lo stesso intento
è ben presente anche in Apollonio (autore di un ampio studio su Gli specchi ustori ).
2
1.1.3. Il contenuto degli Elementi 1 . Non ci è pervenuto alcuno scritto di Euclide relativo alle sue
idee sul modo di procedere della matematica, nessuna riflessione insomma di filosofia della matematica, come
invece si trova in Platone e in Aristotele. Euclide non teorizza sulla matematica ma fa matematica. Tuttavia
i suoi Elementi – oltre ad essere un bagaglio di dottrina ancora oggi vivo e presente pressoché inalterato
nell’insegnamento pre-universitario della geometria – hanno storicamente costituito, per l’organicità della
loro articolazione, per il rigore2 delle argomentazioni e dei metodi, un modello preciso al quale si sono
attenuti tutti i matematici dopo di lui.
Esaminiamo dunque, seppure sommariamente, quest’opera, la sua struttura, i suoi pregi e i suoi limiti,
quali sono stati messi in risalto dalla critica moderna.
Gli Elementi si compongono di 13 Libri, nei quali vengono svolti argomenti di geometria, di aritmetica
e di algebra. La trattazione ha un carattere prettamente teorico, che prescinde da ogni regola di misura o
di calcolo, da ogni applicazione pratica3 ; ad esempio Euclide dimostra il teorema sulla proporzionalità dei
cerchi ai quadrati dei raggi, ma non si occupa di determinare il relativo rapporto costante4 .
Nei Libri I-IV vengono trattate le proprietà fondamentali dei poligoni e dei cerchi: uguaglianza dei
triangoli, teoria delle parallele, equivalenza dei poligoni, quadratura di un poligono (cioè costruzione di un
quadrato equivalente ad un poligono assegnato), proprietà del cerchio, poligoni regolari.
Nel Libro V – un vero capolavoro di astrazione – si prescinde dalla geometria e si sviluppa la teoria delle
proporzioni tra grandezze.
Il Libro VI applica la teoria delle proporzioni alla geometria, studiando le proprietà dei poligoni simili.
Il libro termina con la costruzione di un poligono che sia equivalente ad un poligono dato P e sia simile ad
un poligono dato Q (quando Q è un quadrato, si ricade nella quadratura di P ).
I Libri VII-IX non riguardano la geometria, ma la teoria dei numeri (interi). Euclide rappresenta
i numeri come segmenti ed il prodotto di due numeri come un rettangolo, ma gli argomenti che egli usa
non sono geometrici. Anzi, alcune definizioni e teoremi, ad esempio sulle proporzioni, sono ripetizioni di
quelli svolti per le grandezze; forse Euclide, nel rispetto della tradizione pitagorica, intendeva sottolineare
l’autonomia della teoria dei numeri da ogni teoria geometrica e risentiva forse anche della visione di Aristotele
che, pur considerando il numero come una specie di grandezza, metteva in rilievo la differenza esistente tra
continuo e discreto. Celebri sono la sua dimostrazione che i numeri primi sono più di qualunque moltitudine
assegnata di numeri primi 5 (cioè del fatto che esistono infiniti numeri primi) e quella dell’unicità della
fattorizzazione di un numero in fattori primi.
Il Libro X contiene la classificazione degli incommensurabili e precisamente delle cosiddette irrazionalità
quadratiche. Due segmenti sono commensurabili in lunghezza se lo sono nel senso usuale; sono commensurabili
in potenza se tali sono i quadrati costruiti su essi. Ad es. il lato e la diagonale di un quadrato sono
incommensurabili in lunghezza ma commensurabili in potenza.
I Libri XI-XIII riguardano la geometria solida, il metodo di esaustione6 , i poliedri regolari.
1.1.4. Il metodo ipotetico-deduttivo negli Elementi. Il Libro I si apre con tre serie di principi: le
definizioni, i postulati e le nozioni comuni). In effetti le definizioni (oroi ) vengono espresse con termini che
1 Oltre
che degli Elementi, Euclide è autore anche di altre opere matematiche. Alcune ci sono pervenute: i Dati, (che sono
una sorta di esercizi per ripassare gli Elementi); Sulla divisione (che tratta della suddivisione di una figura geometrica in altre
figure). Altre opere sono invece andate perdute e ne siamo a conoscenza per quanto ce ne hanno riferito PROCLO o PAPPO
o altri commentatori: le Coniche (opera in quattro libri, che secondo Pappo costituirono poi i primi tre capitoli delle Sezioni
coniche di Apollonio): la Pseudaria (una raccolta di dimostrazioni giuste e sbagliate, presentate per esercitare il ragionamento
dei discepoli); i Porismi [cioè Proposizioni] (che trattavano problemi di costruzioni geometriche); i Luoghi superficiali (opera
in due libri, che trattava probabilmente di alcune superfici caratterizzate come luoghi geometrici).
2 L’importanza del rigore era fortemente sentita in Euclide, un rigore che non ammetteva sconti. A questo riguardo, Proclo
racconta che Euclide, richiesto dal re Tolomeo se non ci fosse un mezzo più breve degli Elementi per imparare la geometria,
rispose che in geometria non esistono vie regie.
3 Come racconta Strobeo, quando un allievo chiese ad Euclide quale utilità egli avrebbe ricavato dagli studi della geometria,
il maestro cacciò il malcapitato dopo avergli fatto consegnare qualche moneta
4 Il calcolo di valori approssimati di π verranno poi forniti da Archimede.
5 Se p , p , . . . , p sono numeri primi, e se q è un fattore primo di N = p p . . . p + 1, allora q ∈
/ {p1 , p2 , . . . , pn }.
n
n
1 2
1 2
6 Il metodo di esaustione - introdotto da Eudosso (IV sec. a.C.) e precursore della moderna analisi infinitesimale - viene
utilizzato per il calcolo di aree e volumi: esso consiste nel considerare successioni di figure inscritte e circoscritte alla figura in
esame sempre più ”vicine” alla figura data, la cui misura risulta elemento di separazione delle misure di quelle figure che la
approssimano per difetto e per eccesso.
3
non vengono definiti. Forse Euclide era cosciente che esse non avevano alcuna validità logica, ma intendeva
spiegare intuitivamente che cosa rappresentassero quei termini, in modo da poterli utilizzare nei postulati
fornendo una migliore comprensione dei postulati stessi. Modernamente parlando, sarebbero da denominare
concetti primitivi , termini appunto, definiti poi implicitamente dai postulati.
Dopo le definizioni, Euclide enuncia cinque postulati (richieste, αιτ ηµατ α, aitèmata) e cinque nozioni
comuni (koinài ennòiai ). I libri successivi non contengono né postulati né nozioni comuni, mentre alcune
definizioni sono poste all’inizio dei Libri II-VII e X-XI.
Secondo una distinzione che risale ad Aristotele, i postulati si riferiscono propriamente alla geometria,
mentre le nozioni comuni esprimono proprietà più generali, applicabili a tutte le scienze.
Nel successivo sviluppo storico della matematica – almeno fino alla creazione delle geometrie noneuclidee – sia i postulati che le nozioni comuni vennero considerati come espressioni di verità certe, che non
potevano essere messe in discussione. È peraltro interessante rilevare come l’originario punto di vista del
pensiero greco fosse al riguardo assai meno netto, Secondo lo stesso Aristotele, non era necessario accertare
la verità dei postulati, in quanto essa sarebbe stata certificata a posteriori dalla concordanza dei risultati dedotti dai postulati con la realtà, cioè fondamentalmente con l’esperienza empirica. È poi d’indubbio interesse
che PROCLO (410-485 d.C.), il primo commentatore importante di Euclide, avesse – già nel V sec. d.C. –
precorso la moderna visione della matematica come scienza ipotetico-deduttiva, Ar rivando egli a descrivere
esplicitamente la matematica come una scienza ipotetica, che si limita a trAr re deduzioni dalle assunzioni,
indipendentemente dal fatto che queste siano vere o false.
Riguardo all’esistenza e alla coerenza dei concetti definiti, Euclide non si pronuncia; tuttavia i primi tre
postulati del Libro I (vedi appresso) asseriscono la possibilità di costruire rette e cerchi e quindi ne affermano
l’esistenza (sottintendendone l’unicità). Di fatto, quella di Euclide è un’impostazione costruttivistica e
conseguentemente finitistica.
Riportiamo qui di seguito – oltre ad una selezione delle definizioni più importanti dei vari Libri – tutti
i postulati e tutte le nozioni comuni (che come detto si trovano soltanto all’inizio del Libro I).
Alcune definizioni presenti negli Elementi
(una selezione, dai libri I, V, VII, XI):
Def I-1: Punto è ciò che non ha parti.
Def I-2: Linea è lunghezza senza larghezza.
Def I-3: Estremi di una linea sono punti.
Def I-4: Linea retta è quella che giace ugualmente rispetto ai suoi punti.
Def I-5: Superficie è ciò che ha soltanto lunghezza e larghezza.
Def I-6: Estremi di una superficie sono linee.
Def I-7: Superficie piana è quella che giace ugualmente rispetto alle sue rette.
Def I-8: Angolo piano è l’inclinazione reciproca di due linee su un piano, le quali s’incontrino tra loro e
non giacciano in linea retta. (Si escludono gli angoli piatti).
Def. I-15: Cerchio è una figura piana limitata da un’unica linea, tale che tutte le rette condotte su di essa
da un punto fra quelli interni alla figura sono uguali fra loro.
Def I-16: Quel punto si chiama centro del cerchio.
Def I-17: Diametro del cerchio è una retta tracciata per il centro e limitata in entrambe le direzioni dalla
circonferenza, tagliando il cerchio per metà.
Def I-23: Parallele sono quelle rette che, essendo nello stesso piano e venendo prolungate indefinitamente
da entrambe le parti, non si incontrano fra loro in nessuna di queste.
Def. V-3: Rapporto di due grandezze omogenee è un certo modo di comportarsi rispetto alla quantità.
Def V-4: Si dice che hanno rapporto le grandezze le quali possono, se moltiplicate, superAr si reciprocamente7 .
7 A norma delle Def. V-3 e V-4, Euclide considera aventi rapporto tra loro due grandezze soltanto quando esse siano omogenee
ed Archimedee; in particolare Euclide esclude dalla sua geometria gli angoli tra curve, in particolare l’angolo di contingenza,
ossia quello tra la circonferenza ed una sua tangente. Si noti che Euclide non formula la proprietà di Archimede sotto la
forma esplicita di un postulato, come facciamo noi, ma restringe comunque le proprie considerazioni alle ”grandezze che hanno
4
Def VII-1: Unità è ciò secondo cui ciascun ente è detto uno.
Def VII-2: Numero è una pluralità composta da unità8 .
Def XI-1: È un solido ciò che ha lunghezza, larghezza e altezza.
Def. XI-2: Limite di un solido è una superficie.
I cinque Postulati degli Elementi
(tutti nel Libro I)
1o Postulato: Risulti postulato: che si possa condurre una retta da qualsiasi punto ad ogni altro punto.
2o Postulato: E che si possa prolungare una retta finita continuamente in linea retta.
3o Postulato: E che si possa descrivere un cerchio con qualsiasi centro e ogni distanza.
4o Postulato: E che tutti gli angoli retti siano uguali fra loro.
5o Postulato: E che se una retta, venendo a cadere su due rette forma gli angoli interni da una stessa parte
minori di due angoli retti, le due rette prolungate indefinitamente si incontrano dalla parte in cui sono gli
angoli minori di due retti.
Le cinque nozioni comuni degli Elementi
(tutti nel Libro I)
1a
2a
3a
4a
5a
Nozione
Nozione
Nozione
Nozione
Nozione
comune:
comune:
comune:
comune:
comune:
Cose che sono uguali a una stessa cosa sono uguali anche tra loro.
E se a cose uguali si aggiungono cose uguali, le somme sono uguali.
E se a cose uguali si sottraggono cose uguali, i resti sono uguali.
E le cose che coincidono fra loro sono fra loro uguali.
E il tutto è maggiore della parte.
Pregi e limiti della geometria di Euclide. Il grande merito di Euclide consiste nell’aver raccolto
una serie di conoscenze accumulatesi prima di lui, di averle integrate con propri contributi originali e soprattutto di aver presentato tutto questo materiale in modo ordinato e organico, argomentando in modo
logicamente conseguente le varie proposizioni e teoremi, gettando insomma le basi del moderno metodo
ipotetico-deduttivo. Tuttavia si può notare che molte delle sue definizioni non sempre definiscono, e che le
sue dimostrazioni richiedono taluni assiomi non enunciati esplicitamente, quali il postulato di Archimede,
il postulato di continuità della retta, ed i postulati riguardanti l’ordine lineare sulla retta. Bisognerà
aspettare oltre 2000 anni prima che queste pecche vengano sanate dai matematici della fine del XIX secolo.
Il 5o Postulato. Il 5o Postulato è il famoso postulato delle parallele che viene comunemente enunciato
nella forma (siamo in un piano); Per un punto esterno ad una retta, passa un’unica retta parallela alla
retta data (cioè non secante la retta data). Si noti che nella formulazione di Euclide, il parallelismo viene
descritto in negativo, in quanto pone una condizione affinché due rette (complanari) non siano parallele. Il
postulato afferma in sostanza che per un punto fuori di una retta esiste al più una parallela alla retta data,
mentre si può poi dimostrare l’esistenza di una parallela utilizzando gli altri assiomi euclidei (e la proprietà
di continuità all’interno del fascio di rette di centro quel punto). È ben noto come questo postulato abbia
attirato l’attenzione dei matematici, nel tentativo di dimostrarlo come teorema, tentativo che è fallito a
rapporto”, per le quali, in base alla Def V-4 stessa, vale la proprietà di Archimede.
8 Dunque, per Euclide ”numero” significa numero intero positivo.
5
séguito della creazione delle geometrie non-euclidee (nel sec. XIX), le quali dimostrano l’indipendenza
del 5o Postulato dai primi quattro. Nella geometria non euclidea di Riemann (geometria ellittica) il 5o Postulato viene sostituito dalla richiesta che per un punto esterno ad una retta non passi alcuna parallela alla
retta data; nella geometria non euclidea di Lobatchevski - Bolyai (geometria iperbolica) si richiede invece
che per un punto esterno ad una retta passino due parallele alla retta data (e si dimostra che di conseguenza
ne passano infinite)9 . Si noti che il 5o Postulato perde significato nella geometria proiettiva (nella quale la
nozione di parallelismo non ha senso).
Il problema della coerenza della geometria euclidea (cioè la proprietà che lo sviluppo della teoria non
conduca a contraddizioni) non si pose per molto tempo, perché si pensava che questa geometria fosse precisamente corrispondente alla realtà del mondo fisico ed in esso trovasse a priori la propria legittimità piena. Ma
quando furono scoperte le geometrie non-euclidee, queste certezze cominciAr ono a vacillare, e sorse anche il
nuovo problema della coerenza delle stesse geometrie non-euclidee. Tuttavia la scoperta ad opera di Eugenio
BELTRAMI (1835-1900) e di Felix KLEIN (1849-1925) di modelli, che realizzavano le geometrie non-euclidee
all’interno della geometria euclidea, provò che se la geometria euclidea è coerente, allora anche la geometria
ellittica e la geometria iperbolica lo sono. Attualmente, si ritiene che si debba di volta in volta utilizzare il
tipo di geometria più adatto al problema che si sta studiando: ad esempio, nella teoria della relatività di
Albert EINSTEIN (1879-1955) le geometrie non-euclidee hanno ricevuto applicazioni importanti, mentre la
geometria euclidea è più utile per le applicazioni tradizionali.
In base alle successive ricerche di Hilbert e di altri, la coerenza della geometria euclidea fu a sua volta
ricondotta a quella dell’aritmetica, come vedremo nel prossimo paragrafo. Fu similmente ricondotta
a quella dell’aritmetica anche la coerenza della geometria euclidea a più dimensioni, una coerenza
che appariva ancor più problematica mancando per tale geometria l’interpretazione intuitiva basata sullo
spazio ordinario, tanto che difficilmente un matematico della metà dellOttocento sarebbe stato disposto ad
accettarla.
1.2
I fondamenti della geometria secondo Hilbert.
La geometria euclidea10 è stata assiomatizzata in modo rigoroso da David HILBERT (1899), tramite assiomi
indipendenti. Questo traguardo è stato raggiunto grazie alla combinazione di due grandi conquiste matematiche ottenute precedentemente.
La prima conquista è l’invenzione, dovuta a CARTESIO (René DESCARTES, 1596-1650) della geometria analitica, ossia del metodo di usare le coordinate per lo studio della geometria. Per lo spazio euclideo
ordinario, cioè tridimensionale, si usano tre coordinate per rappresentare un punto, una equazione o un
sistema di equazioni per rappresentare un piano, una retta, una curva, una superficie.
La seconda conquista è la creazione in termini rigorosi dei numeri reali, ottenuta alla fine del XIX
secolo ad opera principalmente di Richard DEDEKIND (1831-1916), di Georg CANTOR (1845-1918) e dello
stesso Hilbert. Il punto di arrivo delle ricerche sui fondamenti dei numeri reali è la presentazione del campo
reale come (l’unico) campo ordinato archimedeo completo. Vediamo di che si tratta. L’insieme R
dei numeri reali costituisce un campo rispetto alle usuali operazioni di somma e prodotto. Inoltre R è un
campo ordinato rispetto all’ordinamento usuale; più precisamente R è un campo ordinato archimedeo, ossia
dati comunque due numeri reali positivi esiste un multiplo dell’uno che supera l’altro. Si può dimostrare che
un qualunque corpo ordinato archimedeo K è necessariamente commutativo, cioè è un campo, ed è precisamente (a meno di isomorfismi) un sottocampo del campo reale; dunque il campo reale R si caratterzza come
l’unico campo archimedeo non estendibile ad un campo ordinato archimedeo più ampio, ossia, come si dice,
si caratterizza come (il) campo ordinato archimedeo completo.
In base a queste due conquiste si riconosce che lo spazio tridimensionale studiato da Euclide (corretto
con l’esplicita aggiunta di un postulato di continuità della retta) si identifica (è isomorfo) con lo spazio
numerico R3 . In questo spazio numerico i punti sono le terne ordinate (x, y, z) di numeri reali, un piano
è il luogo dei punti (x, y, z) che sono soluzione di un’equazione del tipo ax + by + cz + d = 0, con coefficienti
9 Cfr.
10 Oggi
R. Betti, Lobacevskij. L’invenzione delle geometrie non euclidee. Bruno Mondadori, 2005.
per ’geometria euclidea’ si intende lo studio del gruppo ortogonale in uno spazio vettoriale euclideo.
6
reali di cui i primi tre non tutti nulli, ed una retta è il luogo dei punti (x, y, z) che sono soluzione di un
sistema di due equazione di quel tipo e che siano indipendenti e compatibili.
Il problema di assiomatizzare lo spazio euclideo tridimensionale, inteso come totalità dei suoi punti, delle
sue rette e dei suoi piani si traduce e si precisa dunque in quello di assiomatizzare lo spazio numerico R3
(spazio tridimensionale reale) inteso come totalità dei suoi punti, delle sue rette e dei suoi piani.
1.3
Caratterizzazione assiomatica dello spazio ordinario.
Presentiamo finalmente l’assiomatica di HILBERT per lo spazio tridimensionale reale11
Lo spazio è una terna A = (P, R, Π), dove P è un insieme non vuoto di oggetti detti punti, R un insieme
non vuoto di parti di P dette rette, Π un insieme non vuoto di parti di P dette piani, tali che R ∩ Π = ∅,
e tali che siano soddisfatti i seguenti gruppi di assiomi:
I GRUPPO: assiomi dell’appartenenza.
— Per due punti distinti qualunque passa una e ad una sola retta.
— Per tre punti non allineati qualunque passa uno ed un sol piano.
— Ogni retta contiene almeno due punti distinti, ogni piano contiene almeno tre punti non allineati,
lo spazio contiene almeno quattro punti non complanari.
— Se due punti distinti di una retta appartengono ad un piano, la retta è contenuta nel piano.
— Se due piani hanno in comune un punto, essi hanno in comune almeno un altro punto12 .
II GRUPPO: assiomi dell’ordine.
È data una relazione ternaria di intergiacenza tra punti allineati – che si denota scrivendo ABC e che si
legge: B giace tra A e C – in modo che valgano i seguenti assiomi:
— Se A, B, C sono punti allineati qualunque, allora ABC implica CBA.
— Se A e C sono punti distinti qualunque, esiste almeno un B tale che ABC 13 ed esiste almeno un D tale
che ACD.
— Dati tre punti distinti e allineati qualunque, esattamente uno di essi giace tra gli altri due.
— Assioma di Pasch: Siano dati comunque tre punti non allineati A, B, C ed una retta del loro piano, la
quale non passi per alcuno dei tre punti. Se la retta passa per un punto posto tra A e B, allora essa passa
anche o per un punto posto tra B e C oppure per un punto posto tra A e C.
Nozione di segmento, di semiretta, di semipiano e di angolo. I primi due gruppi di assiomi
permettono di introdurre i concetti di segmento, di semiretta, di semipiano e di angolo.
Se A e B sono due punti distinti ed a è la retta che li contiene, si chiama segmento di estremi A e B
l’insieme dei punti di a posti tra A e B. Gli altri punti si dicono esterni al segmento.
Dato un punto O di una retta a, possiamo dividere la retta in due semirette di origine O nel modo
seguente. Si fissi su a un punto A distinto da O: la semiretta (aperta) OA — semiretta di a, di origine O e
11 Hilbert formulò per la prima volta la sua assiomatizzazione nel 1899 con il volume Grundlagen der Geometrie, rielaborandone
in seguito più volte l’esposizione fino alla versione del 1930. Altre diverse assiomatizzazioni della geometria euclidea erano state
formulate dieci anni prima da Giuseppe PEANO (1858-1932) nei suoi Principi di Geometria (1889) e da Giuseppe VERONESE
(1854-1917) nei suoi Fondamenti di Geometria (1891). Nei presenti appunti l’assiomatica di Hilbert viene esposta in modo
semplificato. Anzitutto, nella esposizione originaria di Hilbert, gli insiemi P, R, Π dei punti delle rette e dei piani dello spazio
sono tre insiemi astratti e l’appartenenza (∈ e ⊆) è sostituita da una relazione astratta di incidenza. Inoltre alcune proprietà
che qui figurano come assiomi sono ottenute come teoremi nell’esposizione originaria di Hilbert
12 Si noti che questa proprietà non è valida in Rn se n > 3.
13 Utilizzando l’Assioma di Pasch di cui è detto appresso, Hilbert dimostra che dati comunque due punti distinti A e B esiste
un punto B tale che ABC: a partire da A, C si compiano le seguenti costruzioni (il lettore faccia una figura): retta AC, punto
D non su AC, retta AD, punto E tale che ADE, retta EC, punto F tale che ECF , i punti A, C, E sono non allineati, la retta
DF non passa per questi punti e contiene un punto D del lato AE ma non contiene un punto del lato AC e quindi (per l’
Assioma di Pasch) contiene un punto B del lato AC, ossia risulta ABC.
7
contenente A — è costituita dal punto A e dai punti X di a tali che OXA oppure OAX; l’altra semiretta
di a di origine O è costituita dai punti Y di a tali che AOY . Aggiungendo ad una semiretta aperta la sua
origine si ottiene la corrispondente semiretta chiusa. In questo modo si ottiene una partizione di a in tre
classi: il punto O e le due semirette aperte di a di origine O. Si può dimostrare che un qualsiasi punto A0
della semiretta OA definisce la medesima semiretta.
È l’assioma di Pasch che consente di definire i semipiani determinati in un piano α da una sua retta a:
si considera la relazione ρ definita nell’insieme dei punti di α \ a assumendo AρB se la retta a non contiene
punti situati tra A e B; questa è una relazione (forzatamente) riflessiva, banalmente simmetrica e che risulta
transitiva in virtù dellassioma di Pasch; infatti se AρB e se BρC allora AρC, come è banale se i tre punti
sono allineati e come segue dall’assioma di Pasch se i tre punti non sono allineati. La relazione ρ determina
in α \ a una partizione in classi di equivalenza, che si riconoscono facilmente essere due e che, per definizione,
costituiscono i due semipiani (aperti) di α determinati dalla retta a.
Siano date in un piano α due semirette a = OA e b = OB entrambe di origine un punto O. Tale dato si
b Si chiamano interni
b oppure con ab.
chiama angolo di lati OA e OB e di vertice O, e si denota con AOB
all’angolo tutti i punti di α i quali a due a due individuano segmenti non aventi alcun punto in comune coi
lati dell’angolo; si chiamano esterni all’angolo i punti di α i quali non siano interni e non appartengano ai lati.
III GRUPPO: assiomi della congruenza.
È data una relazione di congruenza tra segmenti ed è data una relazione di congruenza tra angoli,
entrambe denotate con ≡, in modo che valgano i seguenti assiomi:
— Dati comunque due punti A, B ed una semiretta a0 di origine un punto A0 , esiste un unico punto B 0 di a0
tale che siano congruenti i segmenti AB e A0 B 0 . cioè: AB ≡ A0 B 0 .
— Ogni segmento è congruente a se stesso: AB ≡ AB, AB ≡ BA.
— Se AB ≡ A0 B 0 e A0 B 0 ≡ A00 B 00 , allora AB ≡ A00 B 00 .
— Se su una retta a sono dati due segmenti AB e BC privi di punti in comune e su una retta a0 sono dati
due segmenti A0 B 0 e B 0 C 0 privi di punti in comune, e se AB ≡ A0 B 0 e BC ≡ B 0 C 0 , allora AC ≡ A0 C 0 .
b in un piano α e sia data comunque in un piano α0 una retta r0 ed un
— Sia dato comunque un angolo ab
0
0
0
punto O di r , e sia a una delle due semirette di r0 di origine O0 . In ciascuno dei due semipiani di α0
0 b0 ≡ ab
b e tale che tutti i punti
individuati da r0 esiste esattamente una semiretta b0 di origine O0 tale che ad
0
0
0
d
interni dell’angolo a b appartengano al semipiano di α considerato.
b ≡ ab
b e ab
b ≡ ba.
b
— Ogni angolo è congruente a se stesso: ab
0
0
0
0
00
00
00
00
b
d
d
d
b
d
— Se ab ≡ a b e a b ≡ b a allora ab ≡ a b .
c0 C 0 , allora si
b ≡ B0A
— Dati comunque due triangoli ABC e A0 B 0 C 0 , tali che AB ≡ A0 B 0 , AC ≡ A0 C 0 , B AC
0 c0 0
0 c0 0
b
b
ha anche ABC ≡ A B C e ACB ≡ A C B .
IV GRUPPO: assioma delle parallele.
Dati comunque una retta a ed un punto A non appartenente ad a, esiste, nel piano individuato da A e da a,
esattamente una retta b, passante per A e che non interseca a. Tale retta b dicesi la parallela per A ad a.
Nozione di spazio affine. Dicesi spazio affine (di dimensione 3) una qualunque terna ordinata
A = (P, R,Π), del tipo detto all’inizio, i cui punti, rette e piani verificano tutti gli assiomi del I GRUPPO
(assiomi di incidenza) e tutti quelli del IV GRUPPO (assioma delle parallele). Due spazi affini A = (P, R,Π)
e A0 = (P 0 , R0 ,Π0 ) si dicono isomorfi se esiste un isomorfismo f : A → A0 , cioè una bijezione f : P → P 0 che
induce una bijezione R → R0 ed una bijezione Π → Π0 . Si può dimostrare che:
Teorema 1 Ogni spazio affine 3-dimensionale è coordinatizzabile sopra un corpo K (eventualmente non
commutativo), nel senso che è isomorfo allo spazio affine numerico A3 (K), i cui punti sono le terne ordinate
di numeri di K ed i piani e le rette vengono definiti di conseguenza (tramite equazioni) nel modo usuale14 .
14 Se K è un corpo commutativo, cioè un campo, si comprende bene come lo spazio affine numerico A3 (K) possa essere definito
senza difficoltà, come nel caso in cui K risulti essere il campo reale (vedi appresso la dimostrazione del Teorema 2). Il caso in
8
V GRUPPO: assiomi della continuità.
— Assioma di Archimede. Siano dati su una qualunque retta a: un punto qualunque A1 posto tra due
dati punti A e B; e siano dati altri punti A2 , A3 , A4 , . . . , tali che A1 sia posto tra A e A2 , A2 tra A1 e A3 , A3
tra A2 e A4 e cosı̀ via e tali che si abbiano le congruenze AA1 ≡ A1 A2 ≡ A2 A3 ≡ A3 A4 ≡ . . . . Allora esiste
nella successione dei punti A2 , A3 , A4 , . . . un punto An tale che B è posto tra A e An .
— Assioma della completezza. Gli elementi (punti, rette, piani) della geometria costituiscono un sistema
A = (P, R,Π), che non si può ampliare se si mantengono tutti gli assiomi precedenti.
Il requisito fondamentale che si richiede ad un sistema di assiomi è la sua coerenza (o consistenza),
cioè la sua non contraddittorietà, ossia il fatto che lo sviluppo della teoria che muove da quegli assiomi
non conduce (e non potrà mai condurre) a contraddizioni. La consistenza viene dimostrata fornendo un
modello che verifica tutti gli assiomi del sistema. Ad esempio, gli assiomi di gruppo sono consistenti, perché
è possibile esibirne concretamente un modello (ad esempio un gruppo finito di ordine due!). Un’altra proprietà
– interessante, ma non indispensabile, anzi talvolta non desiderabile didatticamente – è la indipendenza
degli assiomi del sistema, ossia l’impossibilità di dedurre qualcuno degli assiomi dai rimanenti. L’eventuale
indipendenza può essere dimostrata fornendo, per ciascun assioma del sistema, un modello che non verifica
quell’assioma pur verificando tutti i rimanenti. Un’ulteriore ed importante proprietà (molto raramente
soddisfatta) è la categoricità del sistema di assiomi, intendendosi con ciò che due qualunque modelli che
lo verificano sono isomorfi, ossia completamente identificabili in senso astratto; ciò si può anche esprimere
dicendo che è stata data una caratterizzazione assiomatica del modello in questione. Ad esempio, il sistema
di assiomi di gruppo non è categorico, mentre lo è quello di gruppo ciclico di ordine n fissato.
La consistenza (non contraddittorietà) del sistema degli assiomi di Hilbert si fonda sulla consistenza del
campo reale R (che a sua volta si fonda su quella del campo razionale Q, e quindi, in ultima analisi sulla
consistenza dell’ insieme N dei numeri naturali, cfr. appresso). Infatti si può dimostrare il teorema:
Teorema 2 ( ”Consistenza” del sistema di assiomi di Hilbert.) Lo spazio numerico tridimensionale
reale A3 (R) soddisfa i cinque gruppi di assiomi di Hilbert.
Dimostrazione. (Cenni). Sia A3 (R) = (P, R,Π) lo spazio numerico tridimensionale reale. In tale
spazio, l’insieme P dei punti è l’insieme R3 delle terne ordinate di numeri reali. L’insieme Π dei piani è:
Π := {αabcd | (a, b, c, d) ∈ R4 , (a, b, c) 6= (0, 0, 0),
ove il piano αabcd è dato da:
αabcd := {(x, y, z) ∈ R3 | ax + by + cz + d = 0}.
L’insieme delle rette è:
R := {α ∩ β | (α 6= β ∈ P) ∧ (α ∩ β 6= ∅)}.
cui K non sia commutativo, richiede qualche accortezza; si noti intanto che si i può definire su un corpo K non commutativo
(ad esempio sul corpo dei quaternioni reali) la nozione di spazio vettoriale destro (risp. sinistro), procedendo come nel caso
commutativo, ma con l’accortezza di scrivere sistematicamente a destra (risp. a sinistra) lo scalare che moltiplica un vettore;
per tali spazi si introducono al solito le nozioni di indipendenza lineare di vettori, di base, di dimensione, componenti di un
vettore rispetto ad una base; si giunge cosı̀ a dimostrare, nel solito modo, che uno spazio vettoriale destro (o sinistro) su un
corpo K di dimensione n è isomorfo allo spazio vettoriale numerico destro (o sinistro) n− dimensionale su K i cui vettori sono
le n−ple ordinate di elementi di K. In modo analogo, si può definire su un corpo K non commutativo (ad esempio sul corpo dei
quaternioni reali) la nozione di spazio affine numerico destro (risp. sinistro) A3 (K), avendo l’accortezza di scrivere le equazioni
che definiscono i piani e le rette ponendovi i coefficienti sempre a sinistra (o sempre a destra) delle indeterminate. Si noti infine
che la costruzione, a partire da un campo finito K = GF (q) con q elementi, del corrispondente spazio affine numerico A3 (K)
fornisce un semplice modello (molto concreto !) di spazio affine A3 e dunque assicura la non contraddittorietà
della assiomatica di spazio affine A3 . Queste considerazioni si estendono faciilmente al caso degli spazi affini e proiettivi di
dimensione d ≥ 2 qualunque. Avvertiamo infine che uno spazio del tipo A3 (K) viene talvolta denotato anche con AG(3, K) o
semplicemente con K 3 .
9
La facile verifica che gli assiomi di Hilbert sono soddisfatti da A3 (R) si basa sulle proprietà ordinali e
di continuità del campo reale R (che può identificarsi con l’insieme dei punti di una retta), su proprietà
elementari dei sistemi di equazioni lineari e su proprietà elementari del gruppo delle isometrie (congruenze)
di R3 . Si noti in particolare che, se A3 (R) non soddisfacesse alla proprietà di completezza, allora sarebbe
ampliabile propriamente ad uno spazio, T , il quale – essendo uno spazio affine tridimensionale – sarebbe,
per il Teorema 1, coordinatizzabile su un corpo K necessariamente ordinato archimedeo (al pari di T ), e
quindi commutativo; ne seguirebbe che K sarebbe un campo archimedeo, estensione propria di R, il che è
impossibile perché R è archimedeo completo. Si osservi che il Teorema 2 riconduce la ”consistenza” del sistema degli assiomi di Hilbert alla ”consistenza” del modello A3 (R), ossia alla consistenza di R, vale a dire alla non contradditorietà della teoria dei
numeri reali.
Teorema 3 ( (Categoricità del sistema di assiomi di Hilbert.) I precedenti cinque gruppi di assiomi
caratterizzano lo spazio A3 (R).
Dimostrazione. (Cenni). Un qualunque spazio T soddisfacente i cinque gruppi di assiomi è anzitutto uno
spazio affine tridimensionale, e quindi, per il Teorema 1 coordinatizzabile su un corpo K, e pertanto isomorfo
allo spazio numerico su K, ossia T ' A3 (K). Il campo K è ordinato archimedeo perché queste proprietà
si trasportano facilmente da T a K. Pertanto K deve essere (a meno di isomorfismi) un sottocampo del
campo reale R ed anzi coincide (a meno di isomorfismi) col campo reale R, perché se per assurdo K fosse
un sottocampo proprio di R, allora lo spazio A3 (R) sarebbe un ampliamento proprio dello spazio T ; d’altra
parte, A3 (R) verifica i cinque gruppi di assiomi e viene cosı̀ contraddetta la proprietà di completezza di T .
L’assurdo prova che K ' R, e quindi T ' A3 (K) ' A3 (R). Il significato del Teorema 3 è che ogni spazio A0 = (P 0 , R0 ,Π0 ) che verifichi gli assiomi di Hilbert è isomorfo
allo spazio numerico A3 (R) = (R3 , R, Π) nel senso che esiste una bijezione f : R3 → P 0 che rispetta tutte le
strutture presenti e che quindi permette di indentificare A0 con A3 (R). In altri termini: (1) f induce una
bijezione R → R0 e una bijezione Π → Π0 ; (2) f conserva l’ordinamento, cioè la relazione di intergiacenza tra
punti allineati; (3) f conserva la congruenza tra segmenti e quella fra angoli; (4) f conserva il parallelismo.
È facile convincersi che lo spazio affine numerico A3 (Q) costruito sul campo razionale verifica tutti gli
assiomi del sistema di Hilbert tranne il ”corrispondente assioma della completezza”: questo non è verificato
perché A3 (Q) si può ampliare propriamente a A3 (R) che verifica tutti gli stessi assiomi.
Come già detto precedentemente, si può dimostrare che il sistema degli assiomi originari di Hilbert è
costituito da assiomi tra loro indipendenti. Si osservi che non è stata richiesta la proprietà simmetrica
della relazione di congruenza (ad esempio tra segmenti), in quanto – come ora vedremo – essa può dedursi
dalle proprietà riflessiva e transitiva con l’uso dell’assioma che esprime il ”trasporto di un segmento” su una
semiretta. Sia dunque AB ≡ A0 B 0 ; vogliamo provare che A0 B 0 ≡ AB. Sia C il punto della semiretta di
origine A che contiene B tale che A0 B 0 ≡ AC . Ne segue AB ≡ AC. Dalle AB ≡ AB e AB ≡ AC, si deduce
B = C. Pertanto A0 B 0 ≡ AB.
1.4
Riconduzione della non contraddittorietà della geometria a quella della
aritmetica.
Si è visto che la non contraddittorietà del sistema degli assiomi di Hilbert si basa sulla non contraddittorietà
della teoria dei numeri reali. Ricordiamo come quest’ultima si riconduce a quella della aritmetica. Si ammette
che esista un modello ben fondato dell’insieme N dei numeri naturali; allora, a partire da questo dato, si
10
costruiscono successivamente l’anello Z degli interi, il campo Q dei razionali e, finalmente, il campo R dei
reali. Questo metodo di definizione del campo reale è dunque un metodo genetico (risalente a Dedekind),
diverso dal metodo assiomatico di Hilbert che definisce in un solo colpo i reali come campo ordinato
archimedeo completo.
Secondo una osservazione scherzosa di Bertrand RUSSELL (1872-1970)15 , la differenza tra il metodo
genetico e quello assiomatico è la stessa che passa tra il lavoro onesto ed il furto: con questo ci si impadronisce
in un attimo di tutta la ricchezza accumulata faticosamente tramite quello.
1.4.1 I numeri naturali.
Ricordiamo che a fondamento dell’aritmetica si trova l’insieme N dei numeri
naturali, definito da Giuseppe PEANO (1858-1932) coi suoi famosi assiomi. In questi intervengono i concetti
primitivi di numero naturale, uno, successore: concetti che non vengano definiti, sebbene gli assiomi che
li riguardano ne dànno una definizione implicita, nel senso che indicano le regole che li governano. Dopotutto,
secondo la definizione scherzosa di Bertrand Russell, la matematica è la scienza in cui non si sa di che cosa
si parla, ed in cui non si sa se quello che si dice sia vero o falso. (La seconda parte della frase sottolinea
l’aspetto della matematica come sistema ipotetico-deduttivo).
Assiomi di Peano.
1. Uno è un numero naturale.
2. Per ogni numero naturale esiste un ben determinato numero naturale successore di quello.
3. Uno non è successore di alcun numero naturale.
4. Due numeri naturali aventi lo stesso successore sono uguali fra loro.
5. Se un insieme di numeri naturali contiene uno ed il successore di ogni suo elemento, allora quell’insieme
coincide con l’insieme di tutti i numeri naturali.
I primi quattro assiomi possono essere riformulati dicendo che è data una terna ordinata (N, 1, σ), tale
che N è un insieme, 1 è un fissato elemento di N, e σ è un’applicazione iniettiva N → N \ {1} (”passaggio al
successore”). Il quinto assioma, noto col nome di principio d’induzione, si può esprimere cosı̀:
[A ⊆ N, 1 ∈ A, σ(A) ⊆ A] ⇒ A = N.
L’esistenza di una terna verificante le proprietà anzidette non può essere dimostrata, ma richiede un
apposito ed esplicito assioma di esistenza. Come dice Leopold KRONECKER (1823-1891), ”Dio ha creato i
numeri naturali, tutto il resto è opera dell’uomo”. È invece facile dimostrare l’unicità (a meno di ”isomorfismi”) di una terna siffatta: se (N, 1, σ) e (N0 , 10 , σ 0 ) sono due tali terne, si può definire un ”isomorfismo”
f : N → N0 , assumendo anzitutto f (1) := 10 , e definendo poi
(n ∈ N)
f (σ(n)) = σ 0 (f (n));
si prova quindi che f è ben definita su tutto N, che f è biunivoca e conserva la struttura in gioco, ossia
permette di identificare le terne date.
Per iinduzione si definiscono poi in N le usuali operazioni di addizione:
(m, n ∈ N)
1 + n := σ(n),
σ(m) + n := σ(m + n);
e di moltiplicazione:
(m, n ∈ N)
1 · n := n,
σ(m) · n := m · n + n;
e si definisce l’usuale ordinamento:
(m, n ∈ N)
m < n ⇔ ∃h ∈ N : m + h = n.
15 Bertrand
Russell è autore insieme a A. N. Whitehead della monumentale opera Principia mathematica (1910-1913) in cui
vengono esposte le basi assiomatiche del calcolo dei predicati e della logica matematica.
11
Anche le usuali proprietà formali delle operazioni + e · si dimostrano per induzione.
1.4.2. L’anello degli interi.
Si passa dal gruppoide N(+) al gruppo additivo Z(+) degli interi, per
simmetrizzazione. Da questo si passa poi facilmente all’anello Z(+,·) degli interi. In altri termini, l’insieme
Z è definito costruttivamente da N, assumendo
Z := (N × N)/ ≡1 ,
dove l’equivalenza ≡1 è definita in N × N da:
(a, b) ≡1 (c, d) :⇔ a + d = b + c.
La somma in Z è ben definita da:
(a, b, c, d ∈ N)
[(a, b)] + [(c, d)] := [(a + c, b + d)].
Il prodotto in Z è ben definito da:
(a, b, c, d ∈ N)
[(a, b)] · [(c, d)] := [(ac + bd, ad + bc)].
L’ordinamento in Z è ben definito da:
(a, b, c, d ∈ N)
[(a, b)] < [(c, d)] :⇔ a + d < b + c.
Si ha l’immersione (cioè un’applicazione iniettiva che conserva la somma, il prodotto e l’ordinamento)
N(+,·,<) → Z(+,·,<) : n 7→ [(σ(n), 1)].
Lo zero di Z(+) è la classe 0 = [(n, n)], n ∈ N. Se n ∈ N , il numero [(σ(n), 1)] di Z si denota ancora con n,
ed il numero [(1, σ(n))] si denota con −n, la classe [(a, b)] si denota anche con a − b, ecc.
1.4.3. Il campo dei razionali.
Si passa dall’anello Z(+,·) degli interi al campo Q(+,·) dei razionali,
ottenendolo come suo campo dei quozienti. In altri termini, l’insieme Q è definito costruttivamente da Z,
assumendo:
Q := (Z × (Z \ {0}))/ ≡2 ,
dove l’equivalenza ≡2 è definita in Z × (Z \ {0}) da:
(a, b) ≡2 (c, d) :⇔ ad = bc.
Ogni classe [(a, b)] ∈ Q si denota con a/b; le operazioni e l’ordinamento in Q sono ben definiti da:
a/b + c/d := (ad + bc)/(bd),
(a/b)(c/d) := (ac)/(bd),
(a/b) < (c/d) :⇔ ad < bc.
Si ha l’immersione
Z(+,·,<) → Q(+,·,<) : a 7→ a/1,
ed il numero a/1 ∈ Q si denota ancora con a, ecc.
1.5
Il campo dei reali.
Storicamente, i numeri reali sono stati definiti costruttivamente a partire dai numeri razionali (metodo
genetico: di Cauchy (Augustin-Louis CAUCHY, 1789-1857), di Dedekind, di Cantor) ). Vedremo poi che i
numeri reali possano essere definiti assiomaticamente (metodo assiomatico di Hilbert).
12
1.5.1. I numeri reali secondo il metodo di Cauchy. Si passa dal campo razionale Q al campo reale
R, ad esempio col procedimento costruttivo di completamento alla Cauchy :
R := C(Q)/ ≡,
dove C(Q) è l’insieme delle successioni di Cauchy di numeri razionali e ≡ è la relazione di equivalenza
che dichiara equivalenti due successioni di Cauchy a, b ∈ C(Q) la cui differenza a − b è una successione
infinitesima: dunque un numero reale è una classe di equivalenza di successioni di Cauchy di
numeri razionali. Ricordiamo che una successione a = (ai ) ∈ QN di numeri razionali ai , ∈ Q, i ∈ N, si
chiama una successione di Cauchy se:
(∀ ∈ Q, > 0)
∃n ∈ N : | am − an |< ∀n, m > n ,
e che una successione di Cauchy c = (ci ) ∈ QN si dice infinitesima se
(∀ ∈ Q, > 0)
∃n ∈ N : | cn |< ∀n > n ,
Si ben definiscono in R la somma, il prodotto e la relazione d’ordine in modo ovvio (è il modo obbligato), e
si ha l’immersione
Q(+,·,<) → R(+,·,<) : a 7→ [(a, a, . . . , a, . . . )],
ed il numero [(a, a, . . . , a, . . . )]∈ R si denota ancora con a, ecc. Si dimostra infine che ogni successione di
Cauchy di numeri reali è convergente (ad un numero reale).
1.5.2. I numeri reali secondo il metodo di Dedekind. Alternativamente: un numero reale è una
sezione di Dedekind (o due sezioni di Dedekind equivalenti ) del campo razionale. Ricordiamo di cosa si
tratta. Una partizione ordinata (o sezione di Dedekind) (A, B) di Q è una partizione non banale di Q
in due ’classi’ A e B:
Q = A ∪ B,
A ∩ B = ∅,
A 6= ∅ =
6 B
tale che :
a ∈ A, b ∈ B ⇒ a < b.
Per ogni tale partizione esiste evidentemente al più un elemento di separazione delle due classi cioè al
più un q ∈ Q tale che
(a, b ∈ Q)
(a < q ⇒ a ∈ A) e (q < b ⇒ b ∈ B).
Evidentemente, se q ∈ Q è elemento di separazione della partizione ordinata (A, B), allora necessariamente
q è il massimo della classe A oppure il minimo della classe B; in entrambi i casi, il numero q risulta
essere elemento di separazione di due sezioni di Dedekind, potendosi attribuire q alla prima o alla seconda
classe: le due partizioni cosı̀ ottenute sono distinte ma verranno considerate equivalenti (perché entrambe
individuano lo stesso q ∈ Q come proprio elemento di separazione); dunque ogni numero razionale q dà luogo
a due sezione di Dedekind (equivalenti) di cui è elemento separatore: la sezione
(A, B) con
A := {x ∈ Q : x ≤ q}, B := {x ∈ Q : x > q}
(A0 , B 0 ) con
A0 := {x ∈ Q : x < q}, B := {x ∈ Q : x ≥ q}.
ma anche la sezione
D’altra parte esistono sezione di Dedekind di Q prive di elemento separatore (in Q), ad esempio la sezione
ottenuta assumendo
A := {x ∈ Q : (x < 0) ∨ (x2 < 2)},
B := {x ∈ Q : (x > 0) ∧ (x2 > 2)};
è infatti ben noto che non esiste alcun razionale x ∈ Q tale che x2 = 2. Se, come in questo caso, (A, B)
è invece una sezione di Dedekind priva di elemento separatore in Q, la sua ’classe di equivalenza’ verrà
considerata costituita soltanto da (A, B). Se indichiamo con D(Q) l’insieme delle sezioni di Dedekind del
13
campo razionale e con ≡ la suddetta relazione di equivalenza in tale insieme, si può, seguendo Dedekind,
definire il campo reale assumendo
R := D(Q)/ ≡ .
Si ben definiscono in R la somma, il prodotto e la relazione d’ordine in modo ovvio (è il modo obbligato), e
si ha l’immersione
Q(+,·,<) → R(+,·,<) : q 7→ [({a ∈ Q : a ≤ q}, {b ∈ Q : b > q}]},
e questo numero di R si denota ancora con q, ecc. Si dimostra infine che ogni sezione di Dedekind del
campo reale ammette un elemento di separazione.
1.5.3. I numeri reali secondo il metodo di Cantor. Alternativamente, ancora: si possono ottenere
i numeri reali (alla Cantor) come classi di equivalenza di coppie di classi contigue di numeri razionali (due
classi contigue dicendosi equivalenti se ”si rincorrono a vicenda”). Ricordiamo di cosa si tratta. Una coppia
(A, B) di sottinsiemi non vuoti di Q si dice una coppia di classi contigue di numeri razionali se
a ∈ A, b ∈ B ⇒ a < b ed inoltre: ∈ Q, > 0 ⇒ ∃a ∈ A, ∃b ∈ B
tale che
| a − b |< .
Evidentemente una coppia di classi contigue di numeri razionali ammette al più un elemento di separazione s ∈ Q. Un esempio di coppie√di classi contigue che non ammettono in Q elemento di separazione è
suggerito dalla scrittura decimale di 2 = 1, 414213562373095: assumiamo
A = {1,
1, 4,
1.41,
1, 414,
1, 4142,
1, 41421,
1, 414213,
1, 4142135,
1, 41421356,
. . . },
B = {2,
1, 5,
1.42,
1, 415,
1, 4143,
1, 41422,
1, 414214,
1, 4142136,
1, 41421357,
. . . }.
Un esempio di coppia di classi contigue che ammette un dato numero q ∈ Q come elemento di separazione è:
A = {q −
1
:
10n
n ∈ N},
B = {q +
1
:
10n
n ∈ N}.
Questi stessi esempi suggeriscono di introdurre una relazione di equivalenza tra coppie di classi contigue, nel
modo seguente; sia Γ(Q) l’insieme delle coppie di classi contigue di numeri razionali e sia ≡ la relazione di
equivalenza definita in Γ(Q) assumendo: (A, B) ≡ (A0 , B 0 ) se e soltanto se:
1) ∀a ∈ A ∃a0 ∈ A0 tale che a0 > a,
3) ∀b ∈ B ∃b0 ∈ B 0 tale che b0 < b,
2) ∀a0 ∈ A0
4) ∀b0 ∈ B 0
∃a ∈ A tale che a > a0 ,
∃b ∈ B tale che b < b0 .
seguendo Cantor, possiamo definire il campo reale assumendo
R := Γ(Q)/ ≡ .
Si ben definiscono in R la somma, il prodotto e la relazione d’ordine in modo ovvio (è il modo obbligato), e
si ha l’immersione
Q(+,·,<) → R(+,·,<) : q 7→ [({q −
1
:
10n
n ∈ N}, {q +
1
:
10n
n ∈ N}]},
e questo numero di R si denota ancora con q, ecc. Si dimostra infine che ogni coppia di classi contigue
di numeri reali ammette un elemento di separazione.
14
1.5.4. I numeri reali secondo il metodo assiomatico di Hilbert. Per illustrare le linee generali
della caratterizzazione assiomatica di Hilbert dello spazio euclideo R3 della geometria elementare, abbiamo
utilizzato la caratterizzazione del campo reale come corpo ordinato archimedeo completo. Ci proponiamo
ora di chiarire questo punto.
Supponiamo di aver già introdotto il campo reale R come completamento del campo razionale Q. Questo
significa che ogni numero reale è una classe di equivalenza di successioni di Cauchy di numeri razionali, e
che ogni successione di Cauchy di numeri reali è convergente ad un numero reale. Il campo reale R può
essere d’altra parte caratterizzato assiomaticamente – e quindi definito – come (l’unico) campo ordinato
archimedeo completo. Ricordiamo di che si tratta.
Ricordiamo che un campo K si dice ordinato se è dato un sottinsieme P di K, detto insieme degli
elementi positivi, tale che:
1. Legge di tricotomia: per ogni x ∈ K, vale una ed una sola delle seguenti alternative:
x = 0,
2. Legge di compatibilità: P + P ⊆ P,
x ∈ P,
−x ∈ P.
P · P ⊆ P.
Nello stesso modo si definisce un corpo ordinato o, ancora più in generale, un anello ordinato (anche
non commutativo). I risultati che seguono vengono formulati per un corpo (commutativo), ma si estendono
facilmente ad un anello (commutativo o no).
Se x ∈ P , si scrive x > 0. Se −x ∈ P , si scrive x < 0, e si dice che x è negativo. Si introduce in K una
relazione d’ordine totale ≤, assumendo a ≤ b sse a = b oppure a < b, dove a < b significa, per definizione,
b − a > 0.
Si dimostrano facilmente le usuali regole delle disuguaglianze e la regola dei segni, secondo la quale
il prodotto di due positivi o di due negativi è positivo mentre il prodotto di un positivo per un negativo è
negativo16 ; da questa si deduce che il quadrato di un qualunque elemento a non nullo è positivo, in quanto:
a2 = aa = (−a)(−a). Ne segue che l’unità u = u2 di K è positiva e pertanto nu > 0 per ogni n ∈ N, cosicché
ogni campo ordinato K ha caratteristica zero; inoltre è facile verificare che l’isomorfismo tra il campo
fondamentale di K ed il campo razionale Q è anche un isomorfismo di insiemi ordinati. Si noti che un
campo ordinato non è algebricamente chiuso in quanto il polinomio X 2 + u non ha zeri in K (perché
x2 + u > 0 per ogni x ∈ K); in altri termini: un campo algebricamente chiuso non è ordinabile; in
particolare il campo complesso non può essere ordinato.
Ricordiamo che un campo (o più generalmente un anello) ordinato K dicesi archimedeo se soddisfa la
seguente condizione (detta il Postulato di Archimede):
(A) Per ogni a, b ∈ K con a > 0 e b > 0, esiste n ∈ N tale che na > b.
Si osservi che il Postulato di Archimede equivale alla condizione seguente (in cui u denota l’unità di K):
(A’) Per ogni c ∈ K con c > 0, esiste n ∈ N tale che nu > c;
infatti (A) implica ovviamente (A’) (si ponga in (A) a = u, b = c); inoltre (A’) implica (A) (si assuma
c = b · a−1 e si moltiplichi la disuguaglianza nu > b · a−1 a destra per a ottenendo (nu)a > b · a−1 a, ossia
16 Questa regola dei segni di un campo ordinato non deve essere confusa con la regola ”più per più fa più, più per meno fa
meno, meno per meno fa più”, che non ha un significato ordinale ma un significato puramente algebrico e che è valida in ogni
anello A come conseguenza della proprietà distributiva del prodotto rispetto alla somma. Si inizia con dimostrare che lo zero
è fattore nullifico: per ogni a ∈ A si ha a · 0 = 0 perché ab = a(b + 0) = ab + a · 0 ⇒ a · 0 = 0; poi si prova che per ogni
a, b ∈ A si ha a(−b) = −(ab): infatti 0 = a · 0 = a(b − b) = a(b + (−b)) = ab + a(−b) ⇒ a(−b) = −(ab) (il che prova anche la
proprietà distributiva del prodotto rispetto alla ”differenza”); infine si prova che per ogni a, b ∈ A si ha (−a)(−b) = ab: infatti
(−a)(−b) = −((−a)b) = −(−(ab)) = ab.
15
na > b.
Esempi. L’anello Z ed i campi Q ed R (ciascuno con l’ordinamento naturale) sono archimedei. Un
esempio di campo non archimedeo è il campo R(X) delle funzioni razionali (frazioni algebriche), ordinato
assumendo:
(f (X) ∈ R(X)) f (X) > 0 sse esiste n ∈ N tale che f (x) > 0 per ogni x ∈ R tale che x > n.
In effetti, la (A) non è soddisfatta, ad es. per b = X ed a = u, perché per ogni n ∈ N si ha nu < X, cioè
X − nu > 0: infatti x − nu > 0 per ogni x ∈ R tale che x > n.
Si può dimostrare che (cfr. B. Segre, Lectures on modern geometry, 1961, p. 28):
Teorema 4 Un corpo ordinato archimedeo è necessariamente commutativo, cioè un campo. Un campo ordinato archimedeo K dicesi completo se ogni sovracampo ordinato archimedeo H ⊇ K,
l’ordinamento del quale conservi l’ordinamento di K, coincide con K.
Teorema 5 Un corpo ordinato archimedeo K è (a meno di isomorfismi) un sottocampo del campo reale R.
Si ha dunque: Q ≤ K ≤ R. Dimostrazione (Cenni17 ). Sappiamo che il campo fondamentale di K è Q, quindi Q ≤ K. Utilizzando
l’ipotesi che K sia archimedeo, si può dimostrare che:
(*)
se s ∈ K \ Q, allora s è il minimo dei maggioranti l’insieme Qs ; = {a ∈ Q : a < s}.
Utilizzando la (*) si può dimostrare che:
(**)
se s ∈ K \ Q, allora s è definito da una successione di Cauchy di numeri razionali.
La (**) assicura che s ∈ R, perché R è, per definizione, il completamento alla Cauchy di Q. Pertanto
K ⊆ R. Dal Teorema (5) segue evidentemente che:
Teorema 6 (Completezza del campo reale). Il campo reale R è ordinato archimedeo e non è ampliabile
propriamente ad un campo ordinato archimedeo H > R .
Dimostrazione Se un tale sovracampo H esistesse, si avrebbe l’assurdo R < H ≤ R.
Dai Teoremi (5) e (6) segue evidentemente che:
Teorema 7 (Caratterizzazione del campo reale). Il campo reale R è (a meno di isomorfismi) l’unico
campo ordinato archimedeo completo. 17 Cfr.
L. Lombardo-Radice, Dispense del corso di Geometria Superiore, Università di Roma, 1963, p. 20-24).
16
Osservazione. La (*) non è necessariamente vera per un campo K ordinato non archimedeo, ad esempio
per il campo K = R(X), precedentemente considerato. Infatti X ∈ R(X) non è il minimo dei maggiorati di
QX = {a ∈ Q : a < X} = Q
perché ogni razionale a ∈ Q è maggiorato ad esempio da X/2, ed è: a < X/2 < X.
1.6
Sugli assiomi di continuità della retta.
Confronto di segmenti. Siano AB e CD due segmenti qualunque. Sia B 0 il punto della semiretta di
origine C contenente D tale che AB ≡ CB 0 . Diremo che AB è minore di CD (e scriveremo AB < CD) se
CB 0 D.
Versi di percorrenza su una retta. Utilizzando la relazione di intergiacenza tra terne di punti allineati
è possibile definire su una retta qualsiasi due versi di percorrenza (tra loro opposti) nel modo seguente. Siano
date su una qualunque retta r due punti distinti P, Q. Definiamo sulla retta r il verso di percorrenza da P
a Q come la relazione < (”precede”) definita tra i punti di r nel modo seguente. Siano anzitutto a e b le
semirette (aperte) di r aventi origine P , e sia b quella che contiene Q. Diciamo allora: che ogni punto di a
precede sia P sia ogni punto di b; che il punto P precede ogni punto di b; che, dati due punti A1 , A2 ∈ a,
si ha A1 < A2 se A1 A2 P ; che, dati due punti B1 , B2 ∈ b, si ha B1 < B2 se P B1 B2 . In modo analogo si
definisce il verso di percorrenza da Q a P .
Classi separate. Sia r una retta sulla quale sia stato fissato un verso di percorrenza. Siano a ed b due
sottoinsiemi di r non vuoti e disgiunti. Si dice che (a, b) è una coppia di classi separate di punti di r, se
ogni punto di a precede ogni punto di b. Un punto P della retta r si chiama un elemento di separazione
di (a, b) se ogni punto di a distinto da P precede P , e se P precede ogni punto di b distinto da P .
Una partizione ordinata (o sezione di Dedekind) della retta r è una coppia (a, b) di classi separate
tale che a ∪ b = r; in altri termini (a, b) è una partizione di r in due classi separate. Evidentemente, se una
partizione ordinata (a, b) della retta r ammette un elemento di separazione, questo è necessariamente unico
(ed è il massimo di a oppure il minimo di b).
Una coppia di classi contigue di punti della retta r è una coppia (a, b) di classi separate di punti
di r tali che, fissato comunque un segmento EF , esistano un punto A ∈ a ed un punto B ∈ b per i quali
AB < EF . Evidentemente, se una coppia (a, b) di classi contigue ammette un elemento di separazione,
questo è necessariamente unico. La proprietà di continuità della retta è stata formulata da Dedekind e
da Cantor attraverso due celebri postulati:
Assioma di Dedekind. Per ogni partizione ordinata di una retta qualunque, esiste almeno un elemento
di separazione.
Assioma di Cantor. Per ogni coppia di classi contigue di punti di una retta qualunque, esiste almeno
un elemento di separazione.
Si può dimostrare che l’assioma di Dedekind equivale all’assioma di continuità di Hilbert e che ciascuno
di essi equivale ai due assiomi di Cantor e di Archimede presi insieme (cfr. L. Berzolari, G. Vivanti, D. Gigli,
Enciclopedia delle matematiche elementari ). Si ha cioè il teorema:
Teorema 8 Assioma di Dedekind ⇔ (assioma di Cantor ∧ assioma di Archimede) ⇔ assioma della continuità di Hilbert. Continuità della retta e numeri reali. Il campo reale e la retta della geometria elementare sono
stati qui presentati indipendentemente l’uno dall’altro. D’altra parte, è proprio la proprietà di continuità
17
che permette di stabilire una corrispondenza biunivoca tra i numeri reali x ed i punti P di una retta r sulla
quale siano stati fissati un punto O come origine ed un segmento OU come unità di misura: dato un punto
P ∈ r, ad esso si associa il numero reale x(P ) definito come la misura di OP rispetto ad OU ; viceversa, dato
un numero reale x, ad esso si associa il punto P = P (x) di r tale che OP abbia misura x rispetto ad OU .
L’assioma di Archimede è sufficiente per associare il numero reale x(P ) al punto P di r: il numero x(P ) –
che è la misura di OP rispetto ad OU – si definisce facilmente (senza scomodare Archimede) quando OP ed
OU sono commensurabili, cioè quando hanno un sottomultiplo comune; quel numero x(P ) si definisce anche
quando OP ed OU sono incommensurabili, perchè allora, per mezzo del postulato di Archimede, si costruisce
nel modo ben noto una coppia (a, b) di due classi contigue di punti, a = (A1 , A2 , . . . ) e b = (B1 , B2 , . . . ), di
cui il punto assegnato P è l’elemento di separazione e si definisce poi x(P ) come l’elemento di separazione
delle corrispondenti classi contigue di numeri razionali (x(A1 ), x(A2 ), . . . ) e (x(B1 ), x(B2 ), . . . ), che sono le
cosiddette misure per difetto e per eccesso – a meno di un decimo, di un centesimo, ecc. – di OP rispetto
ad OU .
Inversamente, per associare il punto P (x) di r ad un arbitrario numero reale x, nel caso in cui x sia
razionale si procede nel modo ben noto costruendo con riga e compasso il punto P (x) a partire dai
punto O e U . Ma se x è irrazionale, è necessario ricorrere all’assioma di continuità della retta, nella forma
di Cantor o di Dedekind. Ricordiamo come si procede.
Se il numero irrazionale x viene presentato ad esempio alla Cantor come l’elemento di separazione di
due classi contigue di numeri razionali (a1 , a2 , . . . ) e (b1 , b2 , . . . ), allora da queste si passa a costruire (con riga
e compasso) le due classi contigue di punti corrispondenti sulla retta (A(a1 ), A(a2 ), . . . ) e (B(b1 ), B(b2 ), . . . );
queste ultime determinano (per l’assioma di continuità di Cantor) un punto P di separazione che viene
assunto come il punto P (x) cercato.
Analogamente, se il numero irrazionale x viene presentato come elemento di separazione di una sezione
di Dedekind (a, b) del campo razionale, questa permette di costruire una corrispondente partizione ordinata
della retta (”sezione di Dedekind della retta”) e questa determina (per l’assioma di continuità di Dedekind)
un elemento di separazione P che viene assunto come il punto P (x) cercato.
Osservazione didattica. Per chi non conosca affatto i numeri reali, la presentazione di un numero
irrazionale come ”elemento di separazione di due classi contigue di numeri razionali” o come ”elemento di
separazione di una partizione ordinata del campo razionale” potrebbe sembrare artificiosa. Da un punto di
vista didattico può pertanto essere conveniente utilizzare la geometria per fare accettare i numeri reali come
enti che sono di fatto nella natura delle cose: si parte dal dato (intuitivo e/o assiomatizzato) della retta dello
spazio ordinario e si ”creano” i numeri (interi, razionali e ”irrazionali”) come misure dei segmenti, nel modo
usuale, come ricordato poc’anzi.
1.7
Sugli assiomi di congruenza.
Alla luce del teorema che caratterizza lo spazio ordinario A3 (R) (introdotto con gli assiomi di Hilbert), è
chiaro come in tale spazio possa poi essere introdotta l’usuale struttura di spazio metrico (con la metrica
euclidea), e quindi la nozione di isometria. Talvolta, nelle esposizioni intuitive della geometria elementare,
si assume come primitivo il concetto di movimento rigido e si definiscono poi congruenti due figure
(insiemi di punti) se esiste un movimento rigido che porta l’una figura sull’altra. Questa impostazione
potrebbe a prima vista sembrare ingenua e tautologica. D’altra parte è proprio la via che era stata seguita
da Giuseppe Peano nei suoi Principi di Geometria (1889), S’intuisce del resto come sia possibile variare gli
assiomi di congruenza di Hilbert, traducendoli opportunamente nel linguaggio dei ”movimenti”. Si chiederà
che è dato un gruppo di biezioni dell’insieme dei punti dello spazio in sé, che gode di opportune proprietà
di ”transitività”, ecc. ecc.
18
2
Gli studi sui fondamenti della matematica.
Se Hilbert aveva ricondotto la coerenza della geometria euclidea all’aritmetica, restava però aperto il problema
della coerenza dell’aritmetica stessa. Hilbert pose esplicitamente questo problema nella sua memorabile
conferenza, tenuta durante il Secondo Congresso Internazionale dei Matematici svoltosi a Parigi nel 1900,
nella quale attirò l’attenzione della comunità matematica su 23 importanti problemi, come argomenti fondamentali da affrontare nel corso del secolo che stava iniziando18 .
Gli assiomi di Peano non risolvono il problema della coerenza dell’aritmetica, perchè non è possibile
dimostrare che essi non conducano ad una contraddizione. D’altra parte riflettendo sui numeri naturali
0, 1, 2, . . . i matematici della fine del 1800 sono stati naturalmente portati alla nozione di insieme. La teoria
degli insiemi sorse ad opera di Georg Cantor, proprio come teoria dei numeri cardinali : la numerosità (o
potenza) di un insieme viene definita come classe (di equivalenza) costituita dagli insiemi ponibili in corrispondenza biunivoca con l’insieme dato. Accanto alla teoria dei numeri cardinali, Cantor ha sviluppato
anche una teoria dei numeri ordinali, che - per dirla in modo approssimativo - indicano la numerosità di un
insieme ben ordinato: il numero ordinale degli elementi di un insieme ben ordinato è definito come classe degli
insiemi (ben) ordinati ponibili con l’insieme dato in corrispondenza biunivoca che ne conservi l’ordinamento.
Un insieme è infinito se può essere posto in corrispondenza biunivoca con una sua parte propria. In tal
modo il concetto di infinito (che era in precedenza definito in modo rigoroso solo come infinito potenziale)
entra a far parte del pensiero matematico come infinito attuale. Per un insieme finito il numero cardinale
concide con il suo numero ordinale (e si identifica con un numero naturale); per gli insiemi infiniti cosı̀ non è,
e Cantor perviene ad una teoria degli insiemi infiniti e ad una corrispondente aritmetica dei cardinali
(e ordinali) infiniti.
Tra i più duri avversari della teoria degli insiemi ricordiamo Leopold KRONECKER (1823-1891), Felix
KLEIN, Henri POINCARÉ(1854-1912), che Ar rivò a dire che la teoria degli insiemi è un interessante caso
patologico e predisse che i posteri considereranno la teoria degli insiemi di Cantor come una malattia da cui
si è guariti. D’altra parte Hilbert nel 1926 disse: Nessuno riuscirà a cacciarci dal paradiso che Cantor ha
creato per noi ed egli come Bertand Russell considerò l’opera di Cantor come una delle più belle realizzazione
del pensiero matematico19 .
Il tentativo di fondare in modo rigoroso l’aritmetica sulla teoria degli insiemi spostò il problema a quello
di trovare una formulazione assiomatica della teoria degli insiemi che potesse dare garanzie di non
contraddittorietà. A tal fine era necessario indagare sulla stessa logica, con la quale si sviluppavano le teorie
matematiche, trovare insomma una base assiomatica per la logica stessa. Il problema dei fondamenti
dell’aritmetica e della teoria degli insiemi diviene cosı̀ il problema dei fondamenti della matematica
nel suo complesso e del ruolo della logica in matematica, problemi questi che erano venuti in modo
drammatico alla ribalta con la scoperta di alcune contraddizioni, chiamate eufemisticamente paradossi,
soprattutto nell’ambito della teoria degli insiemi. Ricordiamo alcuni paradossi tra i più noti.
Paradosso di Burali-Forti (Cesare Burali-Forte, 1897): La collezione degli ordinali non è un insieme:
la successione di tutti i numeri ordinali è ”ben ordinata e pertanto dovrebbe avere come ordinale il più grande
di tutti i numeri ordinali.
Paradosso di Richard (Jules Richard, 1905): L’insieme A dei numeri interi positivi che possono essere
descritti a parole con al piú 100 lettere dell’alfabeto è non vuoto (contiene ad esempio: settantadue, nove
per nove, ecc.) ed è finito perché usando le 26 lettere dell’alfabeto si possono formare al più 26100 espressioni
18 Il secondo problema di Hilbert era precisamente: Studiare l’indipendenza e la non contraddittorietà degli assiomi
dell’aritmetica. Per un esame sullo stato attuale delle ricerche originate dallo studio dei ”Problemi di Hilbert”, cfr. J. Gray, We
must know, we shall know: a history of the Hilbert problems. Oxford Univ. Press, 2000. Si veda anche: Il pensiero di David
Hilbert a cento anni dai ”Grundlagen der Geometrie”, Suppl. n.1, vol. 55 della rivista ”Le Matematiche”, Catania 2000. Ci
si limita qui a ricordare che Paul COHEN (1934- ) ha risolto nel 1963 il Primo Problema di Hilbert consistente nel dimostrare
l’ipotesi del continuo, dovuta a Cantor, secondo cui non esiste alcun cardinale intermedio tra la potenza del numerabile e quella
del continuo. La soluzione di Cohen è nel senso che il suddetto enunciato è indecidibile nel sistema di assiomi della teoria degli
insiemi di Zermelo-Fraenkel, cioè né quell’enunciato né la sua negazione sono teoremi della teoria. Pertanto, se la teoria degli
insiemi di Zermelo-Fraenkel è non contraddittoria, allora la teoria stessa resta non contraddittoria aggregandole come assioma
l’ipotesi del continuo o la sua negazione.
19 Il Lettore riveda al riguardo la dimostrazione delle seguenti affermazioni. 1: N è infinito. 2: | N |=| Q | . 3: L’intervallo
aperto reale ]0, 1[ è equipotente ad R. 4: | N |<| R |. 5: | A |<| P (A) | per ogni insieme A.
19
con al più 100 lettere (e molte di quelle espressioni non sono dotate di significato); sia B linsieme dei restanti
numeri interi (quelli la cui descrizione richiede almeno 101 lettere). Anche B è non vuoto per quanto detto.
Sia b l’intero definito come il piú piccolo numero di B. Dunque il più piccolo intero non descrivibile con al
più 100 lettere può invece essere definito con meno di 100 lettere.
Paradosso del barbiere (Bertrand Russell, 1918): Il barbiere di un piccolo villaggio non fa la barba
a coloro che si radono da soli, ma la fa a tutti quelli che non si radono da soli. Un giorno il barbiere si
domanda se dovrebbe o no radere se stesso. Se sı̀, allora no; se no, allora sı̀.
Paradosso di Cantor: parlare di ”insieme di tutti gli insiemi” conduce ad una contraddizione. L’insieme
degli insiemi che non contengono se stesso come elemento contiene se stesso come elemento? Se sı̀, allora no;
se no, allora sı̀.
Russell ha notato che la causa di questi paradossi consiste nel definire un oggetto in termini di una classe
di oggetti che contiene l’oggetto stesso (definizione impredicativa). Ernst ZERMELO (1871-1953) ha osservato nel 1908 che la definizione di estremo inferiore di un insieme di numeri è impredicativa e che quindi
l’analisi classica contiene dei paradossi.
Per superare i paradossi, i matematici sostituirono alla teoria ingenua degli insiemi quale era stata elaborata da Cantor, altre teorie degli insiemi, di tipo assiomatico. Nasce cosı̀ il sistema assiomatico di Ernst
Zermelo (1908), poi modificato da Abraham A. FRAENKEL (1921) (sistema ZF o di Zermelo-Fraenkel)
e da J. von NEUMANN (1903-1957) nel 1925. Con queste teorie formali si sviluppa tutta la teoria degli
insiemi necessaria all’analisi e si evitano i paradossi (o almeno non sono stati trovati). Ma riguardo al problema della coerenza, divenuto ormai cruciale, Poincaré osservava pessimisticamente: ”Abbiamo messo un
recinto intorno al gregge per proteggerlo dai lupi, ma non sappiamo se ci fossero già dei lupi nel gregge” 20 .
Secondo i critici, i sistemi assiomatici proposti avevano il difetto di presupporre l’uso della logica, proprio
in un momento in cui era la logica stessa e la sua relazione con la matematica a dover essere investigata.
All’inizio del Novecento tre grandi scuole di pensiero affrontatarono in modo netto la questione filosofica
dei fondamenti della matematica: la scuola logicista (Russell e Whitehead), la scuola intuizionista
(Brouwer) e la scuola formalista (Hilbert). Una svolta decisiva viene segnata dai teoremi di Gödel, che
in qualche modo pongono un limite al problema della coerenza, e contribuirono ad indirizzare la filosofia della
matematica verso altre problematiche. È in questo quadro rinnovato che sorge una scuola strutturalista
(Nicolas BOURBAKI).
Ancora sul buon ordinamento e su questioni collegate. Ritorniamo sulla nozione di buon ordinamento, nominata a proposito di quella di numero ordinale. Ricordiamo anzitutto alcune definizioni
riguardanti gli insiemi parzialmente ordinati.
Un insieme X si dice parzialmente ordinato (o poset) se è dotato di una relazione di ordine, ossia di
una relazione riflessiva, antisimmetrica, e transitiva. La relazione d’ordine si denota comunemente con ≤,
cosicché (X, ≤) è la notazione per il poset considerato. Un poset (X, ≤) si dice totalmente ordinato (o
linearmente ordinato o una catena) se, dati comunque due suoi elementi x ed y, risulta necessariamente
x ≤ y oppure y ≤ x.
Un poset (X, ≤) si dice bene ordinato se ogni sua parte non vuota ha un minimo. Ad esempio
l’ordinamento secondo grandezza è un buon ordinamento in N, ma non in Z, né in Q né in R.
Un poset (X, ≤) si dice induttivo se ogni sua catena Y è maggiorata in X. Ad esempio risulta induttivo
il poset degli ideali propri di un anello con unità rispetto all’inclusione; risulta induttivo il poset G(a, b)
delle catene di estremi a e b di un poset X; non risulta induttivo l’insieme dei naturali (o dei reali) ordinato
secondo grandezza.
Un elemento z di un poset (X, ≤) dicesi massimale se: (x ∈ X, z ≤ x) ⇒ x = z.
Si può dimostrare che le proprietà espresse dai seguenti quattro assiomi (o teoremi) sono equivalenti,
e che la loro aggiunta ad un sistema di assiomi della teoria degli insiemi non ne altera il carattere di non
contraddittorietà.
Lemma di Zorn (Max Zorn, 1906 – ) Ogni insieme induttivo possiede un elemento massimale.
20 Cfr.
Morris Kline, Storia del pensiero matematico, vol. II, Einaudi, 1991, p. 1382.
20
Assioma di Zermelo (Ernst Zermelo, 1871–1953). Ogni insieme può essere bene ordinato.
Assioma della scelta. Per ogni insieme E non vuoto esiste almeno una funzione di scelta su E, ossia
un’applicazione F : P ∗ (E) → E, dall’insieme P ∗ (E) delle parti non vuote di E ad E tale che: A ∈ P ∗ (E) ⇒
F (A) ∈ A.
Proprietà di Tarski (1924) (Alfred Tarski, 1901 – 1983). Per ogni numero cardinale infinito c risulta
c = c2 .
Si noti che:
(a) non si conosce esplicitamente una funzione di scelta su R, mentre su N si può assumere F (A) = min(A)
per ogni A ∈ P ∗ (N).
(b) non si conosce un buon ordinamento di R. Un buon ordinamento di N è quello naturale; questo induce
(determina) un buon ordinamento in ogni insieme posto in corrispondenza biunivoca con N, in particolare
in Z e in Q21 .
2.1
La scuola logicista.
Il precedente storico immediato della scuola logicista di Russell e Whitehead era stata la matematizzazione
della logica, che ebbe inizio nel XIX secolo con Augustus DE MORGAN che aveva formulato (nel 1847) le
famose leggi che portano il suo nome:
¬(p ∨ q) ' (¬p) ∧ (¬q),
¬(p ∧ q) ' (¬p) ∨ (¬q)
e che nel linguaggio della teoria degli insiemi si enunciano dicendo che ”il complementare dell’unione è
l’intersezione dei complementari” e che ”il complementare dell’intersezione è l’unione dei complementari”:
CE (A ∪ B) = CE (A) ∩ CE (A),
CE (A ∩ B) = CE (A) ∪ CE (A).
Nello stesso periodo George BOOLE aveva sviluppato una logica estensionale cioè una logica delle classi,
giungendo alla assiomatizzazione di quella che oggi viene chiamata un’algebra di Boole, cioè un reticolo
R(≤, ∩, ∪) con massimo e minimo, distributivo e complementato. L’opera di De Morgan e di Boole portò ad
un effettivo sviluppo della logica aristotelica ed ebbe come conseguenza il distacco della logica dalla filosofia
ed il suo inserimento nella matematica: nasceva la logica matematica.
Fu Charles S. PEIRCE ad introdurre la distinzione tra una proposizione ove intervengono solo costanti
(”Mario è un uomo”) ed una funzione proposizionale di una o più variabili (”x è un uomo”, ”x conosce
y”, ecc.).
La logica matematica fu dunque una matematizzazione della logica; essa ebbe come insigni rappresentanti
Giuseppe PEANO in Italia e Gottlob FREGE in Germania. Quest’ultimo indicò una fondazione assiomatica
della logica (Ideografia, 1879) ed utilizzò la sua logica per i Fondamenti dell’aritmetica (1884), con il
proposito di costruire la matematica come una estensione della logica. La scuola logicista (che,
come detto, si può fare risalire a Frege) trovò i suoi massimi rappresentatnti in Bertrand RUSSELL e Alfred
North WHITEHEAD, che pubblicarono i Principles of Mathematics (1903) e poi i Principia Mathematica
(3 voll., 1910–1913). Essi assumono come primitive le nozioni di proposizione elementare p, q, . . . e di
funzione proposizionale p(x), affermazione di verità di una proposizione elementare, la negazione ¬p di una
proposizione e la disgiunzione p ∨ q di due proposizioni; su questa base viene da loro costruita tutta la logica.
Ad esempio l’implicazione p ⇒ q, da loro scritta alla Peano come p ⊃ q, è definita da ¬p ∨ q e vengono
formulati vari postulati, tra i quali ad esempio:
21 Ricordiamo che si costruisce una bijeezione α : N → Q con il metodo di Cantor disponendo i numeri di Q in una matrice
infinita e ponendo n/m ∈ Q nella casella di posto (n, m); tralasciando i numeri già considerati, si dispongono in una successione
le coppie (n, m) seguendo l’ordine α(1) = (1, 1), α(2) = (2, 1), α(3) = (1, 2), α(4) = (3, 1), . . . , ecc. Per ottenere il buon
ordinamento di Q si ’incolla’ tramite α il buon ordinamento di N su Q. Si noti che, come è evidente a priori, il buon ordinamento
cosı̀ ottenuto su Q non è l’ordinamento usuale di Q.
21
1) (p ∨ p) ⊃ p,
2) q ⊃ (p ∨ q),
3) (p ∨ q) ⊃ (q ∨ p),
4) [p ∨ (q ∨ r)] ⊃ [q ∨ (p ∨ r)].
Dai loro postulati, Russell e Whitehead deducono vari teoremi di logica — ad esempio (p ⊃ ¬p) ⊃ ¬p (la
”riduzione all’assurdo”), p ∨ ¬p (il ”principio del terzo escluso”), ecc. — ed infine teoremi di aritmetica
e di analisi . Gli insiemi vengono introdotti per mezzo di funzioni proposizionali, cosı̀ p(x) indica
l’insieme di tutti gli oggetti per i quali p(x) è vera. Viene quindi sviluppata una teoria dei tipi: una
funzione proposizionale è di tipo zero se si applica a membri x che sono singoli oggetti, di tipo 1 se si
applica a membri x che sono funzioni proposizionali di tipo 0, di tipo n + 1 se si applica a membri x che sono
funzioni proposizionali di tipo n. La teoria dei tipi cerca di evitare i paradossi della teoria degli insiemi, in
particolare evitando le definizioni impredicative, ossia imponendo che ciò che viene definito utilizzando
tutti i membri di una collezione non debba essere membro della collezione medesima.
Un nuovo definitivo passo in avanti fu compiuto da GÖDEL. Egli dimostrò nel 1935 che non è possibile
stabilire la coerenza della teoria dei numeri qualora ci si limiti alla logica della metamatematica. Hermann
WEYL commentò questo risultato dicendo che Dio esiste perché la matematica è coerente ed il diavolo esiste
perché non possiamo dimostrAr ne la coerenza.
Russell e Whitehead sviluppano poi una teoria delle classi, ove per classe s’intende la totalità degli
oggetti che soddisfano una determinata proprietà; gli insiemi sono classi ma non viceversa; una classe
propria è una classe che non è un insieme: le classi hanno la caratteristica di non poter essere
elemento di altre classi. Sono esempi di classi proprie: la classe di tutti gli ordinali, la classe di tutti
gli insiemi, la classe degli insiemi che non contengono se stessi come elemento; se queste classi
fossero insiemi condurrebbero ad una contraddizione.
Le relazioni (binarie) sono classi di coppie che verificano una funzione proposizionale di due variabili. Si
definisce poi 22 la nozione di corrispondenza biunivoca tra classi, che conduce alla definizione di numero
cardinale (la classe delle classi ponibili in corrispondenza biunivoca con una classe data). Dai numeri
cardinali, si passa poi ai numeri naturali, e quindi ai razionali, ai reali, ai complessi, alle funzioni, e
finalmente a tutta l’analisi e alla geometria euclidea. In tal modo la scuola logicista intendeva assolvere
al programma di fondare tutta la matematica sulla logica.
Merito di Russell e Whitehead e della scuola logicista è stato indubbiamente quello di aver fondato una
logica espressa su base assiomatica ed in forma interamente simbolica, contribuendo cosı̀ in modo
sostanziale alla sviluppo e alla diffusione della logica matematica. Tuttavia a prescindere da alcune critiche
di carattere tecnico, è stato messo in evidenza la difficoltà ad aderire fideisticamente ad una filosofia della
matematica in base alla quale tutta la matematica sarebbe una scienza puramente formale, logicodeduttiva, in cui i teoremi seguono dalle leggi del pensiero, prescindendo non solo dalla intuizione ma
soprattutto dall’esperienza fisica.
2.2
La scuola intuizionista.
L’origine di questa filosofia della matematica si può fare risalire a KRONECKER, che aveva fortemente
avversato la teoria degli insiemi di Cantor come ”puro misticismo” ed aveva auspicato una fondazione della
matematica sui numeri interi (”creati da Dio”), ottenuta introducendo tutti gli enti matematici con metodi
costruttivi e con un numero finito di passi; in particolare egli rifiutava i numeri irrazionali, considerati ”non
esistenti”. La filosofia intuizionista prese vigore con la scoperta dei paradossi, e trovò un suo primo grande
propugnatore in Henri POINCARÉ(1954-1912), che avversò la teoria degli insiemi e soprattutto la filosofia
del logicismo, che secondo lui rischiava di ridurre tutta la matematica ad una colossale tautologia. Poincaré
riteneva che tutte le definizioni dovessero essere costruttive e perciò rifiutava l’assioma della scelta;
egli affermava che l’aritmetica non può essere fondata assiomaticamente, ma costituisce un a priori
22 È da notare che la nozione di corrispondenza biunivoca non presuppone il numero 1 (altrimenti si otterrebbe un circolo
vizioso): una corrispondenza tra la classe A e la classe B è definita come una data classe C di coppie (a, b) con a ∈ A e b ∈ B;
la corrispondenza C è biunivoca se: 1) per ogni a ∈ A esiste qualche b ∈ B per cui (a, b) ∈ C; 2) per ogni b ∈ B esiste qualche
a ∈ A per cui (a, b) ∈ C; 3) se (a, b) e (a, b0 ) sono in C, allora b = b0 ; 4) se (a, b) e (a0 , b) sono in C, allora a = a0 .
22
della nostra intuizione, come lo è l’induzione matematica. Simili affermazioni vennero sporadicamente
fatte da altri eminenti matematici quali Emile BOREL (1871–1956), René BAIRE (1874–1932), Jacques
HADAMARD (1865–1963) e Henri LEBESGUE (1875-1941), ma fu Luitzen BROUWER (1881–1966) che
sviluppò sistematicamente tali idee, tanto da poter essere considerato il fondatore della scuola intuizionistica,
che fra l’altro rifiutava il principio del terzo escluso e le dimostrazioni per assurdo. Tale scuola, alla
quale aderı̀, per molti versi, anche Hermann WEYL, non si limitò alla critica del logicismo, ma ricostruı̀ una
nuova matematica basata sulle costruzioni finitiste ritenute accettabili. Si noti che questa filosofia
della matematica propugnata dalla scuola intuizionista treva un suo corrispettivo nella filosofia del senso
comune di Henri BERGSON e di altri.
2.3
La scuola formalista.
A capo di questa scuola troviamo HILBERT, che, dopo aver ricondotto la coerenza della geometria euclidea
a quella dell’aritmetica, si volse nel 1904 al problema di fondare assiomaticamente l’aritmetica senza
la teoria degli insiemi dimostrandone poi la coerenza. Si tratta del cosı̀ detto programma hilbertiano, al quale egli si dedicò intensamente a partire dal 1920 e che raccolse il consenso di molti matematici.
Le idee fondamentali dei formalisti si possono riassumere nei termini seguenti. Poiché la fondazione della
matematica deve tener conto della logica, bisogna trattare contemporaneamente la logica e la matematica; di più, poiché la matematica è costituita da vari discipline, bisogna che ogni disciplina abbia una
sua propria fondazione assiomatica, costituita da concetti e principi sia logici sia matematici; ed ancora:
la logica è un linguaggio fatto di segni che traduce gli enunciati in formule ed esprime i ragionamenti
per mezzo di procedimenti puramente formali. Gli assiomi forniscono le regole con cui certe
formule derivano da altre formule. I segni ed i simboli di queste operazioni ed i simboli matematici
sono svuotati da ogni significato.
Secondo questa concezione, l’essenza della matematica sono i simboli, che non vanno intesi come idealizzazioni di oggetti fisici. La matematica diventa un insieme di sistemi formali, ciascuno con propri concetti,
propri assiomi, proprie formule ben formate, e proprie regole di deduzione. Per alcuni sistemi formali
molto semplici, Hilbert e la sua scuola (W. Ackermann, P. Bernays (1888–1972), J. von Neumann (1903–
1957) riuscirono a dimostrare la coerenza, ma al programma di dimostrare la coerenza dell’aritmetica
infersero un colpo definitivo i risultati di Kurt Gödel (1931), dai quali discendeva che nessun sistema
formale può contenere una qualsiasi branca significativa della matematica, perché ogni tale sistema formale
è incompleto ossia contiene enunciati, i cui concetti appartengono al sistema, che non possono però
essere dimostrati all’interno del sistema stesso. Tuttavia, nonostante il suo fallimento, il programma di
Hilbert lasciò una notevole eredità di risultati metamatematici riguardanti la teoria della dimostrazione,
consentendo infine di pervenire alla concezione moderna secondo cui l’attività matematica consiste essenzialmente nella dimostrazione di teoremi, la cui esecuzione prescinde dai contenuti specifici delle
singole teorie 23 .
2.4
La critica di Gödel.
Come già accennato, il programma formalista di Hilbert consisteva nel tentativo di dimostrare la coerenza della teoria formale dell’aritmetica (cioè dei numeri naturali) utilizzando metodi finitisti ed all’interno
di una teoria che comprendesse sia i termini e le regole logiche di deduzione formale sia i termini dell’aritmetica.
Realizzare questo programma è impossibile, in quanto sussiste il secondo teorema di incompletezza
di Gödel, che ha inferto un colpo fatale al programma stesso. Accenniamo brevemente di cosa si tratta,
ricordando altri due fondamentali teoremi dello stesso Kurt GÖDEL (1906-1978).
Teorema di completezza di Gödel. Una formula che sia realizzata in tutti i modelli di una teoria
23 Cfr.
D. Palladino e C. Palladino, Breve dizionario di logica, carocci, 2005, p. 45-46.
23
del primo ordine è dimostrabile in tale teoria. In altri termini, per una qualunque teoria del prim’ordine,
una formula è dimostrabile se e soltanto se è valida (cioè in tale teoria i teoremi coincidono con le formule
valide).
Primo teorema d’incompletezza di Gödel. Se una teoria formale dell’aritmetica è non contraddittoria, esiste una formula F della teoria tale che né F né non − F sono dimostrabili nella teoria. In altri
termini, se una teoria formale dell’aritmetica è non contraddittoria, essa non è una teoria completa.
Secondo teorema d’incompletezza di Gödel. Se una teoria formale dell’aritmetica è non contraddittoria, non è possibile dimostrare la sua non–contraddittorietà con metodi formalizzabili all’interno di quella
teoria.
Un altro importante teorema di Gödel (1940) riguarda l’ipotesi del continuo; questa ipotesi afferma la
non esistenza di cardinali intermedi tra il numerabile ed il continuo. Il risultato di Gödel è il seguente:
Teorema. Se la teoria degli insiemi è non contraddittoria, si può aggiungere ai suoi assiomi l’ipotesi del
continuo.
Questo risultato è migliorato da un celebre teorema di Paul Cohen (1934–) già citato, dal quale segue
l’indipendenza dell’ipotesi del continuo dagli assiomi della teoria ZF degli insiemi, in quanto afferma che:
Teorema di Cohen (1963). Se la teoria degli insiemi di Zermelo-Fraenkel è non contraddittoria, si può
aggiungere ai suoi assiomi tanto l’ipotesi del continuo quanto la sua negazione.
Lo stesso Cohen ha dimostrato (1963) un analogo risultato per quanto riguarda l’assioma della scelta.
Egli ha inoltre dimostrato che anche aggiungendo l’assioma della scelta al sistema di Zermelo-Fraenckel,
l’ipotesi del continuo non può essere dimostrata.
2.5
La scuola strutturalista.
Un tentativo di rifondare il complesso della matematica moderna su basi assiomatiche è stato compiuto da
un gruppo di matematici francesi (Henri cartan, Claude Chevalley, Jean Dieudonne, André Weil) che si sono
raccolti sotto lo pseudonimo collettivo di Nicolas Bourbaki, dal nome di un generale di Napoleone III.
Il gruppo, fondato nel 1933, cominciò a operare nel 1939 e si è continuamente rinnovato nella composizione,
in quanto vi vige la regola ferrea che i suoi membri vengono espulsi al compiere del quarantesimo anno.
Bourbaki ha pubblicato un trattato in più volumi dal titolo Elementes des Mathématiques, che è diventato
un’opera fondamentale di riferimento per i matematici; esso prende le mosse dalla teoria degli insiemi
ed articola poi l’esposizione della matematica secondo le varie strutture presenti (algebriche, d’ordine,
topologiche, ecc.).
Si noti che in ogni campo (filosofia, sociologia, antropologia, psicanalisi, teoria del linguaggio, ecc.) lo
strutturalismo privilegia le relazioni che intercorrono tra gli oggetti che vengono studiati; basti pensare
alle opere del grande antropologo Claude Lévi-Strauss.
Tra i meriti storici del gruppo bourbakista c’è quello di aver diffuso tra i matematici di tutto il mondo
un linguaggio comune e notazioni di tipo standard e che in gran parte si rifanno a quelle introdotte da
Giuseppe Peano. Il gruppo è ancora attivo sotto forma di Seminaire Bourbaki di cui pubblica annualmente
dei Rendiconti.
24
2.6
Conclusione.
Per concludere, si può dire che siano tutti falliti i tentativi di trovare una soluzione definitiva al problema
di stabilire dei fondamenti certi della matematica, risolvendo in modo soddisfacente il problema della sua
coerenza. Per ironia della sorte, dopo tante ricerche, si è tornati, soprattutto con le moderne concezioni
proprie dell’intuizionismo, alla posizione che avevano inizialmente i matematici greci, che si affidavano
fondamentalmente alla intuizione, ai metodi costruttivi e finitistici.
Forse è addirittura sbagliato pensare che si possa trovare una soluzione definitiva al problema di cosa debba
essere e come debba essere organizzata la matematica; forse la matematica si evolve storicamente,
come le arti figurative, come la musica, trovando nelle varie epoche la sua propria fisionomia e la sua
propria giustificazione in relazione alla evoluzione della filosofia, delle altre scienze e della tecnica.
Chiudiamo questa esposizione con le parole di Poincaré, secondo cui:
. . . la vera matematica, quella che serve a qualche utile scopo, può continuare a svilupparsi secondo i propri
principi, senza prestare alcuna attenzione alle tempeste che infuriano intorno a lei, e proseguirà passo dopo
passo le sue consuete conquiste, che sono definitive e che non sarà mai necessario abbandonare 24 .
3
Un tributo ad Euclide: costruzioni con riga e compasso, i numeri
euclidei e i problemi impossibili dell’antichità
Ricordiamo che il primo ed il terzo postulato di Euclde assicurano rispettivamente ”che si possa condurre
una retta da un qualsiasi punto ad ogni altro punto” e che ”si possa descrivere un cerchio con qualsiasi
centro e ogni distanza”. Questi due postulati affermano la possibilità di ”costruire” la retta per due punti
e la circonferenza di dato centro e raggio. Gli strumenti che permettono materialmente di effettuare queste
costruzioni sono la riga e il compasso. Si intende che la riga non è graduata. In altri termini la riga permette
soltanto di tracciare la retta per due punti dati, mentre il compasso permette di tracciare la circonferenza
che abbia un dato punto come centro ed un dato segmento come raggio. I greci prediligevano la linea retta
e la circonferenza, forse anche a causa della loro particolare bellezza e semplicità rispetto ad altre curve. Il
volere limitare i metodi di costruzione geometrica all’uso della riga e del compasso rispondeva alla esigenza
di ridurre ogni problema, per quanto complicato, ad elementi che fossero il più possibile ’semplici’.
Se A e B sono due punti distinti, denotiamo con lo stesso simbolo AB sia la retta per questi due punti
che il segmento con questi due estremi; e denotiamo con C(O, AB) la circonferenza di centro il punto O e
raggio AB. Procediamo ricordando anzitutto come con l’uso della riga e del compasso si possono effettuare
alcune costruzioni geometriche ed alcune operazioni algebriche, per poi esaminare le ragioni profonde
per le quali alcune costruzioni sono possibili ed altre impossibili: un bell’esempio di matematica
che riflette su se stessa.
COSTRUZIONI GEOMETRICHE ELEMENTARI CON RIGA E COMPASSO
Ne ricordiamo alcune.
Asse di un segmento AB: è la retta M N dove {M, N } = C(A, AB) ∩ C(B, AB).
b è l’asse del segmento AB 0 dove {A} = C(O, OA) ∩ a e {B 0 } =
b = ab:
Bisettrice di un angolo AOB
C(O, OA) ∩ b.
Perpendicolare per un punto P ad una retta a: è l’asse del segmento AB dove {A, B} := a ∩ C(P, M N ) e
M N è un segmento arbitrario (grande quanto basta affinché quella intersezione non sia vuota).
Parallela per un punto P ad una retta a: è la perpendicolare per P alla retta perpendicolare per P ad a.
24 H.
Poincaré. The foundation of science, 1946, p. 480.
25
Supponiamo anche note le seguenti altre costruzioni con riga e compasso:
Dividere un segmento AB in n parti uguali: si usi il Teorema di Talete.
Inscrivere in una circonferenza un n−gono regolare, per n = 3, 4, 5, 6, 8.
Particolarmente interessante – per contrapposizione all’analogo probema della quadratura del cerchio, di
cui si dirà tra breve – appare la costruzione seguente.
Quadratura di un poligono convesso assegnato. Si tratta di costruire con riga e compasso un
quadrato avente la stessa area di un assegnato poligono convesso P = P1 P2 . . . Pn . Si procede in quattro
passi:
1) Costruzione di un triangolo T equivalente a P. Se n > 3, costruiamo anzitutto un poligono con
n − 1 lati ed equivalente al poligono dato: si traccia la diagonale P1 P3 , e poi la parallela per il punto P2
a tale diagonale, fino ad incontrare – diciamo in un punto P20 – il prolungamento del lato P4 P3 . I triangoli
P1 P2 P3 e P1 P20 P3 sono equivalenti (hanno la stessa base P1 P3 e la stessa altezza, che è l’ampiezza della
striscia compresa tra le due rette parallele P1 P3 e P2 P20 ). Sostituendo il triangolo P1 P2 P3 con il triangolo
P1 P20 P3 si ottiene un poligono con n − 1 lati equivalente a P . Iterando il procedimento si giunge a costruire
un triangolo T equivalente a P.
2) Costruzione di un parallelogramma P’ equivalente ad un triangolo T = ABC. Sia M il punto
medio di AC e sia N il punto di intersezione tra la parallela per M ad AB e la parallela per B ad AC. Il
parallelogramma P’ = ABM N e il triangolo T sono equivalenti perché sono composti da poligoni congruenti.
3) Costruzione di un rettangolo R equivalente ad un parallelogramma P’ = ABM N . Si costruscano le
perpendicolari per A e per B ad AB e si considerino le loro intersezioni A0 e B 0 con M N . Allora il rettangolo
R = ABB 0 A0 e il parallelogramma P’ sono equivalenti perché somme o differenze di poligoni congruenti.
4) Costruzione di un quadrato Q equivalente ad un rettangolo R = ABB 0 A0 . Il lato del quadrato Q è
medio proporzionale tra AB e AB 0 e pertanto si costruisce come altezza di un triangolo rettangolo avente
come proiezioni dei cateti sull’ipotenusa segmenti conguenti ad AB e ad AB 0 .
OPERAZIONI ELEMENTARI CON RIGA E COMPASSO
√
Costruzione dei punti P (a ± b), P (ab), P (a/b), P ( a):
Sia fissato nel piano un riferimento cartesiano ortogonale monometrico. Siano dati il punto origine O(0, 0),
ed i punti unità U1 (1, 0), U2 (0, 1) dei due assi. Dati sull’asse delle ascisse i punti A(a) e B(b), si possono
costruire con riga e compasso, i punti seguenti:
P (a ± b): in modo ovvio.
P (ab) è il punto in cui l’asse delle ascisse incontra la parallela per il punto (0, b) alla retta (0, 1)(a, 0) (per il
Teorema di Talete).
P ( a1 ): si considera un triangolo rettangolo con altezza 1 relativa alla ipotenusa e proiezione a di un cateto
relativo alla ipotenusa; allora a1 è la proiezione dell’altro cateto sull’ipotenusa.
P ( ab ): è il punto P(a· 1b ).
a
si utilizza il Teorema di Talete per la divisione di un segmento in n parti uguali.
P (√
n ) con n ∈ N : √
P ( a: il numero a è l’altezza relativa alla ipotenusa di un triangolo rettangolo con proiezioni 1 e a dei
cateti sull’ipotenusa.
PUNTI COSTRUIBILI CON RIGA E COMPASSO
A PARTIRE DA UN INSIEME ASSEGNATO DI PUNTI
Sia fissato nel piano un riferimento cartesiano ortogonale monometrico. Sia inoltre assegnato nel piano
un insieme finito P di k ≥ 3 punti. A partire dai punti di P possiamo considerare due tipi di costruzioni:
26
Costruzioni di primo tipo: Costruzione dell’insieme R(P) delle rette congiungenti due punti distinti
arbitrari di P. (Si noti che | R(P)|≤ k(k − 1)/2.)
Costruzioni di secondo tipo: Costruzione dell’insieme C(P) delle circonferenze di centro un punto
arbitrario di P e raggio uguale al segmento di estremi due punti arbitrari di P. (Si noti che si dispone di k
scelte per il centro e di h ≤ k(k − 1)/2 scelte per il raggio, scelte che conducono a kh circonferenze.)
Definizione 9 I punti del piano costruibili in un passo (con riga e compasso) a partire da P, sono i
punti intersezione di due oggetti di R(P)∪C(P), ossia di due rette, oppure di una retta e di una circonferenza
oppure di due circonferenze tracciate eseguendo una costruzione di primo e di secondo tipo.
Definizione 10 Un punto P del piano si dice costruibile (con riga e compasso) a partire da P, se esiste
una successione finita di punti del piano: P1 , . . . , Pn = P tali che:
1) P1 è costruibile in un passo da P,
2) per ogni i = 2, . . . , n, si ha che Pi è costruibile in un passo da P ∪ {P1 , . . . , Pi−1 }.
Definizione 11 Le coordinate a e b di un punto costruibile (con riga e compasso a partire da P) si dicono
numeri costruibili (con riga e compasso a partire da P).
Al problema di trovare una condizione necessaria affinché un punto (un numero) sia costruibile con riga e
compasso a partire da P risponde il seguente Teorema di Pierre Laurent WANTZEL (1814-1848).
Teorema 12 Sia dato un insieme finito P di punti del piano euclideo nel quale sia fissato un riferimento
cartesiano ortogonale monometrico e sia K0 il campo generato dalle coordinate dei punti di P ossia il
minimo sottocampo di R che contiene le coordinate di tali punti.
Se un punto P (a, b) è costruibile (con riga e compasso a partire da P), allora ciascuna delle sue coordinate
è un numero algebrico su K0 di grado una potenza di due, cioè è radice di un polinomio di K0 [X]
ivi irriducibile e di grado una potenza di due.
Se in particolare K0 = Q, i numeri costruibili si chiamano numeri euclidei, e sono precisamente numeri
algebrici di grado una potenza di due.
Dimostrazione25 . Sia P un punto costruibile a partire da P, Consideriamo una sequenza di insiemi di
punti che indica una costruzione di P :
P
⊂
P ∪ {P1 }
⊂
··· ⊂
P ∪ {P1 , . . . , Pn = P }
e consideriamo la sequenza dei campi associati a questi insiemi di punti:
K0
≤
K1
≤
...
≤
Kn ,
dove cioè Ki è il campo generato dalle coordinate di P ∪ {P1 , . . . , Pi }.
Si noti che congiungere due punti od intersecare due rette non fa uscire dal campo di razionalità
degli enti assegnati, mentre invece intersecare una retta ed una circonferenza oppure due circonferenze fra
loro può eventualmente fare uscire dal campo di razionalità degli enti assegnati conducendo ad un campo
estensione quadratica di quello:
25 La dimostrazione del Teorema di Wantzel è assai istruttiva perché consiste in una semplice riflessione sul tipo di calcoli
che si compiono nel risolvere i più semplici problemi di geometria analitica: retta per due punti, intersezione di due rette,
intersezione di una retta e di una circonferenza, intersezione di due circonferenze.
27
1. la retta per due punti con coordinate in un campo Ki ha equazione con coefficienti nello stesso Ki ;
2. il punto intersezione di due rette con equazioni a coefficienti in un campo Ki ha coordinate in Ki ;
3. un punto itersezione di una retta e di una circonferenza oppure di due circonferenze con
equazioni a coefficienti in un medesimo campo Ki è un punto che ha coordinate in Ki oppure in un
campo estensione quadratica di Ki (qualora l’equazione risultante di secondo grado alla quale si
perviene ponendo a sistema le equazioni date sia priva di radici in Ki ).
Da 1-3 segue che, nella suddetta sequenza dei campi si ha in ogni caso Ki+1 = Ki (t), dove t è
una radice di un polinomio f (X) ∈ Ki [X] irriducibile di grado d ≤ 2; il campo Ki+1 è un Ki −spazio
vettoriale di dimensione [Ki+1 : Ki ] = d ∈ {1, 2}, ove naturalmente, se d = 1 si ha t ∈ Ki e Ki+1 = Ki .
Conseguentemente:
[Kn : K0 ] = [Kn : Kn−1 ] · · · [K2 : K1 ][K1 : K0 ] = 2h
dove
0 ≤ h ≤ n.
In conclusione, se un punto P (a, b) è costruibile (con riga e compasso a partire da P), ciascuna delle sue
coordinate è anzitutto un numero algebrico su K0 ed inoltre il suo di grado di algebricità su K0 è una
potenza di due26 .
Viceversa mostriamo che un numero reale α algebrico su K0 di grado una potenza di due, 2i , è costruibile
con riga e compasso a partire da P, purché il campo K := K(α) contenga una catena di sottocampi
K0 < K1 < · · · < Ki−1 < Ki = K tali che [Ks : Ks−1 ] = 2 per ogni s = 1, 2, . . . , i. Se i = 0, allora
√ α è
ovviamente costruibile al pari di ogni elemento di K0 ; se i > 0, allora α è della forma α = a + b c, con
a, b, c ∈ Ki−1 . Procedendo per induzione su i, possiamo supporre che a, b, c siano costruibili e da ciò segue
subito che anche α lo è in quanto le operazioni da effettuare su a, b, c per ottenere α possono essere eseguite
con riga e compasso. Si noti che la condizione espressa dal Teorema di Wantzel (algebricità di grado una potenza di 2) è
necessaria ma non sufficiente, in quanto, come insegna la Teoria di Galois, esistono estensioni algebriche
di K0 = Q di grado una potenza di due non ottenibili effettuando successive estensioni di grado 2.
Si noti che se P = {(0, 0), (1, 0), (0, 1)}, si ha K0 = Q, ed i numeri costruibili con riga e compasso sono
precisamente i numeri euclidei.
I PROBLEMI ’IMPOSSIBILI’ DELL’ANTICHITÀ
I problemi ”impossibili” dell’antichità sono: La duplicazione del cubo, la quadratura del cerchio, la rettificazione della circonferenza e la trisezione dell’angolo. Dopo oltre duemila anni dalla loro formulazione, è
stato dimostrato che questi problemi sono di impossibile soluzione. Sebbene questa impossibilità sia stata
dimostrata rigorosamente, esistono ancora oggi matematici dilettanti e amatori della matematica che cercano
di ottenere le costruzioni richieste. Le loro argomentazioni contengono errori di deduzione, oppure risolvono
il problema in qualche caso particolare, mostrando cosı̀ la non conoscenza esatta del problema. È estremamente interessante il fatto che una disciplina scientifica (la matematica) rifletta su se stessa e sancisca che
alcuni problemi della stessa disciplina sono di risoluzione impossibile.
Il problema della duplicazione del cubo. Dato lo spigolo a di un cubo, costruire con√
riga e compasso
lo spigolo b del cubo di volume doppio. La condizione porta a b3 = 2a3 e dunque a b = a 3 2. Assumendo
un riferimento cartesiano in cui il segmento a sia il segmento dell’asse
delle ascisse con estremi i punti
√
(0, 0) e (1, 0), si tratta di costruire con riga e compasso il punto ( 3 2, 0), ossia costrure, come si dice, il
√
esempio il numero a + b 3, con a e b razionali è euclideo (costruibile dai punti (0, 0), (1, 0), (0, 1)), in accordo col fatto
2
2
2
che
√ esso è algebrico
√ di grado 2: infatti annulla il polinomio X − 2aX + a − 3b che è irriducibile su Q perché (X − (a +
b 3))(X − (a − b 3) è la sua (unica) fattorizzazione.
26 Ad
28
√
√
numero 3 2, a partire dall’insieme P = (0, 0), (1, 0), (0, 1). In questo caso K0 = Q. Il numero 3 2 è però un
numero algebrico di grado 3 (infatti è radice del polinomio X 3 − 2, irriducibile su Q per il criterio di
Eisenstein27 e dunque, a norma del Teorema di Wantzel, non è un numero costruibile. Dunque il problema
della duplicazione del cubo è impossibile28 .
Il problema della quadratura del cerchio. Costruire con riga e compasso un quadrato avente la
stessa area di un cerchio di raggio r assegnato. La costruzione è impossibile29 Vediamo perché.√Il cerchio
dato ed il quadrato da costruire hanno area πr2 . Il lato del quadrato da costruire vale dunque r π. Come
nel caso precedente possiamo assumere r come segmento unitario sull’asse delle
√ ascisse. Si tratta dunque
a partire dai punti
(0,
0)
e
(1,
0)
di
costruire
con
riga
e
compasso
il
punto
(
π, 0), ossia costrure, come si
√
√
dice, il numero π. Questo è impossibile perché π è trascendente, in quanto, come ha dimostrato nel 1882
Ferdinand LINDEMANN (1852-1939), il numero π è trascendente, mentre i numeri costruibili con riga e
compasso sono, a norma del Teorema di Wantzel, (particolari) numeri algebrici.30
Il problema della rettificazione della circonferenza. Costruire con riga e compasso un segmento
avente la stessa lunghezza di una circonferenza di raggio assegnato. La costruzione è impossibile. Già
Archimede aveva dimostrato l’equivalenza tra questo problema e quello della quadratura del cerchio. Nel
caso della circonferenza, si tratterebbe evidentemente di costruire il numero π con riga e compasso a partire
dai punti (0, 0) e (1, 0) dell’asse delle ascisse, e questo è impossibile perché π è trascendente e dunque non è
costruibile a norma del Teorema di Wantzel.
Il problema della trisezione dell’angolo. Ripartire con riga e compasso un angolo dato in tre angoli
uguali. Dimostriamo che:
Lemma 13 Un angolo di misura θ in radianti è trisecabile con riga e compasso sse il polinomio
4X 3 − 3X − cos θ
è riducibile in Q(cos θ)[X]
31
(1)
.
Dimostrazione. Si cominci con l’osservare che un angolo di misura θ in radianti è dato sse è dato il
punto (cos θ, 0). Pertanto un angolo di misura θ è trisecabile con riga e compasso sse il punto Q = (cos θ3 , 0)
è costruibile con riga e compasso a partire dai numeri del campo Q(cos θ). Questa costruibilità implica - per
il Teorema di Wantzel - che il numero
θ
cos
3
sia algebrico su Q(cos θ) di grado una potenza di due. Ricordiamo ora la formula trigonometrica
cos 3α = 4 cos3 α − 3 cos α;
(2)
27 Il criterio di Eisenstein (Ferdinand Gotthold Eisenstein, 1823-1852) afferma che se F (X) = X n + a
n−1 + · · · + a è
n−1 X
0
un polinomio a coefficienti in Z , se p è un numero primo che divide tutti gli ai (0 ≤ i ≤ n − 1) e se p2 non divide a0 , allora
F (X) è irriducibile in Q[X]. Alternativamente: se X 3 − 2 fosse riducibile su Q avrebbe uno zero m
con m, n interi primi fra
n
loro, e quindi si otterrebbe m3 = 2n3 , il che è impossibile perché il primo membro contiene il fattore 2 con esponente congruo
a 0 modulo 3, mentre il secondo membro contiene il fattore 2 con esponente congruo a 1 modulo 3. Alternativamente ancora:
se X 3 − 2 fosse riducibile in Q[X] allora (per il Lemma di Gauss) sarebbe riducibile in Z[X] e dunque (passando modulo 4)
sarebbe riducibie in Z4 [X] il polinomio X 3 − 2 = X 3 + 2, che invece è ivi irriducibile perché X 3 + 2 non ha zeri in Z4 .
28 Si noti che invece è risolubile Il problema della duplicazione del quadrato: dato il lato a di un quadrato, costruire con riga e
√
compasso il lato x del quadrato di area doppia. La condizione porta a x2 = 2a2 e dunque a x = a 2. Dunque x è la diagonale
del quadrato Q di lato a. Il quadrato Q è costruibile con riga e compasso a partire dal segmento a. Dunque anche la diagonale
di Q lo è.
29 Mentre, come abbiamo visto, è possibile quadrare con riga e compasso un qualsiasi poligono convesso.
30 Si ricordi che un numero è trascendente se non è algebrico (vale a dire non annulla alcun polinomio a coefficienti razionali
non tutti nulli). Si ricordi che i numeri algebrici formano un campo: il campo algebrico; in particolare il quadrato di un
numero algebrico è algebrico (equivalentemente: la radice quadrata di un numero trascendente è trascendente).
31 Q(cos θ) è il campo estensione di Q con l’aggiunta del numero cos θ, ossia l’intersezione di tutti i campi contenenti Q e cos θ.
29
ponendovi α = θ3 , si ottiene:
cos θ = 4 cos3
θ
θ
− 3 cos .
3
3
Questa uguaglianza prova che cos θ3 è sicuramente algebrico su Q(cos θ) di grado d ≤ 3 perché annulla il
polinomio (1); il numero cos θ3 è poi costruibile sse il suo grado di algebricità è d = 1 oppure d = 2, e questo
accade sse il polinomio (1) è riducibile in Q(cos θ)[X], ossia è fattorizzabile nel prodotto di polinomi di grado
più basso (d = 1 = 20 e d = 2 = 21 ) a coefficienti in Q(cos θ). Ciò dimostra l’asserto. Ad esempio l’angolo θ = π2 è trisecabile, perché cos θ = cos π2 = 0, Q(cos θ) = Q ed il polinomio (1)
diventa 4X 3 − 3X che è riducibile su Q. Da ciò segue senz’altro che anche l’angolo θ = π è trisecabile; alternativamente, possiamo dimostrarlo ripetendo l’argomento generale: si ha cos θ = cos π = −1, Q(cos θ) = Q
ed il polinomio (1) diventa 4X 3 − 3X + 1 che è riducibile su Q (ha la radice 12 ). Anche l’angolo θ = 2π è
trisecabile; come segue senz’altro dalla trisecabilità di π2 ; alternativamente, possiamo dimostrarlo ripetendo
l’argomento generale: si ha cos θ = cos 2π = 1, Q(cos θ) = Q ed il polinomio (1) diventa 4X 3 − 3X − 1 che è
riducibile su Q (ha la radice 1). Dimostriamo finalmente che, invece:
Teorema 14 L’angolo θ =
π
3
non è trisecabile con riga e compasso.
Dimostrazione. Si ha cos θ = cos π3 = 12 , Q(cos θ) = Q, ed il polinomio (1) diviene 4X 3 − 3X − 21 , la cui
riducibilità su Q equivale - come si vede effettuando il cambiamento di variabile Y = 2X, cioè X = Y2 - alla
riducibilità su Q di
Y 3 − 3Y − 1.
(3)
La riducibilità del polinomio (3) in Q[Y ] equivale alla sua riducibilità in Z[Y ] per il Lemma di Gauss;
d’altra parte, se (3) fosse riducibile in Z[Y ], una sua fattorizzazione in Z[Y ] si potrebbe leggere come una
fattorizzazioone in Z2 [Y ] del polinomio Y 2 − 3Y − 1 = Y 3 + Y + 1, polinomio che manifestamente non
è fattorizzabile in Z2 [Y ] perché è di terzo grado e non ha zeri in Z2 . In definitiva il polinomio (1) non è
riducibile in Q[X], e l’angolo π3 non è trisecabile. Abbiamo visto che. ad esempio, l’angolo di π2 radianti è trisecabile, mentre quello di π3 radianti non lo è.
Dunque il problema è generalmente impossibile (Wantzel, 1837), mentre lo è in alcuni casi particolari.
ESERCIZIO. Si dimostri che l’angolo
π
3
si può trisecare usando la riga graduata e il compasso.
Il Teorema (14) afferma che non si può costruire con riga e compasso l’angolo 13 π3 = π9 = 2π
18 . Ne segue
che: non si può (con riga e compasso) inscrivere in una circonferenza un poligono regolare di n = 18 o
di n = 9 lati. Si noti che, per il problema della costruibilità con riga e compasso di un n−gono
regolare, è equivalente prefissare il raggio del cerchio circoscritto o il lato del poligono. Infatti il
primo problema equivale alla costruzione dell’angolo 2π
n (angolo al centro che insiste su un lato dell’n−gono),
mentre il secondo equivale alla costruzione dell’angolo π− 2π
n (angolo interno dell’n−gono). Inoltre il poligono
regolare di n lati è costruibile sse lo è quello di 2n lati.
Costruzione di poligoni regolari. Costruire con riga e compasso il poligono regolare con un assegnato
numero n di lati. Karl Friedrich GAUSS (1777-1855) ha determinato per quali valori di n è possibile costruire
con riga e compasso il poligono regolare con n lati. Il risultato può essere riassunto nel seguente enunciato,
la cui dimostrazione viene qui omessa32 .
32 Per la dimostrazione, cfr. ad esempio C. PROCESI, Elementi di teoria di Galois, I, 4, ed. Decibel 1982, od anche N.
JACOBSON, Basic Algebra, vol. I, Freeman and Co, 1974.
30
Teorema 15 Le condizioni segueni sono equivalenti:
1. Il poligono regolare di n lati è costruibile con riga e compasso.
2. φ(n) è una potenza di 2, dove φ è la funzione di Eulero.
3. n = 2k p1 . . . ps , dove k, s ≥ 0 e p1 , . . . , ps sono s primi di Fermat distinti.
Si dimostri per esercizio che 3 ⇒ 2. Ricordiamo alcune nozioni basilari riguardanti gli enti sopra nominati.
Funzione φ di Eulero. La funzione φ : N → N :
n 7→ φ(n) di Eulero è definita da:
φ(n) :=| {k ∈ N : 1 ≤ k ≤ n, (k, n) = 1} | .
Dunque φ(n) uguaglia la cardinalità | U (Zn ) | del gruppo U (Zn ) degli elementi invertibili dell’anello
Zn .
La φ è una funzione moltiplicativa, nel senso che:
(m, n ∈ N)
(m, n) = 1 ⇒ φ(mn) = φ(m)φ(n),
Per dimostrarlo, osserviamo anzitutto che l’applicazione
f : Zmn → Zm × Zn : [a]mn 7→ ([a]m , [a]n )
è evidentemente un morfismo di anelli, che è iniettivo perché ha nucleo [0]mn per l’ipotesi (m, n) = 1 ed è
anche surgettivo33 perché Zmn e Zm × Zn hanno lo stesso numero mn di elementi. Pertanto f : Zmn →
Zm × Zn è un isomorfismo di anelli, che evidentemente subordina un isomorfismo tra i rispettivi gruppi
degli elementi invertibili
f : U (Zmn ) → U (Zm × Zn ) = U (Zm ) × U (Zn ).
Pertanto φ(mn) =| U (Zmn ) |=| U (Zm ) || U (Zn ) |= φ(m)φ(n), e questo completa la verifica della moltiplicatività di φ.
Numeri di Fermat. L’ n−mo numero di Fermat (Pierre Simone de FERMAT, 1601-1665) è definito da
Fn := 2(2
(n ≥ 0)
n
)
+ 1.
Si dimostra che tutti i numeri primi della forma
2k + 1
sono numeri di Fermat. Lo stesso Fermat notò che
F0 = 3,
F1 = 5,
F2 = 17,
F3 = 257,
F4 = 65537
sono primi e congetturò nel 1640 che ogni Fn fosse primo, ma Eulero dimostrò nel 1732 che la congettura era
falsa, indicando una fattorizzazione di F5 = 232 + 1. Ancora oggi i numeri primi di Fermat che si conoscono
sono soltanto i cinque numeri sopra indicati! È sorprendente che esista la dimostrazione della possibilità di
costruire con riga e compasso il poligono regolare con un numero tanto grande di lati, quale è il numero
primo F4 .
33 La surgettività di f va sotto il nome di Teorema Cinese dei Resti. il quale afferma: Se m, n sono relativamente primi
ed a1 , a2 sono interi arbitrari, il sistema di due congruenze
x ≡ a1
(mod
x ≡ a2
m),
(mod
n),
è ’univocamente’ risolubile. Infatti l’elemento ([a1 ]m , [a2 ]n ) proviene tramite f da un’unica classe resto [a]mn , e dunque a è
una soluzione del sistema (univocamente determinata modulo mn). Si noti che si ottiene una ovvia generalizzazione dal caso
di due moduli m, n al caso di s ≥ 2 moduli m1 , m2 , . . . , ms primi fra loro: si considera il morfismo di anelli
f : Zm1 ···ms → Zm1 × · · · × Zms : [a]m1 ···ms 7→ ([a]m1 , . . . , [a]ms ),
si dimostra che f è iniettivo e quindi surgettivo perché i due anelli hanno la stesso numero m1 · · · ms di elementi; si considera
poi un sistema di congruenze x ≡ a1 (mod m1 ), . . . , x ≡ as (mod ms ), che si risolve assumendo x = a, dove [a]m1 ... ms
è il prototipo in f di ([a1 ]m1 , . . . , [as ]ms ).
31
4
4.1
Un tributo ad Hilbert: il ”Terzo Problema di Hilbert”
Introduzione
La nozione di poligono convesso di R2 e quella di poliedro convesso di R3 sono casi particolari, rispettivamente per d = 2 e per d = 3, di quella di politopo convesso di dimensione d di Rd .
Un politopo convesso d−dimensionale P di Rd è per definizione la chiusura convessa
X
X
P = conv(S) := {
ai si : ai ≥ 0,
ai = 1}
di un insieme finito S = {s1 , . . . , sn } ⊂Rd di punti contenuto in Rd ma non contenuto in un Rt con t < d.
Esempi di politopi convessi di dimensione d sono i d−simplessi (per S costituito da d+1 punti indipendenti)
e i d−cubi, come ad esempio il d−cubo unitario Qd = [0, 1]d . Un politopo generale è definito come unione
di un numero finito di politopi convessi.
Equivalentemente un politopo convesso di Rd può essere definito come un insieme limitato P ⊂ Rd che
sia il luogo delle soluzioni di un sistema di disuguaglianze lineari, cioè come un insieme limitato del tipo
P = {x ∈ Rd : Ax ≤ b},
dove A è una matrice reale k × d e b ∈ Rk . Questa seconda definizione può riformularsi dicendo che un
politopo convesso è un insieme limitato P ⊂ Rd che sia intersezione di semispazi di Rd .
Una faccia di un politopo è un insieme F ⊂ P del tipo F = {x ∈ P : ai x = bi }, dove ai è la riga i-esima
della matrice A e bi è la componente i-esima della colonna b, per i ∈ {1, 2, . . . , k}. Tale faccia appare dunque
come intersezione del politopo con uno degli iperpiani che definiscono uno dei semispazi di cui il politopo è
l’intersezione.
La teoria della misura per i poliedri appare più complicata di quella per i poligoni. La formula per
il calcolo dell’area di un triangolo si fonda sul fatto che ”ogni triangolo è equivalente (equiesteso) ad un
parallelogramma con ugual base e metà altezza”; il che a sua volta si fonda sul fatto che quel triangolo e
quel parallelogramma sono equiscomponibili, cioè possono essere decomposti in poligoni congruenti. In
effetti sussiste il seguente
Teorema 16 (Bolyai, Gerwin, 1832 circa). Due poligoni sono equiestesi se e solo se sono equiscomponibili.
Nello sviluppo della teoria elementare del calcolo dei volumi dei poliedri, si inizia con il calcolo del volume di un cubo, poi di un parallelepipedo retto rettangolo, poi di un parallelepipedo generale e poi di un
prisma a base poligonale. Tuttavia, dovendo calcolare il volume di un tetraedro, sorgono delle difficoltà:
occorrerebbe dimostrare che un tetraedro è equivalente alla terza parte di un prisma avente la stessa base e
la stessa altezza, e per questo occorre dimostrare che due tetraedri aventi la stessa base e la stessa altezza
sono equivalenti. Questo scopo sarebbe dunque raggiunto se si potesse dimostrare che due tetraedri aventi
la stessa base e la stessa altezza sono scomponibili in poliedri congruenti, il che però, come vedremo, è generalmente falso.
Questa difficoltà fa sı̀ che la formula per il calcolo del volume di un tetraedro si basi su procedimenti
infinitesimali : ad es. sulla considerazione del tetraedro come elemento di separazione di due classi
contigue di scaloidi, inscritti e circoscritti al tetraedro.
David Hilbert ebbe l’intuizione che questa maggiore complicazione fosse ineliminabile, intuendo che esistono poliedri di ugual volume che non sono equiscomponibili (cioè decomponibili in poliedri
congruenti). Più precisamente egli formulò il seguente
32
TERZO PROBLEMA DI HILBERT: Trovare due tetraedri di uguali basi e uguali altezze che non
sono equiscomponibili (cioè decomponibili in tetraedri congruenti) e che non sono equicompletabili (cioè
combinabili con tetraedri congruenti in modo da formare poliedri equiscomponibili).
Tale problema era stato posto da Hilbert nella sua già ricordata memorabile conferenza, tenuta durante
il Secondo Congresso Internazionale dei Matematici svoltosi a Parigi nel 1900, nella quale attirò l’attenzione
della comunità matematica su 23 importanti problemi, come argomenti fondamentali da affrontare nel corso
del secolo che stava iniziando . Il Terzo Problema di Hilbert34 fu risolto completamente dal suo allievo Max
DEHN: egli esibı̀ (nello stesso 1900) due tetraedri con ugual base e eguale altezza non equiscomponibili e poi
anche (nel 1902) non equicompletabili. La dimostrazione alquanto oscura di Dehn fu ripresa da vari autori35
e finalmente perfezionata da Hugo HADWIGER in due successivi articoli (1949, 1954).
4.2
Invarianti di Dehn
Dato un poliedro P di R3 , denotiamo con e ∈ P un suo spigolo, con α(e) l’angolo diedro fra le due facce
che contengono e, e con M (P ) (insieme delle ampiezze di P ) l’insieme costituito da π e dalle ampiezze degli
angoli diedri di P , cioè:
M (P ) := {π} ∪ {α(e) : e ∈ P }.
Per esempio, l’insieme delle ampiezze di un cubo C e quello di un prisma retto R avente per base un
triangolo equilatero sono dati rispettivamente da:
π π
π
M (C) = {π, }, MR = {π, , }.
2
2 3
Fissato un qualunque insieme finito M ⊂ R contenente M (P ) , sia
X
V (M ) := {
qm · m : m ∈ M, qm ∈ Q} ⊂ R
il Q−spazio vettoriale delle combinazioni lineari degli elementi di M con coefficienti razionali. Fissata una
qualunque applicazione Q−lineare
f : V (M ) → Q tale che
f (π) = 0,
si definisce peso (in P ) di uno spigolo e di P relativo ad f il prodotto tra la lunghezza l(e) di e ed il
valore che f assume sull’ angolo diedro α(e) di quel poliedro, cioè il numero reale
wf (e) = wf (e, P ) := l(e)f (a(e)).
Definiamo poi invariante di Dehn del poliedro P relativo ad f il numero
X
Df (P ) :=
l(e)f (α(e)),
e∈P
cioè la somma dei pesi in P degli spigoli di P . Ad esempio, sia per il cubo C sia per il suddetto prisma R,
l’invariante di Dehn rispetto ad una qualsiasi f vale zero (perché f si annulla su ogni multiplo razionale di
π):
Df (C) = 0,
Df (R) = 0.
Per il seguito, conviene definire il peso non solo di uno spigolo e di un poliedro P , ma anche il peso (in P ) di
un tratto quasiasi e0 ⊆ e come il prodotto tra la lunghezza l(e0 ) di e0 ed il valore che f assume sull’ampiezza
α(e0 ) = α(e) del corrispondente angolo diedro di P :
wf (e0 , P ) = wf (e0 ) := l(e0 )f (α(e0 )).
È importante notare che:
34 Cfr. V.G. BOLTIANSKII, Hilbert’s Third Problem. Washington, 1978; cfr. anche V. VILLANI, ”aree, volumi ed il Terzo
Problema di Hilbert”, in Archimede 53 (2001), 78-91.
35 Tra cui Ugo AMALDI in un articolo del 1902 pubblicato sul Periodico di Matematica.
33
Lemma 17 . Se uno spigolo e di P è decomposto in segmenti e1 , . . . , es a due a due privi di punti interni
comuni, il peso di e è la somma dei pesi degli ei .
Dimostrazione. Infatti, essendo α(e) = α(ei ) per ogni i = 1, . . . , s, si ha:
X
X
X
X
wf (e) := l(e)f (α(e)) = [
l(ei )]f (α(e)) =
[l(ei )f (α(e))] =
[l(ei )f (α(ei ))] =
wf (ei ). i
4.3
i
i
Il Teorema di Dehn-Hadwiger
Ricordiamo che due poliedri P e Q si dicono equiscomponibili se possono essere decomposti in un numero
finito di poliedri
P = P1 ∪ · · · ∪ Pn , Q = Q1 ∪ · · · ∪ Qn
tali che i poliedri Pi siano a due a due privi di punti interni in comune, i poliedri Qi siano a due a due privi
di punti interni in comune ed inoltre i poliedri Pi e Qi siano congruenti per ogni i (1 ≤ i ≤ n).
Precisiamo poi che due poliedri P e Q si dicono equicompletabili se esistono insiemi finiti di poliedri
P1 , . . . , Pm e Q1 , . . . , Qn tali che
– ogni Pi non abbia punti interni in comune né con P né con alcun Pj (per ogni i 6= j);
– ogni Qi non abbia punti interni in comune né con Q né con alcun Qj (per ogni i 6= j);
– Pi e Qi siano congruenti per ogni i (1 ≤ i ≤ m);
– P 0 = P ∪ P1 ∪ · · · ∪ Pm e Q0 = Q ∪ Q1 ∪ · · · ∪ Qm sono equiscomponibili.
Evidentemente poliedri equiscomponibili sono anche equicompletabili e pertanto poliedri non equicompletabili sono non equiscomponibili.
Lemma 18 Sia P un poliedro scomponibile in un numero finito di poliedri P1 , . . . , Pn e sia M un qualsiasi
insieme finito di numeri reali contenente π e tutte le ampiezze degli angoli diedri di P e di P1 , . . . , Pn .
Per ogni applicazione Q − linearef : V (M ) → Q tale che f (π) = 0, l’invariante di Dehn di P è la
somma degli invarianti di Dehn dei Pi :
Df (P ) = Df (P1 ) + · · · + Df (Pn ).
Dimostrazione. Il primo membro è la somma dei pesi wf (e, P ) estesa a tutti gli spigoli e di P . Il secondo
membro è la somma dei pesi wf (e∗ , Pi ) estesa a tutte le coppie (e∗ , Pi ) costituite da un sottopoliedro Pi e da
un suo spigolo e∗ , i = 1, . . . , n. Il contributo di ciascun spigolo e∗ è la somma dei pesi wf (e∗ , Pi ) = l(e∗ )f (αi )
estesa a tutti quei sottopoliedri Pi che hanno e∗ come uno dei propri spigoli (αi denota l’angolo diedro
formato dalle due facce di Pi che contengono e∗ ), e dunque, vale l(e∗ )f (α), dove α denota la somma degli
αi , perché f è additiva.
Calcoliamo dunque il secondo membro riordinando in modo opportuno i vari addendi che vi intervengono.
Uno spigolo e∗ di un sottopoliedro può essere di tre tipi distinti:
e0 ) coincidente con uno spigolo e di P o con una sua parte;
e00 ) contenuto nell’interiore di una faccia di P ;
e000 ) contenuto nell’interiore di P .
Il contributo di un qualunque spigolo di tipo e00 vale zero. Infatti, la somma delle ampiezze degli angoli
diedri dei vari sottopoliedri aventi a comune un fissato spigolo di tipo e” vale evidentemente π. Poiché
34
f (π) = 0, il contributo complessivo di e00 nella somma a secondo membro vale l(e00 )f (π) = 0.
Analogamente, il contributo di un qualunque spigolo di tipo e000 vale zero. Infatti, la somma delle ampiezze
degli angoli diedri (dei sottopoliedri) aventi a comune un fissato spigolo di tipo e000 vale evidentemente 2π.
Poiché f (2π) = 0, il contributo complessivo di e000 nella somma a secondo membro vale l(e000 )f (2π) = 0.
Limitiamoci pertanto a considerare i contributi degli spigoli di tipo e0 . Consideriamo dunque uno spigolo
di tipo e0 contenuto in un fissato spigolo e di P . La somma delle ampiezze degli angoli diedri (dei sottopoliedri)
aventi il dato e0 come proprio spigolo coincide evidentemente con l’ampiezza dell’angolo diedro α(e) di P .
Pertanto il contributo di e0 a secondo membro vale l(e0 )f (α(e)) ossia uguaglia il peso (in P ) wf (e0 , P ) del
pezzo e0 ⊂ e.
Raggruppiamo tutti gli spigoli e01 , . . . , e0s di tipo e0 che sono pezzi di un medesimo spigolo e di P
(del quale costituiscono evidentemente una partizione). Per il Lemma 17, la somma dei pesi di questi
e0i ⊂ e uguaglia il peso di e in P.
D’altra parte, ogni spigolo e di P determina l’insieme E 0 (e) degli spigoli e0 dei sottopoliedri tali che
0
e ⊂ e ; gli insiemi E 0 (e) costituiscono al variare di e una partizione dell’insieme degli spigoli di tipo e0 dei
vari sottopoliedri. In conclusione il contributo complessivo degli spigoli di tipo e0 , cioè il valore del secondo
membro, uguaglia la somma dei pesi degli spigoli e di P , cioè uguaglia il valore del primo membro. Teorema 19 (Dehn–Hadwiger). Siano P e Q due poliedri, sia M un qualunque insieme finito di numeri
reali contenente π e tutte le ampiezze degli angoli diedri di P e di Q, e sia f : V (M ) → Q una qualunque
applicazione Q−lineare tale che f (π) = 0. Allora:
(1) Se P e Q sono equiscomponibili, i loro invarianti di Dehn uguali: Df (P ) = Df (Q).
(2) Se P e Q sono equicompletabili, i loro invarianti di Dehn uguali: Df (P ) = Df (Q).
Dimostrazione. (1) Sia M 0 l’insieme ottenuto aggregando ad M tutte le ampiezze degli angoli diedri
dei pezzi P1 , . . . , Pn e Q1, . . . , Qn coinvolti in una realizzazione della equiscomponibilità di P e di Q, e sia
g : V (M 0 ) → Q una qualunque applicazione Q−lineare che prolunghi f (ottenuta in modo ovvio estendendo
una base di V (M ) contenente π ad una base di V (M 0 ) ). Per il Lemma 17, si ha
Df (P ) = Dg (P ) = Dg (P1 ) + · · · + Dg (Pn );
Df (Q) = Dg (Q) = Dg (Q1 ) + · · · + Dg (Qn );
d’altra parte, per ogni i = 1, . . . , n, si ha Dg (Pi ) = Dg (Qi ) perché Pi e Qi sono congruenti. Pertanto
Df (P ) = Df (Q).
(2) Sia M 0 l’insieme ottenuto aggregando ad M tutte le ampiezze degli angoli diedri dei pezzi P1 , . . . , Pm
e Q1 , . . . , Qm coinvolti in una realizzazione della equicompletabilità di P e di Q, e sia g : V (M 0 ) → Q una
qualunque applicazione Q−lineare che prolunghi f . Attualmente
P 0 := P ∪ P1 ∪ · · · ∪ Pm ,
Q0 := Q ∪ Q1 ∪ · · · ∪ Qm
sono equiscomponibili, pertanto da (1) segue Dg (P 0 ) = Dg (Q0 ) e dal Lemma 17 si ottiene (essendo Dg (P ) =
Df (P ) e Dg (Q) = Df (Q)):
Dg (P 0 ) = Df (P ) + Dg (P1 ) + ... + Dg (Pm ) = Df (Q) + Dg(Q1 ) + ... + Dg(Qm ) = Dg (Q0 );
d’altra parte, per ogni i = 1, . . . , m, si ha Dg (Pi ) = Dg (Qi ) perché Pi e Qi sono congruenti. Pertanto
Df (P ) = Df (Q). 4.4
La soluzione del Terzo Problema di Hilbert
Calcoliamo gli invarianti di Dehn per alcuni poliedrii. Vedremo che i poliedri di cui al n. 4.4.4 e al n. 4.4.5
sono due tetraedri con la stessa base e la stessa altezza, ma con invarianti di Dehn diversi (e dunque non
equiscomponibili).
35
4.4.1 Invariante di Dehn di un cubo. Come già osservato, l’insieme delle ampiezze di un cubo C è
dato da M (C) = {π, π2 }, e pertanto l’invariante di Dehn di C rispetto ad una qualsiasi f vale zero, perché
f si annulla su ogni multiplo razionale di π, cioè Df (C) = 0.
4.4.2 Invariante di Dehn di un prisma retto con base un triangolo equilatero. Come già
osservato, l’insieme delle ampiezze di tale prisma P è dato da M (P ) = {π, π2 , π3 }, e pertanto l’invariante di
Dehn di P rispetto ad una qualsiasi f vale zero, cioè Df (P ) = 0.
4.4.3. Invariante di Dehn di un tetraedro regolare. Sia T0 = (A, B, C, D) un tetraedro regolare di
spigolo s. L’insieme delle ampiezze di T0 è dato da M (T0 ) = {π, α} dove α è l’angolo tra le mediane AM e DM
delle facce ABC e BCD rispettivamente. La proiezione ortogonale H di D sulla faccia ABC è il baricentro
HM
1
del triangolo. Pertanto, con riferimento al triangolo rettangolo DHM , si ha cos α = HM
DM = AM = 3 , ossia
1
α = arccos 3 . Poiché
arccos 13
α
=
π
π
è irrazionale (per il successivo Lemma 20, ove si ponga n = 9), lo spazio vettoriale V (M (T0 )) ha dimensione
2 ed
M (T0 ) = {π, α}
è una sua base.
Possiamo considerare l’applicazione Q−lineare
f : V (M (T0 )) → Q
definita sulla base M (T0 ) assumendo f (π) = 0 ed f (α) = 1. Pertanto si trova Df (T0 ) = 6s 6= 0.
Lemma 20
36
Per ogni intero dispari n ≥ 3, il numero
A(n) :=
arccos √1n
π
è irrazionale. Riguardo all’ipotesi che n sia dispari, si noti che A(1) = 0, A(2) = 14 , A(4) = 14 . In realtà si potrebbe
addirittura dimostrare che A(n) è razionale solo per n = 1, 2, 4.
Il significato geometrico del Lemma 20 – che afferma la incommensurabilità tra π e arccos √1n per ogni
intero dispari n ≥ 3 – è il seguente. Si consideri la poligonale che inizia nel punto A origine degli archi del
cerchio trigonometrico di centro O e che consiste di lati tutti uguali alla corda AB che sottende un angolo
b il cui coseno è √1 . Allora, la suddetta incommensurabilità esprime che questa poligonale prosegue
AOB
n
all’infinito senza chiudersi mai su se stessa.
4.4.4 Invariante di Dehn del tetraedro avente i vertici nell’origine e nei punti unitari degli
assi. L’insieme delle ampiezze di questo tetraedro T1 = (O, A, B, C) è dato da
π
M (T1 ) = {π, , α}
2
dove α è l’angolo tra le mediane CM e OM delle facce ABC e OAB rispettivamente. Con riferimento√al
triangolo rettangolo COM , si ha cos α = OM
parte, nel triangolo rettangolo AOC, si ha AC = 2,
CM . D’altra
q
q
onde nel triangolo rettangolo CM A si ha CM = 32 , e nel triangolo rettangolo COM si ha OM = 12 ,
onde cos α =
√1 ,
3
ossia α = arccos √13 . Poiché
arccos √13
α
=
π
π
36 Cfr.
M. AIGNER, G.M. ZIEGLER, Proofs from the B00K. Springer, 1998, p.31-32.
36
è irrazionale, come segue ponendo n = 3 nel Lemma 20, lo spazio vettoriale V (M (T1 )) ha dimensione 2
(ed M (T1 ) è una sua base). Possiamo considerare l’applicazione Q−lineare f : V (M (T1 )) → Q definita sulla
base
π
M (T1 ) = {π, , α}
2
√
√
assumendo f (π) = 0 ed f (α) = 1. Pertanto f ( π2 ) = 0 e dunque Df (T1 ) = 3f ( π2 ) + 3 2f (α) = 3 2 6= 0,
√
ossia Df (T1 ) = 3 2 6= 0.
4.4.5 Invariante di Dehn del tetraedro avente i vertici nell’origine, nei punti unitari degli
assi x ed y e nel punto unità del piano yz. Sia T2 = (O, A, B, C 0 ), dove:
O(0, 0, 0); A(1, 0, 0); B(0, 1, 0); C 0 (0, 1, 1).
Le facce di T2 hanno equazioni:
OAB : Z = 0;
OBC 0 : X = 0;
ABC 0 : X + Y − 1 = 0;
OAC 0 : Y − Z = 0;
ed i loro versori normali sono rispettivamente:
(0, 0, 1);
(1, 0, 0);
1
1
( √ , √ , 0);
2
2
1
1
(0, √ , − √ ).
2
2
Pertanto i coseni dell’angolo diedro α(e) fra le due facce contenenti uno spigolo e di T2 sono:
e = OB, OC 0 , AB ⇒ cos α(e) = 0 ⇒ α(e) =
e = AC 0 ⇒ cos α(e) = 1/2 ⇒ α(e) =
e = 0A, BC 0 ⇒
| cos α(e) |=
√1
2
π
2;
π
3;
⇒ α(e) =
π
4.
Ne segue che l’insieme delle ampiezze di T2 è dato da M (T2 ) = {π, π2 , π3 , π4 , }, lo spazio vettoriale V (M (T2 ))
è < π >= Q · π, ha dimensione 1, e l’unica funzione Q− lineare f : V (M (T2 )) → Q tale che f (π) = 0 è la
funzione nulla. Pertanto Df (T2 ) = 0.
CONCLUSIONI.
(a) I tetraedri T1 e T2 hanno la stessa base e la stessa altezza, ma non sono né equicompletabili né
equiscomponibili. Ciò segue dal Teorema di Dehn-Hadwiger
√ e dal fatto che gli invarianti di Dehn di T1 e di
T2 – relativi ad una stessa f – sono diversi: Df (T1 ) = 3 2 6= 0, Df (T2 ) = 0. Si noti che lo spazio vettoriale
V (M (T2 )) =< π >= πQ è un sottospazio di V (M (T1 )) =< π, arccos 31 > e che la f definita su V (M (T1 )) è
effettivamente un prolungamento della f definita su V (M (T2 )).
(b) Il tetraedro√T1 ed un cubo C di egual volume non sono né equicompletabili né equiscomponibili.
Infatti Df (T1 ) = 3 2 6= 0, Df (C) = 0, dove ecc.
5
5.1
Alcuni approfondimenti.
Ancora su numeri e polinomi
Sia N = {0, 1, 2, 3, . . . } l’insieme dei numeri interi non negativi. Quando si utilizza la numerazione in
base 10, l’insieme delle cifre usate è C10 = {c ∈ N : 0 ≤ c ≤ 9} ed ogni numero di N viene espresso come
37
una combinazione lineare di potenze di 10 a coefficienti in C10 cioè come una espressione polinomiale in 10
con coefficienti in C10 ; ad esempio 372104 = 3 · 105 + 7 · 104 + 2 · 103 + 1 · 102 + 0 · 101 + 4 · 100 . Più in
generale quando si utilizza la numerazione in base b, dove b ∈ N e b ≥ 2, l’insieme delle cifre usate è
Cb = {c ∈ N : 0 ≤ c ≤ b − 1} ed ogni numero n ∈ N viene espresso come una espressione polinomiale in b
con coefficienti in Cb , ossia come una espressione del tipo
n=
d
X
ai · bi = ad · bd + · · · + a1 · b + a0 ,
dove
ai ∈ N,
0 ≤ ai < b e
ad 6= 0.
i=0
Pd
Notiamo che a0 è il resto della divisione di n per b, e sia q1 = i=1 ai ·bi−1 il quoziente di questa divisione:
Pd
n = b · q1 + a0 ; a1 è il resto della divisione di q1 per b, e sia q2 = i=2 ai · bi−2 il quoziente di questa
divisione: q1 = b · q2 + a1 ; . . . ; ad−1 è il resto della divisione di qd−1 = b · qd + ad−1 per b, ed il quoziente
di questa divisione vale qd = ad < b. Finalmente ad è il resto della divisione di qd = ad per b (il quoziente è
zero): qd = b · 0 + ad dove qd = ad < b.
Il procedimento descritto consente di scrivere qualunque numero n ∈ N in una qualunque base fissata
b ≥ 2. Osserviamo che
Pd
Proposizione 21 (Il giuoco del polinomio). Qualunque polinomio f (x) = i=0 ai · xi ∈ N[x], sia esso
il polinomio nullo o un polinomio di un grado qualunque d ≥ 0, è individuato univocamente dalla conoscenza
di due soli valori: a = f (1) e c = f (a + 1).
Dimostrazione. Dimostriamo l’asserto, provando che f (x) = 0 (cioè f (x) è il polinomio nullo) nel caso che
sia a = 0, e che i coefficienti di f (x) sono le cifre che appaiono nella scrittura di c in base b := a + 1 nel caso
Pd
Pd
che sia a ≥ 1. Sia f (x) = i=0 ai · xi ∈ N[x]. In ogni caso a := f (1) = i=0 ai ≥ aj per ogni j. Se a = 0,
allora aj = 0 per ogni j e dunque f (x) è il polinomio nullo. Se a ≥ 1, allora, posto b := a + 1, si ha b ≥ 2 e
Pd
b > aj per ogni j. Ne segue che f (b) = i=0 ai · bi è la scrittura di c = f (a + 1) = f (b) in base b: in altri
termini i coefficienti aj di f (x) sono le cifre che appaiono della scrittura di c in base b.
La Proposizione 21 è particolarmente espressiva se si confronta col seguente teorema.
Teorema 22 . Dati comunque x1 , . . . , xd+1 ∈ R distinti e dati comunque y1 , . . . , yd+1 ∈ R (anche non
distinti), esiste uno ed un solo polinomio f (x) ∈ R[x] di grado ≤ d tale che f (xi ) = yi per i = 1, . . . , d + 1.
Pd
Dimostrazione. Primo modo. La stringa (ad , . . . , a0 ) dei coefficienti di f (x) = i=0 ai · xi è univocamente
Pd
determinata perché è l’unica soluzione del sistema yj = i=0 ai · xij , (j = 1, . . . , d + 1, di d + 1 equazioni
lineari
nelle d+1 incognite ad , . . . , a0 , il cui determinante è il determinante di Vandermonde V (x1 , . . . .xd+1 ) =
Q
1≤i<j≤d+1 (xj − xi ) 6= 0.
Secondo modo. L’unicità del polinomio segue dal fatto che se f (x) e g(x) fossero due polinomi distinti del
tipo detto, allora f (x) − g(x) sarebbe un polinomio non nullo di grado ≤ d con d + 1 zeri distinti, il che è
impossibile. L’esistenza è data dal polinomio interpolatore di Lagrange
f(x)=
Pd+1
Qi6=j
(x−xi )
i=1,...,d+1
j=1 yj Qi6=j
(xj−x
i=1,...,d+1
i)
= y1 ·
(x−x2 )···(x−xd+1 )
(x1 −x2 )···(x1 −xd+1 )
38
+ · · · + yd+1 ·
(x−x1 )···(x−xd )
(xd+1 −x1 )···(xd+1 −xd ) ·
5.2
5.2.1
Miscellanea algebrica
Non esistono campi propriamente intermedi tra R e C.
Mostriamo che, se K è un campo tale che R < K ≤ C, si ha K = C. Infatti, considerato un α ∈ K \ R,
risulta α = a + ib, con a, b ∈ R e b 6= 0. Pertanto i ∈ K e quindi K = C.
5.2.2
Esistono infiniti campi propriamente intermedi tra Q e R.
√
√
√
Esempi di tali campi intermedi sono dati da: Q( 2) = Q[ 2] = {a + b 2 | a, b ∈ Q}, da Q(π) e più in
generale da Q(A), da Q(B) e da Q(A ∪ B), dove A, B − con Q ⊂ A ∪ B ⊂ R − sono rispettivamente
costituiti da numeri reali algebrici e trascendenti.
5.2.3
In un qualunque campo ordinato K ogni quadrato non nullo è positivo.
Sia infatti a = b2 , con b ∈ K, b 6= 0. Allora b oppure −b è positivo e pertanto a = b · b = (−b)(−b) è positivo
in quanto prodotto di due positivi.
5.2.4
Ogni elemento positivo di R è un quadrato di un elemento di R.
√
esistono elementi positivi
di Q che non sono quadrati
Infatti se a ∈ R e se a > 0 allora a ∈ R. Invece √
√
di elementi di Q: ad esempio 2 ∈ Q è positivo, ma 2 ∈
/ Q. (Se fosse 2 = m/n con m.n ∈ Z, si avrebbe
2n2 = m2 , assurdo perché il fattore 2 comparirebbe un numero dispari di volte nel primo membro ed un
numero pari di volte nel secondo.)
5.2.5
Un automorfismo algebrico f di R è anche un automorfismo ordinale.
Infatti f : R → R trasforma quadrati non nulli in quadrati non nulli e dunque trasforma positivi in positivi
(per 5.2.3) e pertanto è un isomorfismo ordinale: a < b ⇒ b − a > 0 ⇒ f (b − a) > 0 ⇒ f (b) − f (a) > 0 ⇒
f (a) < f (b).
5.2.6
Azione di un automorfismo f di un campo K sul suo campo fondamentale F .
Evidentemente f|F = idF , perché, posto u := 1K , si ha, per ogni n, m ∈ Z, f (±nu) = ±nu, f (nu)−1 =
(nu)−1 , f ((nu)(mu)−1 ) = (nu)(mu)−1 .
39
5.2.7
√
√
√
Se f ∈ Aut(Q( 2)), allora f (a + b 2) = a ± b 2.
5.2.8
L’unico automorfismo del campo reale è l’identità.
Sia f ∈ Aut (R). Supponiamo per assurdo che sia f 6= idR . Allora esiste a ∈ R tale che f (a) 6= a, ed esiste
q ∈ Q tale che a < q < f (a). Da a < q segue f (a) < q perché f è un automorfismo ordinale (per 5.2.5) ed f
fissa ogni numero razionale (per 5.2.6). Dunque f (a) < q < f (a), assurdo.
5.2.9
Gli unici automorfismi continui del campo complesso sono l’identità e il coniugio.
Sia f ∈ Aut (C). Sappiamo che f fissa ogni numero razionale (per 5.2.6) e dunque f (i) = ±i essendo
f (i)2 = f (i2 ) = f (−1) = −1. Se l’automorfismo f è anche continuo, allora f fissa ogni numero reale a perché
a è limite di una successione di numeri razionali ai e dunque f (a) = f (lim(ai )) = lim(f (ai )) = lim(ai ) = a.
Ne segue che per ogni numero complesso a + ib si ha f (a + ib) = a + ib oppure f (a + ib) = a − ib a seconda
che sia f(i)=i oppure f(i)=-i.
5.2.10
L’ordine di un campo finito è potenza di un numero primo.
Sia K un campo finito, con q elementi. La caratteristica di K è un numero primo p ed il campo fondamentale
di K è Zp . Il campo K è uno spazio vettoriale, necessariamente di dimensione finita, diciamo h, sul suo
campo fondamentale Zp , e pertanto K è isomorfo (come spazio vettoriale) allo spazio vettoriale delle h-ple
ordinate di elementi di Zp . Il numero di queste h-ple è ph e quindi K ha altrettanti elementi. Ricordiamo
il teorema di esistenza e unicità dei campi finiti : per ogni primo p ≥ 2 e per ogni intero h ≥ 1, esiste, ed è
unico a meno di isomorfismi, un campo finito con q = ph elementi. Tale campo si denota con GF (q) (”Galois
field of order q”) e può essere ottenuto effettuando una estensione algebrica di Zp rispetto ad un polinomio
irriducible su Zp di grado h, certamente esistente per 5.2.15.
5.2.11
Teorema di Lagrange: l’ordine di un sottogruppo di un gruppo finito divide l’ordine
del gruppo.
Sia G un gruppo finito (moltiplicativo) e sia H un suo sottogruppo. L’insieme {aH : a∈ G} delle classi
laterali sinistre aH di H in G costituisce una partizione di G (verificare !) ed ogni classe aH ha uno stesso
numero | H | di elementi (verificare !). Pertanto il numero degli elementi di G si ottiene moltiplicando il
numero degli elementi di H per il numero delle classi laterali sinistre di H in G.
5.2.12
Se a è un elemento di un gruppo finito G, si ha a|G| = 1G .
Denotiamo con o(a) l’ordine di a, cioè l’ordine del sottogruppo generato da a. Per il Teorema di Lagrange,
o(a) divide | G |. Posto | G |= o(a) · t, si ha a|G| = ao(a)·t = (ao(a) )t = (1G )t = 1G .
40
5.2.13
Se a è un elemento non nullo di un campo finito K con q elementi, si ha aq−1 = 1K ,
Pertanto aq = a per ogni a ∈ K.
Infatti gli elementi non nulli di K costituiscono un gruppo moltiplicativo con q − 1 elementi, e quindi
aq−1 = 1K (per 5.2.12). Moltiplicando entrambi i membri per a, si trova che la relazione aq = a è verificata
da ogni elemento non nullo a ∈ K; la stessa relazione è banalmente verificata anche da a = 0K . In particolare,
per K = Zp si ottiene il Piccolo Teorema di Fermat: se p è primo e a ∈ N, allora ap ≡ a (mod p);
se p è primo e non divide a, allora ap−1 ≡ 1 (mod p).
5.2.14
Un campo finito non è algebricamente chiuso.
Infatti esistono polinomi di grado positivo con coefficienti nel campo privi di zeri nel campo: se il campo ha
q elementi, il polinomio f (x) = xq − x + 1, è tale che f (a) = aq − a + 1 = a − a + 1 = 1 6= 0 per ogni a ∈ K.
5.2.15
Grado dei polinomi irriducibili sopra un campo.
Sia K un campo. Sia f (X) ∈ K[X] un polinomio di grado deg f (X) ≥ 1. Se deg f (X) = 1, allora f (X)
è irriducibile in K[X]; se K è algebricamente chiuso, gli unici polinomi irriducibili di K[X] sono quelli di
grado 1 ed ogni polinomio si fattorizza su K in fattori lineari ed ammette tanti zeri in K quanto è il suo
grado (a patto di contare ogni zero con la dovuta molteplicità).
Se f (X) ∈ R[X] è irriducibile in R[X], allora deg f (X) ≤ 2: si fattorizzi il polinomio in fattori lineari in
C[X] e si noti che ogni zero complesso α si accompagna (con la stessa molteplicità) allo zero coniugato α.
Un polinomio f (X) ∈ R[X] di grado dispari ha almeno una radice in R: segue dalla affermazione precedente
(ma anche dal fatto che la funzione polinomiale associata f : R → R : a 7→ f (a) è continua ed assume sia
valori positivi che valori negativi).
Per ogni intero h ≥ 2, esistono polinomi f (X) ∈ Q[X] di grado h ed ivi irriducibili, ad esempio X h − p
con p numero primo: infatti, se fosse mh = pnh con m, n ∈ Z si arriverebbe a un assurdo in quanto il
primo membro conterrebbe il fattore p con esponente congruo a 0 modulo h mentre il secondo membro con
esponente congruo ad 1 modulo h; alternativamente si usi il criterio di Eisenstein, di cui si è detto discutendo
l’irriducibilità su Q del polinomio X 3 − 2 in relazione al problema della duplicazione del cubo.
Per ogni intero h ≥ 1, esistono polinomi f (X) ∈ GF (q)[X] di grado h ed ivi irriducibili (si omette la
dimostrazione). Si noti che da questo teorema segue subito che per ogni primo p e per ogni intero h ≥ 1
esiste un campo finito di ordine ph : è il campo GF (ph ) = Zp [X]/(f (X)), dove f (X) è un polinomio di Zp [X]
ivi irriducibile e di grado h; ricordiamo che gli elementi di questo campo sono le classi laterali dell’ideale
(f (X)) dell’anello Zp [X] cioè le classi resto modulo f (X) e quindi sono in numero di ph che è il numero dei
possibili resti a0 + a1 X + · · · + ah−1 ∈ Zp [X] che si ottengono dividendo i polinomi di Zp [X] per f (X).
5.2.16
Esempio di corpo non commutativo: i quaternioni reali.
Un quaternione reale q è definito come una qualunque espressioni formale
q = a + ib + jc + kd,
dove a, b, c, d sono numeri reali e i, j e k sono puri simboli. Due quaternioni sono uguali sse hanno ordinatamente gli stessi coefficienti. La somma di due quaternioni, q e q0 = a0 + ib0 + jc0 + kd0 è definita effettuando
la somma secondo le regole usuali dell’algebra, cioè assumendo:
41
q + q0 : = (a + a0 ) + i(b + b0 ) + j(c + c0 ) + k(d + d0 ).
Il prodotto di due quaternioni viene definito effettuando il prodotto delle espressioni formali secondo le regole
usuali dell’algebra e tenendo conto delle seguenti posizioni:
i2 = j2 = k2 = −1,
ij = k,
jk = i,
ki = j,
ji = −ij,
kj = −jk,
ik = −ki.
Dunque: q · q0 := (aa0 − bb0 − cc0 − dd0 ) + i(ab0 + ba0 + cd0 − dc0 ) + j(ac0 + ca0 − bd0 + db0 ) + k(ad0 + da0 + bc0 − cb0 ).
I numeri reali ed i numeri complessi sono evidentemente particolari quaternioni; in particolare i numeri 0 è
il quaternione nullo ed 1 è il quaternione unità. Il coniugato di q è il quaternione q = a − ib − jc − kd; la
norma di q è il numero reale N (q) := qq = a2 + b2 + c2 + d2 . Evidentemente un quaternione è nullo sse ha
norma zero; ne segue che ogni quaternione q 6= 0 è invertibile: q−1 = N q(q) . È facile verificare che l’insieme
H dei quaternioni reali costituisce un corpo non commutativo.
Osserviamo che l’anello H[x] dei polinomi a coefficienti quaternioni presenta alcune anomalie rispetto all’anello
R[x] dei polinomi a coefficienti reali. Anzitutto non è vero che ogni polinomio si fattorizza in modo unico
nel prodotto di polinomi irriducibili, perché ad esempio il polinomio x2 + 1 ammette le tre fattorizzazioni
x2 + 1 = (x + i)(x − i) = (x + j)(x − j) = (x + k)(x − k). Inoltre, come mostra questo stesso esempio, non
è vero che il numero degli zeri di un polinomio non supera il suo grado. Infine, come conseguenza della non
commutatività del prodotto di H, non vale il principio di specializzazione secondo cui ”la specializzazione
del prodotto di due polinomi è il prodotto delle specializzazioni dei fattori”:
0 = [x2 + 1]x=i = [(x + j)(x − j)]x=i 6= [x + j]x=i [x − j]x=i = (i + j)(i − j) = −2k.
5.3
5.3.1
Miscellanea geometrica
Il piano di Fano
. Il piano di Fano (Gino FANO, 1871-1952) è il piano P2 (Z2 ). Esso ha i 7 punti 1(1,0,0), 2(1,1,0), 3(0,1,1),
4(0,1,0), 5(1,0,1), 6(0,0,1), 7(1,1,1) e le 7 rette 124: x2 = 0, 235: x1 + x2 + x3 = 0, 346: x0 = 0 , 457:
x0 + x2 = 0, 561: x1 = 0, 672: x0 + x1 = 0, 713: x1 + x2 = 0, ciascuna delle quali consiste di tre
punti ed ha l’equazione indicata. Per ricostruire quanto detto, conviene partire dall’insieme {1, 2, 3, 4,
5, 6, 7 } dei ’punti’ del ’piano’, e dalla ’retta’ iniziale consistente dei tre punti 124; le rimanenti ’rette’ si
ottengono aggiungendo ripetutamente 1 (modulo 7) a ciascun puinto della retta iniziale. In questo modo si
è ottenuto un piano grafico proiettivo (che si chiama il ’piano di Fano’), perché sono verificati gli assiomi
di piano proiettivo (per due punti distinti qualsiasi passa un’unica retta, due rette distinte qualsiasi hanno
esttamente un punto in comune, esistono almeno tre punti non allineati, ogni retta contiene almeno tre punti).
Possiamo successivamente rappresentare graficamente nel piano euclideo il piano di Fano. considerando un
triangolo equilatero con un lato orizzontale e situato nel semipiano superiore rispetto al lato. I sette ’punti’
sono i tre vertici, i tre punti medi dei lati ed il centro del triangolo; le ’rette’ sono le tre terne di punti
situati sui lati, le tre terne di punti situati sulle mediane e la terna dei punti medi dei lati (punti di tangenza
della circonferenza inscritta). Possiamo poi raccordare le due rappresentazioni indicate per il piano di Fano,
denotando i tre punti sul lato di base (procedendo da sinistra) con 124, assumendo 235 nella terna di punti
di tangenza della circonfernza inscritta (percorsa in senso antiorario), assumendo poi 6 nel terzo vertice del
triangolo ed infine assumendo 7 nel centro. In questa rappresentazione grafica, scegliamo un riferimento
proiettivo A0 A1 A2 U assumendo A0 e A1 nei vertici del lato orizzontale del triangolo, A2 nel terzo vertice
del triangolo ed U nel centro. Con questa scelta del riferimento, ad ogni punto viene associata la terna
(omogenea) di coordinate in Z2 e ogni retta viene rappresentata da una ben determanata equazione, come
indicato all’inizio. ((Il lettore è invitato a fare il disegno, e a etichettare i sette punti della figura nel modo
descritto.).
42
5.3.2
Topologia di Zariski
. Consideriamo un fissato spazio affine Ar (K) su un campo K. Un insieme algebrico affine dello spazio,
definito da un fissato insieme F di polinomi di K[x1 , . . . , xr )], è il luogo V (F ) dei punti dello spazio che
annullano ciascun polinomio di F . Se F e G sono due insiemi di polinomi di K[x1 , . . . , xr ], si ha V (F )∪(G) =
V (F · G), da cui segue per induzione che l’unione di un numero finito di insiemi algebrici è un insieme
algebrico. Inoltre l’intersezione
di una qualunque
famiglia di insiemi algebrici {V (Fi )}i∈I è un insieme
T
S
algebrico perché si ha i∈I V (Fi ) = V ( i∈I Fi ). Infine si ha che il vuoto è un insieme algebrico V (F )
associato ad un sistema F incompatibile di polinomi, e l’intero spazio è un insieme algebrico V (0) associato
al polinomio nullo. Le proprietà stabilite mostrano che la famiglia degli insiemi algebrici V (F ) di un fissato
spazio affine Ar (K) verifica gli assiomi della famiglia dei chiusi di una topologia. La topologia che ne risulta
si chiama la Topologia di Zariski di Ar (K). Analogamente si definisce la Topologia di Zariski di un fissato
spazio proiettivo Pr (K), assumendo la famiglia degli insiemi algebrici proiettivi come famiglia dei suoi chiusi.
5.3.3
Un’affinità del piano euclideo che muti un fissato triangolo in un triangolo congruente
(risp. simile) è una isometria (risp. similitudine).
Sia f una affinità del piano euclideo E2 e sia T un triangolo che sia congruente al suo trasformato T 0 = f (T ).
Poiché i triangoli T e T 0 sono congruenti, esiste una (unica) isometria g di E2 tale che g(T ) = T 0 , cfr. la
Proposizione 23. Poiché f e g sono due affinità che mutano T in T 0 , e poiché il gruppo delle affinità di E2 è
strettamente 1-transitivo sull’insieme dei triangoli, si ha necessariamente f = g, e dunque f è una isometria.
Sia ora f una affinità del piano euclideo E2 e sia T un triangolo che sia simile al suo trasformato T 0 = f (T ).
Poiché i triangoli T e T 0 sono simili, esiste una (unica) similitudine g di E2 tale che g(T ) = T 0 , cfr. la
Proposizione 26. Poiché f e g sono due affinità che mutano T in T 0 , e poiché il gruppo delle affinità di
E2 è strettamente 1-transitivo sull’insieme dei triangoli, si ha necessariamente f = g, e dunque f è una
similitudine.
5.3.4
Un’affinità del piano euclideo che conservi una fissata distanza d > 0 (risp. che trasformi
punti che abbiano tra loro una fissata distanza d > 0 in punti aventi fra loro una fissata
distanza dk) è una isometria (risp. una k-similitudine).
Sia f una affinità del piano euclideo E2 che conservi una fissata distanza d > 0. Vogliamo dimostrare che
f conserva tutte le distanze. Sia T un triangolo equilatero di lato d, Allora f trasforma T in un triangolo
T 0 = f (T ) equilatero di lato d, dunque congruente a T. In virtù del n. 5.3.3, f è un’isometria.
Sia ora f una affinità del piano euclideo E2 che trasformi coppie di punti che abbiano una fissata distanza
d > 0 in coppie di punti a distanza dk con k fisso. Sia T un triangolo equilatero di lato d, Allora f trasforma
T in un triangolo T 0 = f (T ) equilatero di lato dk, dunque simile a T . In virtù del n. 5.3.3, f è una
similitudine, e precisamente una k-similitudine.
5.3.5
Triangoli congruenti e isometrie.
Vedremo in questo paragrafo che condizione necessaria e sufficiente affinché due triangoli del piano euclideo
siano congruenti è che esista una isometria del piano che muti l’uno nell’altro. La condizione è ovviamente sufficiente, perché due triangoli con i lati ordinatamente congruenti sono congruenti. La condizione è
necessaria in virtù della seguente Proposizione.
43
Proposizione 23 Siano ABC e A0 B 0 C 0 due triangoli congruenti del piano euclideo E2 . Esiste ed è unica
una isometria f ∈ Iso(E2 ) tale che f (ABC) = A0 B 0 C 0 ; inoltre tale f è prodotto di al più tre simmetrie
rispetto a rette.
Dimostrazione. Per definizione di triangoli congruenti, si ha l’uguaglianza37 del lati: AB = A0 B 0 , BC =
B C 0 , AC = A0 C 0 . Se A0 = A, si assuma f1 = id(E2 ); se A0 6= A, si assuma f1 = σa , dove a è l’asse del
segmento AA0 . In entrambi i casi si ha ovviamente
0
f1 (A) = A0 .
Sia f1 (B) = B1 , f1 (C) = C1 . Se B1 = B 0 si assuma f2 = id(E2 ); se B1 6= B 0 si assuma f2 = σb , dove b è
l’asse del segmento B 0 B1 . In entrambi i casi si ha ovviamente
f2 (B1 ) = B 0 ed inoltre f2 (A0 ) = A0
perché A0 ∈ b, essendo A0 equidistante dagli estremi del segmento B 0 B1 in quanto A0 B 0 = AB = A0 B1 (=
f1 (AB)). Sia f2 (C1 ) = C2 . Se C2 = C 0 si assuma f3 = id(E2 ); se C2 6= C 0 si assuma f3 = σc , dove c è l’asse
del segmento C2 C 0 . In entrambi i casi si ha ovviamente
f3 (C2 ) = C 0
ed inoltre
f3 (A0 ) = A0 ed anche f3 (B 0 ) = B 0
perché c = A0 B 0 , essendo ciascuno dei due punti A0 e B 0 equidistante dagli estremi del segmento C2 C 0 :
A0 C 0 = AC = A0 C1 = A0 C2 e B 0 C 0 = BC = B1 C1 = B 0 C2 . Pertanto, posto f := f3 f2 f1 , si ha:
f (A) = f3 f2 f1 (A) = f3 f2 (A0 ) = f3 (A0 ) = A0 ,
f (B) = f3 f2 f1 (B) = f3 f2 (B1 ) = f3 (B 0 ) = B 0 ,
f (C) = f3 f2 f1 (C) = f3 f2 (C1 ) = f3 (C2 ) = C 0 .
Da quanto precede si ha che esiste almeno una isometria che trasforma il triangolo T = ABC nel triangolo
T 0 = A0 B 0 C 0 e che tale isometria è prodotto di al più tre simmetrie; l’unicità dell’isometria in questione
segue dal fatto che essa non può che coincidere con l’unica affinità di E2 che muta T in T 0 .
Osservazione 24 . In base alle notazioni introdotte nella dimostrazione del Teorema 23 si ha: f1 (ABC) =
A0 B1 C1 , f2 (A0 B1 C1 ) = A0 B 0 C2 , f3 (A0 B 0 C2 ) = A0 B 0 C 0 .
Corollario 25 Ogni isometria del piano euclideo è prodotto di al più tre simmetrie rispetto a rette.
Dimostrazione. Sia f ∈ Iso(E2 ). Consideriamo un triangolo T ed il suo trasformato T 0 = f (T ). Per il
terzo criterio di uguaglianza i triangoli T e T 0 sono congruenti . Dunque, per la Proposizione 23, f non può
che coincidere con l’unica isometria che muta T in T 0 e che sappiamo essere prodotto di al più tre simmetrie.
37 Qui
e appresso usiamo impropriamente, per segmenti, angoli e triangoli, il termine uguaglianza per indicare la congruenza
ed il simbolo = in luogo di ≡.
44
5.3.6
Triangoli simili e similitudini.
Vedremo in questo paragrafo che condizione necessaria e sufficiente affinché due triangoli del piano euclideo
siano simili è che esista una similitudine del piano che muti l’uno nell’altro. La condizione è ovviamente
sufficiente, perché due triangoli con i lati in proporzione sono simili. La condizione è necessaria in virtù della
seguente Proposizione.
Proposizione 26 Siano ABC e A0 B 0 C 0 due triangoli simili del piano euclideo E2 . Esiste ed è unica una
similitudine f ∈ Sim(E2 ) tale che f (ABC) = A0 B 0 C 0 .
Dimostrazione. Sia τ la traslazione tale che τ (A) = A0 , e sia ρ la rotazione di centro A0 che porta la
semiretta A0 τ (B) sopra la semiretta A0 B 0 ; sia infine ω l’omotetia di centro A0 che porta ρτ (B) in B 0 . I triangoli A0 B 0 C 0 e ωρτ (ABC) = A0 B 0 ωρτ (C) sono congruenti per il terzo criterio di uguaglianza ed hanno il lato
A0 B 0 in comune. Due casi sono possibili a seconda che i due punti ωρτ (C) e C 0 siano o non siano nello stesso
semipiano di origine la retta A0 B 0 : nel primo caso ωρτ (C) = C 0 , mentre nel secondo caso C 0 = σωρτ (C),
dove σ è la simmetria rispetto alla retta A0 B 0 . In conclusione il triangolo ABC viene portato nel triangolo
A0 B 0 C 0 dalla similitudine diretta ωρτ nel primo caso oppure dalla similitudine inversa σωρτ nel secondo
caso. In entrambi i casi esiste una similitudine che porta il triangolo ABC nel triangolo A0 B 0 C 0 ; inoltre tale
similitudine è unica, perché dati due triangoli qualunque esiste ed è unica l’affinità che muta il primo nel
secondo.
6
Ampliamenti, estensioni e generalizzazioni dello spazio della geometria elementare
.
Lo studio della geometria lineare ed algebrica suggerisce in modo spontaneo varie estensioni e generalizzazioni della nozione di spazio, allo scopo di eliminare le eccezioni che si incontrano e di trovare un linguaggio
per quanto possibile unificatore.
Ci limitiamo per il momento al punto di vista della geometria lineare ed algebrica, in quanto esso riflette
le proprietà generali di campo: prescinderemo invece dal punto di vista metrico e differenziale, che è legato
a proprietà specifiche e più riposte del campo reale, quali l’ordinamento e la continuità).
Ci proponiamo di motivare tre tipi di ampliamenti:
(1) ampliamenti del campo base;
(2) passaggio dall’affine al proiettivo;
(3) passaggio a spazi di dimensione superiore.
Appare altamente desiderabile estendere il piano R2 in modo che, nell’ambiente esteso, valga senza
eccezioni il Teorema di Bézout (Etienne BÉZOUT, 1730-1783), secondo cui due qualunque curve algebriche, che non abbiano una componente comune, si intersecano in un numero di punti che uguaglia il
prodotto dei loro ordini (purché ogni punto comune alle due curve venga contato con la dovuta molteplicità
d’intersezione). Si raggiunge lo scopo desiderato, passando dal reale al complesso e dall’affine al proiettivo.
In altri termini, dovremo sviluppare la geometria del piano proiettivo complesso.
45
Vedremo poi che, anche se ci si vuole limitare a studiare la geometria elementare, si è costretti a studiare
(eventualmente in modo inconsapevole) la geometria algebrica in uno spazio di dimensione superiore:
cosı̀, ad esempio, la semplicissima geometria della retta dello spazio ordinario equivale alla geometria
della quadrica di Klein V42 (un’ipersuperficie d’ordine 2 di uno spazio di dimensione 5). Analogamente,
vedremo che le coniche del piano corrispondono ai punti di uno spazio S 5-dimensionale, che le coniche
spezzate corrispondono ai punti di una ipersuperficie cubica V43 di tale S5 , e che le coniche spezzate in
una retta contata due volte corrispondono ai punti di una superficie di S5 , la superficie di Veronese V24 .
Vedremo anche che la superficie di Veronese può essere presentata come immagine proiettiva del sistema
lineare completo delle coniche del piano, e che questi punti di vista potranno essere estesi alla considerazione
della varietà di Veronese rappresentativa del sistema lineare totale delle curve algebriche piane d’ordine
n (o più generalmente della varietà di Veronese rappresentativa del sistema lineare totale delle ipersuperfici
algebriche d’ordine n di uno spazio proiettivo di dimensione r ≥ 2).
Avremo in definitiva motivazioni più che sufficienti per giustificare lo studio della geometria proiettiva
iperpaziale.
Per illustrare nel modo più semplice possibile l’opportunità di effettuare le estensioni suddette, partiamo
anzitutto dall’usuale spazio a due dimensioni (il piano di Euclide). Sappiamo che, come modello del piano
euclideo, possiamo assumere il piano numerico reale A2 (R) = (P, R). In tale spazio, l’insieme P dei punti
è l’insieme R2 delle coppie ordinate di numeri reali. L’insieme R delle rette è:
R := {rabc : (a, b, c) ∈ R3 , (a, b) 6= (0, 0)},
ove la retta rabc è data da:
rabc := {(x, y) ∈ R2 : ax + by + c = 0}.
Talvolta, per abuso di notazione, il piano numerico reale verrà denotato semplicemente con R2 . In tale
ambiente, oltre all’ordinaria geometria lineare (traduzione dell’algebra lineare, riguardante i sistemi di
equazioni lineari), si sviluppa più generalmente la geometria algebrica piana (studio delle curve algebriche
piane, traduzione dello studio dei polinomi e dei sistemi di polinomi in due indeterminate). Ricordiamo che
si definisce curva algebrica di R2 di grado (o ordine) d ≥ 1 una qualunque coppia V(f ) = (R? · f, V (f )), dove
f = f (X, Y ) ∈ R[X, Y ] è un polinomio di grado d, e V (f ) (detto il sostegno o supporto della curva) è
l’insieme dei punti di R2 che annullano f :
V (f ) := {(x, y) ∈ R2 : f (x, y) = 0}.
Diremo anche che V(f ) è la curva definita dall’equazione f (X, Y ) = 0. Si noti che curve distinte possono
avere lo stesso sostegno: ad esempio V (XY ) = V (XY 2 ) = V (X 2 Y ) = V (X 3 Y 5 ) è il comune sostegno di
curve fra loro distinte.
6.1
Ampliamento del campo base: passaggio dal reale al complesso
Questo ampliamento può essere effettuato in due modi:
(1) Passaggio dal piano reale al piano reale complessificato: Ciò significa che il campo base
(campo ove variano i coefficienti delle equazioni algebriche che si considerano) è il campo reale, ma si
consente alle coordinate dei punti soluzione di assumere valori complessi. Ad esempio, l’insieme delle rette
è ora
R := {rabc : (a, b, c) ∈ R3 , (a, b) 6= (0, 0)},
ove la retta rabc è ora data da:
rabc := {(x, y) ∈ C2 : ax + by + c = 0}.
46
(2) Passaggio al piano complesso. Ciò significa che sia i coefficienti delle equazioni considerate sia le
coordinate dei punti variano nel campo complesso. Ad esempio, l’insieme delle rette è ora
R := {rabc : (a, b, c) ∈ C3 , (a, b) 6= (0, 0)},
ove la retta rabc è ora data da:
rabc := {(x, y) ∈ C2 : ax + by + c = 0}.
Per conseguire la validità del teorema di Bézout,
dal reale al complesso è neces√
√ il passaggio
sario: si consideri V(X 2 + Y 2 − 1) ∩ V(X − 2) = {(2, i 3), (2, −i 3)}; ma non è sufficiente: si consideri
V(X − 1) ∩ V (X − 2) = ∅.
Notiamo ancora una volta che i punti comuni vanno contati con la dovuta molteplicità d’intersezione:
ad esempio: V(X 2 + Y 2 − 1) ∩ V(X − 1) = {(1, 0)}, e questo punto va contato due volte perché la retta è ivi
tangente alla circonferenza.
Osservazione. Si noti che, nello studio di questioni aritmetiche ed in teoria dei numeri, si usa andare
nella direzione contraria: anziché ampliare il campo reale R, ci si restringe al campo razionale Q. Ad
esempio, l’esistenza di terne pitagoriche equivale all’esistenza nel primo quadrante di punti razionali
sulla circonferenza X 2 + Y 2 = 1 di centro l’origine e raggio 1: se (a, b, c) ∈ N3 è una terna pitagorica, cioè
se a2 + b2 = c2 , allora (a/c)2 + (b/c)2 = 1, ossia (a/c, b/c) è un punto razionale del tipo detto; viceversa
se (p, q) ∈ Q2 è un punto razionale del tipo detto, si ha p2 + q 2 = 1, e posto che sia p = a/b, q = c/d,
con (a, b, c, d) ∈ N4 , si ha (a/b)2 + (c/d)2 = 1, cioè a2 d2 + c2 b2 = b2 d2 , e si trova la terna pitagorica
(ad, cb, bd). In modo analogo si riconosce subito che l’esistenza di terne di Fermat di ordine n > 2 - cioè di
terne (a, b, c) ∈ N3 tali che an + bn = cn - equivarrebbe all’esistenza nel primo quadrante di punti razionali
sulla curva algebrica di equazione X n + Y n = 1. Il cosiddetto grande (o ultimo) teorema di Fermat,
affermante che non esistono terne di Fermat d’ordine n > 2, è stato dimostrato soltanto nel 1993 (da Andrew
WILES, medaglia Fields38 ).
Ricordiamo infine che, mentre non esistono ovviamente campi intermedi tra il campo reale ed il campo
complesso, esistono invece infiniti campi intermedi tra il campo reale ed il campo razionale, bastando ad
esempio effettuare, a partire da Q, successive estensioni semplici (algebriche o trascendenti) entro R.
6.2
6.2.1
Passaggio dall’affine al proiettivo.
Dal piano affine A2 (R) al piano proiettivo P2 (R).
Tale ampliamento ha anzitutto un valore unificante (ad es. due rette del piano avranno sempre un punto in
comune, proprio o improprio). Si può distinguere tra piano affine ampliato e piano proiettivo vero e
proprio, a seconda che venga o no conservata memoria del piano affine originario. Ad esempio la distinzione
tra punti propri ed impropri ha senso nel piano affine ampliato, ma non nel piano proiettivo (nel quale tutti
i punti sono uguali!), la considerazione della retta impropria ha senso nel piano affine ampliato, ma non nel
piano proiettivo (nel quale tutte le rette sono uguali!). La distinzione diviene più chiara se si adotta il punto
di vista di Klein: la geometria affine del piano affine ampliato ha come gruppo fondamentale il gruppo delle
omografie che mutano in sé la retta impropria, mentre la geometria proiettiva (del;piano proiettivo) ha come
gruppo fondamentale il gruppo di tutte le omografie. Ricordiamo che, il passaggio dal piano affine al piano
38 Le medaglie Fields (che prendono il nome da J.C. Fields, che ha finanziato la loro istituzione) sono premi equivalenti per la
matematica ad un premio Nobel e vengono assegnati - in occasione del Congresso Internazionale dei Matematici (ogni quattro
anni) - a matematici con meno di quaranta anni che si siano distinti per avere ottenuto risultati particolarmente importanti.
47
proiettivo può essere descritto in due modi diversi (fra loro equivalenti): uno sintetico ed uno analitico. Il
modo sintetico consiste dei seguenti passi:
(1) si introduce per ogni fascio di rette parallele un nuovo ”punto, che è la comune direzione delle rette
di quel fascio, cioè il quid comune alle rette del fascio (ovvero, se si preferisce, il fascio stesso, qualora si
preferisca l’aspetto estensivo a quello intensivo del concetto di direzione);
(2) si amplia ciascuna retta con l’aggiunta di un nuovo punto: la direzione di quella retta;
(3) si introduce una nuova retta: la totalità delle direzioni delle rette del piano.
Quando si mantiene la memoria del processo di ampliamento, i vecchi elementi - punti e rette - si
chiamano propri (o al finito), mentre i nuovi vengono chiamati impropri (o all’infinito); la terminologia
si giustifica osservando che quando due rette incidenti del piano euclideo variano con continuità tendendo ad
essere parallele, il loro punto d’intersezione si allontana indefinitamente.
Si noti che gli assiomi di incidenza per un piano proiettivo sono particolarmente semplici ed eleganti. Un
piano proiettivo è una coppia P2 = (P, R), dove P è un insieme non vuoto di elementi detti punti, R è un
insieme di parti di P dette rette, in modo che valgano i seguenti assiomi:
1) Per due punti distinti qualunque passa una e una sola retta.
2) Due rette distinte qualunque si intersecano in uno ed in un solo punto.
3) Esistono 4 punti a 3 a 3 non allineati.
Il terzo assioma può essere sostituito da:
3’) Esistono almeno 3 punti non allineati e (proprietà di Fano39 ) ogni retta contiene almeno 3 punti.
Si noti che la nozione di piano proiettivo è nella natura delle cose. Infatti si ha un piano proiettivo
P2 = (P, R), assumendo come P la stella di rette di R3 di centro un punto A ∈ R3 e come R la stella di
piani di R3 di centro A. Si noti che tale piano P2 è isomorfo al piano P2 (R) (visto come piano all’infinito di
R3 , i cui punti sono le direzioni delle rette della stella e le cui rette sono le giaciture dei piani della stella).
Si noti inoltre che ogni piano della stella si può identificare con il fascio di rette di centro A contenuto nel
piano stesso.
In modo analitico l’ampliamento del piano affine R2 = A2 (R) = AG(2, R) al piano proiettivo P2 (R) =
P G(2, R) viene descritto dai seguenti passi.
1) I punti di P2 (R) sono le ”terne omogenee” di numeri reali. Ogni terna omogenea si ottiene da una
terna ordinata (x0 , x1 , x2 ) di numeri reali non tutti nulli, e consiste per definizione di quella terna stessa e
di tutte le altre terne proporzionali a quella secondo fattori non nulli di R). La terna omogenea associata a
(x0 , x1 , x2 ) si denota con [(x0 , x1 , x2 )].
2) Le rette di P2 (R) sono gli insiemi di punti del tipo:
rabc = {[(x0 , x1 , x2 )] : ax1 + bx2 + cx0 = 0}
ove (a, b, c) è una terna di numeri reali non tutti nulli. Si noti che attualmente non si richiede che sia
(a, b) 6= (0, 0).
3) I punti di A2 (R) si identificano con alcuni punti di P2 (R). Più precisamente il punto (x, y) di A2 (R)
si identifica con il punto [(1, x, y)] di P2 (R). In altri termini: ogni punto [(x0 , x1 , x2 )] di P2 (R) con x0 6= 0 si
identifica col punto (x, y) ove x = x1 /x0 , y = x2 /x0 .
Ad ogni retta di A2 (R) di equazione aX + bY + c = 0 (dove a, b sono non entrambi nulli) corrisponde cosı̀
la retta di P2 (R) di equazione aX1 + bX2 + cX0 = 0. Ogni soluzione (x, y) di quella fornisce una soluzione
omogenea [(1, x, y)] di questa; questa ha poi un’unica ulteriore soluzione [(0, −b, a)]. In altri termini la
39 Il
matematico Gino FANO (1871-1952) è stato già ricordato a proposito del piano proiettivo P2 (Z2 ), che porta il suo nome.
48
retta di A2 (R) è stata ampliata con l’aggiunta del punto [(0, −b, a)]. Questo punto corrisponde al punto
improprio di cui si è detto nella esposizione per via sintetica, perché la condizione di parallelismo tra due
rette di A2 (R) aventi rispettivamente equazione aX + bY + c = 0 ed a0 X + b0 Y + c0 = 0 si traduce (in base
a proprietà elementari dei sistemi di equazioni lineari) nella proporzionalità delle coppie (a, b) e (a0 , b0 ) cioè
nel fatto che sia [(0, −b, a)] = [(0, −b0 , a0 )].
6.2.2
Curve algebriche del piano proiettivo A2 (R).
Ricordiamo che si definisce curva algebrica di P2 (R) di grado (o ordine) d ≥ 1 una qualunque coppia
V(f ) = (R? f, V (f )), dove f = f (X) = f (X0 , X1 , X2 ) ∈ R[X0 , X1 , X2 ] = R[X] è un polinomio omogeneo di
grado d, e V(f) (detto il sostegno della curva) è l’insieme dei punti [(x0 , x1 , x2 )] di P2 (R) che annullano f :
V (f ) := {[x] : x ∈ R3 ∧ f (x) = 0}.
,
Le curve algebriche di ordine 1 sono le rette, le curve algebriche di ordine 2, 3, 4, . . . si chiamano coniche,
cubiche, quartiche, quintiche . . . .
E’ chiaro che ad ogni curva algebrica di grado d del piano affine A2 (R), di equazione f (X, Y ) = 0, si può
associare la curva algebrica di grado d di P2 (R), di equazione
X0d f (X1 /X0 , X2 /X0 ) = 0.
Viceversa, ad ogni curva algebrica di grado d di P2 (R), di equazione f (X0 , X1 , X2 ) = 0 può associAr si
la sua traccia affine, che sarà una curva algebrica di A2 (R), di equazione f (1, X, Y ) = 0, non appena il
polinomio f non contenga il fattore X0d , cioè non appena la curva non consista della retta impropria contata
d volte.
Per conseguire la validità del teorema di Bézout, il passaggio dall’affine al proiettivo è
necessario (ad esempio V (X − 1) ∩ V (X − 2) = ∅ in ambito affine, mentre V (X − 1) ∩ V (X − 2) = {(0, 0, 1)}
in ambito proiettivo), ma non è sufficiente (ad esempio V(X2 + Y 2 − 1) ∩ V (X − 2) = ∅ sia in ambito
affine che proiettivo).
Da quanto precede si ha che, per conseguire la validità del teorema di Bézout, è necessario il passaggio
dal reale al complesso e dall’affine al proiettivo. In effetti quelle due condizioni (prese insieme) sono anche sufficienti, in quanto si può effettivamente dimostrare (con la teoria dell’eliminazione algebrica, e più
precisalmente con la teoria del risultante) che
Teorema 27 (Teorema di Bézout nel piano). Sia P2 = P2 (K) il piano proiettivo su un campo K
algebricamente chiuso. Due curve algebriche di P2 , di gradi n ed m, che non abbiano una componente
comune, hanno esattamente nm punti in comune, a patto di contare ogni punto d’intersezione con la dovuta
molteplicità d’intersezione. I punti distinti sono esattamente nm se le due curve sono generiche40 .
40 L’attributo generico ha in geometria algebrica un significato tecnico, diverso da vquello che ha l’attributo qualunque.
Considerata una certa totalità di enti geometrici, totalità che abbia una certa dimensione k, si dice che ”il generico ente
verifica una certa proprietà’ se la totalità degli enti che non verificano quella proprietà costituisce una sottototalità di
dimensione minore di k. Dunque il significato di ”generico” è relativo ad una certa proprietà e cambia di volta in volta.
Ad esempio: ”sia V(f ) un’ipersuperficie di Pr (K). Il generico punto di Pr (K) non appartiene a V(f )”: in effetti i punti che
appartengono a V(f ) formano una totalità di dimensione r − 1 < r. Ed ancora: ”la generica conica del piano è non singolare”:
in effetti la totalità delle coniche singolari ha dimensione 4 < 5.
49
Deduzione del Teorema di Bézout dal principio di conservazione del numero di intersezioni.
Nel caso in cui K = C, il suddetto teorema di Bézout può essere dedotto dal cosiddetto principio di
conservazione del numero di intersezioni per variazioni continue: variando con continuità ed in
modo generico le due curve (cioè i coefficienti delle rispettive equazioni) anche i punti d’intersezione variano
con continuità ed il loro numero rimane invariato. Nel caso in questione, si fa degenerare la prima curva
in una curva spezzata in n rette generiche e la seconda curva in una curva spezzata in m rette generiche.
Il numero dei punti comuni a queste due curve spezzate è dunque nm , ed è uguale al numero dei punti
comuni alle due curve originarie. Da questo punto di vista la molteplicità d’intersezione di due curve in un
loro punto comune acquista un chiaro significato dinamico come il numero dei punti comuni alle due curve
spezzate in rette che confluiscono nel punto in questione (nella trasformazione inversa, che riporta le due
curve spezzate in rette nelle due curve originarie).
6.2.3
Dallo spazio affine A3 (R) allo spazio proiettivo P3 (R).
Lasciamo al Lettore di descrivere il passaggio dallo spazio affine reale A3 (R) allo spazio complessificato
ed allo spazio complesso A3 (C), seguendo le indicazione sviluppate nel caso piano. Limitiamoci invece a
ripercorrere il passaggio dall’affine al proiettivo per lo spazio reale 3-dimensionale.
In analogia a quanto detto nal caso del piano, si hanno due modi diversi (fra loro equivalenti), uno per
via sintetica ed uno per via analitica, per passare dallo spazio affine ordinario A3 = A3 (R) al corrispondente
spazio proiettivo P3 = P3 (R). Per quanto riguarda A3 , ricordiamo che esso è stato introdotto per via sintetica
con gli assiomi di Hilbert, mentre è stato presentato per via puramente analitica, cioè come spazio numerico,
nella dimostrazione del Teorema 2.
Il modo sintetico per passare da A3 a P3 consiste dei seguenti passi:
(1) si introduce per ogni stella di rette parallele (stella impropria di rette) un nuovo ”punto” (improprio): la
comune direzione delle rette di quella stella;
(2) si amplia ciascuna retta con l’aggiunta di un nuovo punto (improprio): la direzione di quella retta;
(3) si amplia ciascun piano con l’aggiunta di nuovi punti (impropri): le direzioni delle rette del piano e con
l’aggiunta di una nuova retta (impropria): la totalità delle direzioni delle rette del piano (detta anche la
”giacitura” del piano);
(4) si constata che due piani sono paralleli se e solo se ad essi compete la stessa retta impropria (cioè se
hanno la stessa giacitura).
Il modo analitico per passare da A3 (R) a P3 (R) consiste dei seguenti passi:
1) I punti di P3 (R) sono le ”quaterne omogenee” di numeri reali. Ogni quaterna omogenea è definita
come [x] = x · R? , dove x = (x0 , x1 , x2 , x3 ) ∈ R4 \ {0} è una quaterna ordinata di numeri reali non tutti
nulli.
2) I piani di P3 (R) sono gli insiemi di punti del tipo
πabcd := {[(x0 , x1 , x2 , x3 )] : ax1 + bx2 + cx3 + dx0 = 0,
ove (a, b, c, d) ∈ R4 ed (a, b, c, d) 6= (0, 0, 0, 0). Si noti che attualmente non si richiede che sia (a, b, c) 6= (0, 0, 0).
50
3) Le rette di P3 (R) sono le intersezioni πabcd ∩ πa0 b0 c0 d0 di due piani distinti: essere distinti si traduce
nel fatto che le quaterne (a, b, c, d) ed (a0 , b0 , c0 , d0 ) non sono proporzionali; si noti che attualmente non è
mai πabcd ∩ πa0 0 b0 c0 d0 = ∅. In altri termini le rette sono i luoghi dei punti che annullano un sistema lineare
omogeneo di rango 2 del tipo:
aX1 + bX2 + cX3 + dX0 = 0,
a0 X1 + b0 X2 + c0 X3 + d0 X0 = 0.
4) Ciascun punto (x, y, z) di A3 (R) si identifica col punto [(1, x, y, z)] di P3 (R). In altri termini: ogni punto
[(x0 , x1 , x2 , x3 )] di P3 (R)) con x0 6= 0 si identifica col punto (x, y, z) ove x = x1 /x0 , y = x2 /x0 , z = x3 /x0 .
Ad ogni piano di A3 (R) di equazione aX + bY + cZ + d = 0 (dove a, b, c sono non tutti nulli) corrisponde
cosı̀ il piano di P3 (R) di equazione omogenea aX1 + bX2 + cX3 + dX0 = 0. Ogni soluzione (x, y, z) di quella
fornisce una soluzione omogenea [(1, x, y, z)] di questa; le altre soluzioni dell’equazione omogenea sono tutte
e sole le soluzioni del sistema:
aX1 + bX2 + cX3 = 0,
X0 = 0
cioè sono i punti di una retta del piano considerato (la retta impropria del piano).
Due piani di A3 (R), di equazione rispettivamente aX + bY + cZ + d = 0 e a0 X + b0 Y + c0 Z + d0 = 0,
sono paralleli sse coincidono o hanno intersezione vuota, cioè sse le loro due equazioni sono equivalenti o
incompatibili; queste due circostanze si verificano sse la terna (a, b, c) è proporzionale alla terna (a0 , b0 , c0 ),
cioè sse il sistema
aX1 + bX2 + cX3 = 0,
X0 = 0
è equivalente al sistema a0 X1 + b0 X2 + c0 X3 = 0,
X0 = 0
cioè sse i due piani (ampliati) hanno la stessa retta impropria.
In modo analogo si verifica che due rette di A3 (R) sono parallele sse le due rette (ampliate) hanno uno
stesso punto improprio (0, x1 , x2 , x3 ).
6.2.4
Curve, superfici e varietà algebriche degli spazi A3 (R)) e P3 (R).
Ricordiamo che si definisce superficie algebrica di A3 (R) di grado (o ordine) d ≥ 1 una qualunque coppia
V(f ) = (R? f, V (f )), dove f = f (X, Y, Z)[X, Y, Z] è un polinomio di grado d, e V (f ) (detto il sostegno della
superfice) è l’insieme dei punti (x, y, z) di R3 (o, più generalmente, di C3 ) che annullano f :
V (f ) := {(x, y, z) ∈ C3 : f (x, y, z) = 0}.
Analogamente si definisce superficie algebrica di P3 (R) di grado (o ordine) d ≥ 1 una qualunque
coppia V(f ) = (R? f, V (f )), dove f = f (X) = f (X0 , X1 , X2 , X3 ) ∈ R[X0 , X1 , X2 , X3 ] = R[X] è un polinomio
omogeneo di grado d e V (f ) (detto il sostegno della superficie) è l’insieme dei punti [(x0 , x1 , x2 , x3 )] di
P3 (R) (o più generalmente di P3 (C)) che annullano f :
51
V (f ) := {[x] : x ∈ C4 ∧ f (x) = 0}.
Le varietà algebriche di A3 (R) e di A3 (C) si definiscono come intersezioni - considerate nello spazio
proiettivo complessificato - di s ≥ 1 superfici algebriche V(fi ) di quegli spazi:
\
i
V(fi ) =
\
(R? fi , V (fi )) = ({R? fi },
i
\
V (fi )).
i
In altri termini, per dare una varietà algebrica dobbiamo assegnare un insieme F di polinomi f nelle coordinate correnti dello spazio (ciascun polinomio dovrà essere omogeneo, se siamo nel caso proiettivo), ed
assumiamo poi, come varietà definita da F , la coppia
\
V(F ) = (R? F, V (F )), dove V (F ) =
V (f ),
f ∈F
l’intersezione essendo estesa a tutti i polinomi f di F .
Una varietà algebrica potrà dunque essere: vuota (ad esempio l’intersezione di 4 piani generici di P3 ),
un gruppo finito di punti (ad. esempio l’intersezione di 3 piani generici di P3 ; od ancora l’intersezione
di una quadrica e di 2 piani generici); una superficie algebrica (quando le superfici considerate hanno
una componente superficiale comune, ad esempio la superficie cubica X03 − X13 = 0 e la superficie quintica
X05 − X15 = 0); una curva algebrica.
Le curve algebriche di P3 (C) sono per definizione le varietà algebriche di dimensione 1, cioè - per
definizione - quelle varietà algebriche che hanno intersezione non vuota con ogni piano ma non con ogni
retta di P3 (C); si dimostra che, allora, il generico piano incontra la curva in un numero fisso di punti
(contando i punti con la dovuta molteplicità d’intersezione). Ad esempio, la cubica sghemba di A3 (R),
avente equazioni parametriche X = t, Y = t2 , Z = t3 , è una curva algebrica, non è contenuta in alcun piano
ed ha ordine 3. Infatti i punti comuni alla curva e ad un piano generico d’equazione aX + bY + cZ + d = 0
sono esattamentre tre, in quanto si trovano risolvendo in t l’equazione at + bt2 + ct3 + d = 0; inoltre la curva
è intersezione delle quadriche di equazioni X2 − Y = 0 ed XY − Z = 0 rispettivamente. Si noti che in
P3 (C) le due suddette quadriche hanno equazione X12 − X2 X0 = 0 ed X1 X2 − X3 X0 = 0 rispettivamente, e
si intersecano (a norma del teorema spaziale di Bézout) in una curva di ordine 4, che risulta spezzata nella
suddetta cubica sghemba e nella retta (del piano improprio) di equazioni X0 = 0, X1 = 0.
Anche nello spazio, come nel piano, ai fini della validità del teorema di Bézout occorre e basta ampliare
lo spazio A3 (R) passando allo spazio proiettivo e al campo complesso. Sussiste infatti il teorema:
Teorema 28 (Teorema di Bézout nello spazio.) Sia P3 = P3 (K) lo spazio proiettivo 3-dimensionale
su un campo K algebricamente chiuso. Allora: tre superfici algebriche di P3 , di gradi n, m ed h, prive di
componenti comuni e che non passino per una medesima curva, hanno esattamente nmh punti in comune, a
patto di contare ogni punto d’intersezione con la dovuta molteplicità d’intersezione. Il numero dei punti
comuni è esattamente nmh qualora le tre superfici sono generiche. Corollario 29 Sia P3 = P3 (K) lo spazio proiettivo 3-dimensionale su un campo K algebricamente
chiuso. Allora: due superfici algebriche di P3 , di gradi n ed m e prive di componenti superficiali comuni,
si intersecano in una curva algebrica d’ordine nm di P3 .
Dimostrazione. Si applichi il Teorema di Bézout (Teorema 28) alle tre superfici costituite dalle due
superfici date e da un piano generico dello spazio. 52
Deduzione del teorema di Bézout spaziale dal principio di conservazione del numero di
intersezioni. Nel caso in cui K = C, il suddetto Teorema di Bézout in P3 (K) può essere dedotto dal
principio di conservazione del numero di intersezioni per variazioni continue generiche. Le tre
superfici f1 , f2 e f3 si fanno degenerare, per variazione continua generica, in tre superfici g1 , g2 e g3 ,
spezzate rispettivamente in n, in m ed in h piani. Allora g1 ∩ g2 consiste evidentemente di nm rette,
cosicché (g1 ∩ g2 ) ∩ g3 consiste di nmh punti. I punti di (f1 ∩ f2 ) ∩ f3 sono altrettanti. Questo punto di
vista dà un significato dinamico alla molteplicità d’intersezione delle tre superfici f1 , f2 ef3 in un loro punto
comune.
6.3
Passaggio a spazi di dimensione superiore.
Si è visto precedentemente che è opportuno sviluppare la geometria in ambiente proiettivo coordinatizzato
sopra un campo algebricamente chiuso. Vogliamo ora illustrare la necessità intrinseca di considerare
anche spazi di dimensione maggiore di tre, e mostrare come il passaggio a spazi di dimensione superiore
sia quanto mai naturale. A tal fine cominciamo con il fissare la terminologia e le notazioni relative a tali
spazi.
6.3.1
Spazio affine Ar (K).
Sia Ar = Ar (K) = (P, S) lo spazio affine numerico r-dimensionale su un campo K (algebricamente chiuso).
I punti di Ar sono le r-ple ordinate y = (y1 , . . . , yr ) di numeri di K: cioè P = K r . I numeri y1 , . . . , yr si
chiamano le coordinate affini (c.a.) del punto y. Gli iperpiani sono i luoghi H dei punti (y1 , . . . , yr ) ∈ P
che verificano un’equazione lineare del tipo:
H:
u1 Y1 + · · · + ur Yr + u0 = 0,
dove (u0 , . . . , ur ) ∈ K r+1 e (u1 , . . . , ur ) 6= (0, . . . , 0). Più in generale i sottospazi sono le intersezioni di
iperpiani, ossia i luoghi A dei punti (y1 , . . . , yr ) ∈ P che verificano un sistema di s ≥ 1 equazioni del tipo:
A:
u11 Y1 + · · · + u1r Yr + u10 = 0,
...,
us1 Y1 + · · · + usr Yr + us0 = 0.
(4)
Una ipersuperficie di Ar (K) è una coppia V(f ) = (K ? f, V (f )), dove f è un polinomio su K in r
indeterminate, f = f (Y) ∈ K[Y] con Y = (Y1 , . . . , Yr ) e V (f ), detto il sostegno dell’ipersuperficie, è
l’insieme dei punti che annullano f :
V (f ) := {(y1 , . . . , yr ) ∈ P : f (y1 , . . . , yr ) = 0}.
Si dice che V(f ) è l’ipersuperficie definita dal polinomio f (o dall’equazione f = 0).
Una varietà algebrica di Ar si definisce come intersezione di ipersuperfici algebriche. In altri termini,
per dare una varietà algebrica, si deve anzitutto assegnare un insieme F di polinomi f (Y) ∈ K[Y] =
K[Y1 , . . . , Yr ] nelle coordinate correnti dello spazio; si chiama allora varietà definita da F la coppia
V(F ) = (K ? F, V (F )),
dove
K ? F = {af : a ∈ K ? , f ∈ F } e
V (F ) =
\
f ∈F
53
V (f )
,
l’intersezione essendo estesa a tutti i polinomi f di F .
Due varietà algebriche di Ar (K):
V(F ) = (K ? F, V (F )
e
V(F 0 ) = (K ? F 0 , V (F 0 ))
devono attualmente essere considerate equivalenti o ”uguali” dal punto di vista affine), se esiste
un’affinità α di Ar tale che α(F ) = F 0 , e quindi tale che α(V (F )) = V (F 0 )). Ricordiamo che un’affinità di
Ar (K) ha equazioni
0
0
Y1 = a11 Y1 + · · · + a1r Y r + a10 , . . . , Yr = ar1 Y1 + · · · + arr Yr + ar0
,
dove la matrice dei coefficienti è una matrice invertibile ad elementi in K, cioè appartenente al gruppo
GL(r, K) ed (a10 , . . . , ar0 ) ∈ K r .
Un insieme di punti di Ar che sia sostegno V (F ) di una varietà algebrica V(F ) si chiama anche un insieme
algebrico affine di Ar . La totalità degli insiemi algebrici affini di Ar è chiusa rispetto all’intersezione ed
all’unione, e ciò permette di definire l’intersezione e l’unione di varietà algebriche. Infatti, considerati
due insiemi (finiti) F e G di polinomi di K[Y], si ha:
V (F ) ∩ V (G) = V (F ∪ G)
e
V (F ) ∪ V (G) = V (F G),
ove F G = {f g : f ∈ F ∧ g ∈ G}.
Si noti che ogni iperpiano di Ar è un’ipersuperficie di Ar . Più generalmente, ogni sottospazio di Ar è
(sostegno di) una varietà algebrica di Ar .
E’ opportuno distinguere tra la varietà V(F ) e il suo sostegno V (F ), in quanto la considerazione di F
permette di introdurre la nozione (algebrica) di molteplicità delle ”componenti” di V (F ).
Un insieme algebrico V (F ) di Ar si dice riducibile o irriducibile a seconda che esistano o no due insiemi
algebrici V (F1 ) e V (F2 ) contenuti propriamente in V (F ) tali che V (F ) = V (F1 ) ∪ V (F2 ).
Si può dimostrare che ogni insieme algebrico V (F ) può scriversi in modo unico (a meno dell’ordine)
come unione di un numero finito (diciamo t) di insiemi algebrici irriducibili, V (Fi ), detti le sue componenti
irriducibili:
V (F ) = V (F1 ) ∪ V (F2 ) ∪ · · · ∪ V (Ft ).
Se V = (K ? F, V (F )) è una varietà algebrica, e se V (Fi ) è una componente irriducibile del suo sostegno, la
varietà Vi = (K ? Fi , V (Fi )) si chiama una componente irriducibile di V. Si dimostra che rimane definito
un intero mi , detto la moleplicità di V (Fi ) in V, e che il dato (V (Fi ), mi ) equivale ad una varietà algebrica
V(Gi ), che verrà denotata anche con mi V (Fi ); scriveremo allora:
V = m1 V (F1 ) ∪ m2 V (F2 ) ∪ · · · ∪ mt V (Ft ).
54
In conclusione, ogni varietà algebrica determina, in modo essenzialmente unico, le sue componenti irriducibili, con le relative molteplicità.
6.3.2
Spazio proiettivo Pr (K).
Sia Pr = Pr (K) = (P, S) lo spazio proiettivo numerico r-dimensionale su un campo K (algebricamente chiuso). I punti di Pr sono le (r + 1)-ple omogenee di numeri di K. Ogni tale (r + 1)-pla omogenea
è definita come P (x) = [x] = xK ? , dove x = (x0 , . . . , xr ) è una (r + 1)-pla ordinata di numeri di K
non tutti nulli, chiamati le coordinate proiettive omogenee (c.p.o.) del punto P (x). Si scrive anche
P (x) = (x0 : · · · : xr ), per esprimere che il punto P (x) è determinato dai mutui rapporti delle sue c.p.o. Cosı̀
P = {P (x) : x ∈ K r+1 \ 0. In altri termini i punti P (x) di Pr sono le classi di equivalenza xK ? di vettori non
nulli x dello spazio vettoriale K r+1 . Ciò consente di trasportare allo spazio proiettivo Pr varie nozioni
e risultati riguardanti lo spazio vettoriale K r+1 (come quelle di iperpiano, sottospazio, dimensione,
operazioni reticolari (∩ e ∨) tra sottospazi, formula di Grassmann, rappresentazioni analitiche
di sottospazi e di trasformazioni indotte in Pr da trasformazioni lineari o semilineari di K r+1 , ecc.).
Gli iperpiani di Pr sono i luoghi H dei punti P (x) ∈ P che verificano un’equazione lineare del tipo:
H:
u0 X0 + u1 X1 + · · · + ur Xr = 0,
con (u0 , . . . , ur ) ∈ K r+1 \ 0. Il suddetto iperpiano verrà denotato con H(u), le (u0 : u1 : · · · : ur ) si chiamano
le coordinate plückeriane dell’iperpiano H, e l’equazione di H si scriverà anche in forma compatta
interpretando u e x come vettori colonna ed eseguendo il prodotto righe per colonne (e denotando al solito
con t M la trasposta di una matrice M ):
H:
t
uX = 0.
Più in generale un sottospazio di Pr è un’intersezione di iperpiani, ossia un luogo S dei punti
P (x) ∈ P che verificano un sistema di s ≥ 1 equazioni del tipo:
S:
u10 X0 + u11 X1 + · · · + u1r Xr = 0, . . . , us0 X0 + us1 X1 + · · · + usr Xr = 0.
(5)
Alternativamente, i sottospazi - anziché come intersezioni di iperpiani - si possono definire come generati
da punti, ossia come i sottoinsiemi S ⊆ P dei punti P (x) del tipo
S =< P (x0 ), . . . , P (xk ) >:= {P (x) ∈ P : x = λ0 x0 + λ1 x1 + · · · + λk xk },
dove k ≥ 0 è un intero, P (x0 ), . . . , P (xk ) sono k + 1 punti e la (k + 1)-pla (λ0 , λ1 , . . . , λk ) varia in K k +1
con la condizione che sia λ0 x0 + λ1 x1 + · · · + λk xk 6= 0, cioè in modo tale che P (x) sia un punto di Pr . Un
sottospazio di Pr si dice avere dimensione d, se è generabile da d + 1 punti linearmente indipendenti
P (x0 ), . . . , P (xd ), ovvero, in modo equivalente, se esso è l’intersezione di r − d iperpiani linearmente indipendenti H(u0 ), . . . , H(ur−d−1 ). In quanto precede, l’indipendenza lineare è ben definita da quella dei vettori
x0 , . . . , xd e dei vettori u0 , . . . , ur−d−1 rispettivamente. Un sottospazio di dimensione d di Pr si denota
generalmente con Sd ; in particolare S−1 denota il sottospazio vuoto, S0 denota un punto, S1 una retta,
S2 un piano, . . . , Sr−1 un iperpiano di Pr , ed Sr denota l’intero spazio Pr .
55
Nota bene. Come si è detto, negli spazi proiettivi vale la formula di Grassmann. Da questa si deducono
tutte le proprietà grafiche (cioè di appartenenza) di Pr . In particolare, si dimostrano le seguenti proprietà.
(a) Il sottospazio congiungente Sd ∨ S0 ha dimensione d + 1 se S0 ∈
/ Sd .
(b) Il sottospazio intersezione Sd ∩ Sr−1 ha dimensione d − 1 se l’iperpiano Sr−1 non contiene l’Sd .
Esercizio:
(1) Considerate in Pr due rette sghembe ed un punto fuori di esse, esiste una e una sola retta passante
per il punto ed appoggiata alle due rette.
(1’) Dualizzare la (1).
(2) Sia X un qualunque insieme di sottospazi h-dimensionali di Pr , i quali a due a due si intersechino in
uno spazio (h − 1)-dimensionale. Allora, i sottospazi dell’insieme X o passano tutti per un medesimo spazio
(h − 1)-dimensionale, oppure sono tutti contenuti in un medesimo spazio (h + 1)-dimensionale. (Questa
affermazione si dimostra facilmente quando h = 1 ed il ragionamento utilizzato si estende facilmente).
(2’) Dualizzare la (2).
L’immersione dello spazio affine nello spazio proiettivo, Ar (K) ,→ Pr (K), si realizza assumendo
(y1 , . . . , yr ) 7→ P (1, y1 , . . . , yr ).
In altri termini, i punti di Ar corrispondono a quelli di Pr non appartenenti all’iperpiano di equazione X0 = 0
(detto iperpiano improprio o iperpiano all’infinito di Ar ). Le equazioni del passaggio dalle c.p.o alle
c.a. sono
Y1 = X1 /X0 ,
Y2 = X2 /X0 ,
...,
Yr = Xr /X0 .
(6)
L’iperpiano improprio di Ar è uno spazio proiettivo Pr−1 con le c.p.o. (interne) (X1 : · · · : Xr ). Le
equazioni del sottospazio all’infinito (o improprio) ∞(A) del sottospazio A dato dalle (4) si ottengono omogeneizzando le (4) tramite le (6) e facendo quindi sistema con l’ equazione X0 = 0. Si ottiene dunque
(sull’iperpiano X0 = 0, cioè in coordinate interne):
∞(A) :
u11 X1 + · · · + u1r Xr = 0,
...,
us1 X1 + · · · + usr Xr = 0.
Le equazioni di ∞(A) in Pr si ottengono aggregando l’equazione X0 = 0 alle equazioni precedenti.
Un’ipersuperficie di Pr è una coppia V(f ) = (K ? f, V (f )), dove f = f (X) ∈ K[X] = K[X0 , . . . , Xr ] è
un polinomio omogeneo e dove V (f ), detto il sostegno dell’ipersuperficie, è l’insieme dei punti di Pr che
annullano f :
V (f ) := {[(x0 , . . . , xr )] ∈ P : f (x0 , . . . , xr ) = 0}.
Si dice che V(f ) è l’ipersuperficie definita in Pr dal polinomio f (o dall’equazionef = 0). Il grado di f si
chiama grado o ordine dell’ipersuperficie V(f ).
Il seguente teorema caratterizza le ipersuperfici di una retta affine o proiettiva.
Teorema 30 Le ipersuperfici di una retta affine o proiettiva sono i gruppi finiti di punti; più precisamente,
se il campo è algebricamente chiuso, una ipersuperfice di ordine n della retta è un gruppo di n punti, a patto
di contare ogni punto con la dovuta molteplicittà.
56
Dimostrazione. Sia K un campo algebricamente chiuso. Siano A1 la retta affine e P1 la retta proiettiva
su K. Introduciamo un riferimento proiettivo A0 A1 U su P1 , e consideriamo su A1 il riferimento affine
associato A0 U . Denotiamo con x la coordinata affine e con (x0 , x1 ) le coordinate proiettive omogenee di
punto. Poiché lo spazio ambiente ha dimensione r = 1, i sottospazi di dimensione r − 1 sono quelli di
dimensione zero, ossia gli iperpiani della retta sono tutti e soli i suoi punti. Di fatto un punto P (α) ∈
A1 è l’iperpiano di equazione X − α = 0; inoltre un gruppo finito di n punti {P (α1 ), P (α2 ), . . . , P (αn )}
di A1 è un’ipersuperficie d’ordine n di equazione (X − α1 )(X − α2 ) · · · (X − αn ) = 0. Analogamente un
punto P (a0 , a1 ) ∈ P1 è l’iperpiano di equazione a1 X0 − a0 X1 = 0.
Inversamente, un’ipersuperficie algebrica di ordine n ≥ 1 della retta affine A1 , che dunque si
rappresenta con un’equazione del tipo an X n + · · · + a1 X1 + a0 = 0 a coefficienti in K con an 6= 0, consiste
di un gruppo di n punti perché n sono le radici dell’equazione dal momento che K è algebricamente
chiuso. Si noti che quelle n radici (e quindi anche i corrispondenti punti) non sono necessariamente tutte
distinte tra loro, ma sono da contarsi ciascuna con la dovuta molteplicità.
Mostriamo che analogamente un’ipersuperficie algebrica di ordine n ≥ 1 della retta proiettiva
P1 consiste di un gruppo di n punti (da contarsi con la dovuta molteplicità. Nel caso proiettivo,
l’ipersuperficie si rappresenta con un’equazione omogenea del tipo
an X1n + an−1 X1n−1 X0 + · · · + a1 X1 X0n−1 + a0 X0n = 0
(7)
a coefficienti in K non tutti nulli. Se d è la minima potenza con cui compare la X0 (dove 0 ≤ d ≤ n)
l’equazione si scrive (ordinando secondo le potenze decrescenti di X1 ):
an−d X1n−d X0d + an−d−1 X1n−d−1 X0d+1 + · · · + a1 X1 X0n−1 + a0 X0n =
= Xd0 · (an−d X1n−d + an−d−1 X1n−d−1 X0 + · · · + a1 X1 X0n−d−1 + a0 X0n−d ) = 0,
dove an−d 6= 0; si noti che questa equazione si scrive formalmente come nella (7) se d = 0. Le coppie
omogenee (x0 , x1 ) che sono radici di questa equazione sono quelle che annullano almeno uno dei due fattori
a primo membro; il primo fattore (X0d ) è annullato dalla coppia omogenea (0, 1) che corrisponde al punto
A1 ed è da contarsi con molteplicità d, mentre il secondo fattore non si annulla per X0 = 0 e quindi le
sue soluzioni sono le coppie omogene (x0 , x1 ) che corrispondono alle soluzioni x = x1 /x0 del polinomio non
omogeneo
an−d X n−d + an−d−1 X n−d−1 + · · · + a1 X + a0
dove an−d 6= 0, che sappiamo ammettere n − d soluzioni (a patto di contarle con la dovuta molteplicità).
Questo completa la dimostrazione. Si ha dunque che:
Teorema 31 Un’ipersuperfice della retta affine o proiettiva su un campo K algebricamente chiuso è non
vuota e non invade tutto la retta.
Dimostrazione. Un’ipersuperficie di ordine n ≥ 1 della retta è non vuota perché consiste di un numero
finito n 6= 0 di punti, e non invade tutta la retta perché la retta contiene infiniti punti in quanto il campo K
è infinito essendo algebricamente chiuso (cfr. 5.2.14). Più generalmente si ha il seguente teorema:
57
Teorema 32 Un’ipersuperficie algebrica di uno spazio affine o proiettivo su un campo K algebricamente
chiuso è non vuota e non invade tutto lo spazio
Dimostrazione.
Supponiamo che lo spazio sia proiettivo (in modo analogo si tratta il caso affine).
Sia dunque V (f ) (il sostegno di) un’ipersuperficie d’ordine n ≥ 1 dello spazio proiettivo di dimensione
r ≥ 1, definita da un polinomio omogeneo f (X0 , . . . , Xr ) con coefficienti nel campo K non tutti nulli.
Dobbiamo dimostrare che il polinomio f (X0 , . . . , Xr ) ammette in K uno zero (z0 , . . . , zr ) ed un non-zero
(y0 , . . . , yr ). Dimostriamolo per induzione sulla dimensione r dello spazio. Per r = 1 l’asserto è stato ottenuto
esplicitamente nel Teorema 31. Supponiamo allora r ≥ 2 e supponiamo di aver dimostrato l’asserto per
ipersuperfici di spazi di dimensione minore di r. Scriviamo il polinomio omogeneo f (X0 , . . . , Xr ) ordinandone
i monomi secondo le potenze decrescenti della Xr :
f (X0 , . . . , Xr ) = Xrn φ0 + · · · + Xrn−h φh (X0 , . . . , Xr−1 ) + · · · + Xr φn−1 (X0 , . . . , Xr−1 ) + φn (X0 , . . . , Xr−1 )
dove φh (X0 , . . . , Xr−1 ) è un polinomio omogeneo di grado h nelle r − 1 indeterminate X0 , . . . , Xr−1 , per
h = 0, 1, . . . , n. Poiché i coefficienti di f (X0 , . . . , Xr ) non sono tutti nulli, esiste una φh (X0 , . . . , Xr−1 ) con
coefficienti non tutti nulli, per qualche h = 0, 1, . . . , n. Per ipotesi induttiva esiste un non-zero (y0 , . . . , yr−1)
di φh (X0 , . . . , Xr−1 ). Pertanto il polinomio f (y0 , . . . , yr−1 , Xr ) = Xrn φ0 + · · · + Xrn−h φh (y0 , . . . , yr−1 ) + · · · +
Xr φn−1 (y0 , . . . , yr−1 ) + φn (y0 , . . . , yr−1 ) è un polinomio di grado positivo nella sola indeterminata Xr . Per
la base induttiva questo polinomio ammette uno zero zr ed un non-zero yr . Pertanto (y0 , . . . , yr−1 , zr ) è uno
zero mentre (y0 , . . . , yr−1 , yr ) è un non-zero di f (X0 , . . . , Xr−1 , Xr ). Una varietà algebrica di Pr si definisce come intersezione di ipersuperfici algebriche. In altri termini, per
dare una varietà algebrica dobbiamo assegnare un insieme F di polinomi omogenei (non necessariamente
di un medesimo grado) nelle coordinate correnti dello spazio, e si definisce poi, come varietà definita da
F , la coppia
\
V(F ) = (K ? F, V (F )),
dove
V (F ) =
V (f ),
f ∈F
l’intersezione essendo estesa a tutti i polinomi f di F .
Un insieme di punti di Pr che sia sostegno di una varietà algebrica V(F ) si chiama anche un insieme
algebrico proiettivo di Pr . Come nel caso affine, anche la totalità degli insiemi algebrici proiettivi di Pr
è chiusa rispetto all’intersezione ed all’unione, e ciò permette di definire l’intersezione e l’unione di varietà
algebriche. Infatti, considerati due insiemi (finiti) F e G di polinomi di K[X], si ha:
V (F ) ∩ V (G) = V (F ∪ G)
e
V (F ) ∪ V (G) = V (F G), dove
F G = {f g : f ∈ F, g ∈ G}.
Si noti che l’inclusione V (F ) ∪ V (G) ⊆ V (F G) è banale; viceversa, se P è un punto di V (F G), cioè che
annulla tutti i prodotti f g, e se P non appartiene a V (F ), cioè se P non annulla tutte le f , posto ad esempio
f 0 (P ) 6= 0, allora, poiché P annulla in particolare tutti i prodotti f 0 g, si ha che P annulla tutte le g, cioè P
appartiene a V (G).
Si noti ancora che ogni iperpiano di Pr è un’ipersuperficie di Pr e che, più generalmente, ogni sottospazio
di Pr è (sostegno di) una varietà algebrica di Pr .
E’ opportuno distinguere tra una varietà V(F ) e il suo sostegno V (F ), in quanto la considerazione di F
permette di introdurre la nozione (algebrica) di molteplicità delle ”componenti” di V (F ).
Un insieme algebrico proiettivo V (F ) di Pr si dice riducibile o irriducibile a seconda che esistano o no
due insiemi algebrici proiettivi V (F1 ) e V (F2 ) contenuti propriamente in V (F ) tali che V (F ) = V (F1 )∪V (F2 ).
Si può dimostrare che ogni insieme algebrico proiettivo V (F ) può scriversi in modo unico (a meno
dell’ordine) come unione di un numero finito di insiemi algebrici proiettivi irriducibili, V (Fi ), detti le sue
componenti irriducibili:
V (F ) = V (F1 ) ∪ V (F2 ) ∪ · · · ∪ V (Ft ).
58
Come nel caso affine, anche attualmente, se V(F ) = (F K ? , V (F )) è una varietà algebrica di Pr e se V (Fi ) è
una componente irriducibile del suo sostegno, la varietà V(Fi ) = (Fi K ? , V (Fi )) si chiama una componente
irriducibile di V(F ). Si dimostra ancora che rimane definito un intero mi , detto la molteplicità di V (Fi )
in V(F ), e che il dato (V (Fi ), mi ) equivale ad una varietà algebrica V (Gj ), che verrà denotata anche con
mi V (Fi ); e scriveremo allora:
V(F ) = m1 V (F1 ) ∪ m2 V (F2 ) ∪ · · · ∪ mt V (Ft ).
In conclusione, ogni varietà algebrica di Pr determina, in modo essenzialmente unico, le sue componenti
irriducibili, con le relative molteplicità.
Dimensione di una varietà algebrica. Ordine di una varietà algebrica pura. Vogliamo introdurre le nozioni di dimensione e di ordine di una varietà algebrica di uno spazio proiettivo Pr su un
campo K algebricamente chiuso.
Consideriamo anzitutto il caso di una ipersuperficie. Sia dunque V = (f K ? , V (f )) un’ipersuperficie algebrica di Pr , definita dal polinomio omogeneo f = f (X) ∈ K[X] = K[X0 , . . . , Xr ], di grado n ≥ 1. Si può
dimostrare che V (f ) è non vuota (perché il campo K è algebricamente chiuso) e non invade tutto lo spazio
(perché il campo K è infinito), cfr. Teorema 32.
Dunque esistono punti S0 di Pr non appartenenti a V (f ), ossia ”sghembi con V (f )”; d’altra parte si può
dimostrare che ogni retta S1 di Pr interseca V (f ) in qualche punto (perché K è algebricamente chiuso).
Diremo allora che V (f ) ha dimensione r − 1. Questa definizione è anche in accordo al fatto che, mentre un
punto P (x) dello spazio Pr dipende da r parametri essenziali, un punto di V (f ) dipende da r − 1 parametri
essenziali perché f (x) = 0.
Più precisamente si può dimostrare che la generica retta S1 di Pr (attualmente ogni retta che non sia
contenuta in V (f ) ) interseca V (f ) in un numero finito di punti, numero che uguaglia il grado n di f (X), a
patto di contare ogni punto con un’opportuna molteplicità d’intesezione. Si dice allora che V(f ) ha grado
o ordine n. In altri termini il significato geometrico dell’ordine di un’ipersuperficie è che l’ordine
uguaglia il numero dei punti che l’ipersuperficie ha in comune con la retta generica dello spazio.
Per convincersi di quanto detto dianzi, si considerino due punti distinti P (y) e P (z) della retta S1 . I
punti di S1 si ottengono tutti come i punti P (x) per i quali x = λy + µz, al variare di (λ, µ) ∈ K 2 \ {0, 0)}.
I punti comuni ad S1 ed a V(f ) si ottengono tutti come i punti P (x) con x = λy + µz per i quali (λ, µ) è
soluzione dell’equazione f (λy + µz) = 0; questa equazione - se non svanisce (cioè se la retta non è contenuta
nell’ipersuperficie) - è omogenea di grado n in (λ, µ) e dunque dà luogo ad esattamente n soluzioni omogenee
(λ, µ), a patto di contare ogni soluzione con la sua molteplicità algebrica, cfr. il Teorema 30. Si noti che
questa argomentazione combina il Teorema 30 con quanto espresso dal successivo Teorema della sezione tra
una ipersuperficie ed un sottospazio Sd di Pr (cfr. Teorema 39), nel quale si assuma d = 1.
Più generalmente, sia V(F ) una varietà algebrica di Pr , con K algebricamente chiuso. Diremo che V(F )
ha dimensione d, se esistono sottospazi Sr−d−1 sghembi con V (F ), mentre ogni sottospazio Sr−d ha intersezione non vuota con V (F ). Qui d = 0, 1 . . . , r − 1. Per estensione, il sottospazio vuoto S−1 e tutto lo
spazio ambiente Sr vengono considerati varietà algebriche di dimensione −1 ed r rispettivamente. Si noti
che il concetto di dimensione di V(F ) fa intervenire soltanto il suo sostegno V (F ).
La dimensione di una varietà algebrica riducibile uguaglia evidentemente la dimensione massima delle
sue componenti.
Una varietà algebrica si dice pura se tutte le sue componenti hanno una medesima dimensione. Sia V(F )
una varietà algebrica pura di dimensione d. Si dimostra che il generico sottospazio Sr−d interseca V (F ) in
un numero finito di punti, che è sempre lo stesso (cioè non dipende dal particolare Sr−d considerato, purché
generico), a patto di contare ogni punto di V(F ) ∩ Sr−d con la dovuta molteplicità d’intersezione (in un senso
che si può precisare algebricamente). Tale numero (che dipende non soltanto da V (F ) ma anche da V(F )
perché dipende da F (X)) si chiama l’ordine della varietà algebrica pura V(F ). Si dimostra che l’ordine di
una varietà pura uguaglia la somma degli ordini delle sue componenti.
59
n
Una varietà algebrica (pura) di dimensione d e di ordine n si denota con Vdn . Si dimostra che le Vr−1
di
r
n
P sono tutte e sole le ipersuperfici di ordine n di P e che le V0 sono tutti e soli i gruppi di n punti. Tra
questi due estremi (d = 0, d = r − 1) si hanno le Vdn con d = 1 (che si chiamano curve algebriche d’ordine
n), e quelle con d = 2 (che si chiamano superfici algebriche d’ordine n); si hanno poi tutte le possibili Vdn ,
con 2 < d < r − 1. Inoltre si dimostra che le Vd1 sono tutti e soli i sottospazi Sd .
r
Teorema 33 (Teorema di Bézout negli iperspazi). Sia Pr lo spazio proiettivo r-dimensionale su un
campo K algebricamente chiuso. Allora: r ipersuperfici algebriche di Pr di ordini n1 , n2 , . . . , nr , che non
abbiano infiniti punti in comune, hanno esattamente n1 n2 · · · nr punti in comune, a patto di contare ogni
punto d’intersezione con la ”dovuta” molteplicità d’intersezione. Il numero dei punti distinti è effettivamente
n1 n2 · · · nr se le ipersuperfici sono generiche. Corollario 34 L’intersezione di k ipersuperfici algebriche generiche di Pr di gradi n1 , n2 , . . . ,nk è una
varietà algebrica pura di dimensione r − k e di ordine n1 n2 · · · nk .
Dimostrazione. Si applichi il Teorema di Bézout alle r ipersuperfici date dalle k considerate nel corollario
e da r − k iperpiani generici dello spazio. Deduzione del teorema di Bézout dal principio di conservazione del numero di intersezioni.
Nel caso in cui K = C, il suddetto Teorema 33 (di Bézout) segue dal principio di conservazione del
numero di intersezioni per variazioni continue generiche. Le r ipersuperfici f1 , f2 , . . . , fr si fanno degenerare, per variazione continua generica, in r ipersuperfici g1 , g2 , . . . , gr spezzate in n1 , in n2 , . . . , in nr
iperpiani rispettivamente. Allora g1 ∩ · · · ∩ gr consiste di n1 n2 · · · nr punti, perché, per ogni scelta di un
iperpiano in ciascuna ipersuperfice gi (i = 1, 2, . . . , r), si ottengono r iperpiani indipendenti (perché generici)
e che dunque hanno come intersezione un punto. I punti di f1 ∩ · · · ∩ fr sono altrettanti. Ciò dà anche un
significato dinamico alla molteplicità d’intersezione delle ipersuperfici f1 , f2 , . . . , fr in un loro punto comune.
6.4
Sistemi lineri e sistemi algebrici di ipersuperfici di Pr (K).
Lemma 35 Il numero delle combinazioni con ripetizione di n oggetti di classe k è
n+k−1
k
.
Dimostrazione. Sia X = {1, . . . n} l’insieme degli n oggetti. Sia Y = {1, . . . , n + k − 1}. Per dimostrare
il lemma basta evidentemente stabilire una bijezione f tra l’insieme delle combinazioni con ripetizione di
classe k di elementi di X e l’insieme Yk dei k-sottoinsiemi di Y . Sia A una combinazione con ripetizione di
classe k di elementi di X. Ordiniamo gli elementi di A in ordine non decrescente:
A = (a1 , . . . , ak )
con
1 ≤ a1 ≤ a2 ≤ · · · ≤ ak ≤ n.
Associamo ad A il k-sottoinsieme
Y
f (A) = {a1 , a2 + 1, . . . , ak + k − 1} ∈
;
k
si noti che
1 ≤ a1 < a2 + 1 · · · < ak + k − 1 ≤ n + k − 1.
Ogni B ∈ Yk è del tipo B = f (A) per esattamente una combinazione con ripetizione A di classe k degli n
oggetti di X: infatti, possiamo ordinare gli elementi di B in ordine (strettamente) crescente:
B = {b1 , . . . , bk } con
1 < b1 < · · · < bk ≤ n + k − 1,
e risalire poi alla combinazione A = (a1 , . . . , ak ) assumendo a1 := b1 , a2 := b2 − 1, . . . , ak := bk − k + 1 come
è d’obbligo. 60
Corollario 36 Il numero dei monomi distinti Xi1 Xi2 · · · Xin di grado n in r+1 indeterminate X0 , X1 , . . . , Xr
è:
N +1=
r+n
.
n
Sia ora K un campo algebricamente chiuso. Ogni polinomio f (a; X) ∈ K[X] = K[X0 , X1 , . . . , Xr ], omogeneo
di grado n, si scrive nella forma
X
f (a; X) =
ai1 i2 ...in Xi1 Xi2 · · · Xin ,
(i1 ,i2 ,...,in )
dove la somma è estesa a tutte le combinazioni con ripetizione (i1 , i2 , . . . , in ) di classe n degli r + 1 elementi
di {0, 1, . . . , n}. Pertanto f (a; X), qualora se ne scrivano i monomi in un ordine fissato una volta per
tutte, determina ed è determinato dalla stringa ordinata a = (ai1 i2 ...in ) dei suoi N + 1 coefficienti. Poiché
l’ipersuperficie V(f ) = (K ? f, V (f )) di Pr = Pr (K), d’equazione f (a; X) = 0, determina ed è determinata
dai polinomi λf (a; X) = f (λa; X) proporzionali ad f secondo scalari λ non nulli, si ha che l’ipersuperficie
V(f ) determina ed è determinata dal punto P (a) = P (λa) dello spazio proiettivo numerico N -dimensionale
su K, che denoteremo ora con SN riservando la notazione Pr allo spazio contenente V(f ). Conviene inoltre
denotare con Pd (risp. con Sd ) un sottospazio d-dimensionale di Pr (risp. di SN ).
Questo spazio SN si chiama lo spazio rappresentativo del sistema delle ipersuperfici d’ordine
n di Pr . L’applicazione biunivoca Λ dall’insieme delle ipersuperfici d’ordine n di Pr sull’insieme dei
punti di SN definita da
Λ : V(f ) = V(f (a; X)) 7→ P (a) ∈ SN
si chiama la rappresentazione lineare delle ipersuperfici d’ordine n di Pr coi punti di SN . Per abuso
di linguaggio, diremo anche che SN è lo spazio delle ipersuperfici d’ordine n di Pr . Un insieme T di
ipersuperfici d’ordine n di Pr si chiama un sistema lineare (risp. un sistema algebrico) di ipersuperfici se la sua immagine Λ(T ) tramite la rappresentazione lineare Λ è un sottospazio (risp. una varietà
algebrica) dello spazio rappresentativo SN .
Tutte le nozioni relative ad Λ(T ) in SN si trasportano o si rileggono in Pr relativamente a T . Ad esempio,
due o più ipersuperfici d’ordine n di Pr si dicono (linearmente) dipendenti o indipendenti se tali sono i
punti che le rappresentano in SN . Ed ancora: se Λ(T ) è un sottospazio Sd di SN , si dice che d è la dimensione
del sistema lineare T ; inoltre, se d = 0 (cioè se Λ(T ) è un punto), T è una singola ipersuperficie d’ordine n di
Pr , se d = 1 (cioè se Λ(T ) è una retta) si dice che T è un fascio, mentre se d = 2 (cioè se Λ(T ) è un piano) si
dice che T è una rete. I sistemi lineari di dimensione > 2 non ricevono nomi particolari, ma fra essi hanno
particolare importanza quelli di dimensione N − 1, cioè quei sistemi lineari T tali che Λ(T ) è un iperpiano di
SN . Tutte le ipersuperfici d’ordine n di Pr costituiscono il sistema lineare completo delle ipersuperfici
d’ordine n di Pr . Evidentemente un insieme T di ipersuperfici d’ordine n di Pr è un sistema lineare se e
soltanto se T contiene il fascio generato da due sue qualunque ipersuperfici distinte. Inoltre, se Λ(T ) è una
varietà algebrica Vdn di SN , si dice che d ed n sono la dimensione e l’ordine del sistema algebrico T .
Un sistema lineare d-dimensionale T di ipersuperfici d’ordine n di Pr è individuato quando se ne conoscano
d+1 ipersuperfici indipendenti. Se queste hanno equazione rispettivamente f (0) = 0, . . . , f (d) = 0, scriveremo
T =< f (0) , . . . , f (d) >. Se a(j) è la stringa dei coefficienti di f (j) , cioè se f (j) = f (a(j) ; X), j = 0, . . . , d, le
equazioni delle ipersuperfici date si scrivono esplicitamente come
f (a(0) ; X) = 0,
f (a(1) ; X) = 0,
...,
f (a(d) ; X) = 0,
e le ipersuperfici del sistema T da esse generato sono quelle aventi equazione del tipo
λ0 f (a(0) ; X) + λ1 f (a(1) ; X) + · · · + λd f (a(d) ; X) = 0,
cioè del tipo
f (a; X) = 0
con a = λ0 a(0) + λ1 a(1) + · · · + λd a(d) ,
61
al variare di (λ0 , λ1 , . . . , λd ) ∈ K d+1 \ {(0, . . . , 0)}.
La varietà base di un sistema lineare T =< f (0) , . . . , f (d) > di ipersuperfici d’ordine n di Pr è la varietà
algebrica V di Pr intersezione di tutte le ipersuperfici di T . Per ottenere V basta evidentemente considerare
l’intersezione delle ipersuperfici f (0) , . . . , f (d) che generano T , ossia, posto F = {f (0) , . . . , f (d) }, si ha:
V = (F K ? , V (F )),
dove
V (F )
ha equazioni :
f (0) = 0, . . . , f (d) = 0.
Un punto base di T è per definizione un punto di Pr appartenente alla varietà base di T , ossia un punto
comune a tutte le ipersuperfici del sistema T .
Consideriamo i seguenti esempi di sistemi lineari di ipersuperfici di ordine n di Pr .
Per n = 1, si ha che ogni ipersuperficie V(f ) è un iperpiano di Pr e la totalità delle V(f ) è il sistema
lineare totale degli iperpiani di Pr . Infatti, attualmente a è la stringa u delle coordinate plückeriane
dell’iperpiano d’equazione f (u; X) = u0 X0 + · · · + ur Xr = 0; si ha N = r e lo spazio rappresentativo SN
è lo spazio duale di Pr . In questo caso, i sistemi lineari sono i sistemi lineari di iperpiani; ricordiamo
che (Teorema della stella di iperpiani ) ogni stella d’iperpiani Σ(Sd ) di centro un sottospazio di
dimensione d di Pr è un sistema lineare d’iperpiani di Pr di dimensione r − d − 1, Σr − d − 1,
e viceversa41 . La varietà base di un sistema lineare d’iperpiani Σd = Σ(Sr−d−1 ) di Pr è il centro Sr−d−1
della stella.
Diamo ora un esempio di sistema algebrico di iperpiani di Pr . La totalità T degli iperpiani t u · X = 0
tangenti ad una quadrica non singolare di Pr avente equazione t XAX = 0 è un sistema algebrico di dimensione
r − 1 e di ordine 2 costituito da ipersuperfici aventi grado n = 1: tale sistema algebrico si rappresenta nello
2
spazio Σr duale di Pr con la quadrica Vr−1
avente equazione t u ·t A−1 · u = 0.
Per r = 1, lo spazio Pr = P1 è la retta proiettiva; ogni ipersuperficie V(f ) d’ordine n di P1 è un
gruppo di n punti della retta ed è N = n. In questo caso un sistema lineare di dimensione d si chiama
tradizionalmente una serie lineare gdn di gruppi di n punti (nella scrittura gdn , oltre alla dimensione d si
mette in evidenza il grado n, ma si ricordi che il sistema è lineare ossia, come sistema algebrico, ha ordine
1). In particolare gnn è la serie lineare completa dei gruppi di n punti della retta.
Per r = 2, lo spazio Pr =P2 è il piano proiettivo; ogni ipersuperficie V(f ) d’ordine n di P2 è una curva
piana d’ordine n ed è N = n(n + 3)/2. Cosı̀ la totalità delle coniche è un sistema lineare di dimensione 5,
la totalità delle cubiche piane un sistema lineare di dimensione 9, ecc.
Per r = 3, lo spazio Pr è lo spazio proiettivo 3-dimensionale; ogni ipersuperficie V(f ) d’ordine n di P3 è
una superficie d’ordine n e si trova N = n(n2 + 6n + 11)/6.
Per n = 2 ed r = 1, 2, 3, . . . si ha il sistema lineare completo delle quadriche di Pr che ha dimensione
N = r(r + 3)/2. In particolare, per r = 1 si ritrova la serie completa g22 ; per r = 2 si ritrova il sistema
completo S5 delle coniche; per r = 3 si trova il sistema completo S9 delle quadriche di P3 ; ecc.
Nota bene.
Nel seguito, indicheremo con Pr lo spazio proiettivo di partennza (nel quale cioè si
considerano le ipersuperfici di fissato ordine n) e con Pk un qualunque sottospazio k-dimensionale di Pr ,
41 Per la dimostrazione si noti che il sottospazio S =< A0 , A1 , . . . , Ad > (dove Aj = P (δ , δ , . . . , δ ), j ∈ {0, 1, . . . , d} sono
0j 1j
rj
d
i d + 1 punti fondamentali di Pr indicati) ha equazioni Xd+1 = Xd+2 = · · · = Xr = 0 e che la totalità Σ(Sd ) degli iperpiani che
contengono Sd coincide con quella degli iperpiani del sistema lineare di equazione ud+1 Xd+1 + ud+2 Xd+2 + · · · + ur Xr = 0, che
è un sistema lineare Σr−d−1 perché generato da r − d iperpiani indipendenti (che sono gli iperpiani fondamentali di equazione
Xd+1 = 0, Xd+2 = 0, . . . , Xr = 0 rispettivamente). Ebbene, previo un cambiamento di riferimento nello spazio Pr o nel
suo duale Σr , non è restrittivo supporre che il sottospazio Sd sia quello generato dai punti fondamentali indicati, o, per la
parte inversa, che il sistema lineare Σr−d−1 sia quello generato dagli iperpiani fondamentali indicati. Si noti anche che si sta
applicando la proprietà che un iperpiano di equazione u0 X0 + u1 X1 + · · · + ur Xr = 0 contiene un punto fondamentale As di
Pr sse us = 0.
62
k = −1, 0, 1, . . . , r. Per abuso di linguaggio, indicheremo poi con lo stesso simbolo SN tanto lo spazio rappresentativo delle ipersuperfici d’ordine n di Pr quanto la totalità di quelle ipersuperfici. Conseguentemente
indicheremo con lo stesso simbolo Sd tanto un sottospazio d-dimensionale di SN quanto il sistema lineare di
ipersuperfici che l’Sd rappresenta.
Lemma 37 Sia Sd un sistema lineare di dimensione d di ipersuperfici d’ordine n di Pr . Se P ∈ Pr non
è un punto base di Sd , le ipersuperfici di Sd che passano per P costituiscono un sistema lineare Sd−1 , di
dimensione d − 1.
Dimostrazione. Sia P = P (z), z = (z0 , z1 , . . . , zr ). Le ipersuperfici d’ordine n di Pr che passano per P (z)
sono quelle la cui stringa a dei coefficienti (che sono le c.p.o. di punto in SN ), soddisfano alla f (a; z) = 0.
Questa è una condizione lineare per le ai1 i2 ...in , ossia rappresenta un iperpiano SN −1 che denoteremo con Lz
e che in SN ha equazione:
Lz :
f (a; z) =
X
ai1 i2 ...in zi1 zi2 · · · zin = 0.
(i1 ,i2 ,...,in )
Attualmente Sd non è contenuto nell’iperpiano Lz , perché P (z) non è un punto base di Sd . Pertanto
Sd ∩ Lz = Sd ∩ SN −1 è un sottospazio (d − 1)-dimensionale di SN , Nota bene. Riprenderemo in seguito le considerazioni sviluppate nella dimostrazione del Lemma 37,
perché esse sono alla base della importante nozione di immagine proiettiva di un sistema lineare di
ipersuperfici.
Con riferimento all’enunciato del Lemma 37, diremo che il punto P stacca il sistema Sd−1 dal sistema
Sd , o che il sistema Sd−1 è quello staccato da P in Sd .
Corollario 38 (Significato geometrico della dimensione di un sistema lineare). Sia Sd un sistema
lineare di dimensione d di ipersuperfici d’ ordine n di Pr . Il significato di d è che per d punti generici di
Pr passa esattamente un’ipersuperficie del sistema Sd .
In particolare: per N punti generici di Pr passa esattamente un’ipersuperficie d’ordine n di Pr .
Dimostrazione. Consideriamo d punti P1 , . . . , Pd scelti in modo generico in Pr , e precisamente in
modo tale che nessuno appartenga alla varietà base del sistema lineare delle ipersuperfici di Sd passanti per
i punti precedentemente scelti: P1 sia scelto fuori della varietà base del sistema lineare Sd assegnato; P2 sia
scelto fuori della varietà base del sistema lineare Sd−1 staccato da P1 in Sd ; P3 sia scelto fuori della varietà
base del sistema lineare Sd−2 staccato da P2 in Sd−1 ; . . . ; Pd sia scelto fuori della varietà base del sistema
lineare S1 staccato da Pd−1 in S2 . L’imposizione del passaggio per Pd conduce ad un sistema lineare S0
cioè ad una unica ipersuperficie, che è dunque l’unica ipersuperficie del sistema Sd che passi per i punti
P1 , . . . , Pd .
In particolare, applicando questo risultato al sistema lineare completo SN di tutte le ipersuperfici d’ordine
n di Pr (ossia per d = N ), si ottiene l’ultima affermazione. Esercizi. (1) Verificare il contenuto del Corollario nel caso particolare che sia n = 1, cioè illustrando il
significato della dimensione di un sistema lineare d’iperpiani di Pr .
(2) Per cinque punti generici di P2 passa una e una sola conica. Qui ”generici” significa che quattro
qualunque fra questi punti non sono allineati.
(3) Per cinque punti generici di P2 passa una e una sola conica non singolare. Qui ”generici” significa
63
che tre qualunque fra questi punti non sono allineati.
(4) Per nove punti generici di P2 passa una e una sola cubica.
(5) Quattro punti generici di P2 sono punti base di un fascio generico di coniche. Viceversa, un fascio
generico di coniche ha come varietà base un gruppo di quattro punti generici del piano.
(6) Otto punti generici di P2 sono punti base di un fascio generico di cubiche.
(7) (Paradosso di Cramer) Un fascio generico di cubiche di P2 ha come varietà base un gruppo di
nove punti generici del piano. Pertanto, per quei nove punti passano tutte le cubiche del fascio, ma ciò
contraddice (4). (Soluzione: Non è vero che un fascio generico di cubiche di P2 ha come varietà base un
gruppo di nove punti generici del piano: soltanto un qualunque gruppo di otto fra quei punti consiste di
punti generici, perché il nono punto è determinato da quegli otto come ulteriore punto base del fascio di
cubiche passanti per essi).
Teorema 39 (Teorema della sezione per le ipersuperfici) L’intersezione di un’ipersuperficie di Pr con
un sottospazio Pk non contenuto nell’ipersuperficie è un’ipersuperficie, dello stesso ordine, del sottospazio Pk .
Dimostrazione. Poiché le nozioni che intervengono nell’enunciato del teorema sono invarianti per cambiamenti di c.p.o. in Pr , non è restrittivo supporre di aver scelto in Pr un riferimento proiettivo in modo tale
che il sottospazio Pk sia un sottospazio coordinato, diciamo quello di equazioni:
Pk :
Xk+1 = 0,
Xk+2 = 0,
...,
Xr = 0;
supponiamo poi che l’ipersuperficie abbia equazione (di grado diciamo n):
V(f ) :
f (X0 , X1 , . . . , Xk , Xk+1 , . . . , Xr ) = 0.
L’intersezione Pk ∩ V(f ) si rappresenta in Pr con il sistema:
Pk ∩ V(f ) :
Xk+1 = 0,
Xk+2 = 0, . . .
, Xr = 0;
f (X0 , X1 , . . . , Xk , 0, . . . , 0) = 0,
e si rappresenta in Pk (in coordinate interne) con la sola equazione
Pk ∩ V(f ) :
f (X0 , X1 , . . . , Xk , 0, . . . , 0) = 0.
Il primo membro di questa è un polinomio - non nullo, perché Pk non è contenuto in V(f ) - omogeneo dello
stesso grado n nelle coordinate di Pk , e dunque rappresenta un’ipersuperficie d’ordine n di Pk . Teorema 40 (Teorema della sezione per i sistemi lineari. L’intersezione di un sistema lineare Sd di
ipersuperfici d’ordine n di Pr con un sottospazio Pk è un sistema lineare d’ipersuperfici d’ordine n di Pk .
Tale sistema lineare ha dimensione d − t, dove t è il massimo numero delle ipersuperfici indipendenti di Sd
che contengono Pk .
Dimostrazione. Poiché le nozioni che intervengono nell’enunciato del teorema sono invarianti per cambiamenti di c.p.o. in Pr , non è restrittivo supporre di aver scelto in Pr un riferimento proiettivo in modo tale
che il sottospazio Pk sia un sottospazio coordinato, diciamo quello di equazioni:
64
Pk :
Xk+1 = 0,
Xk+2 = 0,
...,
Xr = 0.
Il sistema Sd sarà generato da d + 1 ipersuperfici (indipendenti) di equazione f (j) (X) = 0, j = 0, . . . , d,
dove possiamo supporre che le ultime t fra queste (quelle con j = d−t+1, . . . , d), ma nessuna delle rimanenti,
contengano Pk . L’equazione di una qualunque ipersuperfice del sistema Sd è del tipo
V(f ) ∈ Sd :
λ0 f (0) (X) + λ1 f (1) (X) + · · · + λd f (d) (X) = 0,
dove (λ0 , λ1 , . . . , λd ) ∈ K d+1 \ {(0, . . . , 0)}. Al variare delle λ si ottegono tutte e sole le ipersuperfici del
sistema Sd .
L’intersezione Pk ∩ V(f ) di Pk con ciascuna V(f ) ∈ Sd si rappresenta in Pr con il sistema:
Pk ∩ V(f ) :
d
X
λj f (j) (X0 , . . . , Xk , 0, . . . , 0) = 0,
Xk+1 = 0,
Xk+2 = 0, . . . , Xr = 0,
j=0
e si rappresenta in Pk (in coordinate interne) con la sola equazione
k
P ∩ V(f ) :
d
X
λj f (j) (X0 , . . . , Xk , 0, . . . , 0) = 0.
j=0
Per ciascuna scelta delle λ non tutte nulle, il primo membro è un polinomio - non nullo, perché altrimenti
si troverebbe in Sd una V(f ), indipendente dalle V(f (d−t+1) ), . . . , V(f (d) ) e contenente Pk - omogeneo di grado
n nelle coordinate di Pk e che dunque rappresenta un’ipersuperficie d’ordine n di Pk . Al variare delle λ si
ha dunque un sistema lineare di ipersuperfici d’ordine n di Pk , il quale ha dimensione d−t, perché - per quanto
detto poc’anzi - i polinomi f (0) (X0 , . . . , Xk , 0, . . . , 0), f (1) (X0 , . . . , Xk , 0, . . . , 0), . . . , f (d−t) (X0 , . . . , Xk , 0, . . . , 0)
sono linearmente indipendenti. Esercizio. Rivisitare la dimostrazione del teorema precedente alla luce del teorema fondamentale di
omomorfismo tra spazi vettoriali. Suggerimento: si consideri l’omomorfismo
K[X0 , X1 , . . . , Xr ] → K[X0 , X1 , . . . , Xk , 0, . . . , 0] : f (X0 , X1 , . . . , Xr ) 7→ f (X0 , X1 , . . . , Xk , 0, . . . , 0).
7
Naturalezza degli spazi di dimensione superiore
Abbiamo ora gli elementi per illustrare come sia del tutto naturale considerare spazi di dimensione superiore.
Vedremo infatti (n. 7.1) che quando si studia la totalità delle rette di un P3 (K), di fatto si sta studiando
una ipersuperficie quadrica V42 di uno spazio P5 (K) (la quadrica di Klein). Inoltre, sappiamo già che le
coniche di P2 (K) costituiscono uno spazio P5 (K); dunque studiando la totalità delle coniche ci si muove volenti o nolenti - in P5 (K). Vedremo poi (n. 7.2) che lo studio delle coniche singolari equivale allo studio di
una ipersuperficie algebrica V43 di P5 (K), e che la totalità delle coniche doppiamente singolari corrisponde
ad una superficie V24 (la superficie di Veronese) contenuta nella V43 . Vedremo anche come la superficie
2
di Veronese V24 (legata alle coniche) sia un caso particolare della superficie di Veronese V2n (legata alle
r
curve piane di ordine n qualunque) e, ancor più generalmente, della varietà di Veronese Vrn (legata alle
ipersuperfici d’ordine n di un Pr (K)).
65
7.1
La geometria della retta di P3 (K) e la quadrica di Klein V42
Consideriamo lo spazio P3 = P3 (K). Sappiamo che ogni punto di P3 ha le sue c.p.o. di punto, (x0 , x1 , x2 , x3 ),
e che ogni piano di P3 ha le sue coordinate plükeriane d’iperpiano, (u0 , u1 , u2 , u3 ). Vogliamo ora attribuire
coordinate proiettive anche a ciascura retta di P3 .
Denotiamo con G(1, 3) l’insieme delle rette di P3 . Consideriamo una retta qualunque S1 ∈ G(1, 3),
individuata da due suoi punti distinti qualunque P (x) e P (y). La matrice delle c.p.o. dei due punti:
x0
y0
x1
y1
x2
y2
x3
y3
ha rango 2 perché i due punti sono distinti. Pertanto, in tale matrice, sono non tutti nulli i seguenti minori
del second’ordine:
p01 = x0 y1 − y0 x1 ,
p02 = x0 y2 − y0 x2 ,
p03 = x0 y3 − y0 x3 ,
p23 = x2 y3 − y2 x3 ,
p31 = x3 y1 − y3 x1 ,
p12 = x1 y2 − y1 x2 .
La suddetta sestupla p=p(x,y)=(p01 , p02 , p03 , p23 , p31 , p12 ) ∈ K 6 \ 0 determina un punto P (p) dello
spazio P5 (K). Verificheremo ora che questo punto P (p) dipende soltanto dalla retta S1 e non dipende
né dalla scelta dei punti P (x) e P (y) su S1 né dai loro rispettivi rappresentanti x e y; ne seguirà che
le (p01 , p02 , p03 , p23 , p31 , p12 ) si possono assumere come coordinate proiettive della retta S1 , che vengono
chiamate le coordinate plückeriane (o grassmanniane) della retta. Per la verifica anzidetta, basta
osservare che se λ, µ ∈ K \ {0} e se P (z) è un qualunque altro punto di S1 con z = λx + µy, si ha:
p(λx, µy) = λµp(x, y),
p(z,y)=p(λx + µy, y) = λp(x, y) + µp(y, y) = λp(x, y) + 0 = λp(x, y),
p(x,z)=p(x,λx+µy) =λp(x,x)+µp(x, y) = 0 + µp(x, y) = µp(x, y).
Possiamo dunque dire che abbiamo definito un’applicazione dall’insieme G(1, r) delle rette di P3 (K)
all’insieme dei punti di P5 (K):
G(1, r) → P5 (K) : S1 (p) 7→ P (p),
che chiameremo mappa di Klein: ad una qualunque retta S1 di P3 (K), avente coordinate plükeriane date
da p = (p01 , p02 , p03 , p23 , p31 , p12 ), resta associato il punto P (p) di P5 (K); questo punto non è un punto
qualunque di P5 (K), ma è obbligato ad appartenere alla quadrica V42 di P5 (K), chiamata la quadrica di
Klein, di equazione:
V42 : f (p) = p01 p23 + p02 p31 + p03 p12 = 0,
come si ha subito sviluppando il determinante nullo della matrice

x0
 y0

 x0
y0
x1
y1
x1
y1
x2
y2
x2
y2
66

x3
y3 

x3 
y3
secondo i minori del secondo ordine delle prime due righe42
La mappa di Klein è surgettiva sulla quadrica di Klein, cioè ogni punto P (p) ∈ V42 è immagine di
una retta S1 = S1 (p) di P3 (K). Sia dunque p = (p01 , p02 , p03 , p23 , p31 , p12 ) ∈ K 6 \ {0} tale che f (p) = 0.
Per fissare le idee, sia ad es. p01 6= 0. Consideriamo in P3 (K) i due punti distinti P (x’) e P (y’), con
x’ = (0, p01 , p02 , p03 ) e y’ = (−p01 , 0, p12 , −p31 ). Verifichiamo che la retta S1 per i due punti P (x’) e
P (y’) ha coordinate p(x’,y’) uguali o proporzionali alla sestupla (p01 , p02 , p03 , p23 , p31 , p12 ). Calcoliamo
p(x’,y’) := (p001 , p002 , p003 , p023 , p031 , p012 ) tramite la matrice delle c.p.o. di x’ e di y’:
0
−p01
p01
0
p02
p12
p03
−p31
Si trova: p001 = p01 p01 , p002 = p01 p02 , p003 = p01 p03 , p031 = p01 p31 , p012 = p01 p12 , e finalmente p023 = −p02 p31 −
p12 p03 = p01 p23 in forza della f (p) = 0. In conclusione p(x’,y’) = p01 (p01 , p02 , p03 , p23 , p31 , p12 ), come
asserito.
Mostriamo ora che la mappa di Klein è iniettiva. Siano S1 = XY ed S10 = X 0 Y 0 due rette di P3 (K)
(individuate dai punti indicati: X = P (x), ecc. ) aventi le loro coordinate plükeriane di retta proporzionali,
anzi uguali (come è sempre possibile supporre disponendo del fattore di proporzionalità insito nelle c.p.o.
del punto X): p = p0 = (p01 , p02 , p03 , p23 , p31 , p12 ), dove sia ad es. p01 6= 0. Dobbiamo dimostrare che
S1 = S10 .
Nota bene. Per semplicità di scrittura, conviene effettuare il seguente abuso di notazione: denotiamo
con lo stesso simbolo X sia il punto P (x) sia il vettore x ∈ K 4 che lo rappresenta, e similmente per gli altri
punti Y, X 0 , Y 0 ecc. In particolare, se λ.µ ∈ K, la scrittura λX + µY indica il punto P (λx + µy).
Mostriamo anzitutto che è possibile sostituire i punti X 0 ed Y 0 di S10 con altri due punti X ? = aX 0 + bY 0 e
Y = cX 0 +dY 0 (dunque anche essi appartenenti ad S10 !) in modo che sia x?0 = x0 , x?1 = x1 e y0? = y0 , y1? = y1 .
Basta infatti risolvere in (a, b) ed in (c, d) rispettivamente i sistemi di Cramer:
?
x0 = ax00 + by00 ,
x1 = ax01 + by10
y0 = cx00 + dy00 ,
e
y1 = cx01 + dy10 .
Con questa scelta dei punti, la matrice corrispondente alla retta S1 = XY è:
x0 x1 x2 x3
y0 y1 y2 y3
e la matrice corrispondente alla retta S10 = X ? Y ? è
x0 x1
y0 y1
x?2
y2?
x?3
y3?
.
Queste matrici hanno uguali le prime due colonne; ma anche le ultime due colonne sono uguali: infatti
(x2 , y2 ) = (x?2 , y2? ) è l’unica soluzione del sistema di Cramer nelle incognite (X2 , Y2 ):
p02 = x0 Y2 − y0 X2 ,
p12 = x1 Y2 − y1 X2 ,
e (x3 , y3 ) = (x?3 , y3? ) è l’unica soluzione del sistema di Cramer nelle incognite (X3 , Y3 ):
p03 = x0 Y3 − y0 X3 ,
p31 = X3 y1 − Y3 x1 .
42 Si noti che tale sviluppo conduce alla 2f (p) = 0, da cui si deduce subito f (p) = 0 se il campo K ha caratteristica =
6 2.
D’altra parte poiché la f (p) = 0 vale dunque in caratteristica zero, essa appare come una identità nelle indeterminate xi e yj ,
e pertanto vale anche in caratteristica 2.
67
Pertanto x = x? , y = y? e quindi X = X ? , Y = Y ? , e cosı̀ S1 = XY = X ? Y ? = S10 .
In conclusione: la mappa di Klein è biunivoca tra l’insieme delle rette di P3 (K) e l’insieme dei
punti della quadrica di Klein V42 . Dunque l’insieme delle rette di P3 (K) ”è” - in senso astratto - una
quadrica dello spazio P5 (K) (la quadrica di Klein).
Vediamo ora come la ”geometria della retta ” in P3 (K) si rifletta nella geometria della quadrica di Klein.
Consideriamo, oltre alla forma quadratica che definisce la quadrica di Klein:
f (p) = p01 p23 + p02 p31 + p03 p12 = 0,
anche la forma bilineare associata
f (p,q) = p01 q23 + p02 q31 + p03 q12 + q01 p23 + q02 p31 + q03 p12 .
Lemma 41 (Condizione d’incidenza). Due rette di P3 (K), aventi rispettivamente coordinate plükeriane
p e q, sono incidenti sse f (p,q) = 0.
Dimostrazione. Siano XY e ZT due rette di P3 (K). Sia X = X(x), . . . , T = T (t), con p = p(x,y) =
(p01 , p02 , p03 , p23 , p31 , p12 ) e q = q(z,t) = (q01 , q02 , q03 , q23 , q31 , q12 ). Le due rette sono incidenti sse i punti
X, Y, Z, T appartengono ad un piano, cioè sse i vettori x, y, z, t sono dipendenti, cioè sse la matrice

x0
 y0

 z0
t0
x1
y1
z1
t1
x2
y2
z2
t2

x3
y3 

z3 
t3
ha determinante nullo. Tale determinante è proprio f (p,q), come si vede calcolandolo secondo i minori del
secondo ordine delle prime due righe. Teorema 42 La mappa di Klein trasforma le rette di ciascun fascio di P3 (K) nei punti di una retta giacente
sulla quadrica di Klein. Viceversa, ogni retta giacente sulla quadrica di Klein è immagine di un fascio di
rette di P3 (K).
Dimostrazione. Sia S2 un piano di P3 (K) e sia F un fascio di rette di S2 con centro in un punto X(x).
Siano S10 ed S100 due rette distinte del fascio F , e siano Y 0 (y0 ) ed Y ”(y00 ) due loro rispettivi punti distinti da
X. Tutte e sole le rette di F sono le rette XY con Y (y) ∈ Y 0 Y ”. (Il Lettore faccia un disegno.) Posto che
sia y = ay0 + by00 , le coordinate plükeriane pik di XY si esprimono tramite le p0ik di XY 0 e le p00ik di XY 00
con la stessa coppia (a, b) di parametri, ossia nel modo seguente:
pik = ap0ik + bp00ik
vale a dire
p = ap0 + bp00
Infatti:

xi
xk
pik = 


=
yi
yk
xi
ayi0
+

xk
byi00
ayk0
+
byk00

 = a
68
xi
xk
yi0
yk0


 + b
xi
xk
yi00
yk00

 = ap0ik + bp”ik
ossia:
p = p(x, y) = p(x, ay0 + by00 ) = ap(x, y0 ) + bp(x, y00 ) = ap0 + bp00
e ciò dimostra la prima affermazione. Tornerà utile la seguente
Osservazione. Al variare dei parametri (a, b) si trovano tutti i punti Y = aY 0 + bY 00 della retta Y 0 Y 00
di S2 e tutte le rette XY = S1 (p = ap0 + bp00 ) del fascio di centro X di S2 generato dalle rette XY 0 (p0 ) e
XY 00 (p00 ), ovverosia tutti i punti della retta di P5 (K) passante per i punti P (p0 ) e P (p00 ).
Mostriamo ora che, viceversa, ogni retta di P5 (K) giacente sulla quadrica di Klein è immagine di
un fascio di rette di P5 (K). Si consideri dunque sulla quadrica di Klein V42 una qualunque retta T1 e due
punti distinti P (p0 ) e P (p00 ) di T1 . Per la biunivocità della mappa di Klein, questi due punti sono immagini
di due rette S10 (p0 ) e S100 (p00 ) di P3 (K) le quali sono incidenti (e dunque individuano un fascio F di rette), in
virtù del Lemma 41, perché f (p0 , p00 ) = 0 in quanto:
(∀a, b ∈ K \ {0}) P(ap0 + bp00 ) ∈ T1 ⊆ V42 =⇒
(∀a, b ∈ K \{0}) 0 = f (ap0 +bp00 ) = a2 f (p0 )+b2 f (p00 )+abf (p0 , p00 ) = 0+0+abf (p0 , p00 ) =⇒ f (p0 , p00 ) = 0.
Per quanto osservato, i punti P (p) = P (ap0 + bp00 ) della retta T1 corrispondono biunivocamente alle
rette S1 (p) =S1 (p = ap0 + bp00 ) del fascio F individuato dalle due rette incidenti S10 (p0 ) e S100 (p00 ) , e questo
dimostra che il fascio F è la controimmagine completa della retta T1 . Dimostriamo ora che:
Teorema 43 (1) La mappa di Klein trasforma ciascuna stella di rette di P3 (K) in un piano giacente sulla
quadrica di Klein (piano di tipo σ).
(2) La mappa di Klein trasforma ciascun piano rigato di P3 (K) in un piano giacente sulla quadrica di Klein
(piano di tipo ρ).
(3) Viceversa, ogni piano giacente sulla quadrica di Klein è immagine completa di una stella di rette oppure
di un piano rigato di P3 (K), ossia è un piano di tipo σ oppure un piano di tipo ρ.
Dimostrazione. (1) Sia Σ una stella di rette di P3 (K). Sia X(x) il centro di Σ, siano S10 , S100 , S1000
tre rette non complarari di Σ, sia S2 un piano non contenente X, e siano Y 0 (y0 ), Y 00 (y00 ), Y 000 ((y000 ) i punti
(necessariamente non allineati) in cui quelle tre rette rispettivamente incontrano S2 . Tutte e sole le rette di
Σ sono le rette XY con Y ∈ S2 . (Il Lettore faccia un disegno.)
Posto che sia y = ay0 + by00 + cy000 , le coordinate plükeriane pik della retta XY variabile in Σ si esprimono
000
nel modo seguente:
tramite le p0ik di XY 0 , le p00ik di XY 00 e le p000
ik di XY
pik = ap0ik + bp00ik + cp000
ik ,
ossia
p(x, y) = p(x, ay0 + by00 + cy000 ) = ap(x, y0 ) + bp(x, y00 ) + cp(x, y000 )
e ciò dimostra la (1).
(2) Sia S2 un piano di P3 (K). Siano X 0 , X 00 , X 000 tre punti non allineati di S2 e siano p0ik , p00ik e p000
ik le
coordinate plükeriane delle rette X 00 X 000 , X 0 X 000 , X 0 X 00 rispettivamente. Una qualunque retta S1 del piano
S2 incontra il trilatero X 0 X 00 X 000 in almeno due punti distinti, siano questi Y 0 ed Y 00 , con ad es. Y 0 ∈ X 00 X 000
ed Y 00 ∈ X 0 X 000 . (Il Lettore faccia un disegno.)
Posto che sia y0 = a0 x00 + b0 x000 ed y00 = a00 x0 + b00 x000 , le coordinate plükeriane pik di S1 = Y 0 Y 00 si
esprimono tramite le p0i k, le p00ik e le p000
ik nel modo seguente:
69
pik = a0 a00 p0ik + b0 a00 p00ik + a0 b00 p000
ik
avendosi:

pik = 
yi0
yk0
yi00
yk00


=
a0 x00i + b0 x000
i
a0 x00k + b0 x000
k
a00 x0i + b00 x000
i
a00 x0k + b00 x000
k

,
ossia:
p(y0 , y00 ) = p(a0 x00 + b0 x000 , a00 x0 + b00 x000 ) = a0 a00 p(x00 , x0 ) + a0 b00 p(x00 , x000 ) + b0 a00 p(x000 , x0 )
(essendo b0 b00 p(x000 , x000 ) = b0 b00 · 0 = 0). Ciò dimostra la (2).
(3) Sia T2 un qualunque piano giacente sulla quadrica di Klein V42 . Due punti distinti qualunque di T2
sono congiunti da una retta T1 contenuta in T2 e quindi nella V42 . La retta T1 è immagine di un fascio di
rette di P3 (K) (Teorema 42), e quindi quei due punti sono immagini di due rette incidenti di P3 (K). In
conclusione l’immagine inversa di T2 è un insieme di rette a due a due incidenti di P3 (K), e pertanto
è contenuta in una stella di rette o in un piano rigato di P3 (K)43 . Nel primo caso le rette della stella
corrispondono biunivocamente (per (1) ) ai punti di un piano di tipo σ che evidentemente coincide con T2 ;
nel secondo caso le rette del piano rigato corrispondono biunivocamente (per (2) ) ai punti di un piano di tipo
ρ che evidentemente coincide con T2 . Dunque, in ogni caso, un qualunque piano T2 giacente sulla quadrica
di Klein è un piano di tipo σ oppure un piano di tipo ρ. A norma del punto (3) del Teorema 43, i piani sulla quadrica di Klein si distribuiscono, come si dice, in
due sistemi disgiunti: il sistema dei piani di tipo σ e quello dei piani di tipo ρ.
Teorema 44 Consideriamo due piani distinti giacenti sulla quadrica di Klein. Se essi appartengono allo
stesso sistema, s’intersecano esattamente in un punto.
Se invece appartengono a sistemi diversi, s’intersecano secondo una retta o non hanno alcun punto in
comune.
Dimostrazione. Sappiamo che, sulla quadrica di Klein V42 , i piani di tipo σ rappresentano le stelle di
rette di P3 (K), ed i piani di tipo ρ rappresentano i piani rigati di P3 (K).
Due stelle distinte di rette di P3 (K) hanno in comune esattamente una retta; lo stesso dicasi per due
piani rigati distinti di P3 (K); questa retta di P3 (K) si rappresenta con un punto di V42 .
Invece, una stella di rette ed un piano rigato di P3 (K) non hanno alcuna retta in comune oppure hanno
un fascio di rette in comune, a seconda che il centro della stella appartenga al piano; questo fascio di rette
di P3 (K) si rappresenta con una retta di V42 . 7.2
La superficie di Veronese.
Consideriamo la totalità delle coniche del piano P2 = P2 (K) coordinatizzato su un campo K algebricamente
chiuso di caratteristica 6= 2. L’equazione di una conica verrà scritta come:
43 Se le rette non passano tutte per uno stesso punto, ne esistono tre che formano un trilatero; questo determina un piano che
contiene anche tutte le altre rette dell’insieme, perché ciascuna di esse contiene almeno due punti distinti del trilatero e quindi
del piano.
70
f (a;X) = a00 X02 + a11 X12 + a22 X22 + 2a01 X0 X1 + 2a02 X0 X2 + 2a12 X1 X2 = 0.
La matrice della conica è la matrice simmetrica

a00 a01 a02


A = (aik) = 
 a10 a11 a12

a20 a21 a22






(con aij = aji ).
Gli eventuali punti singolari (doppi) della conica sono i punti che annullano il sistema delle derivate parziali
prime di f (a;X), cioè il sistema AX = 0. Una conica è non singolare, cioè è priva di punti doppi, sse la sua
matrice ha rango rank(A) = 3, ossia sse det(A) 6= 0. Una conica è singolare sse det(A) = 0; una conica
singolare è necessariamente spezzata in due rette; queste sono distinte sse rank(A) = 2 (e la conica dicesi
semplicemente degenere), mentre sono coincidenti sse rank(A) = 1 (e la conica dicesi doppiamente
degenere).
Consideriamo ora lo spazio S5 = S5 (K), rappresentativo del sistema lineare completo delle
coniche di P2 (K). Rappresentiamo la conica d’equazione f (a;X) = 0 con il punto44
P (a) = P (a00 , a01 , a02 , a11 , a12 , a22 )
di
S5 .
Per quanto detto dianzi, abbiamo in S5 la varietà V43 rappresentativa delle coniche singolari, di
equazione:
V43 :
F (a) = det(aik) = 0,
che è evidentemente un’ipersuperficie irriducibile d’ordine 3. In S5 abbiamo inoltre la varietà V24 (contenuta
nella V43 ) rappresentativa delle coniche doppiamente degeneri, che prende il nome di superficie di
Veronese, le cui equazioni si ottengono annullando i minori d’ordine 2 della matrice A. Si vede facilmente
che la condizione che siano nulli tutti i minori d’ordine 2 di A può essere equivalentemente espressa con la
condizione che siano nulli tre opportuni di essi: utilizzeremo i seguenti minori per la definizione di V24 :
V24 :
a00 a11 − a210 = 0,
a11 a22 − a221 = 0,
a01 a22 − a21 a02 = 0,
equazioni queste che costituiscono le equazioni cartesiane della V24 . Si tratta effettivamente di una varietà
algebrica di dimensione 2, perché l’appartenenza alla varietà è caratterizzata da tre condizioni algebriche
indipendenti per le coordinate di un punto di S5 , ed ogni condizione abbassa di un’unità la dimensione.
Vedremo poi che la varietà ha ordine 4.
Sia P = P (z), con z = (z0 , z1 , z2 ), un punto di P2 . Le coniche di P2 che passano per P (z) sono quelle
la cui stringa a dei coefficienti (che è la stringa delle c.p.o. del corrispondente punto in S5 ), soddisfa alla
f (a;z)) = 0. Questa è una condizione lineare per le aik , ossia rappresenta in S5 un iperpiano S4 che
denoteremo con Lz :
X
Lz :
f (a;z)) =
aik zi zk = 0.
Scriviamo l’equazione del più generale iperpiano S4 di S5 nella forma
X
aik αik = 0;
denotiamo cioè con αik la coordinata plükeriana che - nell’equazione dell’iperpiano S4 - è coefficiente della
coordinata aik di punto. Gli iperpiani di S5 formano una totalità lineare di dimensione 5: lo spazio duale
44 In questo caso si usa assumere, come coordinata corrispondente ad un monomio del tipo 2a X X , il numero a
ij i j
ij anziché
il numero 2aij , il che equivale ad effettuare nello spazio rappresentativo S5 una sostituzione linere invertibile sulle coordinate
di punto con matrice diagonale ad elementi 1 e 2.
71
Σ5 di S5 , nel quale le αik sono c.p.o. di punto. Gli iperpiani di tipo Lz , al variare del P (z) in P2 , formano
una totalità T di dimensione 2, perché in corrispondenza biunivoca e algebrica coi punti di P2 . Tale
totalità è un insieme di iperpiani di S5 , cioè di punti di Σ5 , e si chiama l’immagine proiettiva del sistema
lineare delle coniche. Vogliamo provare che l’immagine proiettiva del sistema lineare delle coniche
si identifica con la superficie di Veronese V24 . I coefficienti dell’equazione dell’iperpiano Lz (coordinate
del punto Lz di Σ5 ) sono: αik = zi zk . Le equazioni parametriche di:
T = {Lz ∈ Σ5 : P (z) ∈ P2
sono dunque:
T :
α00 = z02 , α01 = 2z0 z1 , α02 = 2z0 z2 , α11 = z12 , α12 = 2z1 z2 , α22 = z22
(z ∈ K 3 \ {0}).
D’altra parte, la superficie di Veronese V24 è stata definita come l’insieme dei punti P (a) ∈ S5 rappresentativi di coniche doppiamente degeneri, ossia del tipo
(u0 X0 + u1 X1 + u2 X2 )2 = 0;
sviluppando il quadrato, si trova dunque che la totalità dei punti P (a) ∈ V24 ha equazioni parametriche:
V24 :
a00 = u20 , a01 = u0 u1 , a02 = u0 u2 , a11 = u21 , a12 = u1 u2 , a22 = u22
(u ∈ K 3 \ {0})
che - a parte il nome delle coordinate e dei parametri - si identificano proiettivamente alle equazioni parametriche di T : basta effettuare una trasformazione diagonale tra le αij e le aij con coefficienti 1 oppure 2 in
quanto l’identificazione dei parametri zk coi parametri uk porta alla α00 = a00 , alla α01 = 2a01 , e cosı̀ via.
Appurato cosı̀ che T ' V24 , verifichiamo che l’ordine della superficie di Veronese è proprio 4 come
abbiamo indicato senza dimostrazione. A tal fine usiamo la definizione di V24 come immagine proiettiva:
V24 = {Lz ∈ Σ5 : P (z) ∈ P2 }.
L’ordine di questa varietà è, per definizione, il numero dei punti che essa ha in comune con un generico Σ3
(infatti: 3 = dimensione dello spazio − dimensione della varietà = 5 − 2). Attualmente (per il Teorema della
stella d’iperpiani 45 ) Σ3 è una stella generica Σ(S1 ) di iperpiani di S5 di centro una retta generica S1 di S5 ;
questa retta S1 dello spazio rappresentativo è un fascio generico F di coniche di P2 . Pertanto:
ordine(V24 ) =| {Lz ∈ Σ5 : P (z) ∈ P2 , Lz ∈ Σ3 } |=| {Lz ∈ Σ5 : P (z) ∈ P2 , Lz ⊇ S1 } |=
= | {Lz ∈ Σ5 : P (z) ∈ P2 , ogni conica di F passa per P (z)} |=
=| {P (z) ∈ P2 : ogni conica di F passa per P (z)} |=
| {P (z) ∈ P2 : P (z) è un punto base di F |=
= 4 (per il teor. di Bézout, stante la genericità di F).
Una terza definizione possibile della superficie di Veronese V24 (come luogo dei punti doppi
della V43 ) viene fornita dal seguente teorema:
Teorema 45 La superficie di Veronese V24 è il luogo dei punti multipli (doppi) della ipersuperficie V43 di S5
rappresentiva delle coniche singolari di P2 .
45 Il Teorema della stella di iperpiani afferma che: Ogni stella Σ(S ) di iperpiani di uno spazio Pr , di centro un S di Pr , è
d
d
un sistema lineare Σr−d−1 di iperpiani; viceversa ogni sistema lineare Σr−d−1 di iperpiani di Pr è una stella di iperpiani di
centro un Sd di Pr ; cfr. nota n. 41.
72
Dimostrazione. Ricordiamo che la V43 ha in S5 equazione:

V43
:
a00


F (a) = det(A) = det 
 a10

a20
a02

a11
a12


 = 0.


a21
a22
a01
Il luogo dei punti multipli di V43 è il luogo degli zeri P (a) del sistema delle derivate parziali prime di F :
∂F
= a11 a22 − a212 ,
∂a00
∂F
= 2(a10 a22 − a20 a12 ),
∂a01
...,
∂F
= a00 a11 − a201 .
∂a22
e questo è il luogo dei punti P (a) che annullano tutti i minori del secondo ordine della matrice A, cioè è la
superficie di Veronese, luogo V24 dei punti di S5 che rappresentano le coniche doppiamente singolari di P2 .
Quanto precede termina la dimostrazione del teorema, notando da ultimo che tutti i punti multipli di V43
sono punti doppi, e non di molteplicità maggiore, perché il sistema delle derivate seconde di F (a) non ha
autosoluzioni, perché tra quelle derivate seconde ritroviamo (a parte un fattore 2) tutte le coordinate correnti
a00 , a01 , a02 , a11 , a12 , a22 . 7.2.1
Comportamento delle rette di S5 rispetto alla V43 ed alla V24 : coniche degeneri di un
fascio.
Ricordiamo che una retta dello spazio S5 , rappresentativo delle coniche di P2 (K), è un fascio di coniche,
e che le varietà V43 e V24 (la superficie di Veronese) sono le totalità delle coniche degeneri e delle coniche
doppiamente degeneri rispettivamente; si ha dunque
V24 ⊆ V43 ⊆ S5 .
Inoltre la V24 è il luogo dei punti doppi di V43 ed ogni punto di V43 \ V24 è un punto semplice. Poiché
l’ipersuperficie V43 ha ordine tre, ogni retta di S5 interseca V43 in tre punti (a patto di contarli con la
dovuta molteplicità d’intersezione), oppure giace per intero sulla V43 ; in altri termini, un fascio di coniche
contiene tre coniche degeneri (a patto di contarle con la dovuta molteplicità) oppure tutte le sue
coniche sono degeneri.
Il Lettore effettui dei disegni che illustrino i seguenti esempi di fasci di coniche.
1. Fascio generico di coniche. Ha 4 punti base distinti A, B, C, D e contiene tre coniche semplicemente
degeneri: AB ∪ CD, AC ∪ BD, AD ∪ BC.
2. Fascio di coniche tangenti in A = B. Ha 3 punti base distinti, A = B, C, D e contiene due coniche
semplicemente degeneri: AB ∪ CD, AC ∪ BD = AD ∪ BC, dove AB indica la comune tangente in A = B e
la seconda conica è contata due volte. (La retta di S5 che rappresenta il fascio è tangente alla V43 nel punto
semplice che rappresenta la seconda conica).
3. Fascio di coniche bitangenti in A = B ed in C = D. Ha 2 punti base distinti, A = B, C = D
e contiene una conica semplicemente degenere, la AB ∪ CD, e una conica doppiamente degenere, la AC 2
contata due volte (è un punto doppio di V43 ).
4. Fascio di coniche osculantisi in A = B = C. Ha 2 punti base distinti, A = B = C, D, e contiene
una conica semplicemente degenere, la AB ∪ CD contata tre volte. (La retta che rappresenta il fascio è
73
ipertangente alla V43 nel punto semplice che rappresenta quella conica).
5. Fascio di coniche iperosculantisi in A = B = C = D. Ha un solo punto base, A = B = C = D,
e contiene una conica doppiamente degenere, la AB 2 contata tre volte; la retta che rappresenta il fascio è
tangente alla V43 nel punto doppio che rappresenta quella conica.
6. Fascio di tutte coniche degeneri che condividono una componente, costituito da una retta
fissa r e da una retta s variabile in un fascio di rette di centro un punto P . Indicheremo tale fascio di coniche
con
λ(r, P );
poniamo inoltre
Λ1 = {λ(r, P ) : P è un punto ed r è una retta di P2 }.
Evidentemente il fascio λ(r, P ) contiene o non contiene una conica doppiamente degenere (che è necessariamente la r2 ) a seconda che sia P ∈ r oppure P ∈
/ r; la retta che rappresenta il fascio è contenuta nella V43
4
ed è tangente alla V2 nel primo caso.
Analiticamente: sia r(x) = 0 l’equazione della retta r e sia λs1 (x) + µs2 (x) = 0 l’equazione della retta
variabile nel fascio di rette, generato da due rette s1 e s2 passanti per P . L’equazione della conica variabile
nel fascio di coniche tutte degeneri è
λ(r, P ) : r(x)[λs1 (x) + µs2 (x)] = 0, cioè λ[r(x)s1 (x)] + µ[r(x)s2 (x)] = 0.
7. Fascio di tutte coniche degeneri che condividono il punto doppio, costituito da coppie di
rette appartenenti ad uno stesso fascio di centro un punto P . Il fascio è individuato da P e da due coniche
degeneri, r1 ∪ s1 ed r2 ∪ s2 , con P = r1 ∩ s1 = r2 ∩ s2 e pertanto verrà indicato con
λ(P, r1 s1 , r2 s2 );
poniamo inoltre
Λ2 = {λ(P, r1 s1 , r2 s2 ) : P = r1 ∩ s1 = r2 ∩ s2 }.
In questo caso il fascio contiene esattamente due coniche doppiamente degeneri. La retta che rappresenta il
fascio è contenuta nella V43 ed bisecante la V24 .
Esempio: Fascio di coniche generato dalla conica f1,0 di equazione X02 = 0 e dalla conica f0,1 di
equazione X12 = 0. Le coniche del fascio sono le coniche
fλ,µ ;
λX02 − µX12 = 0
(λ, µ) 6= (0, 0)
tutte degeneri perché
fλ,µ ;
√
√
√
√
λX02 − µX12 = ( λX0 + µX1 )( λX0 − µX1 ) = 0.
Il fascio non contiene
coniche doppiamente degeneri diverse
f1,0 ed f0,1 perché se λ 6= 0 e µ 6= 0,
√
√ dalle coniche
√
√
allora la retta λX0 + µX1 = 0 è distinta dalla retta λX0 − µX1 = 0.
Lemma 46 . Ogni retta S1 di S5 che abbia due punti in comune con la superficie di Veronese V24 giace per
intero sulla V43 . Inoltre una retta S1 di S5 ha al più due punti in comune con V24 . Pertanto i punti di V24
sono a tre a tre non allineati. Ne segue che la V24 non contiene rette.
Dimostrazione. Si tratta di provare che se un fascio di coniche di P2 contiene due coniche distinte doppiamente degeneri, allora ogni altra conica del fascio è degenere ma non è doppiamente degenere. In effetti,
74
non è restrittivo supporre che le due coniche doppiamente degeneri siano le coniche di equazione X02 = 0 e
X12 = 0 rispettivamente, e sviluppare l’argomento svolto nell’Esempio di cui sopra. Dimostriamo ora che i soli casi di fasci di tutte coniche degeneri sono quelli detti in 6 e 7.
Teorema 47 (Classificazione dei fasci di tutte coniche degeneri). Sia F un fascio di coniche, tutte
degeneri, di P2 . Allora necessariamente si verifica uno dei due casi seguenti:
(1) Le coniche di F condividono una componente, ossia F è un fascio di coniche con una componente
fissa e l’altra variabile in un fascio di rette.
(2) Le coniche di F condividono il punto doppio, ossia F è un fascio di coniche spezzate in due rette per
un punto fissato.
Dimostrazione. Per il Lemma 46, F ha al più due coniche doppiamente degeneri. Pertanto F è generabile
da due coniche semplicemente degeneri: f1 = r1 ∪ s1 , f2 = r2 ∪ s2 , dove dunque r1 6= s1 e r2 6= s2 .
Se f1 ed f2 condividono una componente, ad es. r1 = r2 = r, questa è anche componente di ogni altra
conica f = λf1 + µf2 di F , e siamo nel caso (1).
Se f1 ed f2 condividono il punto doppio, cioè se r1 ∩ s1 = r2 ∩ s2 = P , allora P è punto doppio per ogni
f ∈ F (perché in P si annullano le derivate parziali prime di f , in quanto vi si annullano quelle di f1 e di
f2 ) e dunque ogni f ∈ F si spezza in due rette per P , e siamo nel caso (2).
Supponiamo che f1 ed f2 non condividano il punto doppio, cioè che sia P1 = r1 ∩ s1 6= r2 ∩ s1 = P2 .
Evidentemente si hanno soltanto le seguenti tre possibilità:
P2 ∈ r1 ∪ s1 ,
P1 ∈ r2 ∪ s2 ,
(P2 ∈
/ r1 ∪ s1 ) ∧ (P1 ∈
/ r2 ∪ s2 ).
(Il Lettore effettui figure corrispondenti ai tre casi suddetti). Nei primi due casi si hanno tre punti base
non allineati, il trilatero dei quali è formato da componenti di f1 e di f2 . Una terza conica f3 di F si spezza
in due rette, una delle quali necessariamente è un lato del trilatero, ad es. s2 . Pertanto f3 ed f2 condividono
una componente e dunque F =< f2 , f3 > è del tipo (1). Il terzo caso non può verificarsi. Infatti nel terzo
caso i punti base formano un quadrangolo ed esistono soltanto tre coniche degeneri per tali quattro punti.
7.2.2
Comportamento dei piani di S5 rispetto alla V43 ed alla V24 : coniche degeneri di una rete.
Ricordiamo ancora una volta che i piani dello spazio S5 rappresentativo delle coniche di P2 = P2 (K) sono
le reti di coniche di P2 e che le varietà V43 e V24 (la superficie di Veronese) sono le totalità delle coniche
degeneri e delle coniche doppiamente degeneri rispettivamente e che inoltre la V24 è il luogo dei punti doppi
di V34 , cosicché ogni punto di V43 \ V24 è un punto semplice.
Un piano di S5 contenuto in V43 rappresenta evidentemente una rete di coniche di P2 tutte degeneri.
Il primo sistema Π1 di piani sulla V43 . (Reti di coniche con componente comune). Se tre
coniche di P2 indipendenti (cioè non formanti fascio) f1 , f2 , f3 sono degeneri e condividono una componente
comune r, fatto che esprimeremo usando una notazione compatta e semplificata del tipo:
f1 = rs1 ,
f2 = rs2 ,
f3 = rs3 ,
allora ogni conica
f = λ1 f1 + λ2 f2 + λ3 f3 = r(λ1 s1 + lλ2 s2 + λ3 s3 )
75
della rete < f1 , f2 , f3 > è degenere e condivide quella componente, mentre la sua componente residua
λ1 s1 + λ2 s2 + λ3 s3 descrive tutte le rette di P2 perché le rette s1 , s2 , s3 sono indipendenti (tali essendo le
f1 , f2 , f3 ).
Denotiamo con π(r) il piano di S5 , contenuto in V43 , che rappresenta la rete delle coniche degeneri che
condividono la componente r:
π(r) = {rs ∈ V43 : s retta di P2 },
e denotiamo con
Π1 = {π(r) : r retta di P2 }
la totalità dei piani cosı̀ ottenuti su V43 al variare della retta r in P2 .
Il secondo sistema Π2 di piani sulla V43 . (Reti di coniche che condividono il punto doppio).
Se tre coniche di P2 indipendenti f1 , f2 , f3 sono semplicemente degeneri e condividono il punto doppio P :
f1 = r1 s1 ,
f2 = r2 s2 ,
f3 = r3 s3 ,
r1 ∩ s1 = r2 ∩ s2 = r3 ∩ s3 = P,
allora ogni conica
f = λ1 f1 + λ2 f2 + λ3 f3 = λ1 (r1 s1 ) + λ2 (r2 s2 ) + λ3 (r3 s3 )
della rete < f1 , f2 , f3 > ha P come punto doppio (perché in P si annullano tutte le derivate parziali di
f1 , f2 , f3 e quindi quelle di f ) ed è dunque degenere in due rette contenenti P , cioè f = rs con P ∈ r, s (ove
può anche essere r = s).
Viceversa una qualunque coppia di rette r, s contenenti P è tale che f = rs sia combinazione lineare delle
f1 , f2 , f3 . Infatti, da un punto di vista astratto, il fascio di rette di P2 di centro P è (nel piano duale di P2 )
una retta S1 ed ogni coppia di rette per P è una coppia di punti di S1 (quadrica di S1 ); pertanto la totalità
delle coppie di rette per P è la totalità delle quadriche di S1 e quindi costituisce uno spazio proiettivo di
dimensione N = N (r, n) = N (1, 2) = 2 (in effetti è la serie lineare completa g22 dei gruppi di 2 punti di
S1 ), ossia è un ”piano proiettivo”, cosicché ogni suo punto f è generabile linearmente dai suoi tre punti
indipendenti f1 , f2 , f3 .
Denotiamo con π(P ) il piano di S5 , contenuto in V43 , che rappresenta la rete delle coniche degeneri di P2
che condividono il punto doppio P :
π(P ) = {rs ∈ V43 : P ∈ r, s},
e denotiamo con
Π2 = {π(P ) : P punto di P2 }
la totalità dei piani cosı̀ ottenuti su V43 al variare del punto P in P2 .
Teorema 48 . (Classificazione delle reti di tutte coniche degeneri). Sia π un piano di S5 contenuto
in V43 . Allora π ∈ Π1 oppure π ∈ Π2 . In altri termini: una rete di coniche tutte degeneri di P2 è costituita
da tutte le coniche spezzate in una retta fissa ed in una retta qualunque del piano, oppure da tutte le coniche
spezzate in due rette per uno stesso punto.
Dimostrazione. Consideriamo π generato da tre suoi punti non allineati, f1 , f2 , f3 . Su ogni lato di tale
triangolo esistono al più due punti di V24 (per il Lemma 46), onde non è restrittivo supporre che ogni fi
corrisponda ad una conica semplicemente degenere. Ciascuno dei tre lati di quel triangolo è una retta,
necessariamente appartenente a Λ1 (ossia è un fascio di coniche con componente comune) oppure a Λ2 (ossia
76
è un fascio di coniche con punto doppio comune), cfr. Teorema 47.
Se in π esistono tre punti non allineati corrispondenti a tre coniche (degeneri) di P2 che condividono una
componente r, allora ogni punto di π corrisponde ad una conica di P2 che condivide la componente r, e
quindi π ∈ Π1 .
Supponiamo allora che, per qualunque triangolo di π, i suoi tre vertici f1 , f2 , f3 corrispondano a coniche
che non condividono una componente. Si possono presentare tre casi . Il Lettore faccia un disegno del
triangolo, segnando ciascun vertice f del triangolo (e analogamente segnando ogni altro punto nominato in
ciò che segue) come ’prodotto’ f = ab delle due rette che vengano indicate come componenti della conica f .
Se (almeno) due lati, ad es. f1 f2 ed f1 f3 , appartengono a Λ2 , allora f1 condivide il punto doppio sia con
f2 sia con f3 , cosicché f1 , f2 ed f3 condividono fra loro il punto doppio, e quindi π ∈ Π2 .
Se un solo lato, ad es. f1 f3 , appartiene a Λ2 , mentre f1 f2 ed f2 f3 appartengono a Λ1 , possiamo assumere
intanto f1 = rs, f2 = rt. Poiché f2 f3 ∈ Λ1 , una componente di f3 deve essere r oppure t, ma non può essere
r perché f1 , f2 ed f3 non condividono una componente, e dunque una componente di f3 deve essere t con
t 6= r. Sia dunque f1 = rs, f2 = rt, f3 = ht con t 6= r.
Possiamo assumere f4 ∈< f2 , f3 >, con f4 = kt, k 6= r. Allora π =< f1 , f4 , f3 > ed è π ∈ Π2 . perché il
trilatero generatore ha i due lati f1 f3 ed f1 f4 appartenenti a Λ2 .
Se infine tutti i lati appartengono a Λ1 , allora le coniche f1 , f2 ed f3 condividono a due a due una
componente comune, che tuttavia non può essere comune a tutte e tre; pertanto si può supporre che sia ad
es. f1 = rt, f2 = rs, f3 = st.
Possiamo assumere:
f4 ∈< f1 , f3 >, con f4 = ht, h 6= s,
f5 ∈< f2 , f3 >, con f5 = sv, v 6= r.
Allora π =< f1 , f4 , f5 > ed attualmente il trilatero generatore ha i due lati f1 f5 ed f4 f5 in Λ2 e quindi
π ∈ Π2 per quanto visto. Ciò completa la dimostrazione. Teorema 49 Consideriamo i due sistemi Π1 e Π2 di piani contenuti sulla V43 .
(1) Per ogni punto di V43 \ V24 passano esattamente due piani di Π1 (che si intersecano esattamente in
quel punto) ed esattamente un piano di Π2 . Inoltre due piani distinti di Π1 si intersecano in esattamente un
punto di V43 \ V24 ; due piani distinti di P2 s’intersecano in esattamente un punto di V24 ; un piano di Π1 ed
un piano di Π2 non hanno punti in comune oppure hanno esattamente una retta in comune.
(2) Per ogni punto di V24 passa un unico piano di Π1 ed ∞1 piani di P i2 .
(3) Ogni piano di Π1 è tangente a V24 .
(4) Ogni piano di Π2 interseca V24 secondo una conica non singolare.
(5) Detto Γ = {π ∩ V24 : π ∈ Π2 } l’insieme delle coniche segate sulla V24 dai piani di Π2 , si ha che (V42 , Γ)
è un piano proiettivo.
Dimostrazione. Denotiamo con r, s due rette qualunque e con P, Q due punti qualunque di P2 . Allora:
(1) Si ha:
(r 6= s) rs ∈ V43 \ V24 ⇒ rs ∈ π(r) ∈ Π1 , rs ∈ π(s) ∈ Π1 , {rs} = π(r) ∩ π(s), rs ∈ π(r ∩ s) ∈ Π2 .
Si ha poi:
π(P ) 6= π(Q) ⇒ P 6= Q ⇒ π(P ) ∩ π(Q) = (P Q)2 ∈ V24 .
Inoltre:
π(r) ∩ π(P ) = ∅ se
P ∈
/ r,
π(r) ∩ π(P ) = {rs : s 3 P } se
mentre
(2). Infatti:
rr ∈ V24 ⇒ [(rr ∈ π(r) ∈ Π1 ) ∧ (∀P ∈ r : rr ∈ π(P ) ∈ Π2 )].
77
P ∈ r.
(3). Infatti:
π ∈ Π1 , π = π(r) ∈ Π1 ⇒ π ∩ V24 = {rr}.
(4). Infatti, sia
π ∈ Π2 , con π = π(P ) = {rs : r ed s rette di P2 passanti per P },
Non è restrittivo assumere P = A0 (1, 0, 0). Posto poi
r:
u1 X1 + u2 X2 = 0,
s:
v1 X1 + v2 X2 = 0,
si ha
rs :
(u1 X1 + u2 X2 )(v1 X1 + v2 X2 ) = u1 v1 X12 + (u1 v2 + u2 v1 )X1 X2 + u2 v2 X22 = 0),
ossia
a11 X12 + a12 X1 X2 + a22 X22 = 0,
π(P ) :
dove
a11 = u1 v1 ,
a12 = u1 v2 + u2 v1 ,
a22 = u2 v2 .
(8)
Il piano π(P ) ha equazioni cartesiane in S5 :
a00 = 0,
a01 = 0,
a02 = 0.
(9)
Le coordinate del punto rs variabile in π(P ) sono:
a00 = 0,
a01 = 0,
a02 = 0,
a11 = u1 v1 ,
a12 = u1 v2 + u2 v1 ,
a22 = u2 v2 .46
(10)
I punti di π(P ) ∩ V24 si ottengono ponendo r = s (cioè u1 = v1 , u2 = v2 , ) in tutto quanto precede; dalla (10)
si ha allora:
π(P ) ∩ V24 = {(0, 0, 0, u21 , 2u1 u2 , u22 ) : (u1 , u2 ) ∈ K \ {(0, 0}.
Questa formula dice che - nelle coordinate interne (a11 , a12 , a22 ) del piano π(P ) che ha equazioni (9) - il
luogo π(P ) ∩ V24 ha equazioni parametriche a11 = u21 , a12 = 2u1 u2 , a22 = u22 , ossia ha equazione cartesiana
4a11 a22 − a212 = 0,
che è l’equazione di una conica non singolare, come asserito.
(5) Siano r2 ed s2 punti distinti di V24 . Allora π = π(r ∩ s) è l’unico piano di Π2 che li contiene, cosicché
π ∩ V24 è l’unica conica di Γ per quei due punti. Siano ora C e C 0 due coniche distinte appartenenti a Γ. Sia
C = π ∩ V24 e C 0 = π 0 ∩ V24 , con π, π 0 ∈ Π2 . Allora π = π(P ), π 0 = π(Q) per opportuni punti P, Q di P2 ; si
ha allora C ∩ C 0 = π ∩ π 0 = (P Q)2 che è un punto di V24 . Infine, evidentemente, ogni conica contiene almeno
tre punti, e ciò completa la dimostrazione. 7.3
r
Veronesiana Vrn delle ipersuperfici d’ordine n di Pr (K).
La superficie di Veronese V24 - rappresentativa in S5 del sistema algebrico delle coniche doppiamente degeneri,
o, se si preferisce, immagine proiettiva (nel duale Σ5 di S5 ) del sistema lineare completo delle coniche di
r
P2 (K) - è caso particolare (r = n = 2) della varietà di Veronese Vrn .
46 Viceversa, ogni punto P (0, 0, 0, a , a , a ) del piano di S avente in S equazioni cartesiane (9) è immagine di una (unica)
11 12 22
5
5
conica rs della rete π(P ): ciò è evidente a priori in virtù delle proprietà della rappresentazione lineare delle coniche di P2 coi
punti di S5 ; a conferma di ciò si noti che il sistema (8) è univocamente risolubile nelle coppie omogenee (u1 , u2 ) e (v1 , v2 ).
78
Questa varietà verrà ora introdotta sia come la varietà rappresentativa in SN del sistema algebrico delle
ipersuperfici d’ordine n di Pr (K). spezzate in n iperpiani coincidenti, sia, equivalentemente, come immagine
proiettiva (nel duale ΣN di SN ) del sistema lineare completo delle ipersuperfici d’ordine n di Pr (K). In
2
particolare (r = 2) si ha la superficie veronesiana V2n delle curve piane d’ordine n.
Consideriamo lo spazio proiettivo Pr = Pr (K) di dimensione r sul campo K (algebricamente chiuso), ed
indichiamo con X = (X0 , X1 , . . . , Xr ) le c.p.o. di punto in Pr .
Sia SN lo spazio rappresentativo delle ipersuperfici f d’ordine n di Pr . Scriviamo l’equazione della più
generale ipersuperficie f nella forma
X
f:
f (a; X) =
as0 s1 ...sr X0s0 X1s1 · · · Xrsr = 0,
s0 +s1 +···+sr =n
dove la somma è estesa a tutte le soluzioni in interi non negativi dell’equazione diofantea:
s0 + s1 + · · · + sr = n,
e dove conveniamo di scrivere i monomi in un ordine stabilito una volta per tutte. Sappiamo che il numero
dei coefficienti di f (a; X), ossia il numero delle soluzioni (s0 , s1 . . . , sr ) di tale equazione diofantea, è
r+n
N +1=
n
e che l’ipersuperficie f si rappresenta come il punto P (a) dello spazio SN .
Conveniamo di scrivere l’equazione di un iperpiano di Pr nella forma
r
X
ui Xi = 0
i=0
e l’equazione di un iperpiano di SN nella forma
X
as0 s1 ...sr αs0 s1 ...sr = 0.
s0 +s1 +···+sr =n
Indichiamo con ΣN lo spazio duale di SN . Le coordinate di punto in ΣN sono le coordinate plükeriane
d’iperpiano αs0 s1 ...sr in SN .
Sia ora P = P (z), z = (z0 , z1 , . . . , zr ) un punto di Pr . Le ipersuperfici d’ordine n di P r che passano per
P (z) sono quelle la cui stringa a dei coefficienti, soddisfa alla f (a; X) = 0. Questa è una condizione lineare
per le as0 s1 ...sr , ossia rappresenta un iperpiano SN −1 che denoteremo con Lz :
X
Lz :
f (a; z) =
as0 s1 ...sr z0s0 z1s1 · · · zrsr = 0.
s0 +s1 +···+sr =n
Questo iperpiano Lz ha coordinate plükeriane
Lz :
αs0 s1 ...sr = z0s0 z1s1 · · · zrsr , con (z0 , z1 , . . . , zr ) ∈ K r+1 \ {0}).
(11)
Gli iperpiani di tipo Lz (al variare di P (z) in Pr ) formano in ΣN una varietà algebrica Vr di dimensione
r, perché gli Lz sono in corrispondenza biunivoca e algebrica coi punti di Pr ), corrispondenza esplicitata
nelle precedenti equazioni parametriche di Vr nei parametri zi . Tale varietà Vr :
Vr = {Lz ∈ ΣN : P (z) ∈ Pr )} ⊆ ΣN .
79
si chiama la immagine proiettiva del sistema lineare completo47 delle ipersuperfici d’ordine n di Pr , e
prende il nome di varietà di Veronese delle ipersuperfici d’ordine n di Pr .
r
Vogliamo ora provare che l’ordine di questa varietà di Veronese Vr è nr , ossia che la varietà è una Vrn .
Per definizione, l’ordine della varietà di Veronese Vr ⊆ ΣN è il numero dei punti che essa ha in comune
con un generico ΣN −r : attualmente (per il Teorema della stella di iperpiani ) ΣN −r = Σ(Sr−1 ) è una stella
generica di iperpiani di SN di centro un generico sottospazio Sr−1 di SN ; questo Sr−1 è (rappresenta) un
generico sistema lineare (r − 1)-dimensionale di ipersuperfici d’ordine n di Pr , e come tale è generato da r
ipersuperfici generiche - f1 , f2 , . . . , fr - d’ordine n di Pr , ed ha come varietà base l’intersezione di queste r
ipersuperfici, cioè un gruppo di nr punti in virtù del teorema di Bézout (Teorema 33). Riassumendo:
ordine(Vr ) =| {Lz ∈ ΣN : P (z) ∈ Pr , Lz ∈ ΣN −r |=| {Lz ∈ ΣN : P (z) ∈ Pr , Lz ⊇ Sr−1 } |=
= | {Lz ∈ ΣN : P (z) ∈ Pr , ogni f di Sr−1 passa per P(z)} |=
=| {P (z) ∈ Pr : ogni f di Sr−1 passa per P (z)} |=
=| {P (z) ∈ Pr : P (z) è un punto base di Sr−1 |=| f1 ∩ f2 ∩ · · · ∩ fr |=
= nr (per il teor. di Bézout, stante la genericità delle fi ).
r
Evidenziando il valore dell’ordine, denoteremo con Vrn la varietà di Veronese suddetta.
r
Dimostriamo ora che la varietà di Veronese Vrn , che è stata qui presentata come una varietà immersa
nel duale ΣN dello spazio SN rappresentativo delle ipersuperfici di ordine n di Pr = Pr (K), si identifica
(è proiettivamente equivalente) alla varietà algebrica immersa in SN costituita dai punti di SN che rappresentano le ipersuperfici d’ordine n di Pr spezzate in n iperpiani coincidenti.
Una ipersuperfici H n d’ordine n di Pr spezzata in n iperpiani coincidenti, ha un’equazione del tipo:
(u0 X0 + u1 X1 + · · · + ur Xr )n = 0;
sviluppando la potenza del polinomio, si trova
Hn :
(u0 X0 + u1 X1 + · · · + ur Xr )n =
X
s0 +s1 +···+sr
n!
us00 us11 · · · usrr X0s0 X1s1 · · · Xrsr = 0,
s
!s
!
·
·
·
s
!
r
=n 0 1
dove al solito la somma è estesa a tutte le soluzioni in interi non negativi dell’equazione diofantea:
s0 + s1 + · · · + sr = n,
Dunque il luogo dei punti P (a) ∈ SN che rappresentano le ipersuperfici del tipo H n ha equazioni parametriche:
n!
us0 us1 · · · rrsr , con (u0 , u1 , . . . , ur ) ∈ K r+1 \ {0}
as0 s1 ...sr =
s0 !s1 ! · · · sr ! 0 1
Queste equazioni si identificano proiettivamente - a parte il nome delle coordinate e dei parametri - alle
equazioni parametriche (11) di Vrnr : basta identificare le zi con le ui ed effettuare una trasformazione
diagonale tra le as0 s1 ...sr e le αs0 s1 ...sr con matrice diagonale ad elementi che sono coefficienti multinomiali.
47 In modo del tutto analogo si definisce la immagine proiettiva di un qualunque sistema lineare d-dimensionale T di ipersud
perfici di ordine n di Pr , anche non completo, cioè di dimensione d < N : le ipersuperfici del sistema lineare Td si rappresentano
come punti di un sottospazio Sd dello spazio rappresentativo SN ed ogni punto generico P (z) di Pr stacca nel sistema lineare
Td un sottosistema (d − 1)-dimensionale che si rappresenta con un iperpiano di Sd , ossia con un punto del duale Σd di Sd .
L’immagine proiettiva del sistema lineare Td è la varietà di questi iperpiani di Sd .
80