l Dipartimento di Matematica “Guido Castelnuovo” Università degli Studi di Roma “La Sapienza”, a.a. 2009-2010 Appunti del corso FONDAMENTI DELLA GEOMETRIA Prof. Pier Vittorio Ceccherini Parte Prima: Dalla geometria elementare alla geometria degli iperspazi 1 Il problema dei fondamenti della geometria come parte di quello dei fondamenti della matematica Il problema dei fondamenti della geometria non può prescindere da quello più generale dei fondamenti della matematica. Per semplicità ci si limiterà a considerare principalmente la posizione assunta al riguardo da tre giganti della matematica – Euclide, Hilbert e Gödel – tre giganti che hanno segnato altrettante tappe fondamentali nella storia della matematica. Tra l’epoca di EUCLIDE (III sec. a.C.) e quella di David HILBERT (1862-1943) e di Kurt GÖDEL (1906-1978) corre un periodo di oltre duemila anni. È perciò impossibile dare conto delle numerose ed importanti conquiste del pensiero matematico che sono maturate in un cosı̀ ampio lasso di tempo e che sono state esse stesse determinanti anche per il problema dei fondamenti. 1.1 La matematica di Euclide 1.1.1. Matematica pre-ellenica È oggi universalmente riconosciuto che ancor prima della civiltà greca fosse notevolmente sviluppata una matematica di rilievo. Nei documenti più antichi che ci sono pervenuti dall’Egitto e dalla Caldea sono largamente utilizzate le nozioni, già fortemente astratte, di numero intero e di misura delle grandezze. Una ancor più significativa documentazione ci proviene dalla successiva civiltà babilonese, che ci mostra un’”algebra” che utilizza metodi eleganti e sicuri e che è qualcosa di più di una semplice raccolta di problemi risolti in modo empirico. Sebbene non vi sia presente niente che possa essere assimilato ad una dimostrazione, si può riconoscere - nella ripetizione dei metodi risolutivi utilizzati - il prodotto di precedenti concatenazioni logiche, sviluppate forse in modo inconscio, del tipo di quelle che precedono ancor oggi la sistemazione logica e la messa in chiaro di una verità matematica o di una formula che si comincia ad intuire. 1.1.2. L’innovazione della matematica greca È merito precipuo dei Greci di aver effettuato uno sforzo del tutto cosciente volto ad organizzare le dimostrazioni matematiche attraverso una sequenza di passaggi logici che non lasciassero alcun dubbio e che potessero essere riconosciuti come assolutamente validi da tutti. Questo canone ideale – probabilmente rispettato fin dai primi contributi conseguiti tra il VI ed il IV sec. a.C. ed attribuiti a TALETE, a PITAGORA e a EUDOSSO – trova poi una sua piena realizzazione in epoca alessandrina (III sec. a.C.) nell’opera della famosa triade di EUCLIDE, ARCHIMEDE e APOLLONIO, per i quali la nozione di dimostrazione non differiva in nulla dalla nostra. È interessante notare come tutto questo fiorire della matematica greca si fosse accompagnato a quello della filosofia, che aveva raggiunto il suo culmine con l’opera di PLATONE e di ARISTOTELE. Le prime riflessioni sul carattere astratto degli enti matematici e sul procedere della matematica per successive deduzioni si trovano espresse proprio in Platone ed in aristotele. Di essi è ben noto linteresse per la matematica e per la logica, tanto che Platone aveva fatto scrivere all’ingresso della sua Accademia di Atene la celebre frase Non entri chi non sa la geometria. Il fenomeno del sorgere e dell’affermarsi della matematica greca – una matematica non soltanto ricca di risultati ma impostata su basi metodologiche completamente nuove – si comprende soltanto alla luce del contemporaneo fiorire della filosofia. All’origine della filosofia greca troviamo la ricerca di una spiegazione della natura, il tentativo di ricondurre la materia a pochi elementi fondamentali. Quasi certamente questa stessa motivazione – il voler sviluppare un’indagine razionale sulla natura – fu per i greci il motivo ispiratore della ricerca matematica, riconosciuta come necessario strumento propedeutico. Non siamo a conoscenza di esplicite dichiarazioni fatte in tal senso dagli autori, tranne che nel caso di TOLOMEO (II sec. d.C.), il quale in un suo passo dichiara di aver sviluppato la trigonometria in vista delle sue applicazioni all’astronomia. Fin dalle origini, la matematica doveva essere presso i greci tutt’altro che una disciplina isolata; EUDOSSO era principalmente un astronomo, e lo stesso EUCLIDE scrisse i Fenomeni (opera di astronomia, che trattava la geometria della sfera in vista dello studio del moto della sfera celeste), l’Ottica (un trattato che consiste di varie definizioni e postulati e di 58 proposizioni), la Catottrica (teoria della riflessione e degli specchi), gli Elementi di musica e alcuni saggi di meccanica. L’intento di applicare la matematica alla fisica si trova notoriamente nell’opera di Archimede (autore di opere di ottica e di meccanica, quali Catottrica, Sui baricentri, Sui corpi galleggianti, Sulle leve, Sull’equilibrio dei piani ); lo stesso intento è ben presente anche in Apollonio (autore di un ampio studio su Gli specchi ustori ). 2 1.1.3. Il contenuto degli Elementi 1 . Non ci è pervenuto alcuno scritto di Euclide relativo alle sue idee sul modo di procedere della matematica, nessuna riflessione insomma di filosofia della matematica, come invece si trova in Platone e in Aristotele. Euclide non teorizza sulla matematica ma fa matematica. Tuttavia i suoi Elementi – oltre ad essere un bagaglio di dottrina ancora oggi vivo e presente pressoché inalterato nell’insegnamento pre-universitario della geometria – hanno storicamente costituito, per l’organicità della loro articolazione, per il rigore2 delle argomentazioni e dei metodi, un modello preciso al quale si sono attenuti tutti i matematici dopo di lui. Esaminiamo dunque, seppure sommariamente, quest’opera, la sua struttura, i suoi pregi e i suoi limiti, quali sono stati messi in risalto dalla critica moderna. Gli Elementi si compongono di 13 Libri, nei quali vengono svolti argomenti di geometria, di aritmetica e di algebra. La trattazione ha un carattere prettamente teorico, che prescinde da ogni regola di misura o di calcolo, da ogni applicazione pratica3 ; ad esempio Euclide dimostra il teorema sulla proporzionalità dei cerchi ai quadrati dei raggi, ma non si occupa di determinare il relativo rapporto costante4 . Nei Libri I-IV vengono trattate le proprietà fondamentali dei poligoni e dei cerchi: uguaglianza dei triangoli, teoria delle parallele, equivalenza dei poligoni, quadratura di un poligono (cioè costruzione di un quadrato equivalente ad un poligono assegnato), proprietà del cerchio, poligoni regolari. Nel Libro V – un vero capolavoro di astrazione – si prescinde dalla geometria e si sviluppa la teoria delle proporzioni tra grandezze. Il Libro VI applica la teoria delle proporzioni alla geometria, studiando le proprietà dei poligoni simili. Il libro termina con la costruzione di un poligono che sia equivalente ad un poligono dato P e sia simile ad un poligono dato Q (quando Q è un quadrato, si ricade nella quadratura di P ). I Libri VII-IX non riguardano la geometria, ma la teoria dei numeri (interi). Euclide rappresenta i numeri come segmenti ed il prodotto di due numeri come un rettangolo, ma gli argomenti che egli usa non sono geometrici. Anzi, alcune definizioni e teoremi, ad esempio sulle proporzioni, sono ripetizioni di quelli svolti per le grandezze; forse Euclide, nel rispetto della tradizione pitagorica, intendeva sottolineare l’autonomia della teoria dei numeri da ogni teoria geometrica e risentiva forse anche della visione di Aristotele che, pur considerando il numero come una specie di grandezza, metteva in rilievo la differenza esistente tra continuo e discreto. Celebri sono la sua dimostrazione che i numeri primi sono più di qualunque moltitudine assegnata di numeri primi 5 (cioè del fatto che esistono infiniti numeri primi) e quella dell’unicità della fattorizzazione di un numero in fattori primi. Il Libro X contiene la classificazione degli incommensurabili e precisamente delle cosiddette irrazionalità quadratiche. Due segmenti sono commensurabili in lunghezza se lo sono nel senso usuale; sono commensurabili in potenza se tali sono i quadrati costruiti su essi. Ad es. il lato e la diagonale di un quadrato sono incommensurabili in lunghezza ma commensurabili in potenza. I Libri XI-XIII riguardano la geometria solida, il metodo di esaustione6 , i poliedri regolari. 1.1.4. Il metodo ipotetico-deduttivo negli Elementi. Il Libro I si apre con tre serie di principi: le definizioni, i postulati e le nozioni comuni). In effetti le definizioni (oroi ) vengono espresse con termini che 1 Oltre che degli Elementi, Euclide è autore anche di altre opere matematiche. Alcune ci sono pervenute: i Dati, (che sono una sorta di esercizi per ripassare gli Elementi); Sulla divisione (che tratta della suddivisione di una figura geometrica in altre figure). Altre opere sono invece andate perdute e ne siamo a conoscenza per quanto ce ne hanno riferito PROCLO o PAPPO o altri commentatori: le Coniche (opera in quattro libri, che secondo Pappo costituirono poi i primi tre capitoli delle Sezioni coniche di Apollonio): la Pseudaria (una raccolta di dimostrazioni giuste e sbagliate, presentate per esercitare il ragionamento dei discepoli); i Porismi [cioè Proposizioni] (che trattavano problemi di costruzioni geometriche); i Luoghi superficiali (opera in due libri, che trattava probabilmente di alcune superfici caratterizzate come luoghi geometrici). 2 L’importanza del rigore era fortemente sentita in Euclide, un rigore che non ammetteva sconti. A questo riguardo, Proclo racconta che Euclide, richiesto dal re Tolomeo se non ci fosse un mezzo più breve degli Elementi per imparare la geometria, rispose che in geometria non esistono vie regie. 3 Come racconta Strobeo, quando un allievo chiese ad Euclide quale utilità egli avrebbe ricavato dagli studi della geometria, il maestro cacciò il malcapitato dopo avergli fatto consegnare qualche moneta 4 Il calcolo di valori approssimati di π verranno poi forniti da Archimede. 5 Se p , p , . . . , p sono numeri primi, e se q è un fattore primo di N = p p . . . p + 1, allora q ∈ / {p1 , p2 , . . . , pn }. n n 1 2 1 2 6 Il metodo di esaustione - introdotto da Eudosso (IV sec. a.C.) e precursore della moderna analisi infinitesimale - viene utilizzato per il calcolo di aree e volumi: esso consiste nel considerare successioni di figure inscritte e circoscritte alla figura in esame sempre più ”vicine” alla figura data, la cui misura risulta elemento di separazione delle misure di quelle figure che la approssimano per difetto e per eccesso. 3 non vengono definiti. Forse Euclide era cosciente che esse non avevano alcuna validità logica, ma intendeva spiegare intuitivamente che cosa rappresentassero quei termini, in modo da poterli utilizzare nei postulati fornendo una migliore comprensione dei postulati stessi. Modernamente parlando, sarebbero da denominare concetti primitivi , termini appunto, definiti poi implicitamente dai postulati. Dopo le definizioni, Euclide enuncia cinque postulati (richieste, αιτ ηµατ α, aitèmata) e cinque nozioni comuni (koinài ennòiai ). I libri successivi non contengono né postulati né nozioni comuni, mentre alcune definizioni sono poste all’inizio dei Libri II-VII e X-XI. Secondo una distinzione che risale ad Aristotele, i postulati si riferiscono propriamente alla geometria, mentre le nozioni comuni esprimono proprietà più generali, applicabili a tutte le scienze. Nel successivo sviluppo storico della matematica – almeno fino alla creazione delle geometrie noneuclidee – sia i postulati che le nozioni comuni vennero considerati come espressioni di verità certe, che non potevano essere messe in discussione. È peraltro interessante rilevare come l’originario punto di vista del pensiero greco fosse al riguardo assai meno netto, Secondo lo stesso Aristotele, non era necessario accertare la verità dei postulati, in quanto essa sarebbe stata certificata a posteriori dalla concordanza dei risultati dedotti dai postulati con la realtà, cioè fondamentalmente con l’esperienza empirica. È poi d’indubbio interesse che PROCLO (410-485 d.C.), il primo commentatore importante di Euclide, avesse – già nel V sec. d.C. – precorso la moderna visione della matematica come scienza ipotetico-deduttiva, Ar rivando egli a descrivere esplicitamente la matematica come una scienza ipotetica, che si limita a trAr re deduzioni dalle assunzioni, indipendentemente dal fatto che queste siano vere o false. Riguardo all’esistenza e alla coerenza dei concetti definiti, Euclide non si pronuncia; tuttavia i primi tre postulati del Libro I (vedi appresso) asseriscono la possibilità di costruire rette e cerchi e quindi ne affermano l’esistenza (sottintendendone l’unicità). Di fatto, quella di Euclide è un’impostazione costruttivistica e conseguentemente finitistica. Riportiamo qui di seguito – oltre ad una selezione delle definizioni più importanti dei vari Libri – tutti i postulati e tutte le nozioni comuni (che come detto si trovano soltanto all’inizio del Libro I). Alcune definizioni presenti negli Elementi (una selezione, dai libri I, V, VII, XI): Def I-1: Punto è ciò che non ha parti. Def I-2: Linea è lunghezza senza larghezza. Def I-3: Estremi di una linea sono punti. Def I-4: Linea retta è quella che giace ugualmente rispetto ai suoi punti. Def I-5: Superficie è ciò che ha soltanto lunghezza e larghezza. Def I-6: Estremi di una superficie sono linee. Def I-7: Superficie piana è quella che giace ugualmente rispetto alle sue rette. Def I-8: Angolo piano è l’inclinazione reciproca di due linee su un piano, le quali s’incontrino tra loro e non giacciano in linea retta. (Si escludono gli angoli piatti). Def. I-15: Cerchio è una figura piana limitata da un’unica linea, tale che tutte le rette condotte su di essa da un punto fra quelli interni alla figura sono uguali fra loro. Def I-16: Quel punto si chiama centro del cerchio. Def I-17: Diametro del cerchio è una retta tracciata per il centro e limitata in entrambe le direzioni dalla circonferenza, tagliando il cerchio per metà. Def I-23: Parallele sono quelle rette che, essendo nello stesso piano e venendo prolungate indefinitamente da entrambe le parti, non si incontrano fra loro in nessuna di queste. Def. V-3: Rapporto di due grandezze omogenee è un certo modo di comportarsi rispetto alla quantità. Def V-4: Si dice che hanno rapporto le grandezze le quali possono, se moltiplicate, superAr si reciprocamente7 . 7 A norma delle Def. V-3 e V-4, Euclide considera aventi rapporto tra loro due grandezze soltanto quando esse siano omogenee ed Archimedee; in particolare Euclide esclude dalla sua geometria gli angoli tra curve, in particolare l’angolo di contingenza, ossia quello tra la circonferenza ed una sua tangente. Si noti che Euclide non formula la proprietà di Archimede sotto la forma esplicita di un postulato, come facciamo noi, ma restringe comunque le proprie considerazioni alle ”grandezze che hanno 4 Def VII-1: Unità è ciò secondo cui ciascun ente è detto uno. Def VII-2: Numero è una pluralità composta da unità8 . Def XI-1: È un solido ciò che ha lunghezza, larghezza e altezza. Def. XI-2: Limite di un solido è una superficie. I cinque Postulati degli Elementi (tutti nel Libro I) 1o Postulato: Risulti postulato: che si possa condurre una retta da qualsiasi punto ad ogni altro punto. 2o Postulato: E che si possa prolungare una retta finita continuamente in linea retta. 3o Postulato: E che si possa descrivere un cerchio con qualsiasi centro e ogni distanza. 4o Postulato: E che tutti gli angoli retti siano uguali fra loro. 5o Postulato: E che se una retta, venendo a cadere su due rette forma gli angoli interni da una stessa parte minori di due angoli retti, le due rette prolungate indefinitamente si incontrano dalla parte in cui sono gli angoli minori di due retti. Le cinque nozioni comuni degli Elementi (tutti nel Libro I) 1a 2a 3a 4a 5a Nozione Nozione Nozione Nozione Nozione comune: comune: comune: comune: comune: Cose che sono uguali a una stessa cosa sono uguali anche tra loro. E se a cose uguali si aggiungono cose uguali, le somme sono uguali. E se a cose uguali si sottraggono cose uguali, i resti sono uguali. E le cose che coincidono fra loro sono fra loro uguali. E il tutto è maggiore della parte. Pregi e limiti della geometria di Euclide. Il grande merito di Euclide consiste nell’aver raccolto una serie di conoscenze accumulatesi prima di lui, di averle integrate con propri contributi originali e soprattutto di aver presentato tutto questo materiale in modo ordinato e organico, argomentando in modo logicamente conseguente le varie proposizioni e teoremi, gettando insomma le basi del moderno metodo ipotetico-deduttivo. Tuttavia si può notare che molte delle sue definizioni non sempre definiscono, e che le sue dimostrazioni richiedono taluni assiomi non enunciati esplicitamente, quali il postulato di Archimede, il postulato di continuità della retta, ed i postulati riguardanti l’ordine lineare sulla retta. Bisognerà aspettare oltre 2000 anni prima che queste pecche vengano sanate dai matematici della fine del XIX secolo. Il 5o Postulato. Il 5o Postulato è il famoso postulato delle parallele che viene comunemente enunciato nella forma (siamo in un piano); Per un punto esterno ad una retta, passa un’unica retta parallela alla retta data (cioè non secante la retta data). Si noti che nella formulazione di Euclide, il parallelismo viene descritto in negativo, in quanto pone una condizione affinché due rette (complanari) non siano parallele. Il postulato afferma in sostanza che per un punto fuori di una retta esiste al più una parallela alla retta data, mentre si può poi dimostrare l’esistenza di una parallela utilizzando gli altri assiomi euclidei (e la proprietà di continuità all’interno del fascio di rette di centro quel punto). È ben noto come questo postulato abbia attirato l’attenzione dei matematici, nel tentativo di dimostrarlo come teorema, tentativo che è fallito a rapporto”, per le quali, in base alla Def V-4 stessa, vale la proprietà di Archimede. 8 Dunque, per Euclide ”numero” significa numero intero positivo. 5 séguito della creazione delle geometrie non-euclidee (nel sec. XIX), le quali dimostrano l’indipendenza del 5o Postulato dai primi quattro. Nella geometria non euclidea di Riemann (geometria ellittica) il 5o Postulato viene sostituito dalla richiesta che per un punto esterno ad una retta non passi alcuna parallela alla retta data; nella geometria non euclidea di Lobatchevski - Bolyai (geometria iperbolica) si richiede invece che per un punto esterno ad una retta passino due parallele alla retta data (e si dimostra che di conseguenza ne passano infinite)9 . Si noti che il 5o Postulato perde significato nella geometria proiettiva (nella quale la nozione di parallelismo non ha senso). Il problema della coerenza della geometria euclidea (cioè la proprietà che lo sviluppo della teoria non conduca a contraddizioni) non si pose per molto tempo, perché si pensava che questa geometria fosse precisamente corrispondente alla realtà del mondo fisico ed in esso trovasse a priori la propria legittimità piena. Ma quando furono scoperte le geometrie non-euclidee, queste certezze cominciAr ono a vacillare, e sorse anche il nuovo problema della coerenza delle stesse geometrie non-euclidee. Tuttavia la scoperta ad opera di Eugenio BELTRAMI (1835-1900) e di Felix KLEIN (1849-1925) di modelli, che realizzavano le geometrie non-euclidee all’interno della geometria euclidea, provò che se la geometria euclidea è coerente, allora anche la geometria ellittica e la geometria iperbolica lo sono. Attualmente, si ritiene che si debba di volta in volta utilizzare il tipo di geometria più adatto al problema che si sta studiando: ad esempio, nella teoria della relatività di Albert EINSTEIN (1879-1955) le geometrie non-euclidee hanno ricevuto applicazioni importanti, mentre la geometria euclidea è più utile per le applicazioni tradizionali. In base alle successive ricerche di Hilbert e di altri, la coerenza della geometria euclidea fu a sua volta ricondotta a quella dell’aritmetica, come vedremo nel prossimo paragrafo. Fu similmente ricondotta a quella dell’aritmetica anche la coerenza della geometria euclidea a più dimensioni, una coerenza che appariva ancor più problematica mancando per tale geometria l’interpretazione intuitiva basata sullo spazio ordinario, tanto che difficilmente un matematico della metà dellOttocento sarebbe stato disposto ad accettarla. 1.2 I fondamenti della geometria secondo Hilbert. La geometria euclidea10 è stata assiomatizzata in modo rigoroso da David HILBERT (1899), tramite assiomi indipendenti. Questo traguardo è stato raggiunto grazie alla combinazione di due grandi conquiste matematiche ottenute precedentemente. La prima conquista è l’invenzione, dovuta a CARTESIO (René DESCARTES, 1596-1650) della geometria analitica, ossia del metodo di usare le coordinate per lo studio della geometria. Per lo spazio euclideo ordinario, cioè tridimensionale, si usano tre coordinate per rappresentare un punto, una equazione o un sistema di equazioni per rappresentare un piano, una retta, una curva, una superficie. La seconda conquista è la creazione in termini rigorosi dei numeri reali, ottenuta alla fine del XIX secolo ad opera principalmente di Richard DEDEKIND (1831-1916), di Georg CANTOR (1845-1918) e dello stesso Hilbert. Il punto di arrivo delle ricerche sui fondamenti dei numeri reali è la presentazione del campo reale come (l’unico) campo ordinato archimedeo completo. Vediamo di che si tratta. L’insieme R dei numeri reali costituisce un campo rispetto alle usuali operazioni di somma e prodotto. Inoltre R è un campo ordinato rispetto all’ordinamento usuale; più precisamente R è un campo ordinato archimedeo, ossia dati comunque due numeri reali positivi esiste un multiplo dell’uno che supera l’altro. Si può dimostrare che un qualunque corpo ordinato archimedeo K è necessariamente commutativo, cioè è un campo, ed è precisamente (a meno di isomorfismi) un sottocampo del campo reale; dunque il campo reale R si caratterzza come l’unico campo archimedeo non estendibile ad un campo ordinato archimedeo più ampio, ossia, come si dice, si caratterizza come (il) campo ordinato archimedeo completo. In base a queste due conquiste si riconosce che lo spazio tridimensionale studiato da Euclide (corretto con l’esplicita aggiunta di un postulato di continuità della retta) si identifica (è isomorfo) con lo spazio numerico R3 . In questo spazio numerico i punti sono le terne ordinate (x, y, z) di numeri reali, un piano è il luogo dei punti (x, y, z) che sono soluzione di un’equazione del tipo ax + by + cz + d = 0, con coefficienti 9 Cfr. 10 Oggi R. Betti, Lobacevskij. L’invenzione delle geometrie non euclidee. Bruno Mondadori, 2005. per ’geometria euclidea’ si intende lo studio del gruppo ortogonale in uno spazio vettoriale euclideo. 6 reali di cui i primi tre non tutti nulli, ed una retta è il luogo dei punti (x, y, z) che sono soluzione di un sistema di due equazione di quel tipo e che siano indipendenti e compatibili. Il problema di assiomatizzare lo spazio euclideo tridimensionale, inteso come totalità dei suoi punti, delle sue rette e dei suoi piani si traduce e si precisa dunque in quello di assiomatizzare lo spazio numerico R3 (spazio tridimensionale reale) inteso come totalità dei suoi punti, delle sue rette e dei suoi piani. 1.3 Caratterizzazione assiomatica dello spazio ordinario. Presentiamo finalmente l’assiomatica di HILBERT per lo spazio tridimensionale reale11 Lo spazio è una terna A = (P, R, Π), dove P è un insieme non vuoto di oggetti detti punti, R un insieme non vuoto di parti di P dette rette, Π un insieme non vuoto di parti di P dette piani, tali che R ∩ Π = ∅, e tali che siano soddisfatti i seguenti gruppi di assiomi: I GRUPPO: assiomi dell’appartenenza. — Per due punti distinti qualunque passa una e ad una sola retta. — Per tre punti non allineati qualunque passa uno ed un sol piano. — Ogni retta contiene almeno due punti distinti, ogni piano contiene almeno tre punti non allineati, lo spazio contiene almeno quattro punti non complanari. — Se due punti distinti di una retta appartengono ad un piano, la retta è contenuta nel piano. — Se due piani hanno in comune un punto, essi hanno in comune almeno un altro punto12 . II GRUPPO: assiomi dell’ordine. È data una relazione ternaria di intergiacenza tra punti allineati – che si denota scrivendo ABC e che si legge: B giace tra A e C – in modo che valgano i seguenti assiomi: — Se A, B, C sono punti allineati qualunque, allora ABC implica CBA. — Se A e C sono punti distinti qualunque, esiste almeno un B tale che ABC 13 ed esiste almeno un D tale che ACD. — Dati tre punti distinti e allineati qualunque, esattamente uno di essi giace tra gli altri due. — Assioma di Pasch: Siano dati comunque tre punti non allineati A, B, C ed una retta del loro piano, la quale non passi per alcuno dei tre punti. Se la retta passa per un punto posto tra A e B, allora essa passa anche o per un punto posto tra B e C oppure per un punto posto tra A e C. Nozione di segmento, di semiretta, di semipiano e di angolo. I primi due gruppi di assiomi permettono di introdurre i concetti di segmento, di semiretta, di semipiano e di angolo. Se A e B sono due punti distinti ed a è la retta che li contiene, si chiama segmento di estremi A e B l’insieme dei punti di a posti tra A e B. Gli altri punti si dicono esterni al segmento. Dato un punto O di una retta a, possiamo dividere la retta in due semirette di origine O nel modo seguente. Si fissi su a un punto A distinto da O: la semiretta (aperta) OA — semiretta di a, di origine O e 11 Hilbert formulò per la prima volta la sua assiomatizzazione nel 1899 con il volume Grundlagen der Geometrie, rielaborandone in seguito più volte l’esposizione fino alla versione del 1930. Altre diverse assiomatizzazioni della geometria euclidea erano state formulate dieci anni prima da Giuseppe PEANO (1858-1932) nei suoi Principi di Geometria (1889) e da Giuseppe VERONESE (1854-1917) nei suoi Fondamenti di Geometria (1891). Nei presenti appunti l’assiomatica di Hilbert viene esposta in modo semplificato. Anzitutto, nella esposizione originaria di Hilbert, gli insiemi P, R, Π dei punti delle rette e dei piani dello spazio sono tre insiemi astratti e l’appartenenza (∈ e ⊆) è sostituita da una relazione astratta di incidenza. Inoltre alcune proprietà che qui figurano come assiomi sono ottenute come teoremi nell’esposizione originaria di Hilbert 12 Si noti che questa proprietà non è valida in Rn se n > 3. 13 Utilizzando l’Assioma di Pasch di cui è detto appresso, Hilbert dimostra che dati comunque due punti distinti A e B esiste un punto B tale che ABC: a partire da A, C si compiano le seguenti costruzioni (il lettore faccia una figura): retta AC, punto D non su AC, retta AD, punto E tale che ADE, retta EC, punto F tale che ECF , i punti A, C, E sono non allineati, la retta DF non passa per questi punti e contiene un punto D del lato AE ma non contiene un punto del lato AC e quindi (per l’ Assioma di Pasch) contiene un punto B del lato AC, ossia risulta ABC. 7 contenente A — è costituita dal punto A e dai punti X di a tali che OXA oppure OAX; l’altra semiretta di a di origine O è costituita dai punti Y di a tali che AOY . Aggiungendo ad una semiretta aperta la sua origine si ottiene la corrispondente semiretta chiusa. In questo modo si ottiene una partizione di a in tre classi: il punto O e le due semirette aperte di a di origine O. Si può dimostrare che un qualsiasi punto A0 della semiretta OA definisce la medesima semiretta. È l’assioma di Pasch che consente di definire i semipiani determinati in un piano α da una sua retta a: si considera la relazione ρ definita nell’insieme dei punti di α \ a assumendo AρB se la retta a non contiene punti situati tra A e B; questa è una relazione (forzatamente) riflessiva, banalmente simmetrica e che risulta transitiva in virtù dellassioma di Pasch; infatti se AρB e se BρC allora AρC, come è banale se i tre punti sono allineati e come segue dall’assioma di Pasch se i tre punti non sono allineati. La relazione ρ determina in α \ a una partizione in classi di equivalenza, che si riconoscono facilmente essere due e che, per definizione, costituiscono i due semipiani (aperti) di α determinati dalla retta a. Siano date in un piano α due semirette a = OA e b = OB entrambe di origine un punto O. Tale dato si b Si chiamano interni b oppure con ab. chiama angolo di lati OA e OB e di vertice O, e si denota con AOB all’angolo tutti i punti di α i quali a due a due individuano segmenti non aventi alcun punto in comune coi lati dell’angolo; si chiamano esterni all’angolo i punti di α i quali non siano interni e non appartengano ai lati. III GRUPPO: assiomi della congruenza. È data una relazione di congruenza tra segmenti ed è data una relazione di congruenza tra angoli, entrambe denotate con ≡, in modo che valgano i seguenti assiomi: — Dati comunque due punti A, B ed una semiretta a0 di origine un punto A0 , esiste un unico punto B 0 di a0 tale che siano congruenti i segmenti AB e A0 B 0 . cioè: AB ≡ A0 B 0 . — Ogni segmento è congruente a se stesso: AB ≡ AB, AB ≡ BA. — Se AB ≡ A0 B 0 e A0 B 0 ≡ A00 B 00 , allora AB ≡ A00 B 00 . — Se su una retta a sono dati due segmenti AB e BC privi di punti in comune e su una retta a0 sono dati due segmenti A0 B 0 e B 0 C 0 privi di punti in comune, e se AB ≡ A0 B 0 e BC ≡ B 0 C 0 , allora AC ≡ A0 C 0 . b in un piano α e sia data comunque in un piano α0 una retta r0 ed un — Sia dato comunque un angolo ab 0 0 0 punto O di r , e sia a una delle due semirette di r0 di origine O0 . In ciascuno dei due semipiani di α0 0 b0 ≡ ab b e tale che tutti i punti individuati da r0 esiste esattamente una semiretta b0 di origine O0 tale che ad 0 0 0 d interni dell’angolo a b appartengano al semipiano di α considerato. b ≡ ab b e ab b ≡ ba. b — Ogni angolo è congruente a se stesso: ab 0 0 0 0 00 00 00 00 b d d d b d — Se ab ≡ a b e a b ≡ b a allora ab ≡ a b . c0 C 0 , allora si b ≡ B0A — Dati comunque due triangoli ABC e A0 B 0 C 0 , tali che AB ≡ A0 B 0 , AC ≡ A0 C 0 , B AC 0 c0 0 0 c0 0 b b ha anche ABC ≡ A B C e ACB ≡ A C B . IV GRUPPO: assioma delle parallele. Dati comunque una retta a ed un punto A non appartenente ad a, esiste, nel piano individuato da A e da a, esattamente una retta b, passante per A e che non interseca a. Tale retta b dicesi la parallela per A ad a. Nozione di spazio affine. Dicesi spazio affine (di dimensione 3) una qualunque terna ordinata A = (P, R,Π), del tipo detto all’inizio, i cui punti, rette e piani verificano tutti gli assiomi del I GRUPPO (assiomi di incidenza) e tutti quelli del IV GRUPPO (assioma delle parallele). Due spazi affini A = (P, R,Π) e A0 = (P 0 , R0 ,Π0 ) si dicono isomorfi se esiste un isomorfismo f : A → A0 , cioè una bijezione f : P → P 0 che induce una bijezione R → R0 ed una bijezione Π → Π0 . Si può dimostrare che: Teorema 1 Ogni spazio affine 3-dimensionale è coordinatizzabile sopra un corpo K (eventualmente non commutativo), nel senso che è isomorfo allo spazio affine numerico A3 (K), i cui punti sono le terne ordinate di numeri di K ed i piani e le rette vengono definiti di conseguenza (tramite equazioni) nel modo usuale14 . 14 Se K è un corpo commutativo, cioè un campo, si comprende bene come lo spazio affine numerico A3 (K) possa essere definito senza difficoltà, come nel caso in cui K risulti essere il campo reale (vedi appresso la dimostrazione del Teorema 2). Il caso in 8 V GRUPPO: assiomi della continuità. — Assioma di Archimede. Siano dati su una qualunque retta a: un punto qualunque A1 posto tra due dati punti A e B; e siano dati altri punti A2 , A3 , A4 , . . . , tali che A1 sia posto tra A e A2 , A2 tra A1 e A3 , A3 tra A2 e A4 e cosı̀ via e tali che si abbiano le congruenze AA1 ≡ A1 A2 ≡ A2 A3 ≡ A3 A4 ≡ . . . . Allora esiste nella successione dei punti A2 , A3 , A4 , . . . un punto An tale che B è posto tra A e An . — Assioma della completezza. Gli elementi (punti, rette, piani) della geometria costituiscono un sistema A = (P, R,Π), che non si può ampliare se si mantengono tutti gli assiomi precedenti. Il requisito fondamentale che si richiede ad un sistema di assiomi è la sua coerenza (o consistenza), cioè la sua non contraddittorietà, ossia il fatto che lo sviluppo della teoria che muove da quegli assiomi non conduce (e non potrà mai condurre) a contraddizioni. La consistenza viene dimostrata fornendo un modello che verifica tutti gli assiomi del sistema. Ad esempio, gli assiomi di gruppo sono consistenti, perché è possibile esibirne concretamente un modello (ad esempio un gruppo finito di ordine due!). Un’altra proprietà – interessante, ma non indispensabile, anzi talvolta non desiderabile didatticamente – è la indipendenza degli assiomi del sistema, ossia l’impossibilità di dedurre qualcuno degli assiomi dai rimanenti. L’eventuale indipendenza può essere dimostrata fornendo, per ciascun assioma del sistema, un modello che non verifica quell’assioma pur verificando tutti i rimanenti. Un’ulteriore ed importante proprietà (molto raramente soddisfatta) è la categoricità del sistema di assiomi, intendendosi con ciò che due qualunque modelli che lo verificano sono isomorfi, ossia completamente identificabili in senso astratto; ciò si può anche esprimere dicendo che è stata data una caratterizzazione assiomatica del modello in questione. Ad esempio, il sistema di assiomi di gruppo non è categorico, mentre lo è quello di gruppo ciclico di ordine n fissato. La consistenza (non contraddittorietà) del sistema degli assiomi di Hilbert si fonda sulla consistenza del campo reale R (che a sua volta si fonda su quella del campo razionale Q, e quindi, in ultima analisi sulla consistenza dell’ insieme N dei numeri naturali, cfr. appresso). Infatti si può dimostrare il teorema: Teorema 2 ( ”Consistenza” del sistema di assiomi di Hilbert.) Lo spazio numerico tridimensionale reale A3 (R) soddisfa i cinque gruppi di assiomi di Hilbert. Dimostrazione. (Cenni). Sia A3 (R) = (P, R,Π) lo spazio numerico tridimensionale reale. In tale spazio, l’insieme P dei punti è l’insieme R3 delle terne ordinate di numeri reali. L’insieme Π dei piani è: Π := {αabcd | (a, b, c, d) ∈ R4 , (a, b, c) 6= (0, 0, 0), ove il piano αabcd è dato da: αabcd := {(x, y, z) ∈ R3 | ax + by + cz + d = 0}. L’insieme delle rette è: R := {α ∩ β | (α 6= β ∈ P) ∧ (α ∩ β 6= ∅)}. cui K non sia commutativo, richiede qualche accortezza; si noti intanto che si i può definire su un corpo K non commutativo (ad esempio sul corpo dei quaternioni reali) la nozione di spazio vettoriale destro (risp. sinistro), procedendo come nel caso commutativo, ma con l’accortezza di scrivere sistematicamente a destra (risp. a sinistra) lo scalare che moltiplica un vettore; per tali spazi si introducono al solito le nozioni di indipendenza lineare di vettori, di base, di dimensione, componenti di un vettore rispetto ad una base; si giunge cosı̀ a dimostrare, nel solito modo, che uno spazio vettoriale destro (o sinistro) su un corpo K di dimensione n è isomorfo allo spazio vettoriale numerico destro (o sinistro) n− dimensionale su K i cui vettori sono le n−ple ordinate di elementi di K. In modo analogo, si può definire su un corpo K non commutativo (ad esempio sul corpo dei quaternioni reali) la nozione di spazio affine numerico destro (risp. sinistro) A3 (K), avendo l’accortezza di scrivere le equazioni che definiscono i piani e le rette ponendovi i coefficienti sempre a sinistra (o sempre a destra) delle indeterminate. Si noti infine che la costruzione, a partire da un campo finito K = GF (q) con q elementi, del corrispondente spazio affine numerico A3 (K) fornisce un semplice modello (molto concreto !) di spazio affine A3 e dunque assicura la non contraddittorietà della assiomatica di spazio affine A3 . Queste considerazioni si estendono faciilmente al caso degli spazi affini e proiettivi di dimensione d ≥ 2 qualunque. Avvertiamo infine che uno spazio del tipo A3 (K) viene talvolta denotato anche con AG(3, K) o semplicemente con K 3 . 9 La facile verifica che gli assiomi di Hilbert sono soddisfatti da A3 (R) si basa sulle proprietà ordinali e di continuità del campo reale R (che può identificarsi con l’insieme dei punti di una retta), su proprietà elementari dei sistemi di equazioni lineari e su proprietà elementari del gruppo delle isometrie (congruenze) di R3 . Si noti in particolare che, se A3 (R) non soddisfacesse alla proprietà di completezza, allora sarebbe ampliabile propriamente ad uno spazio, T , il quale – essendo uno spazio affine tridimensionale – sarebbe, per il Teorema 1, coordinatizzabile su un corpo K necessariamente ordinato archimedeo (al pari di T ), e quindi commutativo; ne seguirebbe che K sarebbe un campo archimedeo, estensione propria di R, il che è impossibile perché R è archimedeo completo. Si osservi che il Teorema 2 riconduce la ”consistenza” del sistema degli assiomi di Hilbert alla ”consistenza” del modello A3 (R), ossia alla consistenza di R, vale a dire alla non contradditorietà della teoria dei numeri reali. Teorema 3 ( (Categoricità del sistema di assiomi di Hilbert.) I precedenti cinque gruppi di assiomi caratterizzano lo spazio A3 (R). Dimostrazione. (Cenni). Un qualunque spazio T soddisfacente i cinque gruppi di assiomi è anzitutto uno spazio affine tridimensionale, e quindi, per il Teorema 1 coordinatizzabile su un corpo K, e pertanto isomorfo allo spazio numerico su K, ossia T ' A3 (K). Il campo K è ordinato archimedeo perché queste proprietà si trasportano facilmente da T a K. Pertanto K deve essere (a meno di isomorfismi) un sottocampo del campo reale R ed anzi coincide (a meno di isomorfismi) col campo reale R, perché se per assurdo K fosse un sottocampo proprio di R, allora lo spazio A3 (R) sarebbe un ampliamento proprio dello spazio T ; d’altra parte, A3 (R) verifica i cinque gruppi di assiomi e viene cosı̀ contraddetta la proprietà di completezza di T . L’assurdo prova che K ' R, e quindi T ' A3 (K) ' A3 (R). Il significato del Teorema 3 è che ogni spazio A0 = (P 0 , R0 ,Π0 ) che verifichi gli assiomi di Hilbert è isomorfo allo spazio numerico A3 (R) = (R3 , R, Π) nel senso che esiste una bijezione f : R3 → P 0 che rispetta tutte le strutture presenti e che quindi permette di indentificare A0 con A3 (R). In altri termini: (1) f induce una bijezione R → R0 e una bijezione Π → Π0 ; (2) f conserva l’ordinamento, cioè la relazione di intergiacenza tra punti allineati; (3) f conserva la congruenza tra segmenti e quella fra angoli; (4) f conserva il parallelismo. È facile convincersi che lo spazio affine numerico A3 (Q) costruito sul campo razionale verifica tutti gli assiomi del sistema di Hilbert tranne il ”corrispondente assioma della completezza”: questo non è verificato perché A3 (Q) si può ampliare propriamente a A3 (R) che verifica tutti gli stessi assiomi. Come già detto precedentemente, si può dimostrare che il sistema degli assiomi originari di Hilbert è costituito da assiomi tra loro indipendenti. Si osservi che non è stata richiesta la proprietà simmetrica della relazione di congruenza (ad esempio tra segmenti), in quanto – come ora vedremo – essa può dedursi dalle proprietà riflessiva e transitiva con l’uso dell’assioma che esprime il ”trasporto di un segmento” su una semiretta. Sia dunque AB ≡ A0 B 0 ; vogliamo provare che A0 B 0 ≡ AB. Sia C il punto della semiretta di origine A che contiene B tale che A0 B 0 ≡ AC . Ne segue AB ≡ AC. Dalle AB ≡ AB e AB ≡ AC, si deduce B = C. Pertanto A0 B 0 ≡ AB. 1.4 Riconduzione della non contraddittorietà della geometria a quella della aritmetica. Si è visto che la non contraddittorietà del sistema degli assiomi di Hilbert si basa sulla non contraddittorietà della teoria dei numeri reali. Ricordiamo come quest’ultima si riconduce a quella della aritmetica. Si ammette che esista un modello ben fondato dell’insieme N dei numeri naturali; allora, a partire da questo dato, si 10 costruiscono successivamente l’anello Z degli interi, il campo Q dei razionali e, finalmente, il campo R dei reali. Questo metodo di definizione del campo reale è dunque un metodo genetico (risalente a Dedekind), diverso dal metodo assiomatico di Hilbert che definisce in un solo colpo i reali come campo ordinato archimedeo completo. Secondo una osservazione scherzosa di Bertrand RUSSELL (1872-1970)15 , la differenza tra il metodo genetico e quello assiomatico è la stessa che passa tra il lavoro onesto ed il furto: con questo ci si impadronisce in un attimo di tutta la ricchezza accumulata faticosamente tramite quello. 1.4.1 I numeri naturali. Ricordiamo che a fondamento dell’aritmetica si trova l’insieme N dei numeri naturali, definito da Giuseppe PEANO (1858-1932) coi suoi famosi assiomi. In questi intervengono i concetti primitivi di numero naturale, uno, successore: concetti che non vengano definiti, sebbene gli assiomi che li riguardano ne dànno una definizione implicita, nel senso che indicano le regole che li governano. Dopotutto, secondo la definizione scherzosa di Bertrand Russell, la matematica è la scienza in cui non si sa di che cosa si parla, ed in cui non si sa se quello che si dice sia vero o falso. (La seconda parte della frase sottolinea l’aspetto della matematica come sistema ipotetico-deduttivo). Assiomi di Peano. 1. Uno è un numero naturale. 2. Per ogni numero naturale esiste un ben determinato numero naturale successore di quello. 3. Uno non è successore di alcun numero naturale. 4. Due numeri naturali aventi lo stesso successore sono uguali fra loro. 5. Se un insieme di numeri naturali contiene uno ed il successore di ogni suo elemento, allora quell’insieme coincide con l’insieme di tutti i numeri naturali. I primi quattro assiomi possono essere riformulati dicendo che è data una terna ordinata (N, 1, σ), tale che N è un insieme, 1 è un fissato elemento di N, e σ è un’applicazione iniettiva N → N \ {1} (”passaggio al successore”). Il quinto assioma, noto col nome di principio d’induzione, si può esprimere cosı̀: [A ⊆ N, 1 ∈ A, σ(A) ⊆ A] ⇒ A = N. L’esistenza di una terna verificante le proprietà anzidette non può essere dimostrata, ma richiede un apposito ed esplicito assioma di esistenza. Come dice Leopold KRONECKER (1823-1891), ”Dio ha creato i numeri naturali, tutto il resto è opera dell’uomo”. È invece facile dimostrare l’unicità (a meno di ”isomorfismi”) di una terna siffatta: se (N, 1, σ) e (N0 , 10 , σ 0 ) sono due tali terne, si può definire un ”isomorfismo” f : N → N0 , assumendo anzitutto f (1) := 10 , e definendo poi (n ∈ N) f (σ(n)) = σ 0 (f (n)); si prova quindi che f è ben definita su tutto N, che f è biunivoca e conserva la struttura in gioco, ossia permette di identificare le terne date. Per iinduzione si definiscono poi in N le usuali operazioni di addizione: (m, n ∈ N) 1 + n := σ(n), σ(m) + n := σ(m + n); e di moltiplicazione: (m, n ∈ N) 1 · n := n, σ(m) · n := m · n + n; e si definisce l’usuale ordinamento: (m, n ∈ N) m < n ⇔ ∃h ∈ N : m + h = n. 15 Bertrand Russell è autore insieme a A. N. Whitehead della monumentale opera Principia mathematica (1910-1913) in cui vengono esposte le basi assiomatiche del calcolo dei predicati e della logica matematica. 11 Anche le usuali proprietà formali delle operazioni + e · si dimostrano per induzione. 1.4.2. L’anello degli interi. Si passa dal gruppoide N(+) al gruppo additivo Z(+) degli interi, per simmetrizzazione. Da questo si passa poi facilmente all’anello Z(+,·) degli interi. In altri termini, l’insieme Z è definito costruttivamente da N, assumendo Z := (N × N)/ ≡1 , dove l’equivalenza ≡1 è definita in N × N da: (a, b) ≡1 (c, d) :⇔ a + d = b + c. La somma in Z è ben definita da: (a, b, c, d ∈ N) [(a, b)] + [(c, d)] := [(a + c, b + d)]. Il prodotto in Z è ben definito da: (a, b, c, d ∈ N) [(a, b)] · [(c, d)] := [(ac + bd, ad + bc)]. L’ordinamento in Z è ben definito da: (a, b, c, d ∈ N) [(a, b)] < [(c, d)] :⇔ a + d < b + c. Si ha l’immersione (cioè un’applicazione iniettiva che conserva la somma, il prodotto e l’ordinamento) N(+,·,<) → Z(+,·,<) : n 7→ [(σ(n), 1)]. Lo zero di Z(+) è la classe 0 = [(n, n)], n ∈ N. Se n ∈ N , il numero [(σ(n), 1)] di Z si denota ancora con n, ed il numero [(1, σ(n))] si denota con −n, la classe [(a, b)] si denota anche con a − b, ecc. 1.4.3. Il campo dei razionali. Si passa dall’anello Z(+,·) degli interi al campo Q(+,·) dei razionali, ottenendolo come suo campo dei quozienti. In altri termini, l’insieme Q è definito costruttivamente da Z, assumendo: Q := (Z × (Z \ {0}))/ ≡2 , dove l’equivalenza ≡2 è definita in Z × (Z \ {0}) da: (a, b) ≡2 (c, d) :⇔ ad = bc. Ogni classe [(a, b)] ∈ Q si denota con a/b; le operazioni e l’ordinamento in Q sono ben definiti da: a/b + c/d := (ad + bc)/(bd), (a/b)(c/d) := (ac)/(bd), (a/b) < (c/d) :⇔ ad < bc. Si ha l’immersione Z(+,·,<) → Q(+,·,<) : a 7→ a/1, ed il numero a/1 ∈ Q si denota ancora con a, ecc. 1.5 Il campo dei reali. Storicamente, i numeri reali sono stati definiti costruttivamente a partire dai numeri razionali (metodo genetico: di Cauchy (Augustin-Louis CAUCHY, 1789-1857), di Dedekind, di Cantor) ). Vedremo poi che i numeri reali possano essere definiti assiomaticamente (metodo assiomatico di Hilbert). 12 1.5.1. I numeri reali secondo il metodo di Cauchy. Si passa dal campo razionale Q al campo reale R, ad esempio col procedimento costruttivo di completamento alla Cauchy : R := C(Q)/ ≡, dove C(Q) è l’insieme delle successioni di Cauchy di numeri razionali e ≡ è la relazione di equivalenza che dichiara equivalenti due successioni di Cauchy a, b ∈ C(Q) la cui differenza a − b è una successione infinitesima: dunque un numero reale è una classe di equivalenza di successioni di Cauchy di numeri razionali. Ricordiamo che una successione a = (ai ) ∈ QN di numeri razionali ai , ∈ Q, i ∈ N, si chiama una successione di Cauchy se: (∀ ∈ Q, > 0) ∃n ∈ N : | am − an |< ∀n, m > n , e che una successione di Cauchy c = (ci ) ∈ QN si dice infinitesima se (∀ ∈ Q, > 0) ∃n ∈ N : | cn |< ∀n > n , Si ben definiscono in R la somma, il prodotto e la relazione d’ordine in modo ovvio (è il modo obbligato), e si ha l’immersione Q(+,·,<) → R(+,·,<) : a 7→ [(a, a, . . . , a, . . . )], ed il numero [(a, a, . . . , a, . . . )]∈ R si denota ancora con a, ecc. Si dimostra infine che ogni successione di Cauchy di numeri reali è convergente (ad un numero reale). 1.5.2. I numeri reali secondo il metodo di Dedekind. Alternativamente: un numero reale è una sezione di Dedekind (o due sezioni di Dedekind equivalenti ) del campo razionale. Ricordiamo di cosa si tratta. Una partizione ordinata (o sezione di Dedekind) (A, B) di Q è una partizione non banale di Q in due ’classi’ A e B: Q = A ∪ B, A ∩ B = ∅, A 6= ∅ = 6 B tale che : a ∈ A, b ∈ B ⇒ a < b. Per ogni tale partizione esiste evidentemente al più un elemento di separazione delle due classi cioè al più un q ∈ Q tale che (a, b ∈ Q) (a < q ⇒ a ∈ A) e (q < b ⇒ b ∈ B). Evidentemente, se q ∈ Q è elemento di separazione della partizione ordinata (A, B), allora necessariamente q è il massimo della classe A oppure il minimo della classe B; in entrambi i casi, il numero q risulta essere elemento di separazione di due sezioni di Dedekind, potendosi attribuire q alla prima o alla seconda classe: le due partizioni cosı̀ ottenute sono distinte ma verranno considerate equivalenti (perché entrambe individuano lo stesso q ∈ Q come proprio elemento di separazione); dunque ogni numero razionale q dà luogo a due sezione di Dedekind (equivalenti) di cui è elemento separatore: la sezione (A, B) con A := {x ∈ Q : x ≤ q}, B := {x ∈ Q : x > q} (A0 , B 0 ) con A0 := {x ∈ Q : x < q}, B := {x ∈ Q : x ≥ q}. ma anche la sezione D’altra parte esistono sezione di Dedekind di Q prive di elemento separatore (in Q), ad esempio la sezione ottenuta assumendo A := {x ∈ Q : (x < 0) ∨ (x2 < 2)}, B := {x ∈ Q : (x > 0) ∧ (x2 > 2)}; è infatti ben noto che non esiste alcun razionale x ∈ Q tale che x2 = 2. Se, come in questo caso, (A, B) è invece una sezione di Dedekind priva di elemento separatore in Q, la sua ’classe di equivalenza’ verrà considerata costituita soltanto da (A, B). Se indichiamo con D(Q) l’insieme delle sezioni di Dedekind del 13 campo razionale e con ≡ la suddetta relazione di equivalenza in tale insieme, si può, seguendo Dedekind, definire il campo reale assumendo R := D(Q)/ ≡ . Si ben definiscono in R la somma, il prodotto e la relazione d’ordine in modo ovvio (è il modo obbligato), e si ha l’immersione Q(+,·,<) → R(+,·,<) : q 7→ [({a ∈ Q : a ≤ q}, {b ∈ Q : b > q}]}, e questo numero di R si denota ancora con q, ecc. Si dimostra infine che ogni sezione di Dedekind del campo reale ammette un elemento di separazione. 1.5.3. I numeri reali secondo il metodo di Cantor. Alternativamente, ancora: si possono ottenere i numeri reali (alla Cantor) come classi di equivalenza di coppie di classi contigue di numeri razionali (due classi contigue dicendosi equivalenti se ”si rincorrono a vicenda”). Ricordiamo di cosa si tratta. Una coppia (A, B) di sottinsiemi non vuoti di Q si dice una coppia di classi contigue di numeri razionali se a ∈ A, b ∈ B ⇒ a < b ed inoltre: ∈ Q, > 0 ⇒ ∃a ∈ A, ∃b ∈ B tale che | a − b |< . Evidentemente una coppia di classi contigue di numeri razionali ammette al più un elemento di separazione s ∈ Q. Un esempio di coppie√di classi contigue che non ammettono in Q elemento di separazione è suggerito dalla scrittura decimale di 2 = 1, 414213562373095: assumiamo A = {1, 1, 4, 1.41, 1, 414, 1, 4142, 1, 41421, 1, 414213, 1, 4142135, 1, 41421356, . . . }, B = {2, 1, 5, 1.42, 1, 415, 1, 4143, 1, 41422, 1, 414214, 1, 4142136, 1, 41421357, . . . }. Un esempio di coppia di classi contigue che ammette un dato numero q ∈ Q come elemento di separazione è: A = {q − 1 : 10n n ∈ N}, B = {q + 1 : 10n n ∈ N}. Questi stessi esempi suggeriscono di introdurre una relazione di equivalenza tra coppie di classi contigue, nel modo seguente; sia Γ(Q) l’insieme delle coppie di classi contigue di numeri razionali e sia ≡ la relazione di equivalenza definita in Γ(Q) assumendo: (A, B) ≡ (A0 , B 0 ) se e soltanto se: 1) ∀a ∈ A ∃a0 ∈ A0 tale che a0 > a, 3) ∀b ∈ B ∃b0 ∈ B 0 tale che b0 < b, 2) ∀a0 ∈ A0 4) ∀b0 ∈ B 0 ∃a ∈ A tale che a > a0 , ∃b ∈ B tale che b < b0 . seguendo Cantor, possiamo definire il campo reale assumendo R := Γ(Q)/ ≡ . Si ben definiscono in R la somma, il prodotto e la relazione d’ordine in modo ovvio (è il modo obbligato), e si ha l’immersione Q(+,·,<) → R(+,·,<) : q 7→ [({q − 1 : 10n n ∈ N}, {q + 1 : 10n n ∈ N}]}, e questo numero di R si denota ancora con q, ecc. Si dimostra infine che ogni coppia di classi contigue di numeri reali ammette un elemento di separazione. 14 1.5.4. I numeri reali secondo il metodo assiomatico di Hilbert. Per illustrare le linee generali della caratterizzazione assiomatica di Hilbert dello spazio euclideo R3 della geometria elementare, abbiamo utilizzato la caratterizzazione del campo reale come corpo ordinato archimedeo completo. Ci proponiamo ora di chiarire questo punto. Supponiamo di aver già introdotto il campo reale R come completamento del campo razionale Q. Questo significa che ogni numero reale è una classe di equivalenza di successioni di Cauchy di numeri razionali, e che ogni successione di Cauchy di numeri reali è convergente ad un numero reale. Il campo reale R può essere d’altra parte caratterizzato assiomaticamente – e quindi definito – come (l’unico) campo ordinato archimedeo completo. Ricordiamo di che si tratta. Ricordiamo che un campo K si dice ordinato se è dato un sottinsieme P di K, detto insieme degli elementi positivi, tale che: 1. Legge di tricotomia: per ogni x ∈ K, vale una ed una sola delle seguenti alternative: x = 0, 2. Legge di compatibilità: P + P ⊆ P, x ∈ P, −x ∈ P. P · P ⊆ P. Nello stesso modo si definisce un corpo ordinato o, ancora più in generale, un anello ordinato (anche non commutativo). I risultati che seguono vengono formulati per un corpo (commutativo), ma si estendono facilmente ad un anello (commutativo o no). Se x ∈ P , si scrive x > 0. Se −x ∈ P , si scrive x < 0, e si dice che x è negativo. Si introduce in K una relazione d’ordine totale ≤, assumendo a ≤ b sse a = b oppure a < b, dove a < b significa, per definizione, b − a > 0. Si dimostrano facilmente le usuali regole delle disuguaglianze e la regola dei segni, secondo la quale il prodotto di due positivi o di due negativi è positivo mentre il prodotto di un positivo per un negativo è negativo16 ; da questa si deduce che il quadrato di un qualunque elemento a non nullo è positivo, in quanto: a2 = aa = (−a)(−a). Ne segue che l’unità u = u2 di K è positiva e pertanto nu > 0 per ogni n ∈ N, cosicché ogni campo ordinato K ha caratteristica zero; inoltre è facile verificare che l’isomorfismo tra il campo fondamentale di K ed il campo razionale Q è anche un isomorfismo di insiemi ordinati. Si noti che un campo ordinato non è algebricamente chiuso in quanto il polinomio X 2 + u non ha zeri in K (perché x2 + u > 0 per ogni x ∈ K); in altri termini: un campo algebricamente chiuso non è ordinabile; in particolare il campo complesso non può essere ordinato. Ricordiamo che un campo (o più generalmente un anello) ordinato K dicesi archimedeo se soddisfa la seguente condizione (detta il Postulato di Archimede): (A) Per ogni a, b ∈ K con a > 0 e b > 0, esiste n ∈ N tale che na > b. Si osservi che il Postulato di Archimede equivale alla condizione seguente (in cui u denota l’unità di K): (A’) Per ogni c ∈ K con c > 0, esiste n ∈ N tale che nu > c; infatti (A) implica ovviamente (A’) (si ponga in (A) a = u, b = c); inoltre (A’) implica (A) (si assuma c = b · a−1 e si moltiplichi la disuguaglianza nu > b · a−1 a destra per a ottenendo (nu)a > b · a−1 a, ossia 16 Questa regola dei segni di un campo ordinato non deve essere confusa con la regola ”più per più fa più, più per meno fa meno, meno per meno fa più”, che non ha un significato ordinale ma un significato puramente algebrico e che è valida in ogni anello A come conseguenza della proprietà distributiva del prodotto rispetto alla somma. Si inizia con dimostrare che lo zero è fattore nullifico: per ogni a ∈ A si ha a · 0 = 0 perché ab = a(b + 0) = ab + a · 0 ⇒ a · 0 = 0; poi si prova che per ogni a, b ∈ A si ha a(−b) = −(ab): infatti 0 = a · 0 = a(b − b) = a(b + (−b)) = ab + a(−b) ⇒ a(−b) = −(ab) (il che prova anche la proprietà distributiva del prodotto rispetto alla ”differenza”); infine si prova che per ogni a, b ∈ A si ha (−a)(−b) = ab: infatti (−a)(−b) = −((−a)b) = −(−(ab)) = ab. 15 na > b. Esempi. L’anello Z ed i campi Q ed R (ciascuno con l’ordinamento naturale) sono archimedei. Un esempio di campo non archimedeo è il campo R(X) delle funzioni razionali (frazioni algebriche), ordinato assumendo: (f (X) ∈ R(X)) f (X) > 0 sse esiste n ∈ N tale che f (x) > 0 per ogni x ∈ R tale che x > n. In effetti, la (A) non è soddisfatta, ad es. per b = X ed a = u, perché per ogni n ∈ N si ha nu < X, cioè X − nu > 0: infatti x − nu > 0 per ogni x ∈ R tale che x > n. Si può dimostrare che (cfr. B. Segre, Lectures on modern geometry, 1961, p. 28): Teorema 4 Un corpo ordinato archimedeo è necessariamente commutativo, cioè un campo. Un campo ordinato archimedeo K dicesi completo se ogni sovracampo ordinato archimedeo H ⊇ K, l’ordinamento del quale conservi l’ordinamento di K, coincide con K. Teorema 5 Un corpo ordinato archimedeo K è (a meno di isomorfismi) un sottocampo del campo reale R. Si ha dunque: Q ≤ K ≤ R. Dimostrazione (Cenni17 ). Sappiamo che il campo fondamentale di K è Q, quindi Q ≤ K. Utilizzando l’ipotesi che K sia archimedeo, si può dimostrare che: (*) se s ∈ K \ Q, allora s è il minimo dei maggioranti l’insieme Qs ; = {a ∈ Q : a < s}. Utilizzando la (*) si può dimostrare che: (**) se s ∈ K \ Q, allora s è definito da una successione di Cauchy di numeri razionali. La (**) assicura che s ∈ R, perché R è, per definizione, il completamento alla Cauchy di Q. Pertanto K ⊆ R. Dal Teorema (5) segue evidentemente che: Teorema 6 (Completezza del campo reale). Il campo reale R è ordinato archimedeo e non è ampliabile propriamente ad un campo ordinato archimedeo H > R . Dimostrazione Se un tale sovracampo H esistesse, si avrebbe l’assurdo R < H ≤ R. Dai Teoremi (5) e (6) segue evidentemente che: Teorema 7 (Caratterizzazione del campo reale). Il campo reale R è (a meno di isomorfismi) l’unico campo ordinato archimedeo completo. 17 Cfr. L. Lombardo-Radice, Dispense del corso di Geometria Superiore, Università di Roma, 1963, p. 20-24). 16 Osservazione. La (*) non è necessariamente vera per un campo K ordinato non archimedeo, ad esempio per il campo K = R(X), precedentemente considerato. Infatti X ∈ R(X) non è il minimo dei maggiorati di QX = {a ∈ Q : a < X} = Q perché ogni razionale a ∈ Q è maggiorato ad esempio da X/2, ed è: a < X/2 < X. 1.6 Sugli assiomi di continuità della retta. Confronto di segmenti. Siano AB e CD due segmenti qualunque. Sia B 0 il punto della semiretta di origine C contenente D tale che AB ≡ CB 0 . Diremo che AB è minore di CD (e scriveremo AB < CD) se CB 0 D. Versi di percorrenza su una retta. Utilizzando la relazione di intergiacenza tra terne di punti allineati è possibile definire su una retta qualsiasi due versi di percorrenza (tra loro opposti) nel modo seguente. Siano date su una qualunque retta r due punti distinti P, Q. Definiamo sulla retta r il verso di percorrenza da P a Q come la relazione < (”precede”) definita tra i punti di r nel modo seguente. Siano anzitutto a e b le semirette (aperte) di r aventi origine P , e sia b quella che contiene Q. Diciamo allora: che ogni punto di a precede sia P sia ogni punto di b; che il punto P precede ogni punto di b; che, dati due punti A1 , A2 ∈ a, si ha A1 < A2 se A1 A2 P ; che, dati due punti B1 , B2 ∈ b, si ha B1 < B2 se P B1 B2 . In modo analogo si definisce il verso di percorrenza da Q a P . Classi separate. Sia r una retta sulla quale sia stato fissato un verso di percorrenza. Siano a ed b due sottoinsiemi di r non vuoti e disgiunti. Si dice che (a, b) è una coppia di classi separate di punti di r, se ogni punto di a precede ogni punto di b. Un punto P della retta r si chiama un elemento di separazione di (a, b) se ogni punto di a distinto da P precede P , e se P precede ogni punto di b distinto da P . Una partizione ordinata (o sezione di Dedekind) della retta r è una coppia (a, b) di classi separate tale che a ∪ b = r; in altri termini (a, b) è una partizione di r in due classi separate. Evidentemente, se una partizione ordinata (a, b) della retta r ammette un elemento di separazione, questo è necessariamente unico (ed è il massimo di a oppure il minimo di b). Una coppia di classi contigue di punti della retta r è una coppia (a, b) di classi separate di punti di r tali che, fissato comunque un segmento EF , esistano un punto A ∈ a ed un punto B ∈ b per i quali AB < EF . Evidentemente, se una coppia (a, b) di classi contigue ammette un elemento di separazione, questo è necessariamente unico. La proprietà di continuità della retta è stata formulata da Dedekind e da Cantor attraverso due celebri postulati: Assioma di Dedekind. Per ogni partizione ordinata di una retta qualunque, esiste almeno un elemento di separazione. Assioma di Cantor. Per ogni coppia di classi contigue di punti di una retta qualunque, esiste almeno un elemento di separazione. Si può dimostrare che l’assioma di Dedekind equivale all’assioma di continuità di Hilbert e che ciascuno di essi equivale ai due assiomi di Cantor e di Archimede presi insieme (cfr. L. Berzolari, G. Vivanti, D. Gigli, Enciclopedia delle matematiche elementari ). Si ha cioè il teorema: Teorema 8 Assioma di Dedekind ⇔ (assioma di Cantor ∧ assioma di Archimede) ⇔ assioma della continuità di Hilbert. Continuità della retta e numeri reali. Il campo reale e la retta della geometria elementare sono stati qui presentati indipendentemente l’uno dall’altro. D’altra parte, è proprio la proprietà di continuità 17 che permette di stabilire una corrispondenza biunivoca tra i numeri reali x ed i punti P di una retta r sulla quale siano stati fissati un punto O come origine ed un segmento OU come unità di misura: dato un punto P ∈ r, ad esso si associa il numero reale x(P ) definito come la misura di OP rispetto ad OU ; viceversa, dato un numero reale x, ad esso si associa il punto P = P (x) di r tale che OP abbia misura x rispetto ad OU . L’assioma di Archimede è sufficiente per associare il numero reale x(P ) al punto P di r: il numero x(P ) – che è la misura di OP rispetto ad OU – si definisce facilmente (senza scomodare Archimede) quando OP ed OU sono commensurabili, cioè quando hanno un sottomultiplo comune; quel numero x(P ) si definisce anche quando OP ed OU sono incommensurabili, perchè allora, per mezzo del postulato di Archimede, si costruisce nel modo ben noto una coppia (a, b) di due classi contigue di punti, a = (A1 , A2 , . . . ) e b = (B1 , B2 , . . . ), di cui il punto assegnato P è l’elemento di separazione e si definisce poi x(P ) come l’elemento di separazione delle corrispondenti classi contigue di numeri razionali (x(A1 ), x(A2 ), . . . ) e (x(B1 ), x(B2 ), . . . ), che sono le cosiddette misure per difetto e per eccesso – a meno di un decimo, di un centesimo, ecc. – di OP rispetto ad OU . Inversamente, per associare il punto P (x) di r ad un arbitrario numero reale x, nel caso in cui x sia razionale si procede nel modo ben noto costruendo con riga e compasso il punto P (x) a partire dai punto O e U . Ma se x è irrazionale, è necessario ricorrere all’assioma di continuità della retta, nella forma di Cantor o di Dedekind. Ricordiamo come si procede. Se il numero irrazionale x viene presentato ad esempio alla Cantor come l’elemento di separazione di due classi contigue di numeri razionali (a1 , a2 , . . . ) e (b1 , b2 , . . . ), allora da queste si passa a costruire (con riga e compasso) le due classi contigue di punti corrispondenti sulla retta (A(a1 ), A(a2 ), . . . ) e (B(b1 ), B(b2 ), . . . ); queste ultime determinano (per l’assioma di continuità di Cantor) un punto P di separazione che viene assunto come il punto P (x) cercato. Analogamente, se il numero irrazionale x viene presentato come elemento di separazione di una sezione di Dedekind (a, b) del campo razionale, questa permette di costruire una corrispondente partizione ordinata della retta (”sezione di Dedekind della retta”) e questa determina (per l’assioma di continuità di Dedekind) un elemento di separazione P che viene assunto come il punto P (x) cercato. Osservazione didattica. Per chi non conosca affatto i numeri reali, la presentazione di un numero irrazionale come ”elemento di separazione di due classi contigue di numeri razionali” o come ”elemento di separazione di una partizione ordinata del campo razionale” potrebbe sembrare artificiosa. Da un punto di vista didattico può pertanto essere conveniente utilizzare la geometria per fare accettare i numeri reali come enti che sono di fatto nella natura delle cose: si parte dal dato (intuitivo e/o assiomatizzato) della retta dello spazio ordinario e si ”creano” i numeri (interi, razionali e ”irrazionali”) come misure dei segmenti, nel modo usuale, come ricordato poc’anzi. 1.7 Sugli assiomi di congruenza. Alla luce del teorema che caratterizza lo spazio ordinario A3 (R) (introdotto con gli assiomi di Hilbert), è chiaro come in tale spazio possa poi essere introdotta l’usuale struttura di spazio metrico (con la metrica euclidea), e quindi la nozione di isometria. Talvolta, nelle esposizioni intuitive della geometria elementare, si assume come primitivo il concetto di movimento rigido e si definiscono poi congruenti due figure (insiemi di punti) se esiste un movimento rigido che porta l’una figura sull’altra. Questa impostazione potrebbe a prima vista sembrare ingenua e tautologica. D’altra parte è proprio la via che era stata seguita da Giuseppe Peano nei suoi Principi di Geometria (1889), S’intuisce del resto come sia possibile variare gli assiomi di congruenza di Hilbert, traducendoli opportunamente nel linguaggio dei ”movimenti”. Si chiederà che è dato un gruppo di biezioni dell’insieme dei punti dello spazio in sé, che gode di opportune proprietà di ”transitività”, ecc. ecc. 18 2 Gli studi sui fondamenti della matematica. Se Hilbert aveva ricondotto la coerenza della geometria euclidea all’aritmetica, restava però aperto il problema della coerenza dell’aritmetica stessa. Hilbert pose esplicitamente questo problema nella sua memorabile conferenza, tenuta durante il Secondo Congresso Internazionale dei Matematici svoltosi a Parigi nel 1900, nella quale attirò l’attenzione della comunità matematica su 23 importanti problemi, come argomenti fondamentali da affrontare nel corso del secolo che stava iniziando18 . Gli assiomi di Peano non risolvono il problema della coerenza dell’aritmetica, perchè non è possibile dimostrare che essi non conducano ad una contraddizione. D’altra parte riflettendo sui numeri naturali 0, 1, 2, . . . i matematici della fine del 1800 sono stati naturalmente portati alla nozione di insieme. La teoria degli insiemi sorse ad opera di Georg Cantor, proprio come teoria dei numeri cardinali : la numerosità (o potenza) di un insieme viene definita come classe (di equivalenza) costituita dagli insiemi ponibili in corrispondenza biunivoca con l’insieme dato. Accanto alla teoria dei numeri cardinali, Cantor ha sviluppato anche una teoria dei numeri ordinali, che - per dirla in modo approssimativo - indicano la numerosità di un insieme ben ordinato: il numero ordinale degli elementi di un insieme ben ordinato è definito come classe degli insiemi (ben) ordinati ponibili con l’insieme dato in corrispondenza biunivoca che ne conservi l’ordinamento. Un insieme è infinito se può essere posto in corrispondenza biunivoca con una sua parte propria. In tal modo il concetto di infinito (che era in precedenza definito in modo rigoroso solo come infinito potenziale) entra a far parte del pensiero matematico come infinito attuale. Per un insieme finito il numero cardinale concide con il suo numero ordinale (e si identifica con un numero naturale); per gli insiemi infiniti cosı̀ non è, e Cantor perviene ad una teoria degli insiemi infiniti e ad una corrispondente aritmetica dei cardinali (e ordinali) infiniti. Tra i più duri avversari della teoria degli insiemi ricordiamo Leopold KRONECKER (1823-1891), Felix KLEIN, Henri POINCARÉ(1854-1912), che Ar rivò a dire che la teoria degli insiemi è un interessante caso patologico e predisse che i posteri considereranno la teoria degli insiemi di Cantor come una malattia da cui si è guariti. D’altra parte Hilbert nel 1926 disse: Nessuno riuscirà a cacciarci dal paradiso che Cantor ha creato per noi ed egli come Bertand Russell considerò l’opera di Cantor come una delle più belle realizzazione del pensiero matematico19 . Il tentativo di fondare in modo rigoroso l’aritmetica sulla teoria degli insiemi spostò il problema a quello di trovare una formulazione assiomatica della teoria degli insiemi che potesse dare garanzie di non contraddittorietà. A tal fine era necessario indagare sulla stessa logica, con la quale si sviluppavano le teorie matematiche, trovare insomma una base assiomatica per la logica stessa. Il problema dei fondamenti dell’aritmetica e della teoria degli insiemi diviene cosı̀ il problema dei fondamenti della matematica nel suo complesso e del ruolo della logica in matematica, problemi questi che erano venuti in modo drammatico alla ribalta con la scoperta di alcune contraddizioni, chiamate eufemisticamente paradossi, soprattutto nell’ambito della teoria degli insiemi. Ricordiamo alcuni paradossi tra i più noti. Paradosso di Burali-Forti (Cesare Burali-Forte, 1897): La collezione degli ordinali non è un insieme: la successione di tutti i numeri ordinali è ”ben ordinata e pertanto dovrebbe avere come ordinale il più grande di tutti i numeri ordinali. Paradosso di Richard (Jules Richard, 1905): L’insieme A dei numeri interi positivi che possono essere descritti a parole con al piú 100 lettere dell’alfabeto è non vuoto (contiene ad esempio: settantadue, nove per nove, ecc.) ed è finito perché usando le 26 lettere dell’alfabeto si possono formare al più 26100 espressioni 18 Il secondo problema di Hilbert era precisamente: Studiare l’indipendenza e la non contraddittorietà degli assiomi dell’aritmetica. Per un esame sullo stato attuale delle ricerche originate dallo studio dei ”Problemi di Hilbert”, cfr. J. Gray, We must know, we shall know: a history of the Hilbert problems. Oxford Univ. Press, 2000. Si veda anche: Il pensiero di David Hilbert a cento anni dai ”Grundlagen der Geometrie”, Suppl. n.1, vol. 55 della rivista ”Le Matematiche”, Catania 2000. Ci si limita qui a ricordare che Paul COHEN (1934- ) ha risolto nel 1963 il Primo Problema di Hilbert consistente nel dimostrare l’ipotesi del continuo, dovuta a Cantor, secondo cui non esiste alcun cardinale intermedio tra la potenza del numerabile e quella del continuo. La soluzione di Cohen è nel senso che il suddetto enunciato è indecidibile nel sistema di assiomi della teoria degli insiemi di Zermelo-Fraenkel, cioè né quell’enunciato né la sua negazione sono teoremi della teoria. Pertanto, se la teoria degli insiemi di Zermelo-Fraenkel è non contraddittoria, allora la teoria stessa resta non contraddittoria aggregandole come assioma l’ipotesi del continuo o la sua negazione. 19 Il Lettore riveda al riguardo la dimostrazione delle seguenti affermazioni. 1: N è infinito. 2: | N |=| Q | . 3: L’intervallo aperto reale ]0, 1[ è equipotente ad R. 4: | N |<| R |. 5: | A |<| P (A) | per ogni insieme A. 19 con al più 100 lettere (e molte di quelle espressioni non sono dotate di significato); sia B linsieme dei restanti numeri interi (quelli la cui descrizione richiede almeno 101 lettere). Anche B è non vuoto per quanto detto. Sia b l’intero definito come il piú piccolo numero di B. Dunque il più piccolo intero non descrivibile con al più 100 lettere può invece essere definito con meno di 100 lettere. Paradosso del barbiere (Bertrand Russell, 1918): Il barbiere di un piccolo villaggio non fa la barba a coloro che si radono da soli, ma la fa a tutti quelli che non si radono da soli. Un giorno il barbiere si domanda se dovrebbe o no radere se stesso. Se sı̀, allora no; se no, allora sı̀. Paradosso di Cantor: parlare di ”insieme di tutti gli insiemi” conduce ad una contraddizione. L’insieme degli insiemi che non contengono se stesso come elemento contiene se stesso come elemento? Se sı̀, allora no; se no, allora sı̀. Russell ha notato che la causa di questi paradossi consiste nel definire un oggetto in termini di una classe di oggetti che contiene l’oggetto stesso (definizione impredicativa). Ernst ZERMELO (1871-1953) ha osservato nel 1908 che la definizione di estremo inferiore di un insieme di numeri è impredicativa e che quindi l’analisi classica contiene dei paradossi. Per superare i paradossi, i matematici sostituirono alla teoria ingenua degli insiemi quale era stata elaborata da Cantor, altre teorie degli insiemi, di tipo assiomatico. Nasce cosı̀ il sistema assiomatico di Ernst Zermelo (1908), poi modificato da Abraham A. FRAENKEL (1921) (sistema ZF o di Zermelo-Fraenkel) e da J. von NEUMANN (1903-1957) nel 1925. Con queste teorie formali si sviluppa tutta la teoria degli insiemi necessaria all’analisi e si evitano i paradossi (o almeno non sono stati trovati). Ma riguardo al problema della coerenza, divenuto ormai cruciale, Poincaré osservava pessimisticamente: ”Abbiamo messo un recinto intorno al gregge per proteggerlo dai lupi, ma non sappiamo se ci fossero già dei lupi nel gregge” 20 . Secondo i critici, i sistemi assiomatici proposti avevano il difetto di presupporre l’uso della logica, proprio in un momento in cui era la logica stessa e la sua relazione con la matematica a dover essere investigata. All’inizio del Novecento tre grandi scuole di pensiero affrontatarono in modo netto la questione filosofica dei fondamenti della matematica: la scuola logicista (Russell e Whitehead), la scuola intuizionista (Brouwer) e la scuola formalista (Hilbert). Una svolta decisiva viene segnata dai teoremi di Gödel, che in qualche modo pongono un limite al problema della coerenza, e contribuirono ad indirizzare la filosofia della matematica verso altre problematiche. È in questo quadro rinnovato che sorge una scuola strutturalista (Nicolas BOURBAKI). Ancora sul buon ordinamento e su questioni collegate. Ritorniamo sulla nozione di buon ordinamento, nominata a proposito di quella di numero ordinale. Ricordiamo anzitutto alcune definizioni riguardanti gli insiemi parzialmente ordinati. Un insieme X si dice parzialmente ordinato (o poset) se è dotato di una relazione di ordine, ossia di una relazione riflessiva, antisimmetrica, e transitiva. La relazione d’ordine si denota comunemente con ≤, cosicché (X, ≤) è la notazione per il poset considerato. Un poset (X, ≤) si dice totalmente ordinato (o linearmente ordinato o una catena) se, dati comunque due suoi elementi x ed y, risulta necessariamente x ≤ y oppure y ≤ x. Un poset (X, ≤) si dice bene ordinato se ogni sua parte non vuota ha un minimo. Ad esempio l’ordinamento secondo grandezza è un buon ordinamento in N, ma non in Z, né in Q né in R. Un poset (X, ≤) si dice induttivo se ogni sua catena Y è maggiorata in X. Ad esempio risulta induttivo il poset degli ideali propri di un anello con unità rispetto all’inclusione; risulta induttivo il poset G(a, b) delle catene di estremi a e b di un poset X; non risulta induttivo l’insieme dei naturali (o dei reali) ordinato secondo grandezza. Un elemento z di un poset (X, ≤) dicesi massimale se: (x ∈ X, z ≤ x) ⇒ x = z. Si può dimostrare che le proprietà espresse dai seguenti quattro assiomi (o teoremi) sono equivalenti, e che la loro aggiunta ad un sistema di assiomi della teoria degli insiemi non ne altera il carattere di non contraddittorietà. Lemma di Zorn (Max Zorn, 1906 – ) Ogni insieme induttivo possiede un elemento massimale. 20 Cfr. Morris Kline, Storia del pensiero matematico, vol. II, Einaudi, 1991, p. 1382. 20 Assioma di Zermelo (Ernst Zermelo, 1871–1953). Ogni insieme può essere bene ordinato. Assioma della scelta. Per ogni insieme E non vuoto esiste almeno una funzione di scelta su E, ossia un’applicazione F : P ∗ (E) → E, dall’insieme P ∗ (E) delle parti non vuote di E ad E tale che: A ∈ P ∗ (E) ⇒ F (A) ∈ A. Proprietà di Tarski (1924) (Alfred Tarski, 1901 – 1983). Per ogni numero cardinale infinito c risulta c = c2 . Si noti che: (a) non si conosce esplicitamente una funzione di scelta su R, mentre su N si può assumere F (A) = min(A) per ogni A ∈ P ∗ (N). (b) non si conosce un buon ordinamento di R. Un buon ordinamento di N è quello naturale; questo induce (determina) un buon ordinamento in ogni insieme posto in corrispondenza biunivoca con N, in particolare in Z e in Q21 . 2.1 La scuola logicista. Il precedente storico immediato della scuola logicista di Russell e Whitehead era stata la matematizzazione della logica, che ebbe inizio nel XIX secolo con Augustus DE MORGAN che aveva formulato (nel 1847) le famose leggi che portano il suo nome: ¬(p ∨ q) ' (¬p) ∧ (¬q), ¬(p ∧ q) ' (¬p) ∨ (¬q) e che nel linguaggio della teoria degli insiemi si enunciano dicendo che ”il complementare dell’unione è l’intersezione dei complementari” e che ”il complementare dell’intersezione è l’unione dei complementari”: CE (A ∪ B) = CE (A) ∩ CE (A), CE (A ∩ B) = CE (A) ∪ CE (A). Nello stesso periodo George BOOLE aveva sviluppato una logica estensionale cioè una logica delle classi, giungendo alla assiomatizzazione di quella che oggi viene chiamata un’algebra di Boole, cioè un reticolo R(≤, ∩, ∪) con massimo e minimo, distributivo e complementato. L’opera di De Morgan e di Boole portò ad un effettivo sviluppo della logica aristotelica ed ebbe come conseguenza il distacco della logica dalla filosofia ed il suo inserimento nella matematica: nasceva la logica matematica. Fu Charles S. PEIRCE ad introdurre la distinzione tra una proposizione ove intervengono solo costanti (”Mario è un uomo”) ed una funzione proposizionale di una o più variabili (”x è un uomo”, ”x conosce y”, ecc.). La logica matematica fu dunque una matematizzazione della logica; essa ebbe come insigni rappresentanti Giuseppe PEANO in Italia e Gottlob FREGE in Germania. Quest’ultimo indicò una fondazione assiomatica della logica (Ideografia, 1879) ed utilizzò la sua logica per i Fondamenti dell’aritmetica (1884), con il proposito di costruire la matematica come una estensione della logica. La scuola logicista (che, come detto, si può fare risalire a Frege) trovò i suoi massimi rappresentatnti in Bertrand RUSSELL e Alfred North WHITEHEAD, che pubblicarono i Principles of Mathematics (1903) e poi i Principia Mathematica (3 voll., 1910–1913). Essi assumono come primitive le nozioni di proposizione elementare p, q, . . . e di funzione proposizionale p(x), affermazione di verità di una proposizione elementare, la negazione ¬p di una proposizione e la disgiunzione p ∨ q di due proposizioni; su questa base viene da loro costruita tutta la logica. Ad esempio l’implicazione p ⇒ q, da loro scritta alla Peano come p ⊃ q, è definita da ¬p ∨ q e vengono formulati vari postulati, tra i quali ad esempio: 21 Ricordiamo che si costruisce una bijeezione α : N → Q con il metodo di Cantor disponendo i numeri di Q in una matrice infinita e ponendo n/m ∈ Q nella casella di posto (n, m); tralasciando i numeri già considerati, si dispongono in una successione le coppie (n, m) seguendo l’ordine α(1) = (1, 1), α(2) = (2, 1), α(3) = (1, 2), α(4) = (3, 1), . . . , ecc. Per ottenere il buon ordinamento di Q si ’incolla’ tramite α il buon ordinamento di N su Q. Si noti che, come è evidente a priori, il buon ordinamento cosı̀ ottenuto su Q non è l’ordinamento usuale di Q. 21 1) (p ∨ p) ⊃ p, 2) q ⊃ (p ∨ q), 3) (p ∨ q) ⊃ (q ∨ p), 4) [p ∨ (q ∨ r)] ⊃ [q ∨ (p ∨ r)]. Dai loro postulati, Russell e Whitehead deducono vari teoremi di logica — ad esempio (p ⊃ ¬p) ⊃ ¬p (la ”riduzione all’assurdo”), p ∨ ¬p (il ”principio del terzo escluso”), ecc. — ed infine teoremi di aritmetica e di analisi . Gli insiemi vengono introdotti per mezzo di funzioni proposizionali, cosı̀ p(x) indica l’insieme di tutti gli oggetti per i quali p(x) è vera. Viene quindi sviluppata una teoria dei tipi: una funzione proposizionale è di tipo zero se si applica a membri x che sono singoli oggetti, di tipo 1 se si applica a membri x che sono funzioni proposizionali di tipo 0, di tipo n + 1 se si applica a membri x che sono funzioni proposizionali di tipo n. La teoria dei tipi cerca di evitare i paradossi della teoria degli insiemi, in particolare evitando le definizioni impredicative, ossia imponendo che ciò che viene definito utilizzando tutti i membri di una collezione non debba essere membro della collezione medesima. Un nuovo definitivo passo in avanti fu compiuto da GÖDEL. Egli dimostrò nel 1935 che non è possibile stabilire la coerenza della teoria dei numeri qualora ci si limiti alla logica della metamatematica. Hermann WEYL commentò questo risultato dicendo che Dio esiste perché la matematica è coerente ed il diavolo esiste perché non possiamo dimostrAr ne la coerenza. Russell e Whitehead sviluppano poi una teoria delle classi, ove per classe s’intende la totalità degli oggetti che soddisfano una determinata proprietà; gli insiemi sono classi ma non viceversa; una classe propria è una classe che non è un insieme: le classi hanno la caratteristica di non poter essere elemento di altre classi. Sono esempi di classi proprie: la classe di tutti gli ordinali, la classe di tutti gli insiemi, la classe degli insiemi che non contengono se stessi come elemento; se queste classi fossero insiemi condurrebbero ad una contraddizione. Le relazioni (binarie) sono classi di coppie che verificano una funzione proposizionale di due variabili. Si definisce poi 22 la nozione di corrispondenza biunivoca tra classi, che conduce alla definizione di numero cardinale (la classe delle classi ponibili in corrispondenza biunivoca con una classe data). Dai numeri cardinali, si passa poi ai numeri naturali, e quindi ai razionali, ai reali, ai complessi, alle funzioni, e finalmente a tutta l’analisi e alla geometria euclidea. In tal modo la scuola logicista intendeva assolvere al programma di fondare tutta la matematica sulla logica. Merito di Russell e Whitehead e della scuola logicista è stato indubbiamente quello di aver fondato una logica espressa su base assiomatica ed in forma interamente simbolica, contribuendo cosı̀ in modo sostanziale alla sviluppo e alla diffusione della logica matematica. Tuttavia a prescindere da alcune critiche di carattere tecnico, è stato messo in evidenza la difficoltà ad aderire fideisticamente ad una filosofia della matematica in base alla quale tutta la matematica sarebbe una scienza puramente formale, logicodeduttiva, in cui i teoremi seguono dalle leggi del pensiero, prescindendo non solo dalla intuizione ma soprattutto dall’esperienza fisica. 2.2 La scuola intuizionista. L’origine di questa filosofia della matematica si può fare risalire a KRONECKER, che aveva fortemente avversato la teoria degli insiemi di Cantor come ”puro misticismo” ed aveva auspicato una fondazione della matematica sui numeri interi (”creati da Dio”), ottenuta introducendo tutti gli enti matematici con metodi costruttivi e con un numero finito di passi; in particolare egli rifiutava i numeri irrazionali, considerati ”non esistenti”. La filosofia intuizionista prese vigore con la scoperta dei paradossi, e trovò un suo primo grande propugnatore in Henri POINCARÉ(1954-1912), che avversò la teoria degli insiemi e soprattutto la filosofia del logicismo, che secondo lui rischiava di ridurre tutta la matematica ad una colossale tautologia. Poincaré riteneva che tutte le definizioni dovessero essere costruttive e perciò rifiutava l’assioma della scelta; egli affermava che l’aritmetica non può essere fondata assiomaticamente, ma costituisce un a priori 22 È da notare che la nozione di corrispondenza biunivoca non presuppone il numero 1 (altrimenti si otterrebbe un circolo vizioso): una corrispondenza tra la classe A e la classe B è definita come una data classe C di coppie (a, b) con a ∈ A e b ∈ B; la corrispondenza C è biunivoca se: 1) per ogni a ∈ A esiste qualche b ∈ B per cui (a, b) ∈ C; 2) per ogni b ∈ B esiste qualche a ∈ A per cui (a, b) ∈ C; 3) se (a, b) e (a, b0 ) sono in C, allora b = b0 ; 4) se (a, b) e (a0 , b) sono in C, allora a = a0 . 22 della nostra intuizione, come lo è l’induzione matematica. Simili affermazioni vennero sporadicamente fatte da altri eminenti matematici quali Emile BOREL (1871–1956), René BAIRE (1874–1932), Jacques HADAMARD (1865–1963) e Henri LEBESGUE (1875-1941), ma fu Luitzen BROUWER (1881–1966) che sviluppò sistematicamente tali idee, tanto da poter essere considerato il fondatore della scuola intuizionistica, che fra l’altro rifiutava il principio del terzo escluso e le dimostrazioni per assurdo. Tale scuola, alla quale aderı̀, per molti versi, anche Hermann WEYL, non si limitò alla critica del logicismo, ma ricostruı̀ una nuova matematica basata sulle costruzioni finitiste ritenute accettabili. Si noti che questa filosofia della matematica propugnata dalla scuola intuizionista treva un suo corrispettivo nella filosofia del senso comune di Henri BERGSON e di altri. 2.3 La scuola formalista. A capo di questa scuola troviamo HILBERT, che, dopo aver ricondotto la coerenza della geometria euclidea a quella dell’aritmetica, si volse nel 1904 al problema di fondare assiomaticamente l’aritmetica senza la teoria degli insiemi dimostrandone poi la coerenza. Si tratta del cosı̀ detto programma hilbertiano, al quale egli si dedicò intensamente a partire dal 1920 e che raccolse il consenso di molti matematici. Le idee fondamentali dei formalisti si possono riassumere nei termini seguenti. Poiché la fondazione della matematica deve tener conto della logica, bisogna trattare contemporaneamente la logica e la matematica; di più, poiché la matematica è costituita da vari discipline, bisogna che ogni disciplina abbia una sua propria fondazione assiomatica, costituita da concetti e principi sia logici sia matematici; ed ancora: la logica è un linguaggio fatto di segni che traduce gli enunciati in formule ed esprime i ragionamenti per mezzo di procedimenti puramente formali. Gli assiomi forniscono le regole con cui certe formule derivano da altre formule. I segni ed i simboli di queste operazioni ed i simboli matematici sono svuotati da ogni significato. Secondo questa concezione, l’essenza della matematica sono i simboli, che non vanno intesi come idealizzazioni di oggetti fisici. La matematica diventa un insieme di sistemi formali, ciascuno con propri concetti, propri assiomi, proprie formule ben formate, e proprie regole di deduzione. Per alcuni sistemi formali molto semplici, Hilbert e la sua scuola (W. Ackermann, P. Bernays (1888–1972), J. von Neumann (1903– 1957) riuscirono a dimostrare la coerenza, ma al programma di dimostrare la coerenza dell’aritmetica infersero un colpo definitivo i risultati di Kurt Gödel (1931), dai quali discendeva che nessun sistema formale può contenere una qualsiasi branca significativa della matematica, perché ogni tale sistema formale è incompleto ossia contiene enunciati, i cui concetti appartengono al sistema, che non possono però essere dimostrati all’interno del sistema stesso. Tuttavia, nonostante il suo fallimento, il programma di Hilbert lasciò una notevole eredità di risultati metamatematici riguardanti la teoria della dimostrazione, consentendo infine di pervenire alla concezione moderna secondo cui l’attività matematica consiste essenzialmente nella dimostrazione di teoremi, la cui esecuzione prescinde dai contenuti specifici delle singole teorie 23 . 2.4 La critica di Gödel. Come già accennato, il programma formalista di Hilbert consisteva nel tentativo di dimostrare la coerenza della teoria formale dell’aritmetica (cioè dei numeri naturali) utilizzando metodi finitisti ed all’interno di una teoria che comprendesse sia i termini e le regole logiche di deduzione formale sia i termini dell’aritmetica. Realizzare questo programma è impossibile, in quanto sussiste il secondo teorema di incompletezza di Gödel, che ha inferto un colpo fatale al programma stesso. Accenniamo brevemente di cosa si tratta, ricordando altri due fondamentali teoremi dello stesso Kurt GÖDEL (1906-1978). Teorema di completezza di Gödel. Una formula che sia realizzata in tutti i modelli di una teoria 23 Cfr. D. Palladino e C. Palladino, Breve dizionario di logica, carocci, 2005, p. 45-46. 23 del primo ordine è dimostrabile in tale teoria. In altri termini, per una qualunque teoria del prim’ordine, una formula è dimostrabile se e soltanto se è valida (cioè in tale teoria i teoremi coincidono con le formule valide). Primo teorema d’incompletezza di Gödel. Se una teoria formale dell’aritmetica è non contraddittoria, esiste una formula F della teoria tale che né F né non − F sono dimostrabili nella teoria. In altri termini, se una teoria formale dell’aritmetica è non contraddittoria, essa non è una teoria completa. Secondo teorema d’incompletezza di Gödel. Se una teoria formale dell’aritmetica è non contraddittoria, non è possibile dimostrare la sua non–contraddittorietà con metodi formalizzabili all’interno di quella teoria. Un altro importante teorema di Gödel (1940) riguarda l’ipotesi del continuo; questa ipotesi afferma la non esistenza di cardinali intermedi tra il numerabile ed il continuo. Il risultato di Gödel è il seguente: Teorema. Se la teoria degli insiemi è non contraddittoria, si può aggiungere ai suoi assiomi l’ipotesi del continuo. Questo risultato è migliorato da un celebre teorema di Paul Cohen (1934–) già citato, dal quale segue l’indipendenza dell’ipotesi del continuo dagli assiomi della teoria ZF degli insiemi, in quanto afferma che: Teorema di Cohen (1963). Se la teoria degli insiemi di Zermelo-Fraenkel è non contraddittoria, si può aggiungere ai suoi assiomi tanto l’ipotesi del continuo quanto la sua negazione. Lo stesso Cohen ha dimostrato (1963) un analogo risultato per quanto riguarda l’assioma della scelta. Egli ha inoltre dimostrato che anche aggiungendo l’assioma della scelta al sistema di Zermelo-Fraenckel, l’ipotesi del continuo non può essere dimostrata. 2.5 La scuola strutturalista. Un tentativo di rifondare il complesso della matematica moderna su basi assiomatiche è stato compiuto da un gruppo di matematici francesi (Henri cartan, Claude Chevalley, Jean Dieudonne, André Weil) che si sono raccolti sotto lo pseudonimo collettivo di Nicolas Bourbaki, dal nome di un generale di Napoleone III. Il gruppo, fondato nel 1933, cominciò a operare nel 1939 e si è continuamente rinnovato nella composizione, in quanto vi vige la regola ferrea che i suoi membri vengono espulsi al compiere del quarantesimo anno. Bourbaki ha pubblicato un trattato in più volumi dal titolo Elementes des Mathématiques, che è diventato un’opera fondamentale di riferimento per i matematici; esso prende le mosse dalla teoria degli insiemi ed articola poi l’esposizione della matematica secondo le varie strutture presenti (algebriche, d’ordine, topologiche, ecc.). Si noti che in ogni campo (filosofia, sociologia, antropologia, psicanalisi, teoria del linguaggio, ecc.) lo strutturalismo privilegia le relazioni che intercorrono tra gli oggetti che vengono studiati; basti pensare alle opere del grande antropologo Claude Lévi-Strauss. Tra i meriti storici del gruppo bourbakista c’è quello di aver diffuso tra i matematici di tutto il mondo un linguaggio comune e notazioni di tipo standard e che in gran parte si rifanno a quelle introdotte da Giuseppe Peano. Il gruppo è ancora attivo sotto forma di Seminaire Bourbaki di cui pubblica annualmente dei Rendiconti. 24 2.6 Conclusione. Per concludere, si può dire che siano tutti falliti i tentativi di trovare una soluzione definitiva al problema di stabilire dei fondamenti certi della matematica, risolvendo in modo soddisfacente il problema della sua coerenza. Per ironia della sorte, dopo tante ricerche, si è tornati, soprattutto con le moderne concezioni proprie dell’intuizionismo, alla posizione che avevano inizialmente i matematici greci, che si affidavano fondamentalmente alla intuizione, ai metodi costruttivi e finitistici. Forse è addirittura sbagliato pensare che si possa trovare una soluzione definitiva al problema di cosa debba essere e come debba essere organizzata la matematica; forse la matematica si evolve storicamente, come le arti figurative, come la musica, trovando nelle varie epoche la sua propria fisionomia e la sua propria giustificazione in relazione alla evoluzione della filosofia, delle altre scienze e della tecnica. Chiudiamo questa esposizione con le parole di Poincaré, secondo cui: . . . la vera matematica, quella che serve a qualche utile scopo, può continuare a svilupparsi secondo i propri principi, senza prestare alcuna attenzione alle tempeste che infuriano intorno a lei, e proseguirà passo dopo passo le sue consuete conquiste, che sono definitive e che non sarà mai necessario abbandonare 24 . 3 Un tributo ad Euclide: costruzioni con riga e compasso, i numeri euclidei e i problemi impossibili dell’antichità Ricordiamo che il primo ed il terzo postulato di Euclde assicurano rispettivamente ”che si possa condurre una retta da un qualsiasi punto ad ogni altro punto” e che ”si possa descrivere un cerchio con qualsiasi centro e ogni distanza”. Questi due postulati affermano la possibilità di ”costruire” la retta per due punti e la circonferenza di dato centro e raggio. Gli strumenti che permettono materialmente di effettuare queste costruzioni sono la riga e il compasso. Si intende che la riga non è graduata. In altri termini la riga permette soltanto di tracciare la retta per due punti dati, mentre il compasso permette di tracciare la circonferenza che abbia un dato punto come centro ed un dato segmento come raggio. I greci prediligevano la linea retta e la circonferenza, forse anche a causa della loro particolare bellezza e semplicità rispetto ad altre curve. Il volere limitare i metodi di costruzione geometrica all’uso della riga e del compasso rispondeva alla esigenza di ridurre ogni problema, per quanto complicato, ad elementi che fossero il più possibile ’semplici’. Se A e B sono due punti distinti, denotiamo con lo stesso simbolo AB sia la retta per questi due punti che il segmento con questi due estremi; e denotiamo con C(O, AB) la circonferenza di centro il punto O e raggio AB. Procediamo ricordando anzitutto come con l’uso della riga e del compasso si possono effettuare alcune costruzioni geometriche ed alcune operazioni algebriche, per poi esaminare le ragioni profonde per le quali alcune costruzioni sono possibili ed altre impossibili: un bell’esempio di matematica che riflette su se stessa. COSTRUZIONI GEOMETRICHE ELEMENTARI CON RIGA E COMPASSO Ne ricordiamo alcune. Asse di un segmento AB: è la retta M N dove {M, N } = C(A, AB) ∩ C(B, AB). b è l’asse del segmento AB 0 dove {A} = C(O, OA) ∩ a e {B 0 } = b = ab: Bisettrice di un angolo AOB C(O, OA) ∩ b. Perpendicolare per un punto P ad una retta a: è l’asse del segmento AB dove {A, B} := a ∩ C(P, M N ) e M N è un segmento arbitrario (grande quanto basta affinché quella intersezione non sia vuota). Parallela per un punto P ad una retta a: è la perpendicolare per P alla retta perpendicolare per P ad a. 24 H. Poincaré. The foundation of science, 1946, p. 480. 25 Supponiamo anche note le seguenti altre costruzioni con riga e compasso: Dividere un segmento AB in n parti uguali: si usi il Teorema di Talete. Inscrivere in una circonferenza un n−gono regolare, per n = 3, 4, 5, 6, 8. Particolarmente interessante – per contrapposizione all’analogo probema della quadratura del cerchio, di cui si dirà tra breve – appare la costruzione seguente. Quadratura di un poligono convesso assegnato. Si tratta di costruire con riga e compasso un quadrato avente la stessa area di un assegnato poligono convesso P = P1 P2 . . . Pn . Si procede in quattro passi: 1) Costruzione di un triangolo T equivalente a P. Se n > 3, costruiamo anzitutto un poligono con n − 1 lati ed equivalente al poligono dato: si traccia la diagonale P1 P3 , e poi la parallela per il punto P2 a tale diagonale, fino ad incontrare – diciamo in un punto P20 – il prolungamento del lato P4 P3 . I triangoli P1 P2 P3 e P1 P20 P3 sono equivalenti (hanno la stessa base P1 P3 e la stessa altezza, che è l’ampiezza della striscia compresa tra le due rette parallele P1 P3 e P2 P20 ). Sostituendo il triangolo P1 P2 P3 con il triangolo P1 P20 P3 si ottiene un poligono con n − 1 lati equivalente a P . Iterando il procedimento si giunge a costruire un triangolo T equivalente a P. 2) Costruzione di un parallelogramma P’ equivalente ad un triangolo T = ABC. Sia M il punto medio di AC e sia N il punto di intersezione tra la parallela per M ad AB e la parallela per B ad AC. Il parallelogramma P’ = ABM N e il triangolo T sono equivalenti perché sono composti da poligoni congruenti. 3) Costruzione di un rettangolo R equivalente ad un parallelogramma P’ = ABM N . Si costruscano le perpendicolari per A e per B ad AB e si considerino le loro intersezioni A0 e B 0 con M N . Allora il rettangolo R = ABB 0 A0 e il parallelogramma P’ sono equivalenti perché somme o differenze di poligoni congruenti. 4) Costruzione di un quadrato Q equivalente ad un rettangolo R = ABB 0 A0 . Il lato del quadrato Q è medio proporzionale tra AB e AB 0 e pertanto si costruisce come altezza di un triangolo rettangolo avente come proiezioni dei cateti sull’ipotenusa segmenti conguenti ad AB e ad AB 0 . OPERAZIONI ELEMENTARI CON RIGA E COMPASSO √ Costruzione dei punti P (a ± b), P (ab), P (a/b), P ( a): Sia fissato nel piano un riferimento cartesiano ortogonale monometrico. Siano dati il punto origine O(0, 0), ed i punti unità U1 (1, 0), U2 (0, 1) dei due assi. Dati sull’asse delle ascisse i punti A(a) e B(b), si possono costruire con riga e compasso, i punti seguenti: P (a ± b): in modo ovvio. P (ab) è il punto in cui l’asse delle ascisse incontra la parallela per il punto (0, b) alla retta (0, 1)(a, 0) (per il Teorema di Talete). P ( a1 ): si considera un triangolo rettangolo con altezza 1 relativa alla ipotenusa e proiezione a di un cateto relativo alla ipotenusa; allora a1 è la proiezione dell’altro cateto sull’ipotenusa. P ( ab ): è il punto P(a· 1b ). a si utilizza il Teorema di Talete per la divisione di un segmento in n parti uguali. P (√ n ) con n ∈ N : √ P ( a: il numero a è l’altezza relativa alla ipotenusa di un triangolo rettangolo con proiezioni 1 e a dei cateti sull’ipotenusa. PUNTI COSTRUIBILI CON RIGA E COMPASSO A PARTIRE DA UN INSIEME ASSEGNATO DI PUNTI Sia fissato nel piano un riferimento cartesiano ortogonale monometrico. Sia inoltre assegnato nel piano un insieme finito P di k ≥ 3 punti. A partire dai punti di P possiamo considerare due tipi di costruzioni: 26 Costruzioni di primo tipo: Costruzione dell’insieme R(P) delle rette congiungenti due punti distinti arbitrari di P. (Si noti che | R(P)|≤ k(k − 1)/2.) Costruzioni di secondo tipo: Costruzione dell’insieme C(P) delle circonferenze di centro un punto arbitrario di P e raggio uguale al segmento di estremi due punti arbitrari di P. (Si noti che si dispone di k scelte per il centro e di h ≤ k(k − 1)/2 scelte per il raggio, scelte che conducono a kh circonferenze.) Definizione 9 I punti del piano costruibili in un passo (con riga e compasso) a partire da P, sono i punti intersezione di due oggetti di R(P)∪C(P), ossia di due rette, oppure di una retta e di una circonferenza oppure di due circonferenze tracciate eseguendo una costruzione di primo e di secondo tipo. Definizione 10 Un punto P del piano si dice costruibile (con riga e compasso) a partire da P, se esiste una successione finita di punti del piano: P1 , . . . , Pn = P tali che: 1) P1 è costruibile in un passo da P, 2) per ogni i = 2, . . . , n, si ha che Pi è costruibile in un passo da P ∪ {P1 , . . . , Pi−1 }. Definizione 11 Le coordinate a e b di un punto costruibile (con riga e compasso a partire da P) si dicono numeri costruibili (con riga e compasso a partire da P). Al problema di trovare una condizione necessaria affinché un punto (un numero) sia costruibile con riga e compasso a partire da P risponde il seguente Teorema di Pierre Laurent WANTZEL (1814-1848). Teorema 12 Sia dato un insieme finito P di punti del piano euclideo nel quale sia fissato un riferimento cartesiano ortogonale monometrico e sia K0 il campo generato dalle coordinate dei punti di P ossia il minimo sottocampo di R che contiene le coordinate di tali punti. Se un punto P (a, b) è costruibile (con riga e compasso a partire da P), allora ciascuna delle sue coordinate è un numero algebrico su K0 di grado una potenza di due, cioè è radice di un polinomio di K0 [X] ivi irriducibile e di grado una potenza di due. Se in particolare K0 = Q, i numeri costruibili si chiamano numeri euclidei, e sono precisamente numeri algebrici di grado una potenza di due. Dimostrazione25 . Sia P un punto costruibile a partire da P, Consideriamo una sequenza di insiemi di punti che indica una costruzione di P : P ⊂ P ∪ {P1 } ⊂ ··· ⊂ P ∪ {P1 , . . . , Pn = P } e consideriamo la sequenza dei campi associati a questi insiemi di punti: K0 ≤ K1 ≤ ... ≤ Kn , dove cioè Ki è il campo generato dalle coordinate di P ∪ {P1 , . . . , Pi }. Si noti che congiungere due punti od intersecare due rette non fa uscire dal campo di razionalità degli enti assegnati, mentre invece intersecare una retta ed una circonferenza oppure due circonferenze fra loro può eventualmente fare uscire dal campo di razionalità degli enti assegnati conducendo ad un campo estensione quadratica di quello: 25 La dimostrazione del Teorema di Wantzel è assai istruttiva perché consiste in una semplice riflessione sul tipo di calcoli che si compiono nel risolvere i più semplici problemi di geometria analitica: retta per due punti, intersezione di due rette, intersezione di una retta e di una circonferenza, intersezione di due circonferenze. 27 1. la retta per due punti con coordinate in un campo Ki ha equazione con coefficienti nello stesso Ki ; 2. il punto intersezione di due rette con equazioni a coefficienti in un campo Ki ha coordinate in Ki ; 3. un punto itersezione di una retta e di una circonferenza oppure di due circonferenze con equazioni a coefficienti in un medesimo campo Ki è un punto che ha coordinate in Ki oppure in un campo estensione quadratica di Ki (qualora l’equazione risultante di secondo grado alla quale si perviene ponendo a sistema le equazioni date sia priva di radici in Ki ). Da 1-3 segue che, nella suddetta sequenza dei campi si ha in ogni caso Ki+1 = Ki (t), dove t è una radice di un polinomio f (X) ∈ Ki [X] irriducibile di grado d ≤ 2; il campo Ki+1 è un Ki −spazio vettoriale di dimensione [Ki+1 : Ki ] = d ∈ {1, 2}, ove naturalmente, se d = 1 si ha t ∈ Ki e Ki+1 = Ki . Conseguentemente: [Kn : K0 ] = [Kn : Kn−1 ] · · · [K2 : K1 ][K1 : K0 ] = 2h dove 0 ≤ h ≤ n. In conclusione, se un punto P (a, b) è costruibile (con riga e compasso a partire da P), ciascuna delle sue coordinate è anzitutto un numero algebrico su K0 ed inoltre il suo di grado di algebricità su K0 è una potenza di due26 . Viceversa mostriamo che un numero reale α algebrico su K0 di grado una potenza di due, 2i , è costruibile con riga e compasso a partire da P, purché il campo K := K(α) contenga una catena di sottocampi K0 < K1 < · · · < Ki−1 < Ki = K tali che [Ks : Ks−1 ] = 2 per ogni s = 1, 2, . . . , i. Se i = 0, allora √ α è ovviamente costruibile al pari di ogni elemento di K0 ; se i > 0, allora α è della forma α = a + b c, con a, b, c ∈ Ki−1 . Procedendo per induzione su i, possiamo supporre che a, b, c siano costruibili e da ciò segue subito che anche α lo è in quanto le operazioni da effettuare su a, b, c per ottenere α possono essere eseguite con riga e compasso. Si noti che la condizione espressa dal Teorema di Wantzel (algebricità di grado una potenza di 2) è necessaria ma non sufficiente, in quanto, come insegna la Teoria di Galois, esistono estensioni algebriche di K0 = Q di grado una potenza di due non ottenibili effettuando successive estensioni di grado 2. Si noti che se P = {(0, 0), (1, 0), (0, 1)}, si ha K0 = Q, ed i numeri costruibili con riga e compasso sono precisamente i numeri euclidei. I PROBLEMI ’IMPOSSIBILI’ DELL’ANTICHITÀ I problemi ”impossibili” dell’antichità sono: La duplicazione del cubo, la quadratura del cerchio, la rettificazione della circonferenza e la trisezione dell’angolo. Dopo oltre duemila anni dalla loro formulazione, è stato dimostrato che questi problemi sono di impossibile soluzione. Sebbene questa impossibilità sia stata dimostrata rigorosamente, esistono ancora oggi matematici dilettanti e amatori della matematica che cercano di ottenere le costruzioni richieste. Le loro argomentazioni contengono errori di deduzione, oppure risolvono il problema in qualche caso particolare, mostrando cosı̀ la non conoscenza esatta del problema. È estremamente interessante il fatto che una disciplina scientifica (la matematica) rifletta su se stessa e sancisca che alcuni problemi della stessa disciplina sono di risoluzione impossibile. Il problema della duplicazione del cubo. Dato lo spigolo a di un cubo, costruire con√ riga e compasso lo spigolo b del cubo di volume doppio. La condizione porta a b3 = 2a3 e dunque a b = a 3 2. Assumendo un riferimento cartesiano in cui il segmento a sia il segmento dell’asse delle ascisse con estremi i punti √ (0, 0) e (1, 0), si tratta di costruire con riga e compasso il punto ( 3 2, 0), ossia costrure, come si dice, il √ esempio il numero a + b 3, con a e b razionali è euclideo (costruibile dai punti (0, 0), (1, 0), (0, 1)), in accordo col fatto 2 2 2 che √ esso è algebrico √ di grado 2: infatti annulla il polinomio X − 2aX + a − 3b che è irriducibile su Q perché (X − (a + b 3))(X − (a − b 3) è la sua (unica) fattorizzazione. 26 Ad 28 √ √ numero 3 2, a partire dall’insieme P = (0, 0), (1, 0), (0, 1). In questo caso K0 = Q. Il numero 3 2 è però un numero algebrico di grado 3 (infatti è radice del polinomio X 3 − 2, irriducibile su Q per il criterio di Eisenstein27 e dunque, a norma del Teorema di Wantzel, non è un numero costruibile. Dunque il problema della duplicazione del cubo è impossibile28 . Il problema della quadratura del cerchio. Costruire con riga e compasso un quadrato avente la stessa area di un cerchio di raggio r assegnato. La costruzione è impossibile29 Vediamo perché.√Il cerchio dato ed il quadrato da costruire hanno area πr2 . Il lato del quadrato da costruire vale dunque r π. Come nel caso precedente possiamo assumere r come segmento unitario sull’asse delle √ ascisse. Si tratta dunque a partire dai punti (0, 0) e (1, 0) di costruire con riga e compasso il punto ( π, 0), ossia costrure, come si √ √ dice, il numero π. Questo è impossibile perché π è trascendente, in quanto, come ha dimostrato nel 1882 Ferdinand LINDEMANN (1852-1939), il numero π è trascendente, mentre i numeri costruibili con riga e compasso sono, a norma del Teorema di Wantzel, (particolari) numeri algebrici.30 Il problema della rettificazione della circonferenza. Costruire con riga e compasso un segmento avente la stessa lunghezza di una circonferenza di raggio assegnato. La costruzione è impossibile. Già Archimede aveva dimostrato l’equivalenza tra questo problema e quello della quadratura del cerchio. Nel caso della circonferenza, si tratterebbe evidentemente di costruire il numero π con riga e compasso a partire dai punti (0, 0) e (1, 0) dell’asse delle ascisse, e questo è impossibile perché π è trascendente e dunque non è costruibile a norma del Teorema di Wantzel. Il problema della trisezione dell’angolo. Ripartire con riga e compasso un angolo dato in tre angoli uguali. Dimostriamo che: Lemma 13 Un angolo di misura θ in radianti è trisecabile con riga e compasso sse il polinomio 4X 3 − 3X − cos θ è riducibile in Q(cos θ)[X] 31 (1) . Dimostrazione. Si cominci con l’osservare che un angolo di misura θ in radianti è dato sse è dato il punto (cos θ, 0). Pertanto un angolo di misura θ è trisecabile con riga e compasso sse il punto Q = (cos θ3 , 0) è costruibile con riga e compasso a partire dai numeri del campo Q(cos θ). Questa costruibilità implica - per il Teorema di Wantzel - che il numero θ cos 3 sia algebrico su Q(cos θ) di grado una potenza di due. Ricordiamo ora la formula trigonometrica cos 3α = 4 cos3 α − 3 cos α; (2) 27 Il criterio di Eisenstein (Ferdinand Gotthold Eisenstein, 1823-1852) afferma che se F (X) = X n + a n−1 + · · · + a è n−1 X 0 un polinomio a coefficienti in Z , se p è un numero primo che divide tutti gli ai (0 ≤ i ≤ n − 1) e se p2 non divide a0 , allora F (X) è irriducibile in Q[X]. Alternativamente: se X 3 − 2 fosse riducibile su Q avrebbe uno zero m con m, n interi primi fra n loro, e quindi si otterrebbe m3 = 2n3 , il che è impossibile perché il primo membro contiene il fattore 2 con esponente congruo a 0 modulo 3, mentre il secondo membro contiene il fattore 2 con esponente congruo a 1 modulo 3. Alternativamente ancora: se X 3 − 2 fosse riducibile in Q[X] allora (per il Lemma di Gauss) sarebbe riducibile in Z[X] e dunque (passando modulo 4) sarebbe riducibie in Z4 [X] il polinomio X 3 − 2 = X 3 + 2, che invece è ivi irriducibile perché X 3 + 2 non ha zeri in Z4 . 28 Si noti che invece è risolubile Il problema della duplicazione del quadrato: dato il lato a di un quadrato, costruire con riga e √ compasso il lato x del quadrato di area doppia. La condizione porta a x2 = 2a2 e dunque a x = a 2. Dunque x è la diagonale del quadrato Q di lato a. Il quadrato Q è costruibile con riga e compasso a partire dal segmento a. Dunque anche la diagonale di Q lo è. 29 Mentre, come abbiamo visto, è possibile quadrare con riga e compasso un qualsiasi poligono convesso. 30 Si ricordi che un numero è trascendente se non è algebrico (vale a dire non annulla alcun polinomio a coefficienti razionali non tutti nulli). Si ricordi che i numeri algebrici formano un campo: il campo algebrico; in particolare il quadrato di un numero algebrico è algebrico (equivalentemente: la radice quadrata di un numero trascendente è trascendente). 31 Q(cos θ) è il campo estensione di Q con l’aggiunta del numero cos θ, ossia l’intersezione di tutti i campi contenenti Q e cos θ. 29 ponendovi α = θ3 , si ottiene: cos θ = 4 cos3 θ θ − 3 cos . 3 3 Questa uguaglianza prova che cos θ3 è sicuramente algebrico su Q(cos θ) di grado d ≤ 3 perché annulla il polinomio (1); il numero cos θ3 è poi costruibile sse il suo grado di algebricità è d = 1 oppure d = 2, e questo accade sse il polinomio (1) è riducibile in Q(cos θ)[X], ossia è fattorizzabile nel prodotto di polinomi di grado più basso (d = 1 = 20 e d = 2 = 21 ) a coefficienti in Q(cos θ). Ciò dimostra l’asserto. Ad esempio l’angolo θ = π2 è trisecabile, perché cos θ = cos π2 = 0, Q(cos θ) = Q ed il polinomio (1) diventa 4X 3 − 3X che è riducibile su Q. Da ciò segue senz’altro che anche l’angolo θ = π è trisecabile; alternativamente, possiamo dimostrarlo ripetendo l’argomento generale: si ha cos θ = cos π = −1, Q(cos θ) = Q ed il polinomio (1) diventa 4X 3 − 3X + 1 che è riducibile su Q (ha la radice 12 ). Anche l’angolo θ = 2π è trisecabile; come segue senz’altro dalla trisecabilità di π2 ; alternativamente, possiamo dimostrarlo ripetendo l’argomento generale: si ha cos θ = cos 2π = 1, Q(cos θ) = Q ed il polinomio (1) diventa 4X 3 − 3X − 1 che è riducibile su Q (ha la radice 1). Dimostriamo finalmente che, invece: Teorema 14 L’angolo θ = π 3 non è trisecabile con riga e compasso. Dimostrazione. Si ha cos θ = cos π3 = 12 , Q(cos θ) = Q, ed il polinomio (1) diviene 4X 3 − 3X − 21 , la cui riducibilità su Q equivale - come si vede effettuando il cambiamento di variabile Y = 2X, cioè X = Y2 - alla riducibilità su Q di Y 3 − 3Y − 1. (3) La riducibilità del polinomio (3) in Q[Y ] equivale alla sua riducibilità in Z[Y ] per il Lemma di Gauss; d’altra parte, se (3) fosse riducibile in Z[Y ], una sua fattorizzazione in Z[Y ] si potrebbe leggere come una fattorizzazioone in Z2 [Y ] del polinomio Y 2 − 3Y − 1 = Y 3 + Y + 1, polinomio che manifestamente non è fattorizzabile in Z2 [Y ] perché è di terzo grado e non ha zeri in Z2 . In definitiva il polinomio (1) non è riducibile in Q[X], e l’angolo π3 non è trisecabile. Abbiamo visto che. ad esempio, l’angolo di π2 radianti è trisecabile, mentre quello di π3 radianti non lo è. Dunque il problema è generalmente impossibile (Wantzel, 1837), mentre lo è in alcuni casi particolari. ESERCIZIO. Si dimostri che l’angolo π 3 si può trisecare usando la riga graduata e il compasso. Il Teorema (14) afferma che non si può costruire con riga e compasso l’angolo 13 π3 = π9 = 2π 18 . Ne segue che: non si può (con riga e compasso) inscrivere in una circonferenza un poligono regolare di n = 18 o di n = 9 lati. Si noti che, per il problema della costruibilità con riga e compasso di un n−gono regolare, è equivalente prefissare il raggio del cerchio circoscritto o il lato del poligono. Infatti il primo problema equivale alla costruzione dell’angolo 2π n (angolo al centro che insiste su un lato dell’n−gono), mentre il secondo equivale alla costruzione dell’angolo π− 2π n (angolo interno dell’n−gono). Inoltre il poligono regolare di n lati è costruibile sse lo è quello di 2n lati. Costruzione di poligoni regolari. Costruire con riga e compasso il poligono regolare con un assegnato numero n di lati. Karl Friedrich GAUSS (1777-1855) ha determinato per quali valori di n è possibile costruire con riga e compasso il poligono regolare con n lati. Il risultato può essere riassunto nel seguente enunciato, la cui dimostrazione viene qui omessa32 . 32 Per la dimostrazione, cfr. ad esempio C. PROCESI, Elementi di teoria di Galois, I, 4, ed. Decibel 1982, od anche N. JACOBSON, Basic Algebra, vol. I, Freeman and Co, 1974. 30 Teorema 15 Le condizioni segueni sono equivalenti: 1. Il poligono regolare di n lati è costruibile con riga e compasso. 2. φ(n) è una potenza di 2, dove φ è la funzione di Eulero. 3. n = 2k p1 . . . ps , dove k, s ≥ 0 e p1 , . . . , ps sono s primi di Fermat distinti. Si dimostri per esercizio che 3 ⇒ 2. Ricordiamo alcune nozioni basilari riguardanti gli enti sopra nominati. Funzione φ di Eulero. La funzione φ : N → N : n 7→ φ(n) di Eulero è definita da: φ(n) :=| {k ∈ N : 1 ≤ k ≤ n, (k, n) = 1} | . Dunque φ(n) uguaglia la cardinalità | U (Zn ) | del gruppo U (Zn ) degli elementi invertibili dell’anello Zn . La φ è una funzione moltiplicativa, nel senso che: (m, n ∈ N) (m, n) = 1 ⇒ φ(mn) = φ(m)φ(n), Per dimostrarlo, osserviamo anzitutto che l’applicazione f : Zmn → Zm × Zn : [a]mn 7→ ([a]m , [a]n ) è evidentemente un morfismo di anelli, che è iniettivo perché ha nucleo [0]mn per l’ipotesi (m, n) = 1 ed è anche surgettivo33 perché Zmn e Zm × Zn hanno lo stesso numero mn di elementi. Pertanto f : Zmn → Zm × Zn è un isomorfismo di anelli, che evidentemente subordina un isomorfismo tra i rispettivi gruppi degli elementi invertibili f : U (Zmn ) → U (Zm × Zn ) = U (Zm ) × U (Zn ). Pertanto φ(mn) =| U (Zmn ) |=| U (Zm ) || U (Zn ) |= φ(m)φ(n), e questo completa la verifica della moltiplicatività di φ. Numeri di Fermat. L’ n−mo numero di Fermat (Pierre Simone de FERMAT, 1601-1665) è definito da Fn := 2(2 (n ≥ 0) n ) + 1. Si dimostra che tutti i numeri primi della forma 2k + 1 sono numeri di Fermat. Lo stesso Fermat notò che F0 = 3, F1 = 5, F2 = 17, F3 = 257, F4 = 65537 sono primi e congetturò nel 1640 che ogni Fn fosse primo, ma Eulero dimostrò nel 1732 che la congettura era falsa, indicando una fattorizzazione di F5 = 232 + 1. Ancora oggi i numeri primi di Fermat che si conoscono sono soltanto i cinque numeri sopra indicati! È sorprendente che esista la dimostrazione della possibilità di costruire con riga e compasso il poligono regolare con un numero tanto grande di lati, quale è il numero primo F4 . 33 La surgettività di f va sotto il nome di Teorema Cinese dei Resti. il quale afferma: Se m, n sono relativamente primi ed a1 , a2 sono interi arbitrari, il sistema di due congruenze x ≡ a1 (mod x ≡ a2 m), (mod n), è ’univocamente’ risolubile. Infatti l’elemento ([a1 ]m , [a2 ]n ) proviene tramite f da un’unica classe resto [a]mn , e dunque a è una soluzione del sistema (univocamente determinata modulo mn). Si noti che si ottiene una ovvia generalizzazione dal caso di due moduli m, n al caso di s ≥ 2 moduli m1 , m2 , . . . , ms primi fra loro: si considera il morfismo di anelli f : Zm1 ···ms → Zm1 × · · · × Zms : [a]m1 ···ms 7→ ([a]m1 , . . . , [a]ms ), si dimostra che f è iniettivo e quindi surgettivo perché i due anelli hanno la stesso numero m1 · · · ms di elementi; si considera poi un sistema di congruenze x ≡ a1 (mod m1 ), . . . , x ≡ as (mod ms ), che si risolve assumendo x = a, dove [a]m1 ... ms è il prototipo in f di ([a1 ]m1 , . . . , [as ]ms ). 31 4 4.1 Un tributo ad Hilbert: il ”Terzo Problema di Hilbert” Introduzione La nozione di poligono convesso di R2 e quella di poliedro convesso di R3 sono casi particolari, rispettivamente per d = 2 e per d = 3, di quella di politopo convesso di dimensione d di Rd . Un politopo convesso d−dimensionale P di Rd è per definizione la chiusura convessa X X P = conv(S) := { ai si : ai ≥ 0, ai = 1} di un insieme finito S = {s1 , . . . , sn } ⊂Rd di punti contenuto in Rd ma non contenuto in un Rt con t < d. Esempi di politopi convessi di dimensione d sono i d−simplessi (per S costituito da d+1 punti indipendenti) e i d−cubi, come ad esempio il d−cubo unitario Qd = [0, 1]d . Un politopo generale è definito come unione di un numero finito di politopi convessi. Equivalentemente un politopo convesso di Rd può essere definito come un insieme limitato P ⊂ Rd che sia il luogo delle soluzioni di un sistema di disuguaglianze lineari, cioè come un insieme limitato del tipo P = {x ∈ Rd : Ax ≤ b}, dove A è una matrice reale k × d e b ∈ Rk . Questa seconda definizione può riformularsi dicendo che un politopo convesso è un insieme limitato P ⊂ Rd che sia intersezione di semispazi di Rd . Una faccia di un politopo è un insieme F ⊂ P del tipo F = {x ∈ P : ai x = bi }, dove ai è la riga i-esima della matrice A e bi è la componente i-esima della colonna b, per i ∈ {1, 2, . . . , k}. Tale faccia appare dunque come intersezione del politopo con uno degli iperpiani che definiscono uno dei semispazi di cui il politopo è l’intersezione. La teoria della misura per i poliedri appare più complicata di quella per i poligoni. La formula per il calcolo dell’area di un triangolo si fonda sul fatto che ”ogni triangolo è equivalente (equiesteso) ad un parallelogramma con ugual base e metà altezza”; il che a sua volta si fonda sul fatto che quel triangolo e quel parallelogramma sono equiscomponibili, cioè possono essere decomposti in poligoni congruenti. In effetti sussiste il seguente Teorema 16 (Bolyai, Gerwin, 1832 circa). Due poligoni sono equiestesi se e solo se sono equiscomponibili. Nello sviluppo della teoria elementare del calcolo dei volumi dei poliedri, si inizia con il calcolo del volume di un cubo, poi di un parallelepipedo retto rettangolo, poi di un parallelepipedo generale e poi di un prisma a base poligonale. Tuttavia, dovendo calcolare il volume di un tetraedro, sorgono delle difficoltà: occorrerebbe dimostrare che un tetraedro è equivalente alla terza parte di un prisma avente la stessa base e la stessa altezza, e per questo occorre dimostrare che due tetraedri aventi la stessa base e la stessa altezza sono equivalenti. Questo scopo sarebbe dunque raggiunto se si potesse dimostrare che due tetraedri aventi la stessa base e la stessa altezza sono scomponibili in poliedri congruenti, il che però, come vedremo, è generalmente falso. Questa difficoltà fa sı̀ che la formula per il calcolo del volume di un tetraedro si basi su procedimenti infinitesimali : ad es. sulla considerazione del tetraedro come elemento di separazione di due classi contigue di scaloidi, inscritti e circoscritti al tetraedro. David Hilbert ebbe l’intuizione che questa maggiore complicazione fosse ineliminabile, intuendo che esistono poliedri di ugual volume che non sono equiscomponibili (cioè decomponibili in poliedri congruenti). Più precisamente egli formulò il seguente 32 TERZO PROBLEMA DI HILBERT: Trovare due tetraedri di uguali basi e uguali altezze che non sono equiscomponibili (cioè decomponibili in tetraedri congruenti) e che non sono equicompletabili (cioè combinabili con tetraedri congruenti in modo da formare poliedri equiscomponibili). Tale problema era stato posto da Hilbert nella sua già ricordata memorabile conferenza, tenuta durante il Secondo Congresso Internazionale dei Matematici svoltosi a Parigi nel 1900, nella quale attirò l’attenzione della comunità matematica su 23 importanti problemi, come argomenti fondamentali da affrontare nel corso del secolo che stava iniziando . Il Terzo Problema di Hilbert34 fu risolto completamente dal suo allievo Max DEHN: egli esibı̀ (nello stesso 1900) due tetraedri con ugual base e eguale altezza non equiscomponibili e poi anche (nel 1902) non equicompletabili. La dimostrazione alquanto oscura di Dehn fu ripresa da vari autori35 e finalmente perfezionata da Hugo HADWIGER in due successivi articoli (1949, 1954). 4.2 Invarianti di Dehn Dato un poliedro P di R3 , denotiamo con e ∈ P un suo spigolo, con α(e) l’angolo diedro fra le due facce che contengono e, e con M (P ) (insieme delle ampiezze di P ) l’insieme costituito da π e dalle ampiezze degli angoli diedri di P , cioè: M (P ) := {π} ∪ {α(e) : e ∈ P }. Per esempio, l’insieme delle ampiezze di un cubo C e quello di un prisma retto R avente per base un triangolo equilatero sono dati rispettivamente da: π π π M (C) = {π, }, MR = {π, , }. 2 2 3 Fissato un qualunque insieme finito M ⊂ R contenente M (P ) , sia X V (M ) := { qm · m : m ∈ M, qm ∈ Q} ⊂ R il Q−spazio vettoriale delle combinazioni lineari degli elementi di M con coefficienti razionali. Fissata una qualunque applicazione Q−lineare f : V (M ) → Q tale che f (π) = 0, si definisce peso (in P ) di uno spigolo e di P relativo ad f il prodotto tra la lunghezza l(e) di e ed il valore che f assume sull’ angolo diedro α(e) di quel poliedro, cioè il numero reale wf (e) = wf (e, P ) := l(e)f (a(e)). Definiamo poi invariante di Dehn del poliedro P relativo ad f il numero X Df (P ) := l(e)f (α(e)), e∈P cioè la somma dei pesi in P degli spigoli di P . Ad esempio, sia per il cubo C sia per il suddetto prisma R, l’invariante di Dehn rispetto ad una qualsiasi f vale zero (perché f si annulla su ogni multiplo razionale di π): Df (C) = 0, Df (R) = 0. Per il seguito, conviene definire il peso non solo di uno spigolo e di un poliedro P , ma anche il peso (in P ) di un tratto quasiasi e0 ⊆ e come il prodotto tra la lunghezza l(e0 ) di e0 ed il valore che f assume sull’ampiezza α(e0 ) = α(e) del corrispondente angolo diedro di P : wf (e0 , P ) = wf (e0 ) := l(e0 )f (α(e0 )). È importante notare che: 34 Cfr. V.G. BOLTIANSKII, Hilbert’s Third Problem. Washington, 1978; cfr. anche V. VILLANI, ”aree, volumi ed il Terzo Problema di Hilbert”, in Archimede 53 (2001), 78-91. 35 Tra cui Ugo AMALDI in un articolo del 1902 pubblicato sul Periodico di Matematica. 33 Lemma 17 . Se uno spigolo e di P è decomposto in segmenti e1 , . . . , es a due a due privi di punti interni comuni, il peso di e è la somma dei pesi degli ei . Dimostrazione. Infatti, essendo α(e) = α(ei ) per ogni i = 1, . . . , s, si ha: X X X X wf (e) := l(e)f (α(e)) = [ l(ei )]f (α(e)) = [l(ei )f (α(e))] = [l(ei )f (α(ei ))] = wf (ei ). i 4.3 i i Il Teorema di Dehn-Hadwiger Ricordiamo che due poliedri P e Q si dicono equiscomponibili se possono essere decomposti in un numero finito di poliedri P = P1 ∪ · · · ∪ Pn , Q = Q1 ∪ · · · ∪ Qn tali che i poliedri Pi siano a due a due privi di punti interni in comune, i poliedri Qi siano a due a due privi di punti interni in comune ed inoltre i poliedri Pi e Qi siano congruenti per ogni i (1 ≤ i ≤ n). Precisiamo poi che due poliedri P e Q si dicono equicompletabili se esistono insiemi finiti di poliedri P1 , . . . , Pm e Q1 , . . . , Qn tali che – ogni Pi non abbia punti interni in comune né con P né con alcun Pj (per ogni i 6= j); – ogni Qi non abbia punti interni in comune né con Q né con alcun Qj (per ogni i 6= j); – Pi e Qi siano congruenti per ogni i (1 ≤ i ≤ m); – P 0 = P ∪ P1 ∪ · · · ∪ Pm e Q0 = Q ∪ Q1 ∪ · · · ∪ Qm sono equiscomponibili. Evidentemente poliedri equiscomponibili sono anche equicompletabili e pertanto poliedri non equicompletabili sono non equiscomponibili. Lemma 18 Sia P un poliedro scomponibile in un numero finito di poliedri P1 , . . . , Pn e sia M un qualsiasi insieme finito di numeri reali contenente π e tutte le ampiezze degli angoli diedri di P e di P1 , . . . , Pn . Per ogni applicazione Q − linearef : V (M ) → Q tale che f (π) = 0, l’invariante di Dehn di P è la somma degli invarianti di Dehn dei Pi : Df (P ) = Df (P1 ) + · · · + Df (Pn ). Dimostrazione. Il primo membro è la somma dei pesi wf (e, P ) estesa a tutti gli spigoli e di P . Il secondo membro è la somma dei pesi wf (e∗ , Pi ) estesa a tutte le coppie (e∗ , Pi ) costituite da un sottopoliedro Pi e da un suo spigolo e∗ , i = 1, . . . , n. Il contributo di ciascun spigolo e∗ è la somma dei pesi wf (e∗ , Pi ) = l(e∗ )f (αi ) estesa a tutti quei sottopoliedri Pi che hanno e∗ come uno dei propri spigoli (αi denota l’angolo diedro formato dalle due facce di Pi che contengono e∗ ), e dunque, vale l(e∗ )f (α), dove α denota la somma degli αi , perché f è additiva. Calcoliamo dunque il secondo membro riordinando in modo opportuno i vari addendi che vi intervengono. Uno spigolo e∗ di un sottopoliedro può essere di tre tipi distinti: e0 ) coincidente con uno spigolo e di P o con una sua parte; e00 ) contenuto nell’interiore di una faccia di P ; e000 ) contenuto nell’interiore di P . Il contributo di un qualunque spigolo di tipo e00 vale zero. Infatti, la somma delle ampiezze degli angoli diedri dei vari sottopoliedri aventi a comune un fissato spigolo di tipo e” vale evidentemente π. Poiché 34 f (π) = 0, il contributo complessivo di e00 nella somma a secondo membro vale l(e00 )f (π) = 0. Analogamente, il contributo di un qualunque spigolo di tipo e000 vale zero. Infatti, la somma delle ampiezze degli angoli diedri (dei sottopoliedri) aventi a comune un fissato spigolo di tipo e000 vale evidentemente 2π. Poiché f (2π) = 0, il contributo complessivo di e000 nella somma a secondo membro vale l(e000 )f (2π) = 0. Limitiamoci pertanto a considerare i contributi degli spigoli di tipo e0 . Consideriamo dunque uno spigolo di tipo e0 contenuto in un fissato spigolo e di P . La somma delle ampiezze degli angoli diedri (dei sottopoliedri) aventi il dato e0 come proprio spigolo coincide evidentemente con l’ampiezza dell’angolo diedro α(e) di P . Pertanto il contributo di e0 a secondo membro vale l(e0 )f (α(e)) ossia uguaglia il peso (in P ) wf (e0 , P ) del pezzo e0 ⊂ e. Raggruppiamo tutti gli spigoli e01 , . . . , e0s di tipo e0 che sono pezzi di un medesimo spigolo e di P (del quale costituiscono evidentemente una partizione). Per il Lemma 17, la somma dei pesi di questi e0i ⊂ e uguaglia il peso di e in P. D’altra parte, ogni spigolo e di P determina l’insieme E 0 (e) degli spigoli e0 dei sottopoliedri tali che 0 e ⊂ e ; gli insiemi E 0 (e) costituiscono al variare di e una partizione dell’insieme degli spigoli di tipo e0 dei vari sottopoliedri. In conclusione il contributo complessivo degli spigoli di tipo e0 , cioè il valore del secondo membro, uguaglia la somma dei pesi degli spigoli e di P , cioè uguaglia il valore del primo membro. Teorema 19 (Dehn–Hadwiger). Siano P e Q due poliedri, sia M un qualunque insieme finito di numeri reali contenente π e tutte le ampiezze degli angoli diedri di P e di Q, e sia f : V (M ) → Q una qualunque applicazione Q−lineare tale che f (π) = 0. Allora: (1) Se P e Q sono equiscomponibili, i loro invarianti di Dehn uguali: Df (P ) = Df (Q). (2) Se P e Q sono equicompletabili, i loro invarianti di Dehn uguali: Df (P ) = Df (Q). Dimostrazione. (1) Sia M 0 l’insieme ottenuto aggregando ad M tutte le ampiezze degli angoli diedri dei pezzi P1 , . . . , Pn e Q1, . . . , Qn coinvolti in una realizzazione della equiscomponibilità di P e di Q, e sia g : V (M 0 ) → Q una qualunque applicazione Q−lineare che prolunghi f (ottenuta in modo ovvio estendendo una base di V (M ) contenente π ad una base di V (M 0 ) ). Per il Lemma 17, si ha Df (P ) = Dg (P ) = Dg (P1 ) + · · · + Dg (Pn ); Df (Q) = Dg (Q) = Dg (Q1 ) + · · · + Dg (Qn ); d’altra parte, per ogni i = 1, . . . , n, si ha Dg (Pi ) = Dg (Qi ) perché Pi e Qi sono congruenti. Pertanto Df (P ) = Df (Q). (2) Sia M 0 l’insieme ottenuto aggregando ad M tutte le ampiezze degli angoli diedri dei pezzi P1 , . . . , Pm e Q1 , . . . , Qm coinvolti in una realizzazione della equicompletabilità di P e di Q, e sia g : V (M 0 ) → Q una qualunque applicazione Q−lineare che prolunghi f . Attualmente P 0 := P ∪ P1 ∪ · · · ∪ Pm , Q0 := Q ∪ Q1 ∪ · · · ∪ Qm sono equiscomponibili, pertanto da (1) segue Dg (P 0 ) = Dg (Q0 ) e dal Lemma 17 si ottiene (essendo Dg (P ) = Df (P ) e Dg (Q) = Df (Q)): Dg (P 0 ) = Df (P ) + Dg (P1 ) + ... + Dg (Pm ) = Df (Q) + Dg(Q1 ) + ... + Dg(Qm ) = Dg (Q0 ); d’altra parte, per ogni i = 1, . . . , m, si ha Dg (Pi ) = Dg (Qi ) perché Pi e Qi sono congruenti. Pertanto Df (P ) = Df (Q). 4.4 La soluzione del Terzo Problema di Hilbert Calcoliamo gli invarianti di Dehn per alcuni poliedrii. Vedremo che i poliedri di cui al n. 4.4.4 e al n. 4.4.5 sono due tetraedri con la stessa base e la stessa altezza, ma con invarianti di Dehn diversi (e dunque non equiscomponibili). 35 4.4.1 Invariante di Dehn di un cubo. Come già osservato, l’insieme delle ampiezze di un cubo C è dato da M (C) = {π, π2 }, e pertanto l’invariante di Dehn di C rispetto ad una qualsiasi f vale zero, perché f si annulla su ogni multiplo razionale di π, cioè Df (C) = 0. 4.4.2 Invariante di Dehn di un prisma retto con base un triangolo equilatero. Come già osservato, l’insieme delle ampiezze di tale prisma P è dato da M (P ) = {π, π2 , π3 }, e pertanto l’invariante di Dehn di P rispetto ad una qualsiasi f vale zero, cioè Df (P ) = 0. 4.4.3. Invariante di Dehn di un tetraedro regolare. Sia T0 = (A, B, C, D) un tetraedro regolare di spigolo s. L’insieme delle ampiezze di T0 è dato da M (T0 ) = {π, α} dove α è l’angolo tra le mediane AM e DM delle facce ABC e BCD rispettivamente. La proiezione ortogonale H di D sulla faccia ABC è il baricentro HM 1 del triangolo. Pertanto, con riferimento al triangolo rettangolo DHM , si ha cos α = HM DM = AM = 3 , ossia 1 α = arccos 3 . Poiché arccos 13 α = π π è irrazionale (per il successivo Lemma 20, ove si ponga n = 9), lo spazio vettoriale V (M (T0 )) ha dimensione 2 ed M (T0 ) = {π, α} è una sua base. Possiamo considerare l’applicazione Q−lineare f : V (M (T0 )) → Q definita sulla base M (T0 ) assumendo f (π) = 0 ed f (α) = 1. Pertanto si trova Df (T0 ) = 6s 6= 0. Lemma 20 36 Per ogni intero dispari n ≥ 3, il numero A(n) := arccos √1n π è irrazionale. Riguardo all’ipotesi che n sia dispari, si noti che A(1) = 0, A(2) = 14 , A(4) = 14 . In realtà si potrebbe addirittura dimostrare che A(n) è razionale solo per n = 1, 2, 4. Il significato geometrico del Lemma 20 – che afferma la incommensurabilità tra π e arccos √1n per ogni intero dispari n ≥ 3 – è il seguente. Si consideri la poligonale che inizia nel punto A origine degli archi del cerchio trigonometrico di centro O e che consiste di lati tutti uguali alla corda AB che sottende un angolo b il cui coseno è √1 . Allora, la suddetta incommensurabilità esprime che questa poligonale prosegue AOB n all’infinito senza chiudersi mai su se stessa. 4.4.4 Invariante di Dehn del tetraedro avente i vertici nell’origine e nei punti unitari degli assi. L’insieme delle ampiezze di questo tetraedro T1 = (O, A, B, C) è dato da π M (T1 ) = {π, , α} 2 dove α è l’angolo tra le mediane CM e OM delle facce ABC e OAB rispettivamente. Con riferimento√al triangolo rettangolo COM , si ha cos α = OM parte, nel triangolo rettangolo AOC, si ha AC = 2, CM . D’altra q q onde nel triangolo rettangolo CM A si ha CM = 32 , e nel triangolo rettangolo COM si ha OM = 12 , onde cos α = √1 , 3 ossia α = arccos √13 . Poiché arccos √13 α = π π 36 Cfr. M. AIGNER, G.M. ZIEGLER, Proofs from the B00K. Springer, 1998, p.31-32. 36 è irrazionale, come segue ponendo n = 3 nel Lemma 20, lo spazio vettoriale V (M (T1 )) ha dimensione 2 (ed M (T1 ) è una sua base). Possiamo considerare l’applicazione Q−lineare f : V (M (T1 )) → Q definita sulla base π M (T1 ) = {π, , α} 2 √ √ assumendo f (π) = 0 ed f (α) = 1. Pertanto f ( π2 ) = 0 e dunque Df (T1 ) = 3f ( π2 ) + 3 2f (α) = 3 2 6= 0, √ ossia Df (T1 ) = 3 2 6= 0. 4.4.5 Invariante di Dehn del tetraedro avente i vertici nell’origine, nei punti unitari degli assi x ed y e nel punto unità del piano yz. Sia T2 = (O, A, B, C 0 ), dove: O(0, 0, 0); A(1, 0, 0); B(0, 1, 0); C 0 (0, 1, 1). Le facce di T2 hanno equazioni: OAB : Z = 0; OBC 0 : X = 0; ABC 0 : X + Y − 1 = 0; OAC 0 : Y − Z = 0; ed i loro versori normali sono rispettivamente: (0, 0, 1); (1, 0, 0); 1 1 ( √ , √ , 0); 2 2 1 1 (0, √ , − √ ). 2 2 Pertanto i coseni dell’angolo diedro α(e) fra le due facce contenenti uno spigolo e di T2 sono: e = OB, OC 0 , AB ⇒ cos α(e) = 0 ⇒ α(e) = e = AC 0 ⇒ cos α(e) = 1/2 ⇒ α(e) = e = 0A, BC 0 ⇒ | cos α(e) |= √1 2 π 2; π 3; ⇒ α(e) = π 4. Ne segue che l’insieme delle ampiezze di T2 è dato da M (T2 ) = {π, π2 , π3 , π4 , }, lo spazio vettoriale V (M (T2 )) è < π >= Q · π, ha dimensione 1, e l’unica funzione Q− lineare f : V (M (T2 )) → Q tale che f (π) = 0 è la funzione nulla. Pertanto Df (T2 ) = 0. CONCLUSIONI. (a) I tetraedri T1 e T2 hanno la stessa base e la stessa altezza, ma non sono né equicompletabili né equiscomponibili. Ciò segue dal Teorema di Dehn-Hadwiger √ e dal fatto che gli invarianti di Dehn di T1 e di T2 – relativi ad una stessa f – sono diversi: Df (T1 ) = 3 2 6= 0, Df (T2 ) = 0. Si noti che lo spazio vettoriale V (M (T2 )) =< π >= πQ è un sottospazio di V (M (T1 )) =< π, arccos 31 > e che la f definita su V (M (T1 )) è effettivamente un prolungamento della f definita su V (M (T2 )). (b) Il tetraedro√T1 ed un cubo C di egual volume non sono né equicompletabili né equiscomponibili. Infatti Df (T1 ) = 3 2 6= 0, Df (C) = 0, dove ecc. 5 5.1 Alcuni approfondimenti. Ancora su numeri e polinomi Sia N = {0, 1, 2, 3, . . . } l’insieme dei numeri interi non negativi. Quando si utilizza la numerazione in base 10, l’insieme delle cifre usate è C10 = {c ∈ N : 0 ≤ c ≤ 9} ed ogni numero di N viene espresso come 37 una combinazione lineare di potenze di 10 a coefficienti in C10 cioè come una espressione polinomiale in 10 con coefficienti in C10 ; ad esempio 372104 = 3 · 105 + 7 · 104 + 2 · 103 + 1 · 102 + 0 · 101 + 4 · 100 . Più in generale quando si utilizza la numerazione in base b, dove b ∈ N e b ≥ 2, l’insieme delle cifre usate è Cb = {c ∈ N : 0 ≤ c ≤ b − 1} ed ogni numero n ∈ N viene espresso come una espressione polinomiale in b con coefficienti in Cb , ossia come una espressione del tipo n= d X ai · bi = ad · bd + · · · + a1 · b + a0 , dove ai ∈ N, 0 ≤ ai < b e ad 6= 0. i=0 Pd Notiamo che a0 è il resto della divisione di n per b, e sia q1 = i=1 ai ·bi−1 il quoziente di questa divisione: Pd n = b · q1 + a0 ; a1 è il resto della divisione di q1 per b, e sia q2 = i=2 ai · bi−2 il quoziente di questa divisione: q1 = b · q2 + a1 ; . . . ; ad−1 è il resto della divisione di qd−1 = b · qd + ad−1 per b, ed il quoziente di questa divisione vale qd = ad < b. Finalmente ad è il resto della divisione di qd = ad per b (il quoziente è zero): qd = b · 0 + ad dove qd = ad < b. Il procedimento descritto consente di scrivere qualunque numero n ∈ N in una qualunque base fissata b ≥ 2. Osserviamo che Pd Proposizione 21 (Il giuoco del polinomio). Qualunque polinomio f (x) = i=0 ai · xi ∈ N[x], sia esso il polinomio nullo o un polinomio di un grado qualunque d ≥ 0, è individuato univocamente dalla conoscenza di due soli valori: a = f (1) e c = f (a + 1). Dimostrazione. Dimostriamo l’asserto, provando che f (x) = 0 (cioè f (x) è il polinomio nullo) nel caso che sia a = 0, e che i coefficienti di f (x) sono le cifre che appaiono nella scrittura di c in base b := a + 1 nel caso Pd Pd che sia a ≥ 1. Sia f (x) = i=0 ai · xi ∈ N[x]. In ogni caso a := f (1) = i=0 ai ≥ aj per ogni j. Se a = 0, allora aj = 0 per ogni j e dunque f (x) è il polinomio nullo. Se a ≥ 1, allora, posto b := a + 1, si ha b ≥ 2 e Pd b > aj per ogni j. Ne segue che f (b) = i=0 ai · bi è la scrittura di c = f (a + 1) = f (b) in base b: in altri termini i coefficienti aj di f (x) sono le cifre che appaiono della scrittura di c in base b. La Proposizione 21 è particolarmente espressiva se si confronta col seguente teorema. Teorema 22 . Dati comunque x1 , . . . , xd+1 ∈ R distinti e dati comunque y1 , . . . , yd+1 ∈ R (anche non distinti), esiste uno ed un solo polinomio f (x) ∈ R[x] di grado ≤ d tale che f (xi ) = yi per i = 1, . . . , d + 1. Pd Dimostrazione. Primo modo. La stringa (ad , . . . , a0 ) dei coefficienti di f (x) = i=0 ai · xi è univocamente Pd determinata perché è l’unica soluzione del sistema yj = i=0 ai · xij , (j = 1, . . . , d + 1, di d + 1 equazioni lineari nelle d+1 incognite ad , . . . , a0 , il cui determinante è il determinante di Vandermonde V (x1 , . . . .xd+1 ) = Q 1≤i<j≤d+1 (xj − xi ) 6= 0. Secondo modo. L’unicità del polinomio segue dal fatto che se f (x) e g(x) fossero due polinomi distinti del tipo detto, allora f (x) − g(x) sarebbe un polinomio non nullo di grado ≤ d con d + 1 zeri distinti, il che è impossibile. L’esistenza è data dal polinomio interpolatore di Lagrange f(x)= Pd+1 Qi6=j (x−xi ) i=1,...,d+1 j=1 yj Qi6=j (xj−x i=1,...,d+1 i) = y1 · (x−x2 )···(x−xd+1 ) (x1 −x2 )···(x1 −xd+1 ) 38 + · · · + yd+1 · (x−x1 )···(x−xd ) (xd+1 −x1 )···(xd+1 −xd ) · 5.2 5.2.1 Miscellanea algebrica Non esistono campi propriamente intermedi tra R e C. Mostriamo che, se K è un campo tale che R < K ≤ C, si ha K = C. Infatti, considerato un α ∈ K \ R, risulta α = a + ib, con a, b ∈ R e b 6= 0. Pertanto i ∈ K e quindi K = C. 5.2.2 Esistono infiniti campi propriamente intermedi tra Q e R. √ √ √ Esempi di tali campi intermedi sono dati da: Q( 2) = Q[ 2] = {a + b 2 | a, b ∈ Q}, da Q(π) e più in generale da Q(A), da Q(B) e da Q(A ∪ B), dove A, B − con Q ⊂ A ∪ B ⊂ R − sono rispettivamente costituiti da numeri reali algebrici e trascendenti. 5.2.3 In un qualunque campo ordinato K ogni quadrato non nullo è positivo. Sia infatti a = b2 , con b ∈ K, b 6= 0. Allora b oppure −b è positivo e pertanto a = b · b = (−b)(−b) è positivo in quanto prodotto di due positivi. 5.2.4 Ogni elemento positivo di R è un quadrato di un elemento di R. √ esistono elementi positivi di Q che non sono quadrati Infatti se a ∈ R e se a > 0 allora a ∈ R. Invece √ √ di elementi di Q: ad esempio 2 ∈ Q è positivo, ma 2 ∈ / Q. (Se fosse 2 = m/n con m.n ∈ Z, si avrebbe 2n2 = m2 , assurdo perché il fattore 2 comparirebbe un numero dispari di volte nel primo membro ed un numero pari di volte nel secondo.) 5.2.5 Un automorfismo algebrico f di R è anche un automorfismo ordinale. Infatti f : R → R trasforma quadrati non nulli in quadrati non nulli e dunque trasforma positivi in positivi (per 5.2.3) e pertanto è un isomorfismo ordinale: a < b ⇒ b − a > 0 ⇒ f (b − a) > 0 ⇒ f (b) − f (a) > 0 ⇒ f (a) < f (b). 5.2.6 Azione di un automorfismo f di un campo K sul suo campo fondamentale F . Evidentemente f|F = idF , perché, posto u := 1K , si ha, per ogni n, m ∈ Z, f (±nu) = ±nu, f (nu)−1 = (nu)−1 , f ((nu)(mu)−1 ) = (nu)(mu)−1 . 39 5.2.7 √ √ √ Se f ∈ Aut(Q( 2)), allora f (a + b 2) = a ± b 2. 5.2.8 L’unico automorfismo del campo reale è l’identità. Sia f ∈ Aut (R). Supponiamo per assurdo che sia f 6= idR . Allora esiste a ∈ R tale che f (a) 6= a, ed esiste q ∈ Q tale che a < q < f (a). Da a < q segue f (a) < q perché f è un automorfismo ordinale (per 5.2.5) ed f fissa ogni numero razionale (per 5.2.6). Dunque f (a) < q < f (a), assurdo. 5.2.9 Gli unici automorfismi continui del campo complesso sono l’identità e il coniugio. Sia f ∈ Aut (C). Sappiamo che f fissa ogni numero razionale (per 5.2.6) e dunque f (i) = ±i essendo f (i)2 = f (i2 ) = f (−1) = −1. Se l’automorfismo f è anche continuo, allora f fissa ogni numero reale a perché a è limite di una successione di numeri razionali ai e dunque f (a) = f (lim(ai )) = lim(f (ai )) = lim(ai ) = a. Ne segue che per ogni numero complesso a + ib si ha f (a + ib) = a + ib oppure f (a + ib) = a − ib a seconda che sia f(i)=i oppure f(i)=-i. 5.2.10 L’ordine di un campo finito è potenza di un numero primo. Sia K un campo finito, con q elementi. La caratteristica di K è un numero primo p ed il campo fondamentale di K è Zp . Il campo K è uno spazio vettoriale, necessariamente di dimensione finita, diciamo h, sul suo campo fondamentale Zp , e pertanto K è isomorfo (come spazio vettoriale) allo spazio vettoriale delle h-ple ordinate di elementi di Zp . Il numero di queste h-ple è ph e quindi K ha altrettanti elementi. Ricordiamo il teorema di esistenza e unicità dei campi finiti : per ogni primo p ≥ 2 e per ogni intero h ≥ 1, esiste, ed è unico a meno di isomorfismi, un campo finito con q = ph elementi. Tale campo si denota con GF (q) (”Galois field of order q”) e può essere ottenuto effettuando una estensione algebrica di Zp rispetto ad un polinomio irriducible su Zp di grado h, certamente esistente per 5.2.15. 5.2.11 Teorema di Lagrange: l’ordine di un sottogruppo di un gruppo finito divide l’ordine del gruppo. Sia G un gruppo finito (moltiplicativo) e sia H un suo sottogruppo. L’insieme {aH : a∈ G} delle classi laterali sinistre aH di H in G costituisce una partizione di G (verificare !) ed ogni classe aH ha uno stesso numero | H | di elementi (verificare !). Pertanto il numero degli elementi di G si ottiene moltiplicando il numero degli elementi di H per il numero delle classi laterali sinistre di H in G. 5.2.12 Se a è un elemento di un gruppo finito G, si ha a|G| = 1G . Denotiamo con o(a) l’ordine di a, cioè l’ordine del sottogruppo generato da a. Per il Teorema di Lagrange, o(a) divide | G |. Posto | G |= o(a) · t, si ha a|G| = ao(a)·t = (ao(a) )t = (1G )t = 1G . 40 5.2.13 Se a è un elemento non nullo di un campo finito K con q elementi, si ha aq−1 = 1K , Pertanto aq = a per ogni a ∈ K. Infatti gli elementi non nulli di K costituiscono un gruppo moltiplicativo con q − 1 elementi, e quindi aq−1 = 1K (per 5.2.12). Moltiplicando entrambi i membri per a, si trova che la relazione aq = a è verificata da ogni elemento non nullo a ∈ K; la stessa relazione è banalmente verificata anche da a = 0K . In particolare, per K = Zp si ottiene il Piccolo Teorema di Fermat: se p è primo e a ∈ N, allora ap ≡ a (mod p); se p è primo e non divide a, allora ap−1 ≡ 1 (mod p). 5.2.14 Un campo finito non è algebricamente chiuso. Infatti esistono polinomi di grado positivo con coefficienti nel campo privi di zeri nel campo: se il campo ha q elementi, il polinomio f (x) = xq − x + 1, è tale che f (a) = aq − a + 1 = a − a + 1 = 1 6= 0 per ogni a ∈ K. 5.2.15 Grado dei polinomi irriducibili sopra un campo. Sia K un campo. Sia f (X) ∈ K[X] un polinomio di grado deg f (X) ≥ 1. Se deg f (X) = 1, allora f (X) è irriducibile in K[X]; se K è algebricamente chiuso, gli unici polinomi irriducibili di K[X] sono quelli di grado 1 ed ogni polinomio si fattorizza su K in fattori lineari ed ammette tanti zeri in K quanto è il suo grado (a patto di contare ogni zero con la dovuta molteplicità). Se f (X) ∈ R[X] è irriducibile in R[X], allora deg f (X) ≤ 2: si fattorizzi il polinomio in fattori lineari in C[X] e si noti che ogni zero complesso α si accompagna (con la stessa molteplicità) allo zero coniugato α. Un polinomio f (X) ∈ R[X] di grado dispari ha almeno una radice in R: segue dalla affermazione precedente (ma anche dal fatto che la funzione polinomiale associata f : R → R : a 7→ f (a) è continua ed assume sia valori positivi che valori negativi). Per ogni intero h ≥ 2, esistono polinomi f (X) ∈ Q[X] di grado h ed ivi irriducibili, ad esempio X h − p con p numero primo: infatti, se fosse mh = pnh con m, n ∈ Z si arriverebbe a un assurdo in quanto il primo membro conterrebbe il fattore p con esponente congruo a 0 modulo h mentre il secondo membro con esponente congruo ad 1 modulo h; alternativamente si usi il criterio di Eisenstein, di cui si è detto discutendo l’irriducibilità su Q del polinomio X 3 − 2 in relazione al problema della duplicazione del cubo. Per ogni intero h ≥ 1, esistono polinomi f (X) ∈ GF (q)[X] di grado h ed ivi irriducibili (si omette la dimostrazione). Si noti che da questo teorema segue subito che per ogni primo p e per ogni intero h ≥ 1 esiste un campo finito di ordine ph : è il campo GF (ph ) = Zp [X]/(f (X)), dove f (X) è un polinomio di Zp [X] ivi irriducibile e di grado h; ricordiamo che gli elementi di questo campo sono le classi laterali dell’ideale (f (X)) dell’anello Zp [X] cioè le classi resto modulo f (X) e quindi sono in numero di ph che è il numero dei possibili resti a0 + a1 X + · · · + ah−1 ∈ Zp [X] che si ottengono dividendo i polinomi di Zp [X] per f (X). 5.2.16 Esempio di corpo non commutativo: i quaternioni reali. Un quaternione reale q è definito come una qualunque espressioni formale q = a + ib + jc + kd, dove a, b, c, d sono numeri reali e i, j e k sono puri simboli. Due quaternioni sono uguali sse hanno ordinatamente gli stessi coefficienti. La somma di due quaternioni, q e q0 = a0 + ib0 + jc0 + kd0 è definita effettuando la somma secondo le regole usuali dell’algebra, cioè assumendo: 41 q + q0 : = (a + a0 ) + i(b + b0 ) + j(c + c0 ) + k(d + d0 ). Il prodotto di due quaternioni viene definito effettuando il prodotto delle espressioni formali secondo le regole usuali dell’algebra e tenendo conto delle seguenti posizioni: i2 = j2 = k2 = −1, ij = k, jk = i, ki = j, ji = −ij, kj = −jk, ik = −ki. Dunque: q · q0 := (aa0 − bb0 − cc0 − dd0 ) + i(ab0 + ba0 + cd0 − dc0 ) + j(ac0 + ca0 − bd0 + db0 ) + k(ad0 + da0 + bc0 − cb0 ). I numeri reali ed i numeri complessi sono evidentemente particolari quaternioni; in particolare i numeri 0 è il quaternione nullo ed 1 è il quaternione unità. Il coniugato di q è il quaternione q = a − ib − jc − kd; la norma di q è il numero reale N (q) := qq = a2 + b2 + c2 + d2 . Evidentemente un quaternione è nullo sse ha norma zero; ne segue che ogni quaternione q 6= 0 è invertibile: q−1 = N q(q) . È facile verificare che l’insieme H dei quaternioni reali costituisce un corpo non commutativo. Osserviamo che l’anello H[x] dei polinomi a coefficienti quaternioni presenta alcune anomalie rispetto all’anello R[x] dei polinomi a coefficienti reali. Anzitutto non è vero che ogni polinomio si fattorizza in modo unico nel prodotto di polinomi irriducibili, perché ad esempio il polinomio x2 + 1 ammette le tre fattorizzazioni x2 + 1 = (x + i)(x − i) = (x + j)(x − j) = (x + k)(x − k). Inoltre, come mostra questo stesso esempio, non è vero che il numero degli zeri di un polinomio non supera il suo grado. Infine, come conseguenza della non commutatività del prodotto di H, non vale il principio di specializzazione secondo cui ”la specializzazione del prodotto di due polinomi è il prodotto delle specializzazioni dei fattori”: 0 = [x2 + 1]x=i = [(x + j)(x − j)]x=i 6= [x + j]x=i [x − j]x=i = (i + j)(i − j) = −2k. 5.3 5.3.1 Miscellanea geometrica Il piano di Fano . Il piano di Fano (Gino FANO, 1871-1952) è il piano P2 (Z2 ). Esso ha i 7 punti 1(1,0,0), 2(1,1,0), 3(0,1,1), 4(0,1,0), 5(1,0,1), 6(0,0,1), 7(1,1,1) e le 7 rette 124: x2 = 0, 235: x1 + x2 + x3 = 0, 346: x0 = 0 , 457: x0 + x2 = 0, 561: x1 = 0, 672: x0 + x1 = 0, 713: x1 + x2 = 0, ciascuna delle quali consiste di tre punti ed ha l’equazione indicata. Per ricostruire quanto detto, conviene partire dall’insieme {1, 2, 3, 4, 5, 6, 7 } dei ’punti’ del ’piano’, e dalla ’retta’ iniziale consistente dei tre punti 124; le rimanenti ’rette’ si ottengono aggiungendo ripetutamente 1 (modulo 7) a ciascun puinto della retta iniziale. In questo modo si è ottenuto un piano grafico proiettivo (che si chiama il ’piano di Fano’), perché sono verificati gli assiomi di piano proiettivo (per due punti distinti qualsiasi passa un’unica retta, due rette distinte qualsiasi hanno esttamente un punto in comune, esistono almeno tre punti non allineati, ogni retta contiene almeno tre punti). Possiamo successivamente rappresentare graficamente nel piano euclideo il piano di Fano. considerando un triangolo equilatero con un lato orizzontale e situato nel semipiano superiore rispetto al lato. I sette ’punti’ sono i tre vertici, i tre punti medi dei lati ed il centro del triangolo; le ’rette’ sono le tre terne di punti situati sui lati, le tre terne di punti situati sulle mediane e la terna dei punti medi dei lati (punti di tangenza della circonferenza inscritta). Possiamo poi raccordare le due rappresentazioni indicate per il piano di Fano, denotando i tre punti sul lato di base (procedendo da sinistra) con 124, assumendo 235 nella terna di punti di tangenza della circonfernza inscritta (percorsa in senso antiorario), assumendo poi 6 nel terzo vertice del triangolo ed infine assumendo 7 nel centro. In questa rappresentazione grafica, scegliamo un riferimento proiettivo A0 A1 A2 U assumendo A0 e A1 nei vertici del lato orizzontale del triangolo, A2 nel terzo vertice del triangolo ed U nel centro. Con questa scelta del riferimento, ad ogni punto viene associata la terna (omogenea) di coordinate in Z2 e ogni retta viene rappresentata da una ben determanata equazione, come indicato all’inizio. ((Il lettore è invitato a fare il disegno, e a etichettare i sette punti della figura nel modo descritto.). 42 5.3.2 Topologia di Zariski . Consideriamo un fissato spazio affine Ar (K) su un campo K. Un insieme algebrico affine dello spazio, definito da un fissato insieme F di polinomi di K[x1 , . . . , xr )], è il luogo V (F ) dei punti dello spazio che annullano ciascun polinomio di F . Se F e G sono due insiemi di polinomi di K[x1 , . . . , xr ], si ha V (F )∪(G) = V (F · G), da cui segue per induzione che l’unione di un numero finito di insiemi algebrici è un insieme algebrico. Inoltre l’intersezione di una qualunque famiglia di insiemi algebrici {V (Fi )}i∈I è un insieme T S algebrico perché si ha i∈I V (Fi ) = V ( i∈I Fi ). Infine si ha che il vuoto è un insieme algebrico V (F ) associato ad un sistema F incompatibile di polinomi, e l’intero spazio è un insieme algebrico V (0) associato al polinomio nullo. Le proprietà stabilite mostrano che la famiglia degli insiemi algebrici V (F ) di un fissato spazio affine Ar (K) verifica gli assiomi della famiglia dei chiusi di una topologia. La topologia che ne risulta si chiama la Topologia di Zariski di Ar (K). Analogamente si definisce la Topologia di Zariski di un fissato spazio proiettivo Pr (K), assumendo la famiglia degli insiemi algebrici proiettivi come famiglia dei suoi chiusi. 5.3.3 Un’affinità del piano euclideo che muti un fissato triangolo in un triangolo congruente (risp. simile) è una isometria (risp. similitudine). Sia f una affinità del piano euclideo E2 e sia T un triangolo che sia congruente al suo trasformato T 0 = f (T ). Poiché i triangoli T e T 0 sono congruenti, esiste una (unica) isometria g di E2 tale che g(T ) = T 0 , cfr. la Proposizione 23. Poiché f e g sono due affinità che mutano T in T 0 , e poiché il gruppo delle affinità di E2 è strettamente 1-transitivo sull’insieme dei triangoli, si ha necessariamente f = g, e dunque f è una isometria. Sia ora f una affinità del piano euclideo E2 e sia T un triangolo che sia simile al suo trasformato T 0 = f (T ). Poiché i triangoli T e T 0 sono simili, esiste una (unica) similitudine g di E2 tale che g(T ) = T 0 , cfr. la Proposizione 26. Poiché f e g sono due affinità che mutano T in T 0 , e poiché il gruppo delle affinità di E2 è strettamente 1-transitivo sull’insieme dei triangoli, si ha necessariamente f = g, e dunque f è una similitudine. 5.3.4 Un’affinità del piano euclideo che conservi una fissata distanza d > 0 (risp. che trasformi punti che abbiano tra loro una fissata distanza d > 0 in punti aventi fra loro una fissata distanza dk) è una isometria (risp. una k-similitudine). Sia f una affinità del piano euclideo E2 che conservi una fissata distanza d > 0. Vogliamo dimostrare che f conserva tutte le distanze. Sia T un triangolo equilatero di lato d, Allora f trasforma T in un triangolo T 0 = f (T ) equilatero di lato d, dunque congruente a T. In virtù del n. 5.3.3, f è un’isometria. Sia ora f una affinità del piano euclideo E2 che trasformi coppie di punti che abbiano una fissata distanza d > 0 in coppie di punti a distanza dk con k fisso. Sia T un triangolo equilatero di lato d, Allora f trasforma T in un triangolo T 0 = f (T ) equilatero di lato dk, dunque simile a T . In virtù del n. 5.3.3, f è una similitudine, e precisamente una k-similitudine. 5.3.5 Triangoli congruenti e isometrie. Vedremo in questo paragrafo che condizione necessaria e sufficiente affinché due triangoli del piano euclideo siano congruenti è che esista una isometria del piano che muti l’uno nell’altro. La condizione è ovviamente sufficiente, perché due triangoli con i lati ordinatamente congruenti sono congruenti. La condizione è necessaria in virtù della seguente Proposizione. 43 Proposizione 23 Siano ABC e A0 B 0 C 0 due triangoli congruenti del piano euclideo E2 . Esiste ed è unica una isometria f ∈ Iso(E2 ) tale che f (ABC) = A0 B 0 C 0 ; inoltre tale f è prodotto di al più tre simmetrie rispetto a rette. Dimostrazione. Per definizione di triangoli congruenti, si ha l’uguaglianza37 del lati: AB = A0 B 0 , BC = B C 0 , AC = A0 C 0 . Se A0 = A, si assuma f1 = id(E2 ); se A0 6= A, si assuma f1 = σa , dove a è l’asse del segmento AA0 . In entrambi i casi si ha ovviamente 0 f1 (A) = A0 . Sia f1 (B) = B1 , f1 (C) = C1 . Se B1 = B 0 si assuma f2 = id(E2 ); se B1 6= B 0 si assuma f2 = σb , dove b è l’asse del segmento B 0 B1 . In entrambi i casi si ha ovviamente f2 (B1 ) = B 0 ed inoltre f2 (A0 ) = A0 perché A0 ∈ b, essendo A0 equidistante dagli estremi del segmento B 0 B1 in quanto A0 B 0 = AB = A0 B1 (= f1 (AB)). Sia f2 (C1 ) = C2 . Se C2 = C 0 si assuma f3 = id(E2 ); se C2 6= C 0 si assuma f3 = σc , dove c è l’asse del segmento C2 C 0 . In entrambi i casi si ha ovviamente f3 (C2 ) = C 0 ed inoltre f3 (A0 ) = A0 ed anche f3 (B 0 ) = B 0 perché c = A0 B 0 , essendo ciascuno dei due punti A0 e B 0 equidistante dagli estremi del segmento C2 C 0 : A0 C 0 = AC = A0 C1 = A0 C2 e B 0 C 0 = BC = B1 C1 = B 0 C2 . Pertanto, posto f := f3 f2 f1 , si ha: f (A) = f3 f2 f1 (A) = f3 f2 (A0 ) = f3 (A0 ) = A0 , f (B) = f3 f2 f1 (B) = f3 f2 (B1 ) = f3 (B 0 ) = B 0 , f (C) = f3 f2 f1 (C) = f3 f2 (C1 ) = f3 (C2 ) = C 0 . Da quanto precede si ha che esiste almeno una isometria che trasforma il triangolo T = ABC nel triangolo T 0 = A0 B 0 C 0 e che tale isometria è prodotto di al più tre simmetrie; l’unicità dell’isometria in questione segue dal fatto che essa non può che coincidere con l’unica affinità di E2 che muta T in T 0 . Osservazione 24 . In base alle notazioni introdotte nella dimostrazione del Teorema 23 si ha: f1 (ABC) = A0 B1 C1 , f2 (A0 B1 C1 ) = A0 B 0 C2 , f3 (A0 B 0 C2 ) = A0 B 0 C 0 . Corollario 25 Ogni isometria del piano euclideo è prodotto di al più tre simmetrie rispetto a rette. Dimostrazione. Sia f ∈ Iso(E2 ). Consideriamo un triangolo T ed il suo trasformato T 0 = f (T ). Per il terzo criterio di uguaglianza i triangoli T e T 0 sono congruenti . Dunque, per la Proposizione 23, f non può che coincidere con l’unica isometria che muta T in T 0 e che sappiamo essere prodotto di al più tre simmetrie. 37 Qui e appresso usiamo impropriamente, per segmenti, angoli e triangoli, il termine uguaglianza per indicare la congruenza ed il simbolo = in luogo di ≡. 44 5.3.6 Triangoli simili e similitudini. Vedremo in questo paragrafo che condizione necessaria e sufficiente affinché due triangoli del piano euclideo siano simili è che esista una similitudine del piano che muti l’uno nell’altro. La condizione è ovviamente sufficiente, perché due triangoli con i lati in proporzione sono simili. La condizione è necessaria in virtù della seguente Proposizione. Proposizione 26 Siano ABC e A0 B 0 C 0 due triangoli simili del piano euclideo E2 . Esiste ed è unica una similitudine f ∈ Sim(E2 ) tale che f (ABC) = A0 B 0 C 0 . Dimostrazione. Sia τ la traslazione tale che τ (A) = A0 , e sia ρ la rotazione di centro A0 che porta la semiretta A0 τ (B) sopra la semiretta A0 B 0 ; sia infine ω l’omotetia di centro A0 che porta ρτ (B) in B 0 . I triangoli A0 B 0 C 0 e ωρτ (ABC) = A0 B 0 ωρτ (C) sono congruenti per il terzo criterio di uguaglianza ed hanno il lato A0 B 0 in comune. Due casi sono possibili a seconda che i due punti ωρτ (C) e C 0 siano o non siano nello stesso semipiano di origine la retta A0 B 0 : nel primo caso ωρτ (C) = C 0 , mentre nel secondo caso C 0 = σωρτ (C), dove σ è la simmetria rispetto alla retta A0 B 0 . In conclusione il triangolo ABC viene portato nel triangolo A0 B 0 C 0 dalla similitudine diretta ωρτ nel primo caso oppure dalla similitudine inversa σωρτ nel secondo caso. In entrambi i casi esiste una similitudine che porta il triangolo ABC nel triangolo A0 B 0 C 0 ; inoltre tale similitudine è unica, perché dati due triangoli qualunque esiste ed è unica l’affinità che muta il primo nel secondo. 6 Ampliamenti, estensioni e generalizzazioni dello spazio della geometria elementare . Lo studio della geometria lineare ed algebrica suggerisce in modo spontaneo varie estensioni e generalizzazioni della nozione di spazio, allo scopo di eliminare le eccezioni che si incontrano e di trovare un linguaggio per quanto possibile unificatore. Ci limitiamo per il momento al punto di vista della geometria lineare ed algebrica, in quanto esso riflette le proprietà generali di campo: prescinderemo invece dal punto di vista metrico e differenziale, che è legato a proprietà specifiche e più riposte del campo reale, quali l’ordinamento e la continuità). Ci proponiamo di motivare tre tipi di ampliamenti: (1) ampliamenti del campo base; (2) passaggio dall’affine al proiettivo; (3) passaggio a spazi di dimensione superiore. Appare altamente desiderabile estendere il piano R2 in modo che, nell’ambiente esteso, valga senza eccezioni il Teorema di Bézout (Etienne BÉZOUT, 1730-1783), secondo cui due qualunque curve algebriche, che non abbiano una componente comune, si intersecano in un numero di punti che uguaglia il prodotto dei loro ordini (purché ogni punto comune alle due curve venga contato con la dovuta molteplicità d’intersezione). Si raggiunge lo scopo desiderato, passando dal reale al complesso e dall’affine al proiettivo. In altri termini, dovremo sviluppare la geometria del piano proiettivo complesso. 45 Vedremo poi che, anche se ci si vuole limitare a studiare la geometria elementare, si è costretti a studiare (eventualmente in modo inconsapevole) la geometria algebrica in uno spazio di dimensione superiore: cosı̀, ad esempio, la semplicissima geometria della retta dello spazio ordinario equivale alla geometria della quadrica di Klein V42 (un’ipersuperficie d’ordine 2 di uno spazio di dimensione 5). Analogamente, vedremo che le coniche del piano corrispondono ai punti di uno spazio S 5-dimensionale, che le coniche spezzate corrispondono ai punti di una ipersuperficie cubica V43 di tale S5 , e che le coniche spezzate in una retta contata due volte corrispondono ai punti di una superficie di S5 , la superficie di Veronese V24 . Vedremo anche che la superficie di Veronese può essere presentata come immagine proiettiva del sistema lineare completo delle coniche del piano, e che questi punti di vista potranno essere estesi alla considerazione della varietà di Veronese rappresentativa del sistema lineare totale delle curve algebriche piane d’ordine n (o più generalmente della varietà di Veronese rappresentativa del sistema lineare totale delle ipersuperfici algebriche d’ordine n di uno spazio proiettivo di dimensione r ≥ 2). Avremo in definitiva motivazioni più che sufficienti per giustificare lo studio della geometria proiettiva iperpaziale. Per illustrare nel modo più semplice possibile l’opportunità di effettuare le estensioni suddette, partiamo anzitutto dall’usuale spazio a due dimensioni (il piano di Euclide). Sappiamo che, come modello del piano euclideo, possiamo assumere il piano numerico reale A2 (R) = (P, R). In tale spazio, l’insieme P dei punti è l’insieme R2 delle coppie ordinate di numeri reali. L’insieme R delle rette è: R := {rabc : (a, b, c) ∈ R3 , (a, b) 6= (0, 0)}, ove la retta rabc è data da: rabc := {(x, y) ∈ R2 : ax + by + c = 0}. Talvolta, per abuso di notazione, il piano numerico reale verrà denotato semplicemente con R2 . In tale ambiente, oltre all’ordinaria geometria lineare (traduzione dell’algebra lineare, riguardante i sistemi di equazioni lineari), si sviluppa più generalmente la geometria algebrica piana (studio delle curve algebriche piane, traduzione dello studio dei polinomi e dei sistemi di polinomi in due indeterminate). Ricordiamo che si definisce curva algebrica di R2 di grado (o ordine) d ≥ 1 una qualunque coppia V(f ) = (R? · f, V (f )), dove f = f (X, Y ) ∈ R[X, Y ] è un polinomio di grado d, e V (f ) (detto il sostegno o supporto della curva) è l’insieme dei punti di R2 che annullano f : V (f ) := {(x, y) ∈ R2 : f (x, y) = 0}. Diremo anche che V(f ) è la curva definita dall’equazione f (X, Y ) = 0. Si noti che curve distinte possono avere lo stesso sostegno: ad esempio V (XY ) = V (XY 2 ) = V (X 2 Y ) = V (X 3 Y 5 ) è il comune sostegno di curve fra loro distinte. 6.1 Ampliamento del campo base: passaggio dal reale al complesso Questo ampliamento può essere effettuato in due modi: (1) Passaggio dal piano reale al piano reale complessificato: Ciò significa che il campo base (campo ove variano i coefficienti delle equazioni algebriche che si considerano) è il campo reale, ma si consente alle coordinate dei punti soluzione di assumere valori complessi. Ad esempio, l’insieme delle rette è ora R := {rabc : (a, b, c) ∈ R3 , (a, b) 6= (0, 0)}, ove la retta rabc è ora data da: rabc := {(x, y) ∈ C2 : ax + by + c = 0}. 46 (2) Passaggio al piano complesso. Ciò significa che sia i coefficienti delle equazioni considerate sia le coordinate dei punti variano nel campo complesso. Ad esempio, l’insieme delle rette è ora R := {rabc : (a, b, c) ∈ C3 , (a, b) 6= (0, 0)}, ove la retta rabc è ora data da: rabc := {(x, y) ∈ C2 : ax + by + c = 0}. Per conseguire la validità del teorema di Bézout, dal reale al complesso è neces√ √ il passaggio sario: si consideri V(X 2 + Y 2 − 1) ∩ V(X − 2) = {(2, i 3), (2, −i 3)}; ma non è sufficiente: si consideri V(X − 1) ∩ V (X − 2) = ∅. Notiamo ancora una volta che i punti comuni vanno contati con la dovuta molteplicità d’intersezione: ad esempio: V(X 2 + Y 2 − 1) ∩ V(X − 1) = {(1, 0)}, e questo punto va contato due volte perché la retta è ivi tangente alla circonferenza. Osservazione. Si noti che, nello studio di questioni aritmetiche ed in teoria dei numeri, si usa andare nella direzione contraria: anziché ampliare il campo reale R, ci si restringe al campo razionale Q. Ad esempio, l’esistenza di terne pitagoriche equivale all’esistenza nel primo quadrante di punti razionali sulla circonferenza X 2 + Y 2 = 1 di centro l’origine e raggio 1: se (a, b, c) ∈ N3 è una terna pitagorica, cioè se a2 + b2 = c2 , allora (a/c)2 + (b/c)2 = 1, ossia (a/c, b/c) è un punto razionale del tipo detto; viceversa se (p, q) ∈ Q2 è un punto razionale del tipo detto, si ha p2 + q 2 = 1, e posto che sia p = a/b, q = c/d, con (a, b, c, d) ∈ N4 , si ha (a/b)2 + (c/d)2 = 1, cioè a2 d2 + c2 b2 = b2 d2 , e si trova la terna pitagorica (ad, cb, bd). In modo analogo si riconosce subito che l’esistenza di terne di Fermat di ordine n > 2 - cioè di terne (a, b, c) ∈ N3 tali che an + bn = cn - equivarrebbe all’esistenza nel primo quadrante di punti razionali sulla curva algebrica di equazione X n + Y n = 1. Il cosiddetto grande (o ultimo) teorema di Fermat, affermante che non esistono terne di Fermat d’ordine n > 2, è stato dimostrato soltanto nel 1993 (da Andrew WILES, medaglia Fields38 ). Ricordiamo infine che, mentre non esistono ovviamente campi intermedi tra il campo reale ed il campo complesso, esistono invece infiniti campi intermedi tra il campo reale ed il campo razionale, bastando ad esempio effettuare, a partire da Q, successive estensioni semplici (algebriche o trascendenti) entro R. 6.2 6.2.1 Passaggio dall’affine al proiettivo. Dal piano affine A2 (R) al piano proiettivo P2 (R). Tale ampliamento ha anzitutto un valore unificante (ad es. due rette del piano avranno sempre un punto in comune, proprio o improprio). Si può distinguere tra piano affine ampliato e piano proiettivo vero e proprio, a seconda che venga o no conservata memoria del piano affine originario. Ad esempio la distinzione tra punti propri ed impropri ha senso nel piano affine ampliato, ma non nel piano proiettivo (nel quale tutti i punti sono uguali!), la considerazione della retta impropria ha senso nel piano affine ampliato, ma non nel piano proiettivo (nel quale tutte le rette sono uguali!). La distinzione diviene più chiara se si adotta il punto di vista di Klein: la geometria affine del piano affine ampliato ha come gruppo fondamentale il gruppo delle omografie che mutano in sé la retta impropria, mentre la geometria proiettiva (del;piano proiettivo) ha come gruppo fondamentale il gruppo di tutte le omografie. Ricordiamo che, il passaggio dal piano affine al piano 38 Le medaglie Fields (che prendono il nome da J.C. Fields, che ha finanziato la loro istituzione) sono premi equivalenti per la matematica ad un premio Nobel e vengono assegnati - in occasione del Congresso Internazionale dei Matematici (ogni quattro anni) - a matematici con meno di quaranta anni che si siano distinti per avere ottenuto risultati particolarmente importanti. 47 proiettivo può essere descritto in due modi diversi (fra loro equivalenti): uno sintetico ed uno analitico. Il modo sintetico consiste dei seguenti passi: (1) si introduce per ogni fascio di rette parallele un nuovo ”punto, che è la comune direzione delle rette di quel fascio, cioè il quid comune alle rette del fascio (ovvero, se si preferisce, il fascio stesso, qualora si preferisca l’aspetto estensivo a quello intensivo del concetto di direzione); (2) si amplia ciascuna retta con l’aggiunta di un nuovo punto: la direzione di quella retta; (3) si introduce una nuova retta: la totalità delle direzioni delle rette del piano. Quando si mantiene la memoria del processo di ampliamento, i vecchi elementi - punti e rette - si chiamano propri (o al finito), mentre i nuovi vengono chiamati impropri (o all’infinito); la terminologia si giustifica osservando che quando due rette incidenti del piano euclideo variano con continuità tendendo ad essere parallele, il loro punto d’intersezione si allontana indefinitamente. Si noti che gli assiomi di incidenza per un piano proiettivo sono particolarmente semplici ed eleganti. Un piano proiettivo è una coppia P2 = (P, R), dove P è un insieme non vuoto di elementi detti punti, R è un insieme di parti di P dette rette, in modo che valgano i seguenti assiomi: 1) Per due punti distinti qualunque passa una e una sola retta. 2) Due rette distinte qualunque si intersecano in uno ed in un solo punto. 3) Esistono 4 punti a 3 a 3 non allineati. Il terzo assioma può essere sostituito da: 3’) Esistono almeno 3 punti non allineati e (proprietà di Fano39 ) ogni retta contiene almeno 3 punti. Si noti che la nozione di piano proiettivo è nella natura delle cose. Infatti si ha un piano proiettivo P2 = (P, R), assumendo come P la stella di rette di R3 di centro un punto A ∈ R3 e come R la stella di piani di R3 di centro A. Si noti che tale piano P2 è isomorfo al piano P2 (R) (visto come piano all’infinito di R3 , i cui punti sono le direzioni delle rette della stella e le cui rette sono le giaciture dei piani della stella). Si noti inoltre che ogni piano della stella si può identificare con il fascio di rette di centro A contenuto nel piano stesso. In modo analitico l’ampliamento del piano affine R2 = A2 (R) = AG(2, R) al piano proiettivo P2 (R) = P G(2, R) viene descritto dai seguenti passi. 1) I punti di P2 (R) sono le ”terne omogenee” di numeri reali. Ogni terna omogenea si ottiene da una terna ordinata (x0 , x1 , x2 ) di numeri reali non tutti nulli, e consiste per definizione di quella terna stessa e di tutte le altre terne proporzionali a quella secondo fattori non nulli di R). La terna omogenea associata a (x0 , x1 , x2 ) si denota con [(x0 , x1 , x2 )]. 2) Le rette di P2 (R) sono gli insiemi di punti del tipo: rabc = {[(x0 , x1 , x2 )] : ax1 + bx2 + cx0 = 0} ove (a, b, c) è una terna di numeri reali non tutti nulli. Si noti che attualmente non si richiede che sia (a, b) 6= (0, 0). 3) I punti di A2 (R) si identificano con alcuni punti di P2 (R). Più precisamente il punto (x, y) di A2 (R) si identifica con il punto [(1, x, y)] di P2 (R). In altri termini: ogni punto [(x0 , x1 , x2 )] di P2 (R) con x0 6= 0 si identifica col punto (x, y) ove x = x1 /x0 , y = x2 /x0 . Ad ogni retta di A2 (R) di equazione aX + bY + c = 0 (dove a, b sono non entrambi nulli) corrisponde cosı̀ la retta di P2 (R) di equazione aX1 + bX2 + cX0 = 0. Ogni soluzione (x, y) di quella fornisce una soluzione omogenea [(1, x, y)] di questa; questa ha poi un’unica ulteriore soluzione [(0, −b, a)]. In altri termini la 39 Il matematico Gino FANO (1871-1952) è stato già ricordato a proposito del piano proiettivo P2 (Z2 ), che porta il suo nome. 48 retta di A2 (R) è stata ampliata con l’aggiunta del punto [(0, −b, a)]. Questo punto corrisponde al punto improprio di cui si è detto nella esposizione per via sintetica, perché la condizione di parallelismo tra due rette di A2 (R) aventi rispettivamente equazione aX + bY + c = 0 ed a0 X + b0 Y + c0 = 0 si traduce (in base a proprietà elementari dei sistemi di equazioni lineari) nella proporzionalità delle coppie (a, b) e (a0 , b0 ) cioè nel fatto che sia [(0, −b, a)] = [(0, −b0 , a0 )]. 6.2.2 Curve algebriche del piano proiettivo A2 (R). Ricordiamo che si definisce curva algebrica di P2 (R) di grado (o ordine) d ≥ 1 una qualunque coppia V(f ) = (R? f, V (f )), dove f = f (X) = f (X0 , X1 , X2 ) ∈ R[X0 , X1 , X2 ] = R[X] è un polinomio omogeneo di grado d, e V(f) (detto il sostegno della curva) è l’insieme dei punti [(x0 , x1 , x2 )] di P2 (R) che annullano f : V (f ) := {[x] : x ∈ R3 ∧ f (x) = 0}. , Le curve algebriche di ordine 1 sono le rette, le curve algebriche di ordine 2, 3, 4, . . . si chiamano coniche, cubiche, quartiche, quintiche . . . . E’ chiaro che ad ogni curva algebrica di grado d del piano affine A2 (R), di equazione f (X, Y ) = 0, si può associare la curva algebrica di grado d di P2 (R), di equazione X0d f (X1 /X0 , X2 /X0 ) = 0. Viceversa, ad ogni curva algebrica di grado d di P2 (R), di equazione f (X0 , X1 , X2 ) = 0 può associAr si la sua traccia affine, che sarà una curva algebrica di A2 (R), di equazione f (1, X, Y ) = 0, non appena il polinomio f non contenga il fattore X0d , cioè non appena la curva non consista della retta impropria contata d volte. Per conseguire la validità del teorema di Bézout, il passaggio dall’affine al proiettivo è necessario (ad esempio V (X − 1) ∩ V (X − 2) = ∅ in ambito affine, mentre V (X − 1) ∩ V (X − 2) = {(0, 0, 1)} in ambito proiettivo), ma non è sufficiente (ad esempio V(X2 + Y 2 − 1) ∩ V (X − 2) = ∅ sia in ambito affine che proiettivo). Da quanto precede si ha che, per conseguire la validità del teorema di Bézout, è necessario il passaggio dal reale al complesso e dall’affine al proiettivo. In effetti quelle due condizioni (prese insieme) sono anche sufficienti, in quanto si può effettivamente dimostrare (con la teoria dell’eliminazione algebrica, e più precisalmente con la teoria del risultante) che Teorema 27 (Teorema di Bézout nel piano). Sia P2 = P2 (K) il piano proiettivo su un campo K algebricamente chiuso. Due curve algebriche di P2 , di gradi n ed m, che non abbiano una componente comune, hanno esattamente nm punti in comune, a patto di contare ogni punto d’intersezione con la dovuta molteplicità d’intersezione. I punti distinti sono esattamente nm se le due curve sono generiche40 . 40 L’attributo generico ha in geometria algebrica un significato tecnico, diverso da vquello che ha l’attributo qualunque. Considerata una certa totalità di enti geometrici, totalità che abbia una certa dimensione k, si dice che ”il generico ente verifica una certa proprietà’ se la totalità degli enti che non verificano quella proprietà costituisce una sottototalità di dimensione minore di k. Dunque il significato di ”generico” è relativo ad una certa proprietà e cambia di volta in volta. Ad esempio: ”sia V(f ) un’ipersuperficie di Pr (K). Il generico punto di Pr (K) non appartiene a V(f )”: in effetti i punti che appartengono a V(f ) formano una totalità di dimensione r − 1 < r. Ed ancora: ”la generica conica del piano è non singolare”: in effetti la totalità delle coniche singolari ha dimensione 4 < 5. 49 Deduzione del Teorema di Bézout dal principio di conservazione del numero di intersezioni. Nel caso in cui K = C, il suddetto teorema di Bézout può essere dedotto dal cosiddetto principio di conservazione del numero di intersezioni per variazioni continue: variando con continuità ed in modo generico le due curve (cioè i coefficienti delle rispettive equazioni) anche i punti d’intersezione variano con continuità ed il loro numero rimane invariato. Nel caso in questione, si fa degenerare la prima curva in una curva spezzata in n rette generiche e la seconda curva in una curva spezzata in m rette generiche. Il numero dei punti comuni a queste due curve spezzate è dunque nm , ed è uguale al numero dei punti comuni alle due curve originarie. Da questo punto di vista la molteplicità d’intersezione di due curve in un loro punto comune acquista un chiaro significato dinamico come il numero dei punti comuni alle due curve spezzate in rette che confluiscono nel punto in questione (nella trasformazione inversa, che riporta le due curve spezzate in rette nelle due curve originarie). 6.2.3 Dallo spazio affine A3 (R) allo spazio proiettivo P3 (R). Lasciamo al Lettore di descrivere il passaggio dallo spazio affine reale A3 (R) allo spazio complessificato ed allo spazio complesso A3 (C), seguendo le indicazione sviluppate nel caso piano. Limitiamoci invece a ripercorrere il passaggio dall’affine al proiettivo per lo spazio reale 3-dimensionale. In analogia a quanto detto nal caso del piano, si hanno due modi diversi (fra loro equivalenti), uno per via sintetica ed uno per via analitica, per passare dallo spazio affine ordinario A3 = A3 (R) al corrispondente spazio proiettivo P3 = P3 (R). Per quanto riguarda A3 , ricordiamo che esso è stato introdotto per via sintetica con gli assiomi di Hilbert, mentre è stato presentato per via puramente analitica, cioè come spazio numerico, nella dimostrazione del Teorema 2. Il modo sintetico per passare da A3 a P3 consiste dei seguenti passi: (1) si introduce per ogni stella di rette parallele (stella impropria di rette) un nuovo ”punto” (improprio): la comune direzione delle rette di quella stella; (2) si amplia ciascuna retta con l’aggiunta di un nuovo punto (improprio): la direzione di quella retta; (3) si amplia ciascun piano con l’aggiunta di nuovi punti (impropri): le direzioni delle rette del piano e con l’aggiunta di una nuova retta (impropria): la totalità delle direzioni delle rette del piano (detta anche la ”giacitura” del piano); (4) si constata che due piani sono paralleli se e solo se ad essi compete la stessa retta impropria (cioè se hanno la stessa giacitura). Il modo analitico per passare da A3 (R) a P3 (R) consiste dei seguenti passi: 1) I punti di P3 (R) sono le ”quaterne omogenee” di numeri reali. Ogni quaterna omogenea è definita come [x] = x · R? , dove x = (x0 , x1 , x2 , x3 ) ∈ R4 \ {0} è una quaterna ordinata di numeri reali non tutti nulli. 2) I piani di P3 (R) sono gli insiemi di punti del tipo πabcd := {[(x0 , x1 , x2 , x3 )] : ax1 + bx2 + cx3 + dx0 = 0, ove (a, b, c, d) ∈ R4 ed (a, b, c, d) 6= (0, 0, 0, 0). Si noti che attualmente non si richiede che sia (a, b, c) 6= (0, 0, 0). 50 3) Le rette di P3 (R) sono le intersezioni πabcd ∩ πa0 b0 c0 d0 di due piani distinti: essere distinti si traduce nel fatto che le quaterne (a, b, c, d) ed (a0 , b0 , c0 , d0 ) non sono proporzionali; si noti che attualmente non è mai πabcd ∩ πa0 0 b0 c0 d0 = ∅. In altri termini le rette sono i luoghi dei punti che annullano un sistema lineare omogeneo di rango 2 del tipo: aX1 + bX2 + cX3 + dX0 = 0, a0 X1 + b0 X2 + c0 X3 + d0 X0 = 0. 4) Ciascun punto (x, y, z) di A3 (R) si identifica col punto [(1, x, y, z)] di P3 (R). In altri termini: ogni punto [(x0 , x1 , x2 , x3 )] di P3 (R)) con x0 6= 0 si identifica col punto (x, y, z) ove x = x1 /x0 , y = x2 /x0 , z = x3 /x0 . Ad ogni piano di A3 (R) di equazione aX + bY + cZ + d = 0 (dove a, b, c sono non tutti nulli) corrisponde cosı̀ il piano di P3 (R) di equazione omogenea aX1 + bX2 + cX3 + dX0 = 0. Ogni soluzione (x, y, z) di quella fornisce una soluzione omogenea [(1, x, y, z)] di questa; le altre soluzioni dell’equazione omogenea sono tutte e sole le soluzioni del sistema: aX1 + bX2 + cX3 = 0, X0 = 0 cioè sono i punti di una retta del piano considerato (la retta impropria del piano). Due piani di A3 (R), di equazione rispettivamente aX + bY + cZ + d = 0 e a0 X + b0 Y + c0 Z + d0 = 0, sono paralleli sse coincidono o hanno intersezione vuota, cioè sse le loro due equazioni sono equivalenti o incompatibili; queste due circostanze si verificano sse la terna (a, b, c) è proporzionale alla terna (a0 , b0 , c0 ), cioè sse il sistema aX1 + bX2 + cX3 = 0, X0 = 0 è equivalente al sistema a0 X1 + b0 X2 + c0 X3 = 0, X0 = 0 cioè sse i due piani (ampliati) hanno la stessa retta impropria. In modo analogo si verifica che due rette di A3 (R) sono parallele sse le due rette (ampliate) hanno uno stesso punto improprio (0, x1 , x2 , x3 ). 6.2.4 Curve, superfici e varietà algebriche degli spazi A3 (R)) e P3 (R). Ricordiamo che si definisce superficie algebrica di A3 (R) di grado (o ordine) d ≥ 1 una qualunque coppia V(f ) = (R? f, V (f )), dove f = f (X, Y, Z)[X, Y, Z] è un polinomio di grado d, e V (f ) (detto il sostegno della superfice) è l’insieme dei punti (x, y, z) di R3 (o, più generalmente, di C3 ) che annullano f : V (f ) := {(x, y, z) ∈ C3 : f (x, y, z) = 0}. Analogamente si definisce superficie algebrica di P3 (R) di grado (o ordine) d ≥ 1 una qualunque coppia V(f ) = (R? f, V (f )), dove f = f (X) = f (X0 , X1 , X2 , X3 ) ∈ R[X0 , X1 , X2 , X3 ] = R[X] è un polinomio omogeneo di grado d e V (f ) (detto il sostegno della superficie) è l’insieme dei punti [(x0 , x1 , x2 , x3 )] di P3 (R) (o più generalmente di P3 (C)) che annullano f : 51 V (f ) := {[x] : x ∈ C4 ∧ f (x) = 0}. Le varietà algebriche di A3 (R) e di A3 (C) si definiscono come intersezioni - considerate nello spazio proiettivo complessificato - di s ≥ 1 superfici algebriche V(fi ) di quegli spazi: \ i V(fi ) = \ (R? fi , V (fi )) = ({R? fi }, i \ V (fi )). i In altri termini, per dare una varietà algebrica dobbiamo assegnare un insieme F di polinomi f nelle coordinate correnti dello spazio (ciascun polinomio dovrà essere omogeneo, se siamo nel caso proiettivo), ed assumiamo poi, come varietà definita da F , la coppia \ V(F ) = (R? F, V (F )), dove V (F ) = V (f ), f ∈F l’intersezione essendo estesa a tutti i polinomi f di F . Una varietà algebrica potrà dunque essere: vuota (ad esempio l’intersezione di 4 piani generici di P3 ), un gruppo finito di punti (ad. esempio l’intersezione di 3 piani generici di P3 ; od ancora l’intersezione di una quadrica e di 2 piani generici); una superficie algebrica (quando le superfici considerate hanno una componente superficiale comune, ad esempio la superficie cubica X03 − X13 = 0 e la superficie quintica X05 − X15 = 0); una curva algebrica. Le curve algebriche di P3 (C) sono per definizione le varietà algebriche di dimensione 1, cioè - per definizione - quelle varietà algebriche che hanno intersezione non vuota con ogni piano ma non con ogni retta di P3 (C); si dimostra che, allora, il generico piano incontra la curva in un numero fisso di punti (contando i punti con la dovuta molteplicità d’intersezione). Ad esempio, la cubica sghemba di A3 (R), avente equazioni parametriche X = t, Y = t2 , Z = t3 , è una curva algebrica, non è contenuta in alcun piano ed ha ordine 3. Infatti i punti comuni alla curva e ad un piano generico d’equazione aX + bY + cZ + d = 0 sono esattamentre tre, in quanto si trovano risolvendo in t l’equazione at + bt2 + ct3 + d = 0; inoltre la curva è intersezione delle quadriche di equazioni X2 − Y = 0 ed XY − Z = 0 rispettivamente. Si noti che in P3 (C) le due suddette quadriche hanno equazione X12 − X2 X0 = 0 ed X1 X2 − X3 X0 = 0 rispettivamente, e si intersecano (a norma del teorema spaziale di Bézout) in una curva di ordine 4, che risulta spezzata nella suddetta cubica sghemba e nella retta (del piano improprio) di equazioni X0 = 0, X1 = 0. Anche nello spazio, come nel piano, ai fini della validità del teorema di Bézout occorre e basta ampliare lo spazio A3 (R) passando allo spazio proiettivo e al campo complesso. Sussiste infatti il teorema: Teorema 28 (Teorema di Bézout nello spazio.) Sia P3 = P3 (K) lo spazio proiettivo 3-dimensionale su un campo K algebricamente chiuso. Allora: tre superfici algebriche di P3 , di gradi n, m ed h, prive di componenti comuni e che non passino per una medesima curva, hanno esattamente nmh punti in comune, a patto di contare ogni punto d’intersezione con la dovuta molteplicità d’intersezione. Il numero dei punti comuni è esattamente nmh qualora le tre superfici sono generiche. Corollario 29 Sia P3 = P3 (K) lo spazio proiettivo 3-dimensionale su un campo K algebricamente chiuso. Allora: due superfici algebriche di P3 , di gradi n ed m e prive di componenti superficiali comuni, si intersecano in una curva algebrica d’ordine nm di P3 . Dimostrazione. Si applichi il Teorema di Bézout (Teorema 28) alle tre superfici costituite dalle due superfici date e da un piano generico dello spazio. 52 Deduzione del teorema di Bézout spaziale dal principio di conservazione del numero di intersezioni. Nel caso in cui K = C, il suddetto Teorema di Bézout in P3 (K) può essere dedotto dal principio di conservazione del numero di intersezioni per variazioni continue generiche. Le tre superfici f1 , f2 e f3 si fanno degenerare, per variazione continua generica, in tre superfici g1 , g2 e g3 , spezzate rispettivamente in n, in m ed in h piani. Allora g1 ∩ g2 consiste evidentemente di nm rette, cosicché (g1 ∩ g2 ) ∩ g3 consiste di nmh punti. I punti di (f1 ∩ f2 ) ∩ f3 sono altrettanti. Questo punto di vista dà un significato dinamico alla molteplicità d’intersezione delle tre superfici f1 , f2 ef3 in un loro punto comune. 6.3 Passaggio a spazi di dimensione superiore. Si è visto precedentemente che è opportuno sviluppare la geometria in ambiente proiettivo coordinatizzato sopra un campo algebricamente chiuso. Vogliamo ora illustrare la necessità intrinseca di considerare anche spazi di dimensione maggiore di tre, e mostrare come il passaggio a spazi di dimensione superiore sia quanto mai naturale. A tal fine cominciamo con il fissare la terminologia e le notazioni relative a tali spazi. 6.3.1 Spazio affine Ar (K). Sia Ar = Ar (K) = (P, S) lo spazio affine numerico r-dimensionale su un campo K (algebricamente chiuso). I punti di Ar sono le r-ple ordinate y = (y1 , . . . , yr ) di numeri di K: cioè P = K r . I numeri y1 , . . . , yr si chiamano le coordinate affini (c.a.) del punto y. Gli iperpiani sono i luoghi H dei punti (y1 , . . . , yr ) ∈ P che verificano un’equazione lineare del tipo: H: u1 Y1 + · · · + ur Yr + u0 = 0, dove (u0 , . . . , ur ) ∈ K r+1 e (u1 , . . . , ur ) 6= (0, . . . , 0). Più in generale i sottospazi sono le intersezioni di iperpiani, ossia i luoghi A dei punti (y1 , . . . , yr ) ∈ P che verificano un sistema di s ≥ 1 equazioni del tipo: A: u11 Y1 + · · · + u1r Yr + u10 = 0, ..., us1 Y1 + · · · + usr Yr + us0 = 0. (4) Una ipersuperficie di Ar (K) è una coppia V(f ) = (K ? f, V (f )), dove f è un polinomio su K in r indeterminate, f = f (Y) ∈ K[Y] con Y = (Y1 , . . . , Yr ) e V (f ), detto il sostegno dell’ipersuperficie, è l’insieme dei punti che annullano f : V (f ) := {(y1 , . . . , yr ) ∈ P : f (y1 , . . . , yr ) = 0}. Si dice che V(f ) è l’ipersuperficie definita dal polinomio f (o dall’equazione f = 0). Una varietà algebrica di Ar si definisce come intersezione di ipersuperfici algebriche. In altri termini, per dare una varietà algebrica, si deve anzitutto assegnare un insieme F di polinomi f (Y) ∈ K[Y] = K[Y1 , . . . , Yr ] nelle coordinate correnti dello spazio; si chiama allora varietà definita da F la coppia V(F ) = (K ? F, V (F )), dove K ? F = {af : a ∈ K ? , f ∈ F } e V (F ) = \ f ∈F 53 V (f ) , l’intersezione essendo estesa a tutti i polinomi f di F . Due varietà algebriche di Ar (K): V(F ) = (K ? F, V (F ) e V(F 0 ) = (K ? F 0 , V (F 0 )) devono attualmente essere considerate equivalenti o ”uguali” dal punto di vista affine), se esiste un’affinità α di Ar tale che α(F ) = F 0 , e quindi tale che α(V (F )) = V (F 0 )). Ricordiamo che un’affinità di Ar (K) ha equazioni 0 0 Y1 = a11 Y1 + · · · + a1r Y r + a10 , . . . , Yr = ar1 Y1 + · · · + arr Yr + ar0 , dove la matrice dei coefficienti è una matrice invertibile ad elementi in K, cioè appartenente al gruppo GL(r, K) ed (a10 , . . . , ar0 ) ∈ K r . Un insieme di punti di Ar che sia sostegno V (F ) di una varietà algebrica V(F ) si chiama anche un insieme algebrico affine di Ar . La totalità degli insiemi algebrici affini di Ar è chiusa rispetto all’intersezione ed all’unione, e ciò permette di definire l’intersezione e l’unione di varietà algebriche. Infatti, considerati due insiemi (finiti) F e G di polinomi di K[Y], si ha: V (F ) ∩ V (G) = V (F ∪ G) e V (F ) ∪ V (G) = V (F G), ove F G = {f g : f ∈ F ∧ g ∈ G}. Si noti che ogni iperpiano di Ar è un’ipersuperficie di Ar . Più generalmente, ogni sottospazio di Ar è (sostegno di) una varietà algebrica di Ar . E’ opportuno distinguere tra la varietà V(F ) e il suo sostegno V (F ), in quanto la considerazione di F permette di introdurre la nozione (algebrica) di molteplicità delle ”componenti” di V (F ). Un insieme algebrico V (F ) di Ar si dice riducibile o irriducibile a seconda che esistano o no due insiemi algebrici V (F1 ) e V (F2 ) contenuti propriamente in V (F ) tali che V (F ) = V (F1 ) ∪ V (F2 ). Si può dimostrare che ogni insieme algebrico V (F ) può scriversi in modo unico (a meno dell’ordine) come unione di un numero finito (diciamo t) di insiemi algebrici irriducibili, V (Fi ), detti le sue componenti irriducibili: V (F ) = V (F1 ) ∪ V (F2 ) ∪ · · · ∪ V (Ft ). Se V = (K ? F, V (F )) è una varietà algebrica, e se V (Fi ) è una componente irriducibile del suo sostegno, la varietà Vi = (K ? Fi , V (Fi )) si chiama una componente irriducibile di V. Si dimostra che rimane definito un intero mi , detto la moleplicità di V (Fi ) in V, e che il dato (V (Fi ), mi ) equivale ad una varietà algebrica V(Gi ), che verrà denotata anche con mi V (Fi ); scriveremo allora: V = m1 V (F1 ) ∪ m2 V (F2 ) ∪ · · · ∪ mt V (Ft ). 54 In conclusione, ogni varietà algebrica determina, in modo essenzialmente unico, le sue componenti irriducibili, con le relative molteplicità. 6.3.2 Spazio proiettivo Pr (K). Sia Pr = Pr (K) = (P, S) lo spazio proiettivo numerico r-dimensionale su un campo K (algebricamente chiuso). I punti di Pr sono le (r + 1)-ple omogenee di numeri di K. Ogni tale (r + 1)-pla omogenea è definita come P (x) = [x] = xK ? , dove x = (x0 , . . . , xr ) è una (r + 1)-pla ordinata di numeri di K non tutti nulli, chiamati le coordinate proiettive omogenee (c.p.o.) del punto P (x). Si scrive anche P (x) = (x0 : · · · : xr ), per esprimere che il punto P (x) è determinato dai mutui rapporti delle sue c.p.o. Cosı̀ P = {P (x) : x ∈ K r+1 \ 0. In altri termini i punti P (x) di Pr sono le classi di equivalenza xK ? di vettori non nulli x dello spazio vettoriale K r+1 . Ciò consente di trasportare allo spazio proiettivo Pr varie nozioni e risultati riguardanti lo spazio vettoriale K r+1 (come quelle di iperpiano, sottospazio, dimensione, operazioni reticolari (∩ e ∨) tra sottospazi, formula di Grassmann, rappresentazioni analitiche di sottospazi e di trasformazioni indotte in Pr da trasformazioni lineari o semilineari di K r+1 , ecc.). Gli iperpiani di Pr sono i luoghi H dei punti P (x) ∈ P che verificano un’equazione lineare del tipo: H: u0 X0 + u1 X1 + · · · + ur Xr = 0, con (u0 , . . . , ur ) ∈ K r+1 \ 0. Il suddetto iperpiano verrà denotato con H(u), le (u0 : u1 : · · · : ur ) si chiamano le coordinate plückeriane dell’iperpiano H, e l’equazione di H si scriverà anche in forma compatta interpretando u e x come vettori colonna ed eseguendo il prodotto righe per colonne (e denotando al solito con t M la trasposta di una matrice M ): H: t uX = 0. Più in generale un sottospazio di Pr è un’intersezione di iperpiani, ossia un luogo S dei punti P (x) ∈ P che verificano un sistema di s ≥ 1 equazioni del tipo: S: u10 X0 + u11 X1 + · · · + u1r Xr = 0, . . . , us0 X0 + us1 X1 + · · · + usr Xr = 0. (5) Alternativamente, i sottospazi - anziché come intersezioni di iperpiani - si possono definire come generati da punti, ossia come i sottoinsiemi S ⊆ P dei punti P (x) del tipo S =< P (x0 ), . . . , P (xk ) >:= {P (x) ∈ P : x = λ0 x0 + λ1 x1 + · · · + λk xk }, dove k ≥ 0 è un intero, P (x0 ), . . . , P (xk ) sono k + 1 punti e la (k + 1)-pla (λ0 , λ1 , . . . , λk ) varia in K k +1 con la condizione che sia λ0 x0 + λ1 x1 + · · · + λk xk 6= 0, cioè in modo tale che P (x) sia un punto di Pr . Un sottospazio di Pr si dice avere dimensione d, se è generabile da d + 1 punti linearmente indipendenti P (x0 ), . . . , P (xd ), ovvero, in modo equivalente, se esso è l’intersezione di r − d iperpiani linearmente indipendenti H(u0 ), . . . , H(ur−d−1 ). In quanto precede, l’indipendenza lineare è ben definita da quella dei vettori x0 , . . . , xd e dei vettori u0 , . . . , ur−d−1 rispettivamente. Un sottospazio di dimensione d di Pr si denota generalmente con Sd ; in particolare S−1 denota il sottospazio vuoto, S0 denota un punto, S1 una retta, S2 un piano, . . . , Sr−1 un iperpiano di Pr , ed Sr denota l’intero spazio Pr . 55 Nota bene. Come si è detto, negli spazi proiettivi vale la formula di Grassmann. Da questa si deducono tutte le proprietà grafiche (cioè di appartenenza) di Pr . In particolare, si dimostrano le seguenti proprietà. (a) Il sottospazio congiungente Sd ∨ S0 ha dimensione d + 1 se S0 ∈ / Sd . (b) Il sottospazio intersezione Sd ∩ Sr−1 ha dimensione d − 1 se l’iperpiano Sr−1 non contiene l’Sd . Esercizio: (1) Considerate in Pr due rette sghembe ed un punto fuori di esse, esiste una e una sola retta passante per il punto ed appoggiata alle due rette. (1’) Dualizzare la (1). (2) Sia X un qualunque insieme di sottospazi h-dimensionali di Pr , i quali a due a due si intersechino in uno spazio (h − 1)-dimensionale. Allora, i sottospazi dell’insieme X o passano tutti per un medesimo spazio (h − 1)-dimensionale, oppure sono tutti contenuti in un medesimo spazio (h + 1)-dimensionale. (Questa affermazione si dimostra facilmente quando h = 1 ed il ragionamento utilizzato si estende facilmente). (2’) Dualizzare la (2). L’immersione dello spazio affine nello spazio proiettivo, Ar (K) ,→ Pr (K), si realizza assumendo (y1 , . . . , yr ) 7→ P (1, y1 , . . . , yr ). In altri termini, i punti di Ar corrispondono a quelli di Pr non appartenenti all’iperpiano di equazione X0 = 0 (detto iperpiano improprio o iperpiano all’infinito di Ar ). Le equazioni del passaggio dalle c.p.o alle c.a. sono Y1 = X1 /X0 , Y2 = X2 /X0 , ..., Yr = Xr /X0 . (6) L’iperpiano improprio di Ar è uno spazio proiettivo Pr−1 con le c.p.o. (interne) (X1 : · · · : Xr ). Le equazioni del sottospazio all’infinito (o improprio) ∞(A) del sottospazio A dato dalle (4) si ottengono omogeneizzando le (4) tramite le (6) e facendo quindi sistema con l’ equazione X0 = 0. Si ottiene dunque (sull’iperpiano X0 = 0, cioè in coordinate interne): ∞(A) : u11 X1 + · · · + u1r Xr = 0, ..., us1 X1 + · · · + usr Xr = 0. Le equazioni di ∞(A) in Pr si ottengono aggregando l’equazione X0 = 0 alle equazioni precedenti. Un’ipersuperficie di Pr è una coppia V(f ) = (K ? f, V (f )), dove f = f (X) ∈ K[X] = K[X0 , . . . , Xr ] è un polinomio omogeneo e dove V (f ), detto il sostegno dell’ipersuperficie, è l’insieme dei punti di Pr che annullano f : V (f ) := {[(x0 , . . . , xr )] ∈ P : f (x0 , . . . , xr ) = 0}. Si dice che V(f ) è l’ipersuperficie definita in Pr dal polinomio f (o dall’equazionef = 0). Il grado di f si chiama grado o ordine dell’ipersuperficie V(f ). Il seguente teorema caratterizza le ipersuperfici di una retta affine o proiettiva. Teorema 30 Le ipersuperfici di una retta affine o proiettiva sono i gruppi finiti di punti; più precisamente, se il campo è algebricamente chiuso, una ipersuperfice di ordine n della retta è un gruppo di n punti, a patto di contare ogni punto con la dovuta molteplicittà. 56 Dimostrazione. Sia K un campo algebricamente chiuso. Siano A1 la retta affine e P1 la retta proiettiva su K. Introduciamo un riferimento proiettivo A0 A1 U su P1 , e consideriamo su A1 il riferimento affine associato A0 U . Denotiamo con x la coordinata affine e con (x0 , x1 ) le coordinate proiettive omogenee di punto. Poiché lo spazio ambiente ha dimensione r = 1, i sottospazi di dimensione r − 1 sono quelli di dimensione zero, ossia gli iperpiani della retta sono tutti e soli i suoi punti. Di fatto un punto P (α) ∈ A1 è l’iperpiano di equazione X − α = 0; inoltre un gruppo finito di n punti {P (α1 ), P (α2 ), . . . , P (αn )} di A1 è un’ipersuperficie d’ordine n di equazione (X − α1 )(X − α2 ) · · · (X − αn ) = 0. Analogamente un punto P (a0 , a1 ) ∈ P1 è l’iperpiano di equazione a1 X0 − a0 X1 = 0. Inversamente, un’ipersuperficie algebrica di ordine n ≥ 1 della retta affine A1 , che dunque si rappresenta con un’equazione del tipo an X n + · · · + a1 X1 + a0 = 0 a coefficienti in K con an 6= 0, consiste di un gruppo di n punti perché n sono le radici dell’equazione dal momento che K è algebricamente chiuso. Si noti che quelle n radici (e quindi anche i corrispondenti punti) non sono necessariamente tutte distinte tra loro, ma sono da contarsi ciascuna con la dovuta molteplicità. Mostriamo che analogamente un’ipersuperficie algebrica di ordine n ≥ 1 della retta proiettiva P1 consiste di un gruppo di n punti (da contarsi con la dovuta molteplicità. Nel caso proiettivo, l’ipersuperficie si rappresenta con un’equazione omogenea del tipo an X1n + an−1 X1n−1 X0 + · · · + a1 X1 X0n−1 + a0 X0n = 0 (7) a coefficienti in K non tutti nulli. Se d è la minima potenza con cui compare la X0 (dove 0 ≤ d ≤ n) l’equazione si scrive (ordinando secondo le potenze decrescenti di X1 ): an−d X1n−d X0d + an−d−1 X1n−d−1 X0d+1 + · · · + a1 X1 X0n−1 + a0 X0n = = Xd0 · (an−d X1n−d + an−d−1 X1n−d−1 X0 + · · · + a1 X1 X0n−d−1 + a0 X0n−d ) = 0, dove an−d 6= 0; si noti che questa equazione si scrive formalmente come nella (7) se d = 0. Le coppie omogenee (x0 , x1 ) che sono radici di questa equazione sono quelle che annullano almeno uno dei due fattori a primo membro; il primo fattore (X0d ) è annullato dalla coppia omogenea (0, 1) che corrisponde al punto A1 ed è da contarsi con molteplicità d, mentre il secondo fattore non si annulla per X0 = 0 e quindi le sue soluzioni sono le coppie omogene (x0 , x1 ) che corrispondono alle soluzioni x = x1 /x0 del polinomio non omogeneo an−d X n−d + an−d−1 X n−d−1 + · · · + a1 X + a0 dove an−d 6= 0, che sappiamo ammettere n − d soluzioni (a patto di contarle con la dovuta molteplicità). Questo completa la dimostrazione. Si ha dunque che: Teorema 31 Un’ipersuperfice della retta affine o proiettiva su un campo K algebricamente chiuso è non vuota e non invade tutto la retta. Dimostrazione. Un’ipersuperficie di ordine n ≥ 1 della retta è non vuota perché consiste di un numero finito n 6= 0 di punti, e non invade tutta la retta perché la retta contiene infiniti punti in quanto il campo K è infinito essendo algebricamente chiuso (cfr. 5.2.14). Più generalmente si ha il seguente teorema: 57 Teorema 32 Un’ipersuperficie algebrica di uno spazio affine o proiettivo su un campo K algebricamente chiuso è non vuota e non invade tutto lo spazio Dimostrazione. Supponiamo che lo spazio sia proiettivo (in modo analogo si tratta il caso affine). Sia dunque V (f ) (il sostegno di) un’ipersuperficie d’ordine n ≥ 1 dello spazio proiettivo di dimensione r ≥ 1, definita da un polinomio omogeneo f (X0 , . . . , Xr ) con coefficienti nel campo K non tutti nulli. Dobbiamo dimostrare che il polinomio f (X0 , . . . , Xr ) ammette in K uno zero (z0 , . . . , zr ) ed un non-zero (y0 , . . . , yr ). Dimostriamolo per induzione sulla dimensione r dello spazio. Per r = 1 l’asserto è stato ottenuto esplicitamente nel Teorema 31. Supponiamo allora r ≥ 2 e supponiamo di aver dimostrato l’asserto per ipersuperfici di spazi di dimensione minore di r. Scriviamo il polinomio omogeneo f (X0 , . . . , Xr ) ordinandone i monomi secondo le potenze decrescenti della Xr : f (X0 , . . . , Xr ) = Xrn φ0 + · · · + Xrn−h φh (X0 , . . . , Xr−1 ) + · · · + Xr φn−1 (X0 , . . . , Xr−1 ) + φn (X0 , . . . , Xr−1 ) dove φh (X0 , . . . , Xr−1 ) è un polinomio omogeneo di grado h nelle r − 1 indeterminate X0 , . . . , Xr−1 , per h = 0, 1, . . . , n. Poiché i coefficienti di f (X0 , . . . , Xr ) non sono tutti nulli, esiste una φh (X0 , . . . , Xr−1 ) con coefficienti non tutti nulli, per qualche h = 0, 1, . . . , n. Per ipotesi induttiva esiste un non-zero (y0 , . . . , yr−1) di φh (X0 , . . . , Xr−1 ). Pertanto il polinomio f (y0 , . . . , yr−1 , Xr ) = Xrn φ0 + · · · + Xrn−h φh (y0 , . . . , yr−1 ) + · · · + Xr φn−1 (y0 , . . . , yr−1 ) + φn (y0 , . . . , yr−1 ) è un polinomio di grado positivo nella sola indeterminata Xr . Per la base induttiva questo polinomio ammette uno zero zr ed un non-zero yr . Pertanto (y0 , . . . , yr−1 , zr ) è uno zero mentre (y0 , . . . , yr−1 , yr ) è un non-zero di f (X0 , . . . , Xr−1 , Xr ). Una varietà algebrica di Pr si definisce come intersezione di ipersuperfici algebriche. In altri termini, per dare una varietà algebrica dobbiamo assegnare un insieme F di polinomi omogenei (non necessariamente di un medesimo grado) nelle coordinate correnti dello spazio, e si definisce poi, come varietà definita da F , la coppia \ V(F ) = (K ? F, V (F )), dove V (F ) = V (f ), f ∈F l’intersezione essendo estesa a tutti i polinomi f di F . Un insieme di punti di Pr che sia sostegno di una varietà algebrica V(F ) si chiama anche un insieme algebrico proiettivo di Pr . Come nel caso affine, anche la totalità degli insiemi algebrici proiettivi di Pr è chiusa rispetto all’intersezione ed all’unione, e ciò permette di definire l’intersezione e l’unione di varietà algebriche. Infatti, considerati due insiemi (finiti) F e G di polinomi di K[X], si ha: V (F ) ∩ V (G) = V (F ∪ G) e V (F ) ∪ V (G) = V (F G), dove F G = {f g : f ∈ F, g ∈ G}. Si noti che l’inclusione V (F ) ∪ V (G) ⊆ V (F G) è banale; viceversa, se P è un punto di V (F G), cioè che annulla tutti i prodotti f g, e se P non appartiene a V (F ), cioè se P non annulla tutte le f , posto ad esempio f 0 (P ) 6= 0, allora, poiché P annulla in particolare tutti i prodotti f 0 g, si ha che P annulla tutte le g, cioè P appartiene a V (G). Si noti ancora che ogni iperpiano di Pr è un’ipersuperficie di Pr e che, più generalmente, ogni sottospazio di Pr è (sostegno di) una varietà algebrica di Pr . E’ opportuno distinguere tra una varietà V(F ) e il suo sostegno V (F ), in quanto la considerazione di F permette di introdurre la nozione (algebrica) di molteplicità delle ”componenti” di V (F ). Un insieme algebrico proiettivo V (F ) di Pr si dice riducibile o irriducibile a seconda che esistano o no due insiemi algebrici proiettivi V (F1 ) e V (F2 ) contenuti propriamente in V (F ) tali che V (F ) = V (F1 )∪V (F2 ). Si può dimostrare che ogni insieme algebrico proiettivo V (F ) può scriversi in modo unico (a meno dell’ordine) come unione di un numero finito di insiemi algebrici proiettivi irriducibili, V (Fi ), detti le sue componenti irriducibili: V (F ) = V (F1 ) ∪ V (F2 ) ∪ · · · ∪ V (Ft ). 58 Come nel caso affine, anche attualmente, se V(F ) = (F K ? , V (F )) è una varietà algebrica di Pr e se V (Fi ) è una componente irriducibile del suo sostegno, la varietà V(Fi ) = (Fi K ? , V (Fi )) si chiama una componente irriducibile di V(F ). Si dimostra ancora che rimane definito un intero mi , detto la molteplicità di V (Fi ) in V(F ), e che il dato (V (Fi ), mi ) equivale ad una varietà algebrica V (Gj ), che verrà denotata anche con mi V (Fi ); e scriveremo allora: V(F ) = m1 V (F1 ) ∪ m2 V (F2 ) ∪ · · · ∪ mt V (Ft ). In conclusione, ogni varietà algebrica di Pr determina, in modo essenzialmente unico, le sue componenti irriducibili, con le relative molteplicità. Dimensione di una varietà algebrica. Ordine di una varietà algebrica pura. Vogliamo introdurre le nozioni di dimensione e di ordine di una varietà algebrica di uno spazio proiettivo Pr su un campo K algebricamente chiuso. Consideriamo anzitutto il caso di una ipersuperficie. Sia dunque V = (f K ? , V (f )) un’ipersuperficie algebrica di Pr , definita dal polinomio omogeneo f = f (X) ∈ K[X] = K[X0 , . . . , Xr ], di grado n ≥ 1. Si può dimostrare che V (f ) è non vuota (perché il campo K è algebricamente chiuso) e non invade tutto lo spazio (perché il campo K è infinito), cfr. Teorema 32. Dunque esistono punti S0 di Pr non appartenenti a V (f ), ossia ”sghembi con V (f )”; d’altra parte si può dimostrare che ogni retta S1 di Pr interseca V (f ) in qualche punto (perché K è algebricamente chiuso). Diremo allora che V (f ) ha dimensione r − 1. Questa definizione è anche in accordo al fatto che, mentre un punto P (x) dello spazio Pr dipende da r parametri essenziali, un punto di V (f ) dipende da r − 1 parametri essenziali perché f (x) = 0. Più precisamente si può dimostrare che la generica retta S1 di Pr (attualmente ogni retta che non sia contenuta in V (f ) ) interseca V (f ) in un numero finito di punti, numero che uguaglia il grado n di f (X), a patto di contare ogni punto con un’opportuna molteplicità d’intesezione. Si dice allora che V(f ) ha grado o ordine n. In altri termini il significato geometrico dell’ordine di un’ipersuperficie è che l’ordine uguaglia il numero dei punti che l’ipersuperficie ha in comune con la retta generica dello spazio. Per convincersi di quanto detto dianzi, si considerino due punti distinti P (y) e P (z) della retta S1 . I punti di S1 si ottengono tutti come i punti P (x) per i quali x = λy + µz, al variare di (λ, µ) ∈ K 2 \ {0, 0)}. I punti comuni ad S1 ed a V(f ) si ottengono tutti come i punti P (x) con x = λy + µz per i quali (λ, µ) è soluzione dell’equazione f (λy + µz) = 0; questa equazione - se non svanisce (cioè se la retta non è contenuta nell’ipersuperficie) - è omogenea di grado n in (λ, µ) e dunque dà luogo ad esattamente n soluzioni omogenee (λ, µ), a patto di contare ogni soluzione con la sua molteplicità algebrica, cfr. il Teorema 30. Si noti che questa argomentazione combina il Teorema 30 con quanto espresso dal successivo Teorema della sezione tra una ipersuperficie ed un sottospazio Sd di Pr (cfr. Teorema 39), nel quale si assuma d = 1. Più generalmente, sia V(F ) una varietà algebrica di Pr , con K algebricamente chiuso. Diremo che V(F ) ha dimensione d, se esistono sottospazi Sr−d−1 sghembi con V (F ), mentre ogni sottospazio Sr−d ha intersezione non vuota con V (F ). Qui d = 0, 1 . . . , r − 1. Per estensione, il sottospazio vuoto S−1 e tutto lo spazio ambiente Sr vengono considerati varietà algebriche di dimensione −1 ed r rispettivamente. Si noti che il concetto di dimensione di V(F ) fa intervenire soltanto il suo sostegno V (F ). La dimensione di una varietà algebrica riducibile uguaglia evidentemente la dimensione massima delle sue componenti. Una varietà algebrica si dice pura se tutte le sue componenti hanno una medesima dimensione. Sia V(F ) una varietà algebrica pura di dimensione d. Si dimostra che il generico sottospazio Sr−d interseca V (F ) in un numero finito di punti, che è sempre lo stesso (cioè non dipende dal particolare Sr−d considerato, purché generico), a patto di contare ogni punto di V(F ) ∩ Sr−d con la dovuta molteplicità d’intersezione (in un senso che si può precisare algebricamente). Tale numero (che dipende non soltanto da V (F ) ma anche da V(F ) perché dipende da F (X)) si chiama l’ordine della varietà algebrica pura V(F ). Si dimostra che l’ordine di una varietà pura uguaglia la somma degli ordini delle sue componenti. 59 n Una varietà algebrica (pura) di dimensione d e di ordine n si denota con Vdn . Si dimostra che le Vr−1 di r n P sono tutte e sole le ipersuperfici di ordine n di P e che le V0 sono tutti e soli i gruppi di n punti. Tra questi due estremi (d = 0, d = r − 1) si hanno le Vdn con d = 1 (che si chiamano curve algebriche d’ordine n), e quelle con d = 2 (che si chiamano superfici algebriche d’ordine n); si hanno poi tutte le possibili Vdn , con 2 < d < r − 1. Inoltre si dimostra che le Vd1 sono tutti e soli i sottospazi Sd . r Teorema 33 (Teorema di Bézout negli iperspazi). Sia Pr lo spazio proiettivo r-dimensionale su un campo K algebricamente chiuso. Allora: r ipersuperfici algebriche di Pr di ordini n1 , n2 , . . . , nr , che non abbiano infiniti punti in comune, hanno esattamente n1 n2 · · · nr punti in comune, a patto di contare ogni punto d’intersezione con la ”dovuta” molteplicità d’intersezione. Il numero dei punti distinti è effettivamente n1 n2 · · · nr se le ipersuperfici sono generiche. Corollario 34 L’intersezione di k ipersuperfici algebriche generiche di Pr di gradi n1 , n2 , . . . ,nk è una varietà algebrica pura di dimensione r − k e di ordine n1 n2 · · · nk . Dimostrazione. Si applichi il Teorema di Bézout alle r ipersuperfici date dalle k considerate nel corollario e da r − k iperpiani generici dello spazio. Deduzione del teorema di Bézout dal principio di conservazione del numero di intersezioni. Nel caso in cui K = C, il suddetto Teorema 33 (di Bézout) segue dal principio di conservazione del numero di intersezioni per variazioni continue generiche. Le r ipersuperfici f1 , f2 , . . . , fr si fanno degenerare, per variazione continua generica, in r ipersuperfici g1 , g2 , . . . , gr spezzate in n1 , in n2 , . . . , in nr iperpiani rispettivamente. Allora g1 ∩ · · · ∩ gr consiste di n1 n2 · · · nr punti, perché, per ogni scelta di un iperpiano in ciascuna ipersuperfice gi (i = 1, 2, . . . , r), si ottengono r iperpiani indipendenti (perché generici) e che dunque hanno come intersezione un punto. I punti di f1 ∩ · · · ∩ fr sono altrettanti. Ciò dà anche un significato dinamico alla molteplicità d’intersezione delle ipersuperfici f1 , f2 , . . . , fr in un loro punto comune. 6.4 Sistemi lineri e sistemi algebrici di ipersuperfici di Pr (K). Lemma 35 Il numero delle combinazioni con ripetizione di n oggetti di classe k è n+k−1 k . Dimostrazione. Sia X = {1, . . . n} l’insieme degli n oggetti. Sia Y = {1, . . . , n + k − 1}. Per dimostrare il lemma basta evidentemente stabilire una bijezione f tra l’insieme delle combinazioni con ripetizione di classe k di elementi di X e l’insieme Yk dei k-sottoinsiemi di Y . Sia A una combinazione con ripetizione di classe k di elementi di X. Ordiniamo gli elementi di A in ordine non decrescente: A = (a1 , . . . , ak ) con 1 ≤ a1 ≤ a2 ≤ · · · ≤ ak ≤ n. Associamo ad A il k-sottoinsieme Y f (A) = {a1 , a2 + 1, . . . , ak + k − 1} ∈ ; k si noti che 1 ≤ a1 < a2 + 1 · · · < ak + k − 1 ≤ n + k − 1. Ogni B ∈ Yk è del tipo B = f (A) per esattamente una combinazione con ripetizione A di classe k degli n oggetti di X: infatti, possiamo ordinare gli elementi di B in ordine (strettamente) crescente: B = {b1 , . . . , bk } con 1 < b1 < · · · < bk ≤ n + k − 1, e risalire poi alla combinazione A = (a1 , . . . , ak ) assumendo a1 := b1 , a2 := b2 − 1, . . . , ak := bk − k + 1 come è d’obbligo. 60 Corollario 36 Il numero dei monomi distinti Xi1 Xi2 · · · Xin di grado n in r+1 indeterminate X0 , X1 , . . . , Xr è: N +1= r+n . n Sia ora K un campo algebricamente chiuso. Ogni polinomio f (a; X) ∈ K[X] = K[X0 , X1 , . . . , Xr ], omogeneo di grado n, si scrive nella forma X f (a; X) = ai1 i2 ...in Xi1 Xi2 · · · Xin , (i1 ,i2 ,...,in ) dove la somma è estesa a tutte le combinazioni con ripetizione (i1 , i2 , . . . , in ) di classe n degli r + 1 elementi di {0, 1, . . . , n}. Pertanto f (a; X), qualora se ne scrivano i monomi in un ordine fissato una volta per tutte, determina ed è determinato dalla stringa ordinata a = (ai1 i2 ...in ) dei suoi N + 1 coefficienti. Poiché l’ipersuperficie V(f ) = (K ? f, V (f )) di Pr = Pr (K), d’equazione f (a; X) = 0, determina ed è determinata dai polinomi λf (a; X) = f (λa; X) proporzionali ad f secondo scalari λ non nulli, si ha che l’ipersuperficie V(f ) determina ed è determinata dal punto P (a) = P (λa) dello spazio proiettivo numerico N -dimensionale su K, che denoteremo ora con SN riservando la notazione Pr allo spazio contenente V(f ). Conviene inoltre denotare con Pd (risp. con Sd ) un sottospazio d-dimensionale di Pr (risp. di SN ). Questo spazio SN si chiama lo spazio rappresentativo del sistema delle ipersuperfici d’ordine n di Pr . L’applicazione biunivoca Λ dall’insieme delle ipersuperfici d’ordine n di Pr sull’insieme dei punti di SN definita da Λ : V(f ) = V(f (a; X)) 7→ P (a) ∈ SN si chiama la rappresentazione lineare delle ipersuperfici d’ordine n di Pr coi punti di SN . Per abuso di linguaggio, diremo anche che SN è lo spazio delle ipersuperfici d’ordine n di Pr . Un insieme T di ipersuperfici d’ordine n di Pr si chiama un sistema lineare (risp. un sistema algebrico) di ipersuperfici se la sua immagine Λ(T ) tramite la rappresentazione lineare Λ è un sottospazio (risp. una varietà algebrica) dello spazio rappresentativo SN . Tutte le nozioni relative ad Λ(T ) in SN si trasportano o si rileggono in Pr relativamente a T . Ad esempio, due o più ipersuperfici d’ordine n di Pr si dicono (linearmente) dipendenti o indipendenti se tali sono i punti che le rappresentano in SN . Ed ancora: se Λ(T ) è un sottospazio Sd di SN , si dice che d è la dimensione del sistema lineare T ; inoltre, se d = 0 (cioè se Λ(T ) è un punto), T è una singola ipersuperficie d’ordine n di Pr , se d = 1 (cioè se Λ(T ) è una retta) si dice che T è un fascio, mentre se d = 2 (cioè se Λ(T ) è un piano) si dice che T è una rete. I sistemi lineari di dimensione > 2 non ricevono nomi particolari, ma fra essi hanno particolare importanza quelli di dimensione N − 1, cioè quei sistemi lineari T tali che Λ(T ) è un iperpiano di SN . Tutte le ipersuperfici d’ordine n di Pr costituiscono il sistema lineare completo delle ipersuperfici d’ordine n di Pr . Evidentemente un insieme T di ipersuperfici d’ordine n di Pr è un sistema lineare se e soltanto se T contiene il fascio generato da due sue qualunque ipersuperfici distinte. Inoltre, se Λ(T ) è una varietà algebrica Vdn di SN , si dice che d ed n sono la dimensione e l’ordine del sistema algebrico T . Un sistema lineare d-dimensionale T di ipersuperfici d’ordine n di Pr è individuato quando se ne conoscano d+1 ipersuperfici indipendenti. Se queste hanno equazione rispettivamente f (0) = 0, . . . , f (d) = 0, scriveremo T =< f (0) , . . . , f (d) >. Se a(j) è la stringa dei coefficienti di f (j) , cioè se f (j) = f (a(j) ; X), j = 0, . . . , d, le equazioni delle ipersuperfici date si scrivono esplicitamente come f (a(0) ; X) = 0, f (a(1) ; X) = 0, ..., f (a(d) ; X) = 0, e le ipersuperfici del sistema T da esse generato sono quelle aventi equazione del tipo λ0 f (a(0) ; X) + λ1 f (a(1) ; X) + · · · + λd f (a(d) ; X) = 0, cioè del tipo f (a; X) = 0 con a = λ0 a(0) + λ1 a(1) + · · · + λd a(d) , 61 al variare di (λ0 , λ1 , . . . , λd ) ∈ K d+1 \ {(0, . . . , 0)}. La varietà base di un sistema lineare T =< f (0) , . . . , f (d) > di ipersuperfici d’ordine n di Pr è la varietà algebrica V di Pr intersezione di tutte le ipersuperfici di T . Per ottenere V basta evidentemente considerare l’intersezione delle ipersuperfici f (0) , . . . , f (d) che generano T , ossia, posto F = {f (0) , . . . , f (d) }, si ha: V = (F K ? , V (F )), dove V (F ) ha equazioni : f (0) = 0, . . . , f (d) = 0. Un punto base di T è per definizione un punto di Pr appartenente alla varietà base di T , ossia un punto comune a tutte le ipersuperfici del sistema T . Consideriamo i seguenti esempi di sistemi lineari di ipersuperfici di ordine n di Pr . Per n = 1, si ha che ogni ipersuperficie V(f ) è un iperpiano di Pr e la totalità delle V(f ) è il sistema lineare totale degli iperpiani di Pr . Infatti, attualmente a è la stringa u delle coordinate plückeriane dell’iperpiano d’equazione f (u; X) = u0 X0 + · · · + ur Xr = 0; si ha N = r e lo spazio rappresentativo SN è lo spazio duale di Pr . In questo caso, i sistemi lineari sono i sistemi lineari di iperpiani; ricordiamo che (Teorema della stella di iperpiani ) ogni stella d’iperpiani Σ(Sd ) di centro un sottospazio di dimensione d di Pr è un sistema lineare d’iperpiani di Pr di dimensione r − d − 1, Σr − d − 1, e viceversa41 . La varietà base di un sistema lineare d’iperpiani Σd = Σ(Sr−d−1 ) di Pr è il centro Sr−d−1 della stella. Diamo ora un esempio di sistema algebrico di iperpiani di Pr . La totalità T degli iperpiani t u · X = 0 tangenti ad una quadrica non singolare di Pr avente equazione t XAX = 0 è un sistema algebrico di dimensione r − 1 e di ordine 2 costituito da ipersuperfici aventi grado n = 1: tale sistema algebrico si rappresenta nello 2 spazio Σr duale di Pr con la quadrica Vr−1 avente equazione t u ·t A−1 · u = 0. Per r = 1, lo spazio Pr = P1 è la retta proiettiva; ogni ipersuperficie V(f ) d’ordine n di P1 è un gruppo di n punti della retta ed è N = n. In questo caso un sistema lineare di dimensione d si chiama tradizionalmente una serie lineare gdn di gruppi di n punti (nella scrittura gdn , oltre alla dimensione d si mette in evidenza il grado n, ma si ricordi che il sistema è lineare ossia, come sistema algebrico, ha ordine 1). In particolare gnn è la serie lineare completa dei gruppi di n punti della retta. Per r = 2, lo spazio Pr =P2 è il piano proiettivo; ogni ipersuperficie V(f ) d’ordine n di P2 è una curva piana d’ordine n ed è N = n(n + 3)/2. Cosı̀ la totalità delle coniche è un sistema lineare di dimensione 5, la totalità delle cubiche piane un sistema lineare di dimensione 9, ecc. Per r = 3, lo spazio Pr è lo spazio proiettivo 3-dimensionale; ogni ipersuperficie V(f ) d’ordine n di P3 è una superficie d’ordine n e si trova N = n(n2 + 6n + 11)/6. Per n = 2 ed r = 1, 2, 3, . . . si ha il sistema lineare completo delle quadriche di Pr che ha dimensione N = r(r + 3)/2. In particolare, per r = 1 si ritrova la serie completa g22 ; per r = 2 si ritrova il sistema completo S5 delle coniche; per r = 3 si trova il sistema completo S9 delle quadriche di P3 ; ecc. Nota bene. Nel seguito, indicheremo con Pr lo spazio proiettivo di partennza (nel quale cioè si considerano le ipersuperfici di fissato ordine n) e con Pk un qualunque sottospazio k-dimensionale di Pr , 41 Per la dimostrazione si noti che il sottospazio S =< A0 , A1 , . . . , Ad > (dove Aj = P (δ , δ , . . . , δ ), j ∈ {0, 1, . . . , d} sono 0j 1j rj d i d + 1 punti fondamentali di Pr indicati) ha equazioni Xd+1 = Xd+2 = · · · = Xr = 0 e che la totalità Σ(Sd ) degli iperpiani che contengono Sd coincide con quella degli iperpiani del sistema lineare di equazione ud+1 Xd+1 + ud+2 Xd+2 + · · · + ur Xr = 0, che è un sistema lineare Σr−d−1 perché generato da r − d iperpiani indipendenti (che sono gli iperpiani fondamentali di equazione Xd+1 = 0, Xd+2 = 0, . . . , Xr = 0 rispettivamente). Ebbene, previo un cambiamento di riferimento nello spazio Pr o nel suo duale Σr , non è restrittivo supporre che il sottospazio Sd sia quello generato dai punti fondamentali indicati, o, per la parte inversa, che il sistema lineare Σr−d−1 sia quello generato dagli iperpiani fondamentali indicati. Si noti anche che si sta applicando la proprietà che un iperpiano di equazione u0 X0 + u1 X1 + · · · + ur Xr = 0 contiene un punto fondamentale As di Pr sse us = 0. 62 k = −1, 0, 1, . . . , r. Per abuso di linguaggio, indicheremo poi con lo stesso simbolo SN tanto lo spazio rappresentativo delle ipersuperfici d’ordine n di Pr quanto la totalità di quelle ipersuperfici. Conseguentemente indicheremo con lo stesso simbolo Sd tanto un sottospazio d-dimensionale di SN quanto il sistema lineare di ipersuperfici che l’Sd rappresenta. Lemma 37 Sia Sd un sistema lineare di dimensione d di ipersuperfici d’ordine n di Pr . Se P ∈ Pr non è un punto base di Sd , le ipersuperfici di Sd che passano per P costituiscono un sistema lineare Sd−1 , di dimensione d − 1. Dimostrazione. Sia P = P (z), z = (z0 , z1 , . . . , zr ). Le ipersuperfici d’ordine n di Pr che passano per P (z) sono quelle la cui stringa a dei coefficienti (che sono le c.p.o. di punto in SN ), soddisfano alla f (a; z) = 0. Questa è una condizione lineare per le ai1 i2 ...in , ossia rappresenta un iperpiano SN −1 che denoteremo con Lz e che in SN ha equazione: Lz : f (a; z) = X ai1 i2 ...in zi1 zi2 · · · zin = 0. (i1 ,i2 ,...,in ) Attualmente Sd non è contenuto nell’iperpiano Lz , perché P (z) non è un punto base di Sd . Pertanto Sd ∩ Lz = Sd ∩ SN −1 è un sottospazio (d − 1)-dimensionale di SN , Nota bene. Riprenderemo in seguito le considerazioni sviluppate nella dimostrazione del Lemma 37, perché esse sono alla base della importante nozione di immagine proiettiva di un sistema lineare di ipersuperfici. Con riferimento all’enunciato del Lemma 37, diremo che il punto P stacca il sistema Sd−1 dal sistema Sd , o che il sistema Sd−1 è quello staccato da P in Sd . Corollario 38 (Significato geometrico della dimensione di un sistema lineare). Sia Sd un sistema lineare di dimensione d di ipersuperfici d’ ordine n di Pr . Il significato di d è che per d punti generici di Pr passa esattamente un’ipersuperficie del sistema Sd . In particolare: per N punti generici di Pr passa esattamente un’ipersuperficie d’ordine n di Pr . Dimostrazione. Consideriamo d punti P1 , . . . , Pd scelti in modo generico in Pr , e precisamente in modo tale che nessuno appartenga alla varietà base del sistema lineare delle ipersuperfici di Sd passanti per i punti precedentemente scelti: P1 sia scelto fuori della varietà base del sistema lineare Sd assegnato; P2 sia scelto fuori della varietà base del sistema lineare Sd−1 staccato da P1 in Sd ; P3 sia scelto fuori della varietà base del sistema lineare Sd−2 staccato da P2 in Sd−1 ; . . . ; Pd sia scelto fuori della varietà base del sistema lineare S1 staccato da Pd−1 in S2 . L’imposizione del passaggio per Pd conduce ad un sistema lineare S0 cioè ad una unica ipersuperficie, che è dunque l’unica ipersuperficie del sistema Sd che passi per i punti P1 , . . . , Pd . In particolare, applicando questo risultato al sistema lineare completo SN di tutte le ipersuperfici d’ordine n di Pr (ossia per d = N ), si ottiene l’ultima affermazione. Esercizi. (1) Verificare il contenuto del Corollario nel caso particolare che sia n = 1, cioè illustrando il significato della dimensione di un sistema lineare d’iperpiani di Pr . (2) Per cinque punti generici di P2 passa una e una sola conica. Qui ”generici” significa che quattro qualunque fra questi punti non sono allineati. (3) Per cinque punti generici di P2 passa una e una sola conica non singolare. Qui ”generici” significa 63 che tre qualunque fra questi punti non sono allineati. (4) Per nove punti generici di P2 passa una e una sola cubica. (5) Quattro punti generici di P2 sono punti base di un fascio generico di coniche. Viceversa, un fascio generico di coniche ha come varietà base un gruppo di quattro punti generici del piano. (6) Otto punti generici di P2 sono punti base di un fascio generico di cubiche. (7) (Paradosso di Cramer) Un fascio generico di cubiche di P2 ha come varietà base un gruppo di nove punti generici del piano. Pertanto, per quei nove punti passano tutte le cubiche del fascio, ma ciò contraddice (4). (Soluzione: Non è vero che un fascio generico di cubiche di P2 ha come varietà base un gruppo di nove punti generici del piano: soltanto un qualunque gruppo di otto fra quei punti consiste di punti generici, perché il nono punto è determinato da quegli otto come ulteriore punto base del fascio di cubiche passanti per essi). Teorema 39 (Teorema della sezione per le ipersuperfici) L’intersezione di un’ipersuperficie di Pr con un sottospazio Pk non contenuto nell’ipersuperficie è un’ipersuperficie, dello stesso ordine, del sottospazio Pk . Dimostrazione. Poiché le nozioni che intervengono nell’enunciato del teorema sono invarianti per cambiamenti di c.p.o. in Pr , non è restrittivo supporre di aver scelto in Pr un riferimento proiettivo in modo tale che il sottospazio Pk sia un sottospazio coordinato, diciamo quello di equazioni: Pk : Xk+1 = 0, Xk+2 = 0, ..., Xr = 0; supponiamo poi che l’ipersuperficie abbia equazione (di grado diciamo n): V(f ) : f (X0 , X1 , . . . , Xk , Xk+1 , . . . , Xr ) = 0. L’intersezione Pk ∩ V(f ) si rappresenta in Pr con il sistema: Pk ∩ V(f ) : Xk+1 = 0, Xk+2 = 0, . . . , Xr = 0; f (X0 , X1 , . . . , Xk , 0, . . . , 0) = 0, e si rappresenta in Pk (in coordinate interne) con la sola equazione Pk ∩ V(f ) : f (X0 , X1 , . . . , Xk , 0, . . . , 0) = 0. Il primo membro di questa è un polinomio - non nullo, perché Pk non è contenuto in V(f ) - omogeneo dello stesso grado n nelle coordinate di Pk , e dunque rappresenta un’ipersuperficie d’ordine n di Pk . Teorema 40 (Teorema della sezione per i sistemi lineari. L’intersezione di un sistema lineare Sd di ipersuperfici d’ordine n di Pr con un sottospazio Pk è un sistema lineare d’ipersuperfici d’ordine n di Pk . Tale sistema lineare ha dimensione d − t, dove t è il massimo numero delle ipersuperfici indipendenti di Sd che contengono Pk . Dimostrazione. Poiché le nozioni che intervengono nell’enunciato del teorema sono invarianti per cambiamenti di c.p.o. in Pr , non è restrittivo supporre di aver scelto in Pr un riferimento proiettivo in modo tale che il sottospazio Pk sia un sottospazio coordinato, diciamo quello di equazioni: 64 Pk : Xk+1 = 0, Xk+2 = 0, ..., Xr = 0. Il sistema Sd sarà generato da d + 1 ipersuperfici (indipendenti) di equazione f (j) (X) = 0, j = 0, . . . , d, dove possiamo supporre che le ultime t fra queste (quelle con j = d−t+1, . . . , d), ma nessuna delle rimanenti, contengano Pk . L’equazione di una qualunque ipersuperfice del sistema Sd è del tipo V(f ) ∈ Sd : λ0 f (0) (X) + λ1 f (1) (X) + · · · + λd f (d) (X) = 0, dove (λ0 , λ1 , . . . , λd ) ∈ K d+1 \ {(0, . . . , 0)}. Al variare delle λ si ottegono tutte e sole le ipersuperfici del sistema Sd . L’intersezione Pk ∩ V(f ) di Pk con ciascuna V(f ) ∈ Sd si rappresenta in Pr con il sistema: Pk ∩ V(f ) : d X λj f (j) (X0 , . . . , Xk , 0, . . . , 0) = 0, Xk+1 = 0, Xk+2 = 0, . . . , Xr = 0, j=0 e si rappresenta in Pk (in coordinate interne) con la sola equazione k P ∩ V(f ) : d X λj f (j) (X0 , . . . , Xk , 0, . . . , 0) = 0. j=0 Per ciascuna scelta delle λ non tutte nulle, il primo membro è un polinomio - non nullo, perché altrimenti si troverebbe in Sd una V(f ), indipendente dalle V(f (d−t+1) ), . . . , V(f (d) ) e contenente Pk - omogeneo di grado n nelle coordinate di Pk e che dunque rappresenta un’ipersuperficie d’ordine n di Pk . Al variare delle λ si ha dunque un sistema lineare di ipersuperfici d’ordine n di Pk , il quale ha dimensione d−t, perché - per quanto detto poc’anzi - i polinomi f (0) (X0 , . . . , Xk , 0, . . . , 0), f (1) (X0 , . . . , Xk , 0, . . . , 0), . . . , f (d−t) (X0 , . . . , Xk , 0, . . . , 0) sono linearmente indipendenti. Esercizio. Rivisitare la dimostrazione del teorema precedente alla luce del teorema fondamentale di omomorfismo tra spazi vettoriali. Suggerimento: si consideri l’omomorfismo K[X0 , X1 , . . . , Xr ] → K[X0 , X1 , . . . , Xk , 0, . . . , 0] : f (X0 , X1 , . . . , Xr ) 7→ f (X0 , X1 , . . . , Xk , 0, . . . , 0). 7 Naturalezza degli spazi di dimensione superiore Abbiamo ora gli elementi per illustrare come sia del tutto naturale considerare spazi di dimensione superiore. Vedremo infatti (n. 7.1) che quando si studia la totalità delle rette di un P3 (K), di fatto si sta studiando una ipersuperficie quadrica V42 di uno spazio P5 (K) (la quadrica di Klein). Inoltre, sappiamo già che le coniche di P2 (K) costituiscono uno spazio P5 (K); dunque studiando la totalità delle coniche ci si muove volenti o nolenti - in P5 (K). Vedremo poi (n. 7.2) che lo studio delle coniche singolari equivale allo studio di una ipersuperficie algebrica V43 di P5 (K), e che la totalità delle coniche doppiamente singolari corrisponde ad una superficie V24 (la superficie di Veronese) contenuta nella V43 . Vedremo anche come la superficie 2 di Veronese V24 (legata alle coniche) sia un caso particolare della superficie di Veronese V2n (legata alle r curve piane di ordine n qualunque) e, ancor più generalmente, della varietà di Veronese Vrn (legata alle ipersuperfici d’ordine n di un Pr (K)). 65 7.1 La geometria della retta di P3 (K) e la quadrica di Klein V42 Consideriamo lo spazio P3 = P3 (K). Sappiamo che ogni punto di P3 ha le sue c.p.o. di punto, (x0 , x1 , x2 , x3 ), e che ogni piano di P3 ha le sue coordinate plükeriane d’iperpiano, (u0 , u1 , u2 , u3 ). Vogliamo ora attribuire coordinate proiettive anche a ciascura retta di P3 . Denotiamo con G(1, 3) l’insieme delle rette di P3 . Consideriamo una retta qualunque S1 ∈ G(1, 3), individuata da due suoi punti distinti qualunque P (x) e P (y). La matrice delle c.p.o. dei due punti: x0 y0 x1 y1 x2 y2 x3 y3 ha rango 2 perché i due punti sono distinti. Pertanto, in tale matrice, sono non tutti nulli i seguenti minori del second’ordine: p01 = x0 y1 − y0 x1 , p02 = x0 y2 − y0 x2 , p03 = x0 y3 − y0 x3 , p23 = x2 y3 − y2 x3 , p31 = x3 y1 − y3 x1 , p12 = x1 y2 − y1 x2 . La suddetta sestupla p=p(x,y)=(p01 , p02 , p03 , p23 , p31 , p12 ) ∈ K 6 \ 0 determina un punto P (p) dello spazio P5 (K). Verificheremo ora che questo punto P (p) dipende soltanto dalla retta S1 e non dipende né dalla scelta dei punti P (x) e P (y) su S1 né dai loro rispettivi rappresentanti x e y; ne seguirà che le (p01 , p02 , p03 , p23 , p31 , p12 ) si possono assumere come coordinate proiettive della retta S1 , che vengono chiamate le coordinate plückeriane (o grassmanniane) della retta. Per la verifica anzidetta, basta osservare che se λ, µ ∈ K \ {0} e se P (z) è un qualunque altro punto di S1 con z = λx + µy, si ha: p(λx, µy) = λµp(x, y), p(z,y)=p(λx + µy, y) = λp(x, y) + µp(y, y) = λp(x, y) + 0 = λp(x, y), p(x,z)=p(x,λx+µy) =λp(x,x)+µp(x, y) = 0 + µp(x, y) = µp(x, y). Possiamo dunque dire che abbiamo definito un’applicazione dall’insieme G(1, r) delle rette di P3 (K) all’insieme dei punti di P5 (K): G(1, r) → P5 (K) : S1 (p) 7→ P (p), che chiameremo mappa di Klein: ad una qualunque retta S1 di P3 (K), avente coordinate plükeriane date da p = (p01 , p02 , p03 , p23 , p31 , p12 ), resta associato il punto P (p) di P5 (K); questo punto non è un punto qualunque di P5 (K), ma è obbligato ad appartenere alla quadrica V42 di P5 (K), chiamata la quadrica di Klein, di equazione: V42 : f (p) = p01 p23 + p02 p31 + p03 p12 = 0, come si ha subito sviluppando il determinante nullo della matrice x0 y0 x0 y0 x1 y1 x1 y1 x2 y2 x2 y2 66 x3 y3 x3 y3 secondo i minori del secondo ordine delle prime due righe42 La mappa di Klein è surgettiva sulla quadrica di Klein, cioè ogni punto P (p) ∈ V42 è immagine di una retta S1 = S1 (p) di P3 (K). Sia dunque p = (p01 , p02 , p03 , p23 , p31 , p12 ) ∈ K 6 \ {0} tale che f (p) = 0. Per fissare le idee, sia ad es. p01 6= 0. Consideriamo in P3 (K) i due punti distinti P (x’) e P (y’), con x’ = (0, p01 , p02 , p03 ) e y’ = (−p01 , 0, p12 , −p31 ). Verifichiamo che la retta S1 per i due punti P (x’) e P (y’) ha coordinate p(x’,y’) uguali o proporzionali alla sestupla (p01 , p02 , p03 , p23 , p31 , p12 ). Calcoliamo p(x’,y’) := (p001 , p002 , p003 , p023 , p031 , p012 ) tramite la matrice delle c.p.o. di x’ e di y’: 0 −p01 p01 0 p02 p12 p03 −p31 Si trova: p001 = p01 p01 , p002 = p01 p02 , p003 = p01 p03 , p031 = p01 p31 , p012 = p01 p12 , e finalmente p023 = −p02 p31 − p12 p03 = p01 p23 in forza della f (p) = 0. In conclusione p(x’,y’) = p01 (p01 , p02 , p03 , p23 , p31 , p12 ), come asserito. Mostriamo ora che la mappa di Klein è iniettiva. Siano S1 = XY ed S10 = X 0 Y 0 due rette di P3 (K) (individuate dai punti indicati: X = P (x), ecc. ) aventi le loro coordinate plükeriane di retta proporzionali, anzi uguali (come è sempre possibile supporre disponendo del fattore di proporzionalità insito nelle c.p.o. del punto X): p = p0 = (p01 , p02 , p03 , p23 , p31 , p12 ), dove sia ad es. p01 6= 0. Dobbiamo dimostrare che S1 = S10 . Nota bene. Per semplicità di scrittura, conviene effettuare il seguente abuso di notazione: denotiamo con lo stesso simbolo X sia il punto P (x) sia il vettore x ∈ K 4 che lo rappresenta, e similmente per gli altri punti Y, X 0 , Y 0 ecc. In particolare, se λ.µ ∈ K, la scrittura λX + µY indica il punto P (λx + µy). Mostriamo anzitutto che è possibile sostituire i punti X 0 ed Y 0 di S10 con altri due punti X ? = aX 0 + bY 0 e Y = cX 0 +dY 0 (dunque anche essi appartenenti ad S10 !) in modo che sia x?0 = x0 , x?1 = x1 e y0? = y0 , y1? = y1 . Basta infatti risolvere in (a, b) ed in (c, d) rispettivamente i sistemi di Cramer: ? x0 = ax00 + by00 , x1 = ax01 + by10 y0 = cx00 + dy00 , e y1 = cx01 + dy10 . Con questa scelta dei punti, la matrice corrispondente alla retta S1 = XY è: x0 x1 x2 x3 y0 y1 y2 y3 e la matrice corrispondente alla retta S10 = X ? Y ? è x0 x1 y0 y1 x?2 y2? x?3 y3? . Queste matrici hanno uguali le prime due colonne; ma anche le ultime due colonne sono uguali: infatti (x2 , y2 ) = (x?2 , y2? ) è l’unica soluzione del sistema di Cramer nelle incognite (X2 , Y2 ): p02 = x0 Y2 − y0 X2 , p12 = x1 Y2 − y1 X2 , e (x3 , y3 ) = (x?3 , y3? ) è l’unica soluzione del sistema di Cramer nelle incognite (X3 , Y3 ): p03 = x0 Y3 − y0 X3 , p31 = X3 y1 − Y3 x1 . 42 Si noti che tale sviluppo conduce alla 2f (p) = 0, da cui si deduce subito f (p) = 0 se il campo K ha caratteristica = 6 2. D’altra parte poiché la f (p) = 0 vale dunque in caratteristica zero, essa appare come una identità nelle indeterminate xi e yj , e pertanto vale anche in caratteristica 2. 67 Pertanto x = x? , y = y? e quindi X = X ? , Y = Y ? , e cosı̀ S1 = XY = X ? Y ? = S10 . In conclusione: la mappa di Klein è biunivoca tra l’insieme delle rette di P3 (K) e l’insieme dei punti della quadrica di Klein V42 . Dunque l’insieme delle rette di P3 (K) ”è” - in senso astratto - una quadrica dello spazio P5 (K) (la quadrica di Klein). Vediamo ora come la ”geometria della retta ” in P3 (K) si rifletta nella geometria della quadrica di Klein. Consideriamo, oltre alla forma quadratica che definisce la quadrica di Klein: f (p) = p01 p23 + p02 p31 + p03 p12 = 0, anche la forma bilineare associata f (p,q) = p01 q23 + p02 q31 + p03 q12 + q01 p23 + q02 p31 + q03 p12 . Lemma 41 (Condizione d’incidenza). Due rette di P3 (K), aventi rispettivamente coordinate plükeriane p e q, sono incidenti sse f (p,q) = 0. Dimostrazione. Siano XY e ZT due rette di P3 (K). Sia X = X(x), . . . , T = T (t), con p = p(x,y) = (p01 , p02 , p03 , p23 , p31 , p12 ) e q = q(z,t) = (q01 , q02 , q03 , q23 , q31 , q12 ). Le due rette sono incidenti sse i punti X, Y, Z, T appartengono ad un piano, cioè sse i vettori x, y, z, t sono dipendenti, cioè sse la matrice x0 y0 z0 t0 x1 y1 z1 t1 x2 y2 z2 t2 x3 y3 z3 t3 ha determinante nullo. Tale determinante è proprio f (p,q), come si vede calcolandolo secondo i minori del secondo ordine delle prime due righe. Teorema 42 La mappa di Klein trasforma le rette di ciascun fascio di P3 (K) nei punti di una retta giacente sulla quadrica di Klein. Viceversa, ogni retta giacente sulla quadrica di Klein è immagine di un fascio di rette di P3 (K). Dimostrazione. Sia S2 un piano di P3 (K) e sia F un fascio di rette di S2 con centro in un punto X(x). Siano S10 ed S100 due rette distinte del fascio F , e siano Y 0 (y0 ) ed Y ”(y00 ) due loro rispettivi punti distinti da X. Tutte e sole le rette di F sono le rette XY con Y (y) ∈ Y 0 Y ”. (Il Lettore faccia un disegno.) Posto che sia y = ay0 + by00 , le coordinate plükeriane pik di XY si esprimono tramite le p0ik di XY 0 e le p00ik di XY 00 con la stessa coppia (a, b) di parametri, ossia nel modo seguente: pik = ap0ik + bp00ik vale a dire p = ap0 + bp00 Infatti: xi xk pik = = yi yk xi ayi0 + xk byi00 ayk0 + byk00 = a 68 xi xk yi0 yk0 + b xi xk yi00 yk00 = ap0ik + bp”ik ossia: p = p(x, y) = p(x, ay0 + by00 ) = ap(x, y0 ) + bp(x, y00 ) = ap0 + bp00 e ciò dimostra la prima affermazione. Tornerà utile la seguente Osservazione. Al variare dei parametri (a, b) si trovano tutti i punti Y = aY 0 + bY 00 della retta Y 0 Y 00 di S2 e tutte le rette XY = S1 (p = ap0 + bp00 ) del fascio di centro X di S2 generato dalle rette XY 0 (p0 ) e XY 00 (p00 ), ovverosia tutti i punti della retta di P5 (K) passante per i punti P (p0 ) e P (p00 ). Mostriamo ora che, viceversa, ogni retta di P5 (K) giacente sulla quadrica di Klein è immagine di un fascio di rette di P5 (K). Si consideri dunque sulla quadrica di Klein V42 una qualunque retta T1 e due punti distinti P (p0 ) e P (p00 ) di T1 . Per la biunivocità della mappa di Klein, questi due punti sono immagini di due rette S10 (p0 ) e S100 (p00 ) di P3 (K) le quali sono incidenti (e dunque individuano un fascio F di rette), in virtù del Lemma 41, perché f (p0 , p00 ) = 0 in quanto: (∀a, b ∈ K \ {0}) P(ap0 + bp00 ) ∈ T1 ⊆ V42 =⇒ (∀a, b ∈ K \{0}) 0 = f (ap0 +bp00 ) = a2 f (p0 )+b2 f (p00 )+abf (p0 , p00 ) = 0+0+abf (p0 , p00 ) =⇒ f (p0 , p00 ) = 0. Per quanto osservato, i punti P (p) = P (ap0 + bp00 ) della retta T1 corrispondono biunivocamente alle rette S1 (p) =S1 (p = ap0 + bp00 ) del fascio F individuato dalle due rette incidenti S10 (p0 ) e S100 (p00 ) , e questo dimostra che il fascio F è la controimmagine completa della retta T1 . Dimostriamo ora che: Teorema 43 (1) La mappa di Klein trasforma ciascuna stella di rette di P3 (K) in un piano giacente sulla quadrica di Klein (piano di tipo σ). (2) La mappa di Klein trasforma ciascun piano rigato di P3 (K) in un piano giacente sulla quadrica di Klein (piano di tipo ρ). (3) Viceversa, ogni piano giacente sulla quadrica di Klein è immagine completa di una stella di rette oppure di un piano rigato di P3 (K), ossia è un piano di tipo σ oppure un piano di tipo ρ. Dimostrazione. (1) Sia Σ una stella di rette di P3 (K). Sia X(x) il centro di Σ, siano S10 , S100 , S1000 tre rette non complarari di Σ, sia S2 un piano non contenente X, e siano Y 0 (y0 ), Y 00 (y00 ), Y 000 ((y000 ) i punti (necessariamente non allineati) in cui quelle tre rette rispettivamente incontrano S2 . Tutte e sole le rette di Σ sono le rette XY con Y ∈ S2 . (Il Lettore faccia un disegno.) Posto che sia y = ay0 + by00 + cy000 , le coordinate plükeriane pik della retta XY variabile in Σ si esprimono 000 nel modo seguente: tramite le p0ik di XY 0 , le p00ik di XY 00 e le p000 ik di XY pik = ap0ik + bp00ik + cp000 ik , ossia p(x, y) = p(x, ay0 + by00 + cy000 ) = ap(x, y0 ) + bp(x, y00 ) + cp(x, y000 ) e ciò dimostra la (1). (2) Sia S2 un piano di P3 (K). Siano X 0 , X 00 , X 000 tre punti non allineati di S2 e siano p0ik , p00ik e p000 ik le coordinate plükeriane delle rette X 00 X 000 , X 0 X 000 , X 0 X 00 rispettivamente. Una qualunque retta S1 del piano S2 incontra il trilatero X 0 X 00 X 000 in almeno due punti distinti, siano questi Y 0 ed Y 00 , con ad es. Y 0 ∈ X 00 X 000 ed Y 00 ∈ X 0 X 000 . (Il Lettore faccia un disegno.) Posto che sia y0 = a0 x00 + b0 x000 ed y00 = a00 x0 + b00 x000 , le coordinate plükeriane pik di S1 = Y 0 Y 00 si esprimono tramite le p0i k, le p00ik e le p000 ik nel modo seguente: 69 pik = a0 a00 p0ik + b0 a00 p00ik + a0 b00 p000 ik avendosi: pik = yi0 yk0 yi00 yk00 = a0 x00i + b0 x000 i a0 x00k + b0 x000 k a00 x0i + b00 x000 i a00 x0k + b00 x000 k , ossia: p(y0 , y00 ) = p(a0 x00 + b0 x000 , a00 x0 + b00 x000 ) = a0 a00 p(x00 , x0 ) + a0 b00 p(x00 , x000 ) + b0 a00 p(x000 , x0 ) (essendo b0 b00 p(x000 , x000 ) = b0 b00 · 0 = 0). Ciò dimostra la (2). (3) Sia T2 un qualunque piano giacente sulla quadrica di Klein V42 . Due punti distinti qualunque di T2 sono congiunti da una retta T1 contenuta in T2 e quindi nella V42 . La retta T1 è immagine di un fascio di rette di P3 (K) (Teorema 42), e quindi quei due punti sono immagini di due rette incidenti di P3 (K). In conclusione l’immagine inversa di T2 è un insieme di rette a due a due incidenti di P3 (K), e pertanto è contenuta in una stella di rette o in un piano rigato di P3 (K)43 . Nel primo caso le rette della stella corrispondono biunivocamente (per (1) ) ai punti di un piano di tipo σ che evidentemente coincide con T2 ; nel secondo caso le rette del piano rigato corrispondono biunivocamente (per (2) ) ai punti di un piano di tipo ρ che evidentemente coincide con T2 . Dunque, in ogni caso, un qualunque piano T2 giacente sulla quadrica di Klein è un piano di tipo σ oppure un piano di tipo ρ. A norma del punto (3) del Teorema 43, i piani sulla quadrica di Klein si distribuiscono, come si dice, in due sistemi disgiunti: il sistema dei piani di tipo σ e quello dei piani di tipo ρ. Teorema 44 Consideriamo due piani distinti giacenti sulla quadrica di Klein. Se essi appartengono allo stesso sistema, s’intersecano esattamente in un punto. Se invece appartengono a sistemi diversi, s’intersecano secondo una retta o non hanno alcun punto in comune. Dimostrazione. Sappiamo che, sulla quadrica di Klein V42 , i piani di tipo σ rappresentano le stelle di rette di P3 (K), ed i piani di tipo ρ rappresentano i piani rigati di P3 (K). Due stelle distinte di rette di P3 (K) hanno in comune esattamente una retta; lo stesso dicasi per due piani rigati distinti di P3 (K); questa retta di P3 (K) si rappresenta con un punto di V42 . Invece, una stella di rette ed un piano rigato di P3 (K) non hanno alcuna retta in comune oppure hanno un fascio di rette in comune, a seconda che il centro della stella appartenga al piano; questo fascio di rette di P3 (K) si rappresenta con una retta di V42 . 7.2 La superficie di Veronese. Consideriamo la totalità delle coniche del piano P2 = P2 (K) coordinatizzato su un campo K algebricamente chiuso di caratteristica 6= 2. L’equazione di una conica verrà scritta come: 43 Se le rette non passano tutte per uno stesso punto, ne esistono tre che formano un trilatero; questo determina un piano che contiene anche tutte le altre rette dell’insieme, perché ciascuna di esse contiene almeno due punti distinti del trilatero e quindi del piano. 70 f (a;X) = a00 X02 + a11 X12 + a22 X22 + 2a01 X0 X1 + 2a02 X0 X2 + 2a12 X1 X2 = 0. La matrice della conica è la matrice simmetrica a00 a01 a02 A = (aik) = a10 a11 a12 a20 a21 a22 (con aij = aji ). Gli eventuali punti singolari (doppi) della conica sono i punti che annullano il sistema delle derivate parziali prime di f (a;X), cioè il sistema AX = 0. Una conica è non singolare, cioè è priva di punti doppi, sse la sua matrice ha rango rank(A) = 3, ossia sse det(A) 6= 0. Una conica è singolare sse det(A) = 0; una conica singolare è necessariamente spezzata in due rette; queste sono distinte sse rank(A) = 2 (e la conica dicesi semplicemente degenere), mentre sono coincidenti sse rank(A) = 1 (e la conica dicesi doppiamente degenere). Consideriamo ora lo spazio S5 = S5 (K), rappresentativo del sistema lineare completo delle coniche di P2 (K). Rappresentiamo la conica d’equazione f (a;X) = 0 con il punto44 P (a) = P (a00 , a01 , a02 , a11 , a12 , a22 ) di S5 . Per quanto detto dianzi, abbiamo in S5 la varietà V43 rappresentativa delle coniche singolari, di equazione: V43 : F (a) = det(aik) = 0, che è evidentemente un’ipersuperficie irriducibile d’ordine 3. In S5 abbiamo inoltre la varietà V24 (contenuta nella V43 ) rappresentativa delle coniche doppiamente degeneri, che prende il nome di superficie di Veronese, le cui equazioni si ottengono annullando i minori d’ordine 2 della matrice A. Si vede facilmente che la condizione che siano nulli tutti i minori d’ordine 2 di A può essere equivalentemente espressa con la condizione che siano nulli tre opportuni di essi: utilizzeremo i seguenti minori per la definizione di V24 : V24 : a00 a11 − a210 = 0, a11 a22 − a221 = 0, a01 a22 − a21 a02 = 0, equazioni queste che costituiscono le equazioni cartesiane della V24 . Si tratta effettivamente di una varietà algebrica di dimensione 2, perché l’appartenenza alla varietà è caratterizzata da tre condizioni algebriche indipendenti per le coordinate di un punto di S5 , ed ogni condizione abbassa di un’unità la dimensione. Vedremo poi che la varietà ha ordine 4. Sia P = P (z), con z = (z0 , z1 , z2 ), un punto di P2 . Le coniche di P2 che passano per P (z) sono quelle la cui stringa a dei coefficienti (che è la stringa delle c.p.o. del corrispondente punto in S5 ), soddisfa alla f (a;z)) = 0. Questa è una condizione lineare per le aik , ossia rappresenta in S5 un iperpiano S4 che denoteremo con Lz : X Lz : f (a;z)) = aik zi zk = 0. Scriviamo l’equazione del più generale iperpiano S4 di S5 nella forma X aik αik = 0; denotiamo cioè con αik la coordinata plükeriana che - nell’equazione dell’iperpiano S4 - è coefficiente della coordinata aik di punto. Gli iperpiani di S5 formano una totalità lineare di dimensione 5: lo spazio duale 44 In questo caso si usa assumere, come coordinata corrispondente ad un monomio del tipo 2a X X , il numero a ij i j ij anziché il numero 2aij , il che equivale ad effettuare nello spazio rappresentativo S5 una sostituzione linere invertibile sulle coordinate di punto con matrice diagonale ad elementi 1 e 2. 71 Σ5 di S5 , nel quale le αik sono c.p.o. di punto. Gli iperpiani di tipo Lz , al variare del P (z) in P2 , formano una totalità T di dimensione 2, perché in corrispondenza biunivoca e algebrica coi punti di P2 . Tale totalità è un insieme di iperpiani di S5 , cioè di punti di Σ5 , e si chiama l’immagine proiettiva del sistema lineare delle coniche. Vogliamo provare che l’immagine proiettiva del sistema lineare delle coniche si identifica con la superficie di Veronese V24 . I coefficienti dell’equazione dell’iperpiano Lz (coordinate del punto Lz di Σ5 ) sono: αik = zi zk . Le equazioni parametriche di: T = {Lz ∈ Σ5 : P (z) ∈ P2 sono dunque: T : α00 = z02 , α01 = 2z0 z1 , α02 = 2z0 z2 , α11 = z12 , α12 = 2z1 z2 , α22 = z22 (z ∈ K 3 \ {0}). D’altra parte, la superficie di Veronese V24 è stata definita come l’insieme dei punti P (a) ∈ S5 rappresentativi di coniche doppiamente degeneri, ossia del tipo (u0 X0 + u1 X1 + u2 X2 )2 = 0; sviluppando il quadrato, si trova dunque che la totalità dei punti P (a) ∈ V24 ha equazioni parametriche: V24 : a00 = u20 , a01 = u0 u1 , a02 = u0 u2 , a11 = u21 , a12 = u1 u2 , a22 = u22 (u ∈ K 3 \ {0}) che - a parte il nome delle coordinate e dei parametri - si identificano proiettivamente alle equazioni parametriche di T : basta effettuare una trasformazione diagonale tra le αij e le aij con coefficienti 1 oppure 2 in quanto l’identificazione dei parametri zk coi parametri uk porta alla α00 = a00 , alla α01 = 2a01 , e cosı̀ via. Appurato cosı̀ che T ' V24 , verifichiamo che l’ordine della superficie di Veronese è proprio 4 come abbiamo indicato senza dimostrazione. A tal fine usiamo la definizione di V24 come immagine proiettiva: V24 = {Lz ∈ Σ5 : P (z) ∈ P2 }. L’ordine di questa varietà è, per definizione, il numero dei punti che essa ha in comune con un generico Σ3 (infatti: 3 = dimensione dello spazio − dimensione della varietà = 5 − 2). Attualmente (per il Teorema della stella d’iperpiani 45 ) Σ3 è una stella generica Σ(S1 ) di iperpiani di S5 di centro una retta generica S1 di S5 ; questa retta S1 dello spazio rappresentativo è un fascio generico F di coniche di P2 . Pertanto: ordine(V24 ) =| {Lz ∈ Σ5 : P (z) ∈ P2 , Lz ∈ Σ3 } |=| {Lz ∈ Σ5 : P (z) ∈ P2 , Lz ⊇ S1 } |= = | {Lz ∈ Σ5 : P (z) ∈ P2 , ogni conica di F passa per P (z)} |= =| {P (z) ∈ P2 : ogni conica di F passa per P (z)} |= | {P (z) ∈ P2 : P (z) è un punto base di F |= = 4 (per il teor. di Bézout, stante la genericità di F). Una terza definizione possibile della superficie di Veronese V24 (come luogo dei punti doppi della V43 ) viene fornita dal seguente teorema: Teorema 45 La superficie di Veronese V24 è il luogo dei punti multipli (doppi) della ipersuperficie V43 di S5 rappresentiva delle coniche singolari di P2 . 45 Il Teorema della stella di iperpiani afferma che: Ogni stella Σ(S ) di iperpiani di uno spazio Pr , di centro un S di Pr , è d d un sistema lineare Σr−d−1 di iperpiani; viceversa ogni sistema lineare Σr−d−1 di iperpiani di Pr è una stella di iperpiani di centro un Sd di Pr ; cfr. nota n. 41. 72 Dimostrazione. Ricordiamo che la V43 ha in S5 equazione: V43 : a00 F (a) = det(A) = det a10 a20 a02 a11 a12 = 0. a21 a22 a01 Il luogo dei punti multipli di V43 è il luogo degli zeri P (a) del sistema delle derivate parziali prime di F : ∂F = a11 a22 − a212 , ∂a00 ∂F = 2(a10 a22 − a20 a12 ), ∂a01 ..., ∂F = a00 a11 − a201 . ∂a22 e questo è il luogo dei punti P (a) che annullano tutti i minori del secondo ordine della matrice A, cioè è la superficie di Veronese, luogo V24 dei punti di S5 che rappresentano le coniche doppiamente singolari di P2 . Quanto precede termina la dimostrazione del teorema, notando da ultimo che tutti i punti multipli di V43 sono punti doppi, e non di molteplicità maggiore, perché il sistema delle derivate seconde di F (a) non ha autosoluzioni, perché tra quelle derivate seconde ritroviamo (a parte un fattore 2) tutte le coordinate correnti a00 , a01 , a02 , a11 , a12 , a22 . 7.2.1 Comportamento delle rette di S5 rispetto alla V43 ed alla V24 : coniche degeneri di un fascio. Ricordiamo che una retta dello spazio S5 , rappresentativo delle coniche di P2 (K), è un fascio di coniche, e che le varietà V43 e V24 (la superficie di Veronese) sono le totalità delle coniche degeneri e delle coniche doppiamente degeneri rispettivamente; si ha dunque V24 ⊆ V43 ⊆ S5 . Inoltre la V24 è il luogo dei punti doppi di V43 ed ogni punto di V43 \ V24 è un punto semplice. Poiché l’ipersuperficie V43 ha ordine tre, ogni retta di S5 interseca V43 in tre punti (a patto di contarli con la dovuta molteplicità d’intersezione), oppure giace per intero sulla V43 ; in altri termini, un fascio di coniche contiene tre coniche degeneri (a patto di contarle con la dovuta molteplicità) oppure tutte le sue coniche sono degeneri. Il Lettore effettui dei disegni che illustrino i seguenti esempi di fasci di coniche. 1. Fascio generico di coniche. Ha 4 punti base distinti A, B, C, D e contiene tre coniche semplicemente degeneri: AB ∪ CD, AC ∪ BD, AD ∪ BC. 2. Fascio di coniche tangenti in A = B. Ha 3 punti base distinti, A = B, C, D e contiene due coniche semplicemente degeneri: AB ∪ CD, AC ∪ BD = AD ∪ BC, dove AB indica la comune tangente in A = B e la seconda conica è contata due volte. (La retta di S5 che rappresenta il fascio è tangente alla V43 nel punto semplice che rappresenta la seconda conica). 3. Fascio di coniche bitangenti in A = B ed in C = D. Ha 2 punti base distinti, A = B, C = D e contiene una conica semplicemente degenere, la AB ∪ CD, e una conica doppiamente degenere, la AC 2 contata due volte (è un punto doppio di V43 ). 4. Fascio di coniche osculantisi in A = B = C. Ha 2 punti base distinti, A = B = C, D, e contiene una conica semplicemente degenere, la AB ∪ CD contata tre volte. (La retta che rappresenta il fascio è 73 ipertangente alla V43 nel punto semplice che rappresenta quella conica). 5. Fascio di coniche iperosculantisi in A = B = C = D. Ha un solo punto base, A = B = C = D, e contiene una conica doppiamente degenere, la AB 2 contata tre volte; la retta che rappresenta il fascio è tangente alla V43 nel punto doppio che rappresenta quella conica. 6. Fascio di tutte coniche degeneri che condividono una componente, costituito da una retta fissa r e da una retta s variabile in un fascio di rette di centro un punto P . Indicheremo tale fascio di coniche con λ(r, P ); poniamo inoltre Λ1 = {λ(r, P ) : P è un punto ed r è una retta di P2 }. Evidentemente il fascio λ(r, P ) contiene o non contiene una conica doppiamente degenere (che è necessariamente la r2 ) a seconda che sia P ∈ r oppure P ∈ / r; la retta che rappresenta il fascio è contenuta nella V43 4 ed è tangente alla V2 nel primo caso. Analiticamente: sia r(x) = 0 l’equazione della retta r e sia λs1 (x) + µs2 (x) = 0 l’equazione della retta variabile nel fascio di rette, generato da due rette s1 e s2 passanti per P . L’equazione della conica variabile nel fascio di coniche tutte degeneri è λ(r, P ) : r(x)[λs1 (x) + µs2 (x)] = 0, cioè λ[r(x)s1 (x)] + µ[r(x)s2 (x)] = 0. 7. Fascio di tutte coniche degeneri che condividono il punto doppio, costituito da coppie di rette appartenenti ad uno stesso fascio di centro un punto P . Il fascio è individuato da P e da due coniche degeneri, r1 ∪ s1 ed r2 ∪ s2 , con P = r1 ∩ s1 = r2 ∩ s2 e pertanto verrà indicato con λ(P, r1 s1 , r2 s2 ); poniamo inoltre Λ2 = {λ(P, r1 s1 , r2 s2 ) : P = r1 ∩ s1 = r2 ∩ s2 }. In questo caso il fascio contiene esattamente due coniche doppiamente degeneri. La retta che rappresenta il fascio è contenuta nella V43 ed bisecante la V24 . Esempio: Fascio di coniche generato dalla conica f1,0 di equazione X02 = 0 e dalla conica f0,1 di equazione X12 = 0. Le coniche del fascio sono le coniche fλ,µ ; λX02 − µX12 = 0 (λ, µ) 6= (0, 0) tutte degeneri perché fλ,µ ; √ √ √ √ λX02 − µX12 = ( λX0 + µX1 )( λX0 − µX1 ) = 0. Il fascio non contiene coniche doppiamente degeneri diverse f1,0 ed f0,1 perché se λ 6= 0 e µ 6= 0, √ √ dalle coniche √ √ allora la retta λX0 + µX1 = 0 è distinta dalla retta λX0 − µX1 = 0. Lemma 46 . Ogni retta S1 di S5 che abbia due punti in comune con la superficie di Veronese V24 giace per intero sulla V43 . Inoltre una retta S1 di S5 ha al più due punti in comune con V24 . Pertanto i punti di V24 sono a tre a tre non allineati. Ne segue che la V24 non contiene rette. Dimostrazione. Si tratta di provare che se un fascio di coniche di P2 contiene due coniche distinte doppiamente degeneri, allora ogni altra conica del fascio è degenere ma non è doppiamente degenere. In effetti, 74 non è restrittivo supporre che le due coniche doppiamente degeneri siano le coniche di equazione X02 = 0 e X12 = 0 rispettivamente, e sviluppare l’argomento svolto nell’Esempio di cui sopra. Dimostriamo ora che i soli casi di fasci di tutte coniche degeneri sono quelli detti in 6 e 7. Teorema 47 (Classificazione dei fasci di tutte coniche degeneri). Sia F un fascio di coniche, tutte degeneri, di P2 . Allora necessariamente si verifica uno dei due casi seguenti: (1) Le coniche di F condividono una componente, ossia F è un fascio di coniche con una componente fissa e l’altra variabile in un fascio di rette. (2) Le coniche di F condividono il punto doppio, ossia F è un fascio di coniche spezzate in due rette per un punto fissato. Dimostrazione. Per il Lemma 46, F ha al più due coniche doppiamente degeneri. Pertanto F è generabile da due coniche semplicemente degeneri: f1 = r1 ∪ s1 , f2 = r2 ∪ s2 , dove dunque r1 6= s1 e r2 6= s2 . Se f1 ed f2 condividono una componente, ad es. r1 = r2 = r, questa è anche componente di ogni altra conica f = λf1 + µf2 di F , e siamo nel caso (1). Se f1 ed f2 condividono il punto doppio, cioè se r1 ∩ s1 = r2 ∩ s2 = P , allora P è punto doppio per ogni f ∈ F (perché in P si annullano le derivate parziali prime di f , in quanto vi si annullano quelle di f1 e di f2 ) e dunque ogni f ∈ F si spezza in due rette per P , e siamo nel caso (2). Supponiamo che f1 ed f2 non condividano il punto doppio, cioè che sia P1 = r1 ∩ s1 6= r2 ∩ s1 = P2 . Evidentemente si hanno soltanto le seguenti tre possibilità: P2 ∈ r1 ∪ s1 , P1 ∈ r2 ∪ s2 , (P2 ∈ / r1 ∪ s1 ) ∧ (P1 ∈ / r2 ∪ s2 ). (Il Lettore effettui figure corrispondenti ai tre casi suddetti). Nei primi due casi si hanno tre punti base non allineati, il trilatero dei quali è formato da componenti di f1 e di f2 . Una terza conica f3 di F si spezza in due rette, una delle quali necessariamente è un lato del trilatero, ad es. s2 . Pertanto f3 ed f2 condividono una componente e dunque F =< f2 , f3 > è del tipo (1). Il terzo caso non può verificarsi. Infatti nel terzo caso i punti base formano un quadrangolo ed esistono soltanto tre coniche degeneri per tali quattro punti. 7.2.2 Comportamento dei piani di S5 rispetto alla V43 ed alla V24 : coniche degeneri di una rete. Ricordiamo ancora una volta che i piani dello spazio S5 rappresentativo delle coniche di P2 = P2 (K) sono le reti di coniche di P2 e che le varietà V43 e V24 (la superficie di Veronese) sono le totalità delle coniche degeneri e delle coniche doppiamente degeneri rispettivamente e che inoltre la V24 è il luogo dei punti doppi di V34 , cosicché ogni punto di V43 \ V24 è un punto semplice. Un piano di S5 contenuto in V43 rappresenta evidentemente una rete di coniche di P2 tutte degeneri. Il primo sistema Π1 di piani sulla V43 . (Reti di coniche con componente comune). Se tre coniche di P2 indipendenti (cioè non formanti fascio) f1 , f2 , f3 sono degeneri e condividono una componente comune r, fatto che esprimeremo usando una notazione compatta e semplificata del tipo: f1 = rs1 , f2 = rs2 , f3 = rs3 , allora ogni conica f = λ1 f1 + λ2 f2 + λ3 f3 = r(λ1 s1 + lλ2 s2 + λ3 s3 ) 75 della rete < f1 , f2 , f3 > è degenere e condivide quella componente, mentre la sua componente residua λ1 s1 + λ2 s2 + λ3 s3 descrive tutte le rette di P2 perché le rette s1 , s2 , s3 sono indipendenti (tali essendo le f1 , f2 , f3 ). Denotiamo con π(r) il piano di S5 , contenuto in V43 , che rappresenta la rete delle coniche degeneri che condividono la componente r: π(r) = {rs ∈ V43 : s retta di P2 }, e denotiamo con Π1 = {π(r) : r retta di P2 } la totalità dei piani cosı̀ ottenuti su V43 al variare della retta r in P2 . Il secondo sistema Π2 di piani sulla V43 . (Reti di coniche che condividono il punto doppio). Se tre coniche di P2 indipendenti f1 , f2 , f3 sono semplicemente degeneri e condividono il punto doppio P : f1 = r1 s1 , f2 = r2 s2 , f3 = r3 s3 , r1 ∩ s1 = r2 ∩ s2 = r3 ∩ s3 = P, allora ogni conica f = λ1 f1 + λ2 f2 + λ3 f3 = λ1 (r1 s1 ) + λ2 (r2 s2 ) + λ3 (r3 s3 ) della rete < f1 , f2 , f3 > ha P come punto doppio (perché in P si annullano tutte le derivate parziali di f1 , f2 , f3 e quindi quelle di f ) ed è dunque degenere in due rette contenenti P , cioè f = rs con P ∈ r, s (ove può anche essere r = s). Viceversa una qualunque coppia di rette r, s contenenti P è tale che f = rs sia combinazione lineare delle f1 , f2 , f3 . Infatti, da un punto di vista astratto, il fascio di rette di P2 di centro P è (nel piano duale di P2 ) una retta S1 ed ogni coppia di rette per P è una coppia di punti di S1 (quadrica di S1 ); pertanto la totalità delle coppie di rette per P è la totalità delle quadriche di S1 e quindi costituisce uno spazio proiettivo di dimensione N = N (r, n) = N (1, 2) = 2 (in effetti è la serie lineare completa g22 dei gruppi di 2 punti di S1 ), ossia è un ”piano proiettivo”, cosicché ogni suo punto f è generabile linearmente dai suoi tre punti indipendenti f1 , f2 , f3 . Denotiamo con π(P ) il piano di S5 , contenuto in V43 , che rappresenta la rete delle coniche degeneri di P2 che condividono il punto doppio P : π(P ) = {rs ∈ V43 : P ∈ r, s}, e denotiamo con Π2 = {π(P ) : P punto di P2 } la totalità dei piani cosı̀ ottenuti su V43 al variare del punto P in P2 . Teorema 48 . (Classificazione delle reti di tutte coniche degeneri). Sia π un piano di S5 contenuto in V43 . Allora π ∈ Π1 oppure π ∈ Π2 . In altri termini: una rete di coniche tutte degeneri di P2 è costituita da tutte le coniche spezzate in una retta fissa ed in una retta qualunque del piano, oppure da tutte le coniche spezzate in due rette per uno stesso punto. Dimostrazione. Consideriamo π generato da tre suoi punti non allineati, f1 , f2 , f3 . Su ogni lato di tale triangolo esistono al più due punti di V24 (per il Lemma 46), onde non è restrittivo supporre che ogni fi corrisponda ad una conica semplicemente degenere. Ciascuno dei tre lati di quel triangolo è una retta, necessariamente appartenente a Λ1 (ossia è un fascio di coniche con componente comune) oppure a Λ2 (ossia 76 è un fascio di coniche con punto doppio comune), cfr. Teorema 47. Se in π esistono tre punti non allineati corrispondenti a tre coniche (degeneri) di P2 che condividono una componente r, allora ogni punto di π corrisponde ad una conica di P2 che condivide la componente r, e quindi π ∈ Π1 . Supponiamo allora che, per qualunque triangolo di π, i suoi tre vertici f1 , f2 , f3 corrispondano a coniche che non condividono una componente. Si possono presentare tre casi . Il Lettore faccia un disegno del triangolo, segnando ciascun vertice f del triangolo (e analogamente segnando ogni altro punto nominato in ciò che segue) come ’prodotto’ f = ab delle due rette che vengano indicate come componenti della conica f . Se (almeno) due lati, ad es. f1 f2 ed f1 f3 , appartengono a Λ2 , allora f1 condivide il punto doppio sia con f2 sia con f3 , cosicché f1 , f2 ed f3 condividono fra loro il punto doppio, e quindi π ∈ Π2 . Se un solo lato, ad es. f1 f3 , appartiene a Λ2 , mentre f1 f2 ed f2 f3 appartengono a Λ1 , possiamo assumere intanto f1 = rs, f2 = rt. Poiché f2 f3 ∈ Λ1 , una componente di f3 deve essere r oppure t, ma non può essere r perché f1 , f2 ed f3 non condividono una componente, e dunque una componente di f3 deve essere t con t 6= r. Sia dunque f1 = rs, f2 = rt, f3 = ht con t 6= r. Possiamo assumere f4 ∈< f2 , f3 >, con f4 = kt, k 6= r. Allora π =< f1 , f4 , f3 > ed è π ∈ Π2 . perché il trilatero generatore ha i due lati f1 f3 ed f1 f4 appartenenti a Λ2 . Se infine tutti i lati appartengono a Λ1 , allora le coniche f1 , f2 ed f3 condividono a due a due una componente comune, che tuttavia non può essere comune a tutte e tre; pertanto si può supporre che sia ad es. f1 = rt, f2 = rs, f3 = st. Possiamo assumere: f4 ∈< f1 , f3 >, con f4 = ht, h 6= s, f5 ∈< f2 , f3 >, con f5 = sv, v 6= r. Allora π =< f1 , f4 , f5 > ed attualmente il trilatero generatore ha i due lati f1 f5 ed f4 f5 in Λ2 e quindi π ∈ Π2 per quanto visto. Ciò completa la dimostrazione. Teorema 49 Consideriamo i due sistemi Π1 e Π2 di piani contenuti sulla V43 . (1) Per ogni punto di V43 \ V24 passano esattamente due piani di Π1 (che si intersecano esattamente in quel punto) ed esattamente un piano di Π2 . Inoltre due piani distinti di Π1 si intersecano in esattamente un punto di V43 \ V24 ; due piani distinti di P2 s’intersecano in esattamente un punto di V24 ; un piano di Π1 ed un piano di Π2 non hanno punti in comune oppure hanno esattamente una retta in comune. (2) Per ogni punto di V24 passa un unico piano di Π1 ed ∞1 piani di P i2 . (3) Ogni piano di Π1 è tangente a V24 . (4) Ogni piano di Π2 interseca V24 secondo una conica non singolare. (5) Detto Γ = {π ∩ V24 : π ∈ Π2 } l’insieme delle coniche segate sulla V24 dai piani di Π2 , si ha che (V42 , Γ) è un piano proiettivo. Dimostrazione. Denotiamo con r, s due rette qualunque e con P, Q due punti qualunque di P2 . Allora: (1) Si ha: (r 6= s) rs ∈ V43 \ V24 ⇒ rs ∈ π(r) ∈ Π1 , rs ∈ π(s) ∈ Π1 , {rs} = π(r) ∩ π(s), rs ∈ π(r ∩ s) ∈ Π2 . Si ha poi: π(P ) 6= π(Q) ⇒ P 6= Q ⇒ π(P ) ∩ π(Q) = (P Q)2 ∈ V24 . Inoltre: π(r) ∩ π(P ) = ∅ se P ∈ / r, π(r) ∩ π(P ) = {rs : s 3 P } se mentre (2). Infatti: rr ∈ V24 ⇒ [(rr ∈ π(r) ∈ Π1 ) ∧ (∀P ∈ r : rr ∈ π(P ) ∈ Π2 )]. 77 P ∈ r. (3). Infatti: π ∈ Π1 , π = π(r) ∈ Π1 ⇒ π ∩ V24 = {rr}. (4). Infatti, sia π ∈ Π2 , con π = π(P ) = {rs : r ed s rette di P2 passanti per P }, Non è restrittivo assumere P = A0 (1, 0, 0). Posto poi r: u1 X1 + u2 X2 = 0, s: v1 X1 + v2 X2 = 0, si ha rs : (u1 X1 + u2 X2 )(v1 X1 + v2 X2 ) = u1 v1 X12 + (u1 v2 + u2 v1 )X1 X2 + u2 v2 X22 = 0), ossia a11 X12 + a12 X1 X2 + a22 X22 = 0, π(P ) : dove a11 = u1 v1 , a12 = u1 v2 + u2 v1 , a22 = u2 v2 . (8) Il piano π(P ) ha equazioni cartesiane in S5 : a00 = 0, a01 = 0, a02 = 0. (9) Le coordinate del punto rs variabile in π(P ) sono: a00 = 0, a01 = 0, a02 = 0, a11 = u1 v1 , a12 = u1 v2 + u2 v1 , a22 = u2 v2 .46 (10) I punti di π(P ) ∩ V24 si ottengono ponendo r = s (cioè u1 = v1 , u2 = v2 , ) in tutto quanto precede; dalla (10) si ha allora: π(P ) ∩ V24 = {(0, 0, 0, u21 , 2u1 u2 , u22 ) : (u1 , u2 ) ∈ K \ {(0, 0}. Questa formula dice che - nelle coordinate interne (a11 , a12 , a22 ) del piano π(P ) che ha equazioni (9) - il luogo π(P ) ∩ V24 ha equazioni parametriche a11 = u21 , a12 = 2u1 u2 , a22 = u22 , ossia ha equazione cartesiana 4a11 a22 − a212 = 0, che è l’equazione di una conica non singolare, come asserito. (5) Siano r2 ed s2 punti distinti di V24 . Allora π = π(r ∩ s) è l’unico piano di Π2 che li contiene, cosicché π ∩ V24 è l’unica conica di Γ per quei due punti. Siano ora C e C 0 due coniche distinte appartenenti a Γ. Sia C = π ∩ V24 e C 0 = π 0 ∩ V24 , con π, π 0 ∈ Π2 . Allora π = π(P ), π 0 = π(Q) per opportuni punti P, Q di P2 ; si ha allora C ∩ C 0 = π ∩ π 0 = (P Q)2 che è un punto di V24 . Infine, evidentemente, ogni conica contiene almeno tre punti, e ciò completa la dimostrazione. 7.3 r Veronesiana Vrn delle ipersuperfici d’ordine n di Pr (K). La superficie di Veronese V24 - rappresentativa in S5 del sistema algebrico delle coniche doppiamente degeneri, o, se si preferisce, immagine proiettiva (nel duale Σ5 di S5 ) del sistema lineare completo delle coniche di r P2 (K) - è caso particolare (r = n = 2) della varietà di Veronese Vrn . 46 Viceversa, ogni punto P (0, 0, 0, a , a , a ) del piano di S avente in S equazioni cartesiane (9) è immagine di una (unica) 11 12 22 5 5 conica rs della rete π(P ): ciò è evidente a priori in virtù delle proprietà della rappresentazione lineare delle coniche di P2 coi punti di S5 ; a conferma di ciò si noti che il sistema (8) è univocamente risolubile nelle coppie omogenee (u1 , u2 ) e (v1 , v2 ). 78 Questa varietà verrà ora introdotta sia come la varietà rappresentativa in SN del sistema algebrico delle ipersuperfici d’ordine n di Pr (K). spezzate in n iperpiani coincidenti, sia, equivalentemente, come immagine proiettiva (nel duale ΣN di SN ) del sistema lineare completo delle ipersuperfici d’ordine n di Pr (K). In 2 particolare (r = 2) si ha la superficie veronesiana V2n delle curve piane d’ordine n. Consideriamo lo spazio proiettivo Pr = Pr (K) di dimensione r sul campo K (algebricamente chiuso), ed indichiamo con X = (X0 , X1 , . . . , Xr ) le c.p.o. di punto in Pr . Sia SN lo spazio rappresentativo delle ipersuperfici f d’ordine n di Pr . Scriviamo l’equazione della più generale ipersuperficie f nella forma X f: f (a; X) = as0 s1 ...sr X0s0 X1s1 · · · Xrsr = 0, s0 +s1 +···+sr =n dove la somma è estesa a tutte le soluzioni in interi non negativi dell’equazione diofantea: s0 + s1 + · · · + sr = n, e dove conveniamo di scrivere i monomi in un ordine stabilito una volta per tutte. Sappiamo che il numero dei coefficienti di f (a; X), ossia il numero delle soluzioni (s0 , s1 . . . , sr ) di tale equazione diofantea, è r+n N +1= n e che l’ipersuperficie f si rappresenta come il punto P (a) dello spazio SN . Conveniamo di scrivere l’equazione di un iperpiano di Pr nella forma r X ui Xi = 0 i=0 e l’equazione di un iperpiano di SN nella forma X as0 s1 ...sr αs0 s1 ...sr = 0. s0 +s1 +···+sr =n Indichiamo con ΣN lo spazio duale di SN . Le coordinate di punto in ΣN sono le coordinate plükeriane d’iperpiano αs0 s1 ...sr in SN . Sia ora P = P (z), z = (z0 , z1 , . . . , zr ) un punto di Pr . Le ipersuperfici d’ordine n di P r che passano per P (z) sono quelle la cui stringa a dei coefficienti, soddisfa alla f (a; X) = 0. Questa è una condizione lineare per le as0 s1 ...sr , ossia rappresenta un iperpiano SN −1 che denoteremo con Lz : X Lz : f (a; z) = as0 s1 ...sr z0s0 z1s1 · · · zrsr = 0. s0 +s1 +···+sr =n Questo iperpiano Lz ha coordinate plükeriane Lz : αs0 s1 ...sr = z0s0 z1s1 · · · zrsr , con (z0 , z1 , . . . , zr ) ∈ K r+1 \ {0}). (11) Gli iperpiani di tipo Lz (al variare di P (z) in Pr ) formano in ΣN una varietà algebrica Vr di dimensione r, perché gli Lz sono in corrispondenza biunivoca e algebrica coi punti di Pr ), corrispondenza esplicitata nelle precedenti equazioni parametriche di Vr nei parametri zi . Tale varietà Vr : Vr = {Lz ∈ ΣN : P (z) ∈ Pr )} ⊆ ΣN . 79 si chiama la immagine proiettiva del sistema lineare completo47 delle ipersuperfici d’ordine n di Pr , e prende il nome di varietà di Veronese delle ipersuperfici d’ordine n di Pr . r Vogliamo ora provare che l’ordine di questa varietà di Veronese Vr è nr , ossia che la varietà è una Vrn . Per definizione, l’ordine della varietà di Veronese Vr ⊆ ΣN è il numero dei punti che essa ha in comune con un generico ΣN −r : attualmente (per il Teorema della stella di iperpiani ) ΣN −r = Σ(Sr−1 ) è una stella generica di iperpiani di SN di centro un generico sottospazio Sr−1 di SN ; questo Sr−1 è (rappresenta) un generico sistema lineare (r − 1)-dimensionale di ipersuperfici d’ordine n di Pr , e come tale è generato da r ipersuperfici generiche - f1 , f2 , . . . , fr - d’ordine n di Pr , ed ha come varietà base l’intersezione di queste r ipersuperfici, cioè un gruppo di nr punti in virtù del teorema di Bézout (Teorema 33). Riassumendo: ordine(Vr ) =| {Lz ∈ ΣN : P (z) ∈ Pr , Lz ∈ ΣN −r |=| {Lz ∈ ΣN : P (z) ∈ Pr , Lz ⊇ Sr−1 } |= = | {Lz ∈ ΣN : P (z) ∈ Pr , ogni f di Sr−1 passa per P(z)} |= =| {P (z) ∈ Pr : ogni f di Sr−1 passa per P (z)} |= =| {P (z) ∈ Pr : P (z) è un punto base di Sr−1 |=| f1 ∩ f2 ∩ · · · ∩ fr |= = nr (per il teor. di Bézout, stante la genericità delle fi ). r Evidenziando il valore dell’ordine, denoteremo con Vrn la varietà di Veronese suddetta. r Dimostriamo ora che la varietà di Veronese Vrn , che è stata qui presentata come una varietà immersa nel duale ΣN dello spazio SN rappresentativo delle ipersuperfici di ordine n di Pr = Pr (K), si identifica (è proiettivamente equivalente) alla varietà algebrica immersa in SN costituita dai punti di SN che rappresentano le ipersuperfici d’ordine n di Pr spezzate in n iperpiani coincidenti. Una ipersuperfici H n d’ordine n di Pr spezzata in n iperpiani coincidenti, ha un’equazione del tipo: (u0 X0 + u1 X1 + · · · + ur Xr )n = 0; sviluppando la potenza del polinomio, si trova Hn : (u0 X0 + u1 X1 + · · · + ur Xr )n = X s0 +s1 +···+sr n! us00 us11 · · · usrr X0s0 X1s1 · · · Xrsr = 0, s !s ! · · · s ! r =n 0 1 dove al solito la somma è estesa a tutte le soluzioni in interi non negativi dell’equazione diofantea: s0 + s1 + · · · + sr = n, Dunque il luogo dei punti P (a) ∈ SN che rappresentano le ipersuperfici del tipo H n ha equazioni parametriche: n! us0 us1 · · · rrsr , con (u0 , u1 , . . . , ur ) ∈ K r+1 \ {0} as0 s1 ...sr = s0 !s1 ! · · · sr ! 0 1 Queste equazioni si identificano proiettivamente - a parte il nome delle coordinate e dei parametri - alle equazioni parametriche (11) di Vrnr : basta identificare le zi con le ui ed effettuare una trasformazione diagonale tra le as0 s1 ...sr e le αs0 s1 ...sr con matrice diagonale ad elementi che sono coefficienti multinomiali. 47 In modo del tutto analogo si definisce la immagine proiettiva di un qualunque sistema lineare d-dimensionale T di ipersud perfici di ordine n di Pr , anche non completo, cioè di dimensione d < N : le ipersuperfici del sistema lineare Td si rappresentano come punti di un sottospazio Sd dello spazio rappresentativo SN ed ogni punto generico P (z) di Pr stacca nel sistema lineare Td un sottosistema (d − 1)-dimensionale che si rappresenta con un iperpiano di Sd , ossia con un punto del duale Σd di Sd . L’immagine proiettiva del sistema lineare Td è la varietà di questi iperpiani di Sd . 80