Istituzioni di Algebra per la Laurea Specialistica in Matematica Università di Torino Alberto Albano Dipartimento di Matematica, Università di Torino, Via Carlo Alberto 10, 10123 Torino, ITALY E-mail address: [email protected] URL: http://www.dm.unito.it/personalpages/albano/index.htm Indice Capitolo 1. Il Sistema Assiomatico di Zermelo e Fraenkel §1. Gli assiomi §2. Conseguenze dell’assioma della scelta Capitolo 2. §1. §2. §3. §4. §5. Moduli Il concetto di modulo Sottomoduli, quozienti e somme Moduli liberi Prodotti tensoriali Successioni esatte Esercizi 1 1 6 11 12 15 19 23 28 34 Capitolo 3. Moduli di tipo finito §1. Moduli Noetheriani §2. Moduli su domini a ideali principali §3. La forma canonica di Jordan §4. Algebre di divisione finite 37 37 41 48 51 Capitolo 4. Anelli non commutativi §1. Algebre di endomorfismi §2. L’algebra gruppo K[G] 57 58 63 Capitolo 5. Categorie e funtori §1. Categorie §2. Alcune costruzioni 65 65 69 Bibliografia 73 iii Capitolo 1 Il Sistema Assiomatico di Zermelo e Fraenkel In questo primo capitolo presentiamo il sistema assiomatico di Zermelo–Fraenkel, su cui è basata tutta la matematica moderna. Nel primo paragrafo enunceremo gli assiomi, con qualche commento sul loro significato, e nel secondo discuteremo più in dettaglio l’assioma della scelta e alcune sue importanti conseguenze, come il lemma di Zorn, il principio del buon ordinamento e l’induzione transfinita. Una discussione completa sul significato degli assiomi in matematica, e in particolare degli assiomi della teoria degli insiemi, si trova in [Ma]. Un’altra fonte utile è [An], dove si trovano sviluppati in dettaglio molti degli argomenti che qui sono solo accennati. 1. Gli assiomi Nell’enunciare gli assiomi useremo un linguaggio non completamente formale. Sviluppare in modo strettamente formale l’assiomatica della teoria degli insiemi richiede un lavoro notevole, e per questo rimandiamo a un corso di Istituzioni di Logica Matematica. Scriveremo le formule, quando necessario, utilizzando gli usuali simboli logici. Il sistema assiomatico che descriveremo ha 10 assiomi. L’ultimo di questi è l’assioma della scelta, e ha una posizione un po’ particolare rispetto agli altri. Di solito il sistema formato dai primi nove viene detto ZF, e quello con tutti e dieci ZFC (e cioè ZF + C, dove C = choice, scelta in inglese) Nella teoria degli insiemi vi è un solo tipo di oggetto primitivo, l’insieme e una sola relazione fra insiemi, l’appartenenza. Per dire che un insieme appartiene ad un altro si scrive x∈y che si legge “x appartiene ad y” oppure “x è un elemento di y”. Di solito, siamo abituati a distinguere fra “insiemi” ed “elementi”, ma in effetti basta un solo concetto primitivo. Il primo assioma dice che un insieme è determinato unicamente 1 2 1. Il Sistema Assiomatico di Zermelo e Fraenkel dalla collezione dei suoi elementi e non da altre informazioni, come per esempio l’ordine dei suoi elementi. ZF 1. Assioma dell’estensione. Due insiemi x e y sono uguali se e solo se ogni elemento dell’insieme x è un elemento dell’insieme y e ogni elemento dell’insieme y è un elemento dell’insieme x. In simboli (1) ∀x∀y x = y ⇐⇒ [∀z z ∈ x ⇐⇒ z ∈ y] Se ogni elemento di x è un elemento di y scriviamo x ⊆ y e leggiamo “x è un sottoinsieme di y”. ZF 2. Assioma dell’insieme vuoto. Esiste un insieme che non contiene elementi. In simboli (2) ∃z ∀x x ∈ /z Dall’assioma di estensione segue che l’insieme vuoto è unico, e si indica con il simbolo ∅. Osserviamo anche che ∅ ⊆ x per ogni insieme x. Tutti i rimanenti assiomi garantiscono l’esistenza di insiemi aventi opportune proprietà o risultanti da appropriate costruzioni. ZF 3. Assioma della coppia. Per ogni due insiemi x e y esiste un insieme z i cui elementi sono solo x e y. In simboli (3) ∀x∀y ∃z : ∀w w ∈ z ⇐⇒ [w = x ∨ w = y] Questo insieme si denota con z = {x, y}. Osserviamo che x e y non sono necessariamente distinti, e si ha allora z = {x, x} = {x}. Dunque, dato un insieme x, l’assioma della coppia afferma, in particolare, l’esistenza di un insieme {x} che ha come unico elemento x. È importante ricordarsi che x 6= {x}. In particolare, x ∈ {x}, ma dimostreremo che x ∈ / x. In effetti, uno degli scopi dell’assiomatica di Zermelo–Fraenkel è di escludere l’affermazione x ∈ x, poiché da questa si possino derivare delle contraddizioni (paradosso di Russell). A partire dall’esistenza della coppia, si può definire la coppia ordinata di due insiemi hx, yi ponendo, per definizione hx, yi = {x, {x, y}}. Lo scopo di questa definizione è avere hx, yi = hu, vi ⇐⇒ x = u ∧ y = v, cosa che si verifica facilmente usando gli assiomi che abbiamo già. La nozione di coppia ordinata sarà utile per definire le corrispondenze fra insiemi e le funzioni. ZF 4. Assioma dell’unione. Per ogni insieme x esiste un insieme y tale che l’insieme z è un elemento di y se e solo se z è elemento di un elemento di x. In simboli (4) ∀x ∃y : ∀z z ∈ y ⇐⇒ [∃w : z ∈ w ∧ w ∈ x] L’insieme y è l’unione di tutti gli elementi di tutti gli elementi di x, e si scrive [ y= x. 1. Gli assiomi 3 S La notazione non S è quella che siamo S abituati ad usare: per esempio,Sn {x1 , x2 } di solito si scrive x1 x2 , l’unione {x1 , x2 , . . . , xn } di solito si scrive i=1 xi , e cosı̀ via. ZF 5. Assioma dell’insieme potenza. Per ogni insieme x esiste un insieme y tale che gli elementi di y siano tutti e soli i sottoinsiemi di x. In simboli (5) ∀x ∃y : ∀z z ∈ y ⇐⇒ z ⊆ x Naturalmente, y è l’insieme delle parti di x, (o insieme potenza, in inglese power set) e useremo la notazione y = P(x). Quali insiemi possiamo costruire a partire dagli assiomi che abbiamo? L’assioma dell’insieme vuoto garantisce che c’è almeno un insieme, ∅, e usando l’assioma della coppia, dell’unione e dell’insieme potenza possiamo costruire la sequenza di insiemi: ∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}, . . . ottenuta “collezionando” via via gli insiemi già costruiti. Si vede subito che ogni insieme che si ottiene in questo modo ha un numero finito di elementi. Se vogliamo parlare di insiemi infiniti dobbiamo avere un assioma apposito. Definiamo la nozione di “seguente”: se x è un insieme, l’insieme seguente è x0 = x ∪ {x}. Per esempio, ∅0 = ∅ ∪ {∅} = {∅}, ∅00 = {∅} ∪ {{∅}} = {∅, {∅}} ZF 6. Assioma dell’infinito. Esiste un insieme x che ha ∅ come elemento e per ogni y ∈ x anche y 0 ∈ x. In simboli (6) ∃x : ∅ ∈ x ∧ [∀y y ∈ x =⇒ y 0 ∈ x] È immediato riconoscere in questo assioma la base del principio di induzione e la costruzione stessa dell’insieme dei numeri naturali. L’assioma dell’infinito afferma che i numeri naturali formano un insieme e si possono considerare come una “infinità conclusa”, e cioè possono essere considerati tutti contemporaneamente, e non solo uno dopo l’altro. Notiamo però che, per l’assioma dell’insieme potenza, esiste l’insieme delle parti di questo insieme infinito, e Cantor scoprı̀ che questa nuova infinità è maggiore di quella iniziale, e cosı̀ via. Dunque, l’esistenza di un solo insieme infinito implica l’esistenza di infiniti insiemi infiniti, tutti di cardinalità maggiore uno dell’altro. Ora che abbiamo moltissimi insiemi, grandi quanto vogliamo, possiamo costruire altri insiemi come “sottoinsiemi” di insiemi già dati. Si tratta di stabilire se riusciamo a individuare solo alcuni fra i sottoinsiemi di un insieme, e non ottenerli tutti contemporaneamente come ci permette l’assioma dell’insieme potenza. ZF 7. Assioma del sottoinsieme. Per ogni insieme x e per ogni proprietà P di un insieme, esiste un insieme y tale che z ∈ y se e solo se z ∈ x e z gode della proprietà P . In simboli (7) ∀x ∀P ∃y : ∀z z ∈ y ⇐⇒ z ∈ x ∧ P (z) Di solito si scrive y = {z ∈ x | P (z)}. Questo assioma viene anche chiamato assioma di comprensione o assioma di separazione. 4 1. Il Sistema Assiomatico di Zermelo e Fraenkel Nella formulazione di questo assioma è evidente l’incertezza di significato dell’espressione “proprietà di insiemi”. Formulare con precisione questo significato è molto difficile nel linguaggio naturale che stiamo usando; diciamo solo che una proprietà è espressa mediante una “frase” che contiene solo simboli per rappresentare insiemi e le parole (o i simboli corrispondenti) “non”, “e”, “oppure”, “se . . . allora . . . ”, “per ogni”, “esiste”, “uguale”, “essere elemento”, loro sinonimi, e che è costruita “regolarmente”. Proprio dire cosa è una frase costruita regolarmente è la difficoltà maggiore e necessita l’introduzione di un linguaggio formale e la nozione di correttezza sintattica. Rimandiamo a [An] per una trattazione più completa. Piuttosto che tentare di definire con precisione “proprietà”, vediamone almeno alcune, che corrispondono a costruzioni ben note. Se P (u) è la proprietà u ∈ v, allora per ogni insieme x l’assioma del sottoinsieme garantisce l’esistenza dell’intersezione y = x ∩ v. Se P (u) è la proprietà u ∈ / v, allora si ha il complemento y = x \ v. Osserviamo infine che l’assioma del sottoinsieme è in realtà uno “schema di assiomi”, e cioè abbiamo un assioma per ogni proprietà P . Dunque ZF contiene infiniti assiomi e non solo 10, come avevamo affermato al’inizio della discussione. In virtù del teorema di incompletezza di Gödel (vedi, per esempio, [NaNe]), questo non è un difetto grave. Anche i due prossimi assiomi sono schemi di assiomi. In matematica le funzioni hanno un ruolo importante, e il prossimo assioma dice, intuitivamente, che l’immagine di un insieme è un insieme. Per enunciare con precisione l’assioma, ricordiamo la definizione di prodotto cartesiano di insiemi e cioè l’insieme delle coppie ordinate il cui primo elemento appartiene a x e il secondo a y. Osserviamo che se u ∈ x e v ∈ y, allora {u, v} ∈ P(x ∪ y) e hu, vi = {u, {u, v}} ∈ P(P(x ∪ y)). Il prodotto cartesiano x × y è definito da x × y = {z ∈ P(P(x ∪ y)) | ∃u ∈ x ∃v ∈ y : z = hu, vi} e dagli assiomi dell’insieme potenza e del sottoinsieme si ha che è un insieme. Ricordiamo che una relazione binaria fra gli insiemi x e y è un sottoinsieme di x×y, e una funzione da x a y è una relazione binaria f ⊆ x × y tale che per ogni u ∈ x esiste un unico v ∈ y tale che hu, vi ∈ f . ZF 8. Assioma del rimpiazzamento. Sia P una proprietà di coppie ordinate di insiemi tale che per tutti gli elementi x di un certo insieme u e per tutti gli insiemi y e z se le coppie hx, yi e hx, zi godono di P , allora y = z. Allora esiste un insieme v tale che y ∈ v se e solo se esiste x ∈ u tale che la coppia hx, yi gode della proprietà P In simboli (8) ∀u ∀P [∀x ∈ u ∀y∀z P (hx, yi) ∧ P (hx, zi) =⇒ y = z] =⇒ [∃v ∀t t ∈ v ⇐⇒ ∃s ∈ u P (hs, ti)] Dopo aver letto con cura l’enunciato, capiamo che l’ipotesi è che P definisce una funzione sull’insieme u (in realtà, P può essere una proprietà un po’ più generale di una funzione, ma ristretta a u definisce essenzialmente una funzione) e la conclusione garantita dall’assioma è che esiste un insieme v che è l’immagine della funzione. 1. Gli assiomi 5 L’assioma del sottoinsieme garantisce l’esistenza di un insieme per ogni proprietà, e cioè per ogni formula “sintatticamente corretta”, ma solo come sottoinsieme di un insieme già dato. Ci si può chiedere se si possa ampliare questo assioma, e cioè se data una proprietà P si possa postulare l’esistenza di un insieme formato da tutti gli insiemi che soddisfano P . Questa era l’idea originale di Cantor e Frege (e cioè “insieme = proprietà”), ma il paradosso di Russell mise presto in evidenza che non è sufficiente che la frase che definisce P sia corretta grammaticalmente. Ci devono essere delle restrizioni semantiche, e cioè di significato. Il paradosso di Russell nasce dall’affermazione che V = {x | x ∈ / x} sia un insieme. Allora V ∈ V =⇒ V ∈ / V e anche V ∈ / V =⇒ V ∈ V , una contraddizione. Una possibile soluzione a questo dilemma è impedire che V ∈ V sia vero. ZF 9. Assioma della fondazione. Sia P una proprietà degli insiemi, e supponiamo che esista un insieme y che gode di P . Allora esiste un insieme x che gode di P e tale che ogni suo elemento non gode di P . In simboli (9) ∀P [∃y P (y)] =⇒ [∃x P (x) ∧ ∀z P (z) =⇒ z ∈ / x] Lemma 1.1. Per ogni insieme x, x∈ / x. Dimostrazione. Sia P (u) la proprietà u ∈ u. Se esiste un insieme y tale che P (y), e cioè y ∈ y, per l’assioma della fondazione esiste un altro insieme x tale che (i) x ∈ x, (ii) ∀z ∈ x, z ∈ /z Dalla (i) x ∈ x, e quindi dalla (ii) si ha che x ∈ / x e dunque una contraddizione. Dunque non può esistere nessun insieme y tale che y ∈ y e questa è la tesi. ¤ Dunque V = {x | x ∈ / x} è la totalità di tutti gli insiemi dell’universo di Zermelo–Frankel, ma V non è un insieme, altrimenti dovrebbe essere V ∈ V , impossibile per gli insiemi di ZF. In questo modo si evita il paradosso di Russell. Nulla vieta che ci siano altri paradossi meno immediati e non ancora scoperti, ma per ora (in poco più di cento anni) non ne sono stati trovati. L’ultimo assioma è il celebre assioma della scelta: ZF 10. Assioma della scelta. Per ogni insieme x non vuoto esiste una funzione f che ad ogni sottoinsieme non vuoto di x assegna un suo elemento. In simboli (10) ∀x [x 6= ∅] =⇒ ∃f : P(x) \ ∅ → x ∧ [∀y y ⊆ x ∧ y 6= ∅ =⇒ f (y) ∈ y] L’assioma della scelta viene spesso abbreviato AC (Axiom of Choice), specialmente nei libri in inglese. 6 1. Il Sistema Assiomatico di Zermelo e Fraenkel AC afferma la possibilità di scegliere un elemento da ogni sottoinsieme di un insieme dato, e di poter fare tutte queste scelte simultaneamente. È evidente che se l’insieme x è finito, non c’è bisogno dell’assioma della scelta per l’esistenza della funzione f . Dunque AC è un’affermazione vera nel caso finito che vogliamo valga anche nel caso infinito. È appena il caso di notare che vi sono molte dimostrazioni matematiche che richiedono questo assioma, e molte di queste erano considerate valide anche prima che Zermelo usasse questa forma nella sua famosa dimostrazione del principio del buon ordinamento nel 1904. Nel prossimo paragrafo vedremo alcune conseguenze di questo assioma, di uso corrente nelle dimostrazioni matematiche. Gödel, nel 1940, ha dimostrato che AC è consistente con gli altri assiomi usuali della teoria degli insiemi, nella formulazione di Zermelo–Fraenkel, e cioè non si può dimostrare la negazione di AC in ZF. Paul Cohen, nel 1963 ha dimostrato che AC è indipendente dagli altri assiomi, e cioè non può essere dimostrato in ZF. Dunque accettare o meno AC è una questione di scelta (il gioco di parole è voluto). La matematica contemporanea ha accettato AC e lo considera un assioma indispensabile. Vi è una corrente in Matematica, detta Costruttivismo, che non accetta AC e considera corrette solo dimostrazioni di esistenza in cui sia possibile “costruire” esplicitamente l’oggetto di cui si afferma l’esistenza. Molti teoremi della matematica contemporanea (e anche della matematica dell’Ottocento) sono fuori dalla portata dei metodi costruttivi, per esempio il teorema di Weierstrass sull’esistenza di massimi e minini di funzioni continue. Per una interessante discussione sull’assioma della scelta, condotta da Emil Borel, Henri Lebesgue, Jacques Hadamard e Robert Baire nel 1905, vedere [Lettres]. Proprio la controversia che si sviluppò sulla dimostrazione di Zermelo del principio del buon ordinamento portò quest’ultimo alle ricerche sui fondamenti della teoria degli insiemi che culminarono nella formulazione del sistema assiomatico che abbiamo appena descritto. 2. Conseguenze dell’assioma della scelta Vedremo, in questo paragrafo, alcuni enunciati equivalenti all’assioma della scelta in ZF. Questo vuol dire che, assumendo solo gli assiomi ZF 1–9 si può dimostrare che AC vale se e solo se vale uno di questi enunciati. Dunque accettare AC o uno di questi come assioma è logicamente equivalente, ma può essere psicologicamente differente. E in effetti, forse è proprio AC ad essere il più intuitivamente “vero”. Non riporteremo le dimostrazioni. In [An] e in [Dev] Capitolo II.9 le dimostrazioni di equivalenza sono basate sulla teoria dei numeri ordinali, mentre in [vdW], Volume I, Capitolo 9 vi sono delle dimostrazioni dirette dei teoremi seguenti sulla base di AC. Molte delle riformulazioni dell’assioma della scelta riguardano gli insiemi ordinati, e abbiamo perciò bisogno di ricordare alcune definizioni. Sia X un insieme. Definizione 2.1. Una relazione ≤ su X si dice un ordine se è riflessiva, antisimmetrica e transitiva, e cioè (1) a ≤ a per ogni a ∈ X; (2) a ≤ b e b ≤ a =⇒ a = b; (3) a ≤ b e b ≤ c =⇒ a ≤ c. 2. Conseguenze dell’assioma della scelta 7 Se per ogni coppia di elementi a, b ∈ X vale una delle a ≤ b oppure b ≤ a, allora l’ordine è detto totale e X è detto linearmente ordinato (o totalmente ordinato), altrimenti l’ordine è detto parziale. La relazione a ≤ b si legge a precede b oppure a è minore o uguale a b. C’è anche un simbolo di “minore stretto” con il significato solito, e cioè a < b se e solo se a ≤ b e a 6= b. Esempi ben noti sono l’ordinamento dei numeri naturali, interi, razionali e reali. Questi ordini sono totali. Un esempio di ordinamento parziale è quello dato dall’inclusione fra i sottoinsiemi di un insieme Z definito da A ≤ B se e solo se A ⊆ B. Se X è ordinato, un elemento a ∈ X si dice minimo se per ogni b ∈ X, a ≤ b, e analogamente per il massimo. È chiaro che il minimo (massimo) se esiste, è unico. Definizione 2.2. Un insieme X si dice bene ordinato se ogni sottoinsieme di X ha un minimo. Per esempio N, con l’ordinamento solito, è bene ordinato. Z non è bene ordinato, ma può essere bene ordinato da un altro ordinamento, per esempio 0, 1, −1, 2, −2, 3, −3, . . . oppure 1, 2, 3, . . . ; 0, −1, −2, −3, . . . in cui ogni positivo precede tutti i negativi. L’insieme dei razionali Q non è bene ordinato dall’ordinamento solito, ma poiché è numerabile può essere bene ordinato usando una corrispondenza biunivoca con N e trasportando l’ordine. Dunque tutti gli insiemi numerabili possono essere bene ordinati (e anche quelli finiti, naturalmente). L’insieme R dei numeri reali non è bene ordinato dall’ordinamento solito, e non è nemmeno numerabile. Esiste su R un buon ordinamento? La risposta non è ovvia, e costruire esplicitamente un buon ordinamento risulta a prima vista molto difficile. Principio del Buon Ordinamento. Ogni insieme X può essere bene ordinato. Fu proprio nel dimostrare questo teorema che Zermelo usò in modo esplicito AC (che non era ancora un assioma), dando cosı̀ inizio alla discussione sulla sua verità o necessità di essere accettato. A questo proposito, i commenti di Lebesgue nella terza lettera in [Lettres] sono ancora oggi molto interessanti. Definizione 2.3. Sia M un sottoinsieme di un insieme parzialmente ordinato X. Se per ogni x ∈ M si ha x ≤ s, allora s si dice un maggiorante di M . Se esiste un maggiorante m di M tale che m ≤ s per ogni maggiorante s di M , allora m è unico, e viene detto estremo superiore di M . L’enunciato originale del lemma di Zorn riguarda l’ordinamento dei sottoinsiemi di un insieme. Sia dunque X un insieme e ordiniamo (parzialmente) l’insieme delle parti P(X) con l’inclusione. Un sottoinsieme C di P(X) totalmente ordinato si dice una catena. Un sottoinsieme A di P(X) si dice chiuso se per ogni catena, contiene anche l’unione della catena. Un elemento di A si dice massimale se non è contenuto in nessun altro elemento di A. Possiamo definire questi concetti per qualunque ordine: se M è un qualunque insieme parzialmente ordinato, un sottoinsieme è una catena se è totalmente ordinato, è chiuso se con ogni catena contiene anche 8 1. Il Sistema Assiomatico di Zermelo e Fraenkel l’estremo superiore della catena e un elemento x ∈ M è massimale se per ogni y ∈ M , x ≤ y =⇒ x = y. Lemma di Zorn. Ogni sottoinsieme chiuso A di M contiene almeno un elemento massimale. Una catena K di M si dice massimale se per ogni x ∈ M , se x ∈ / K allora l’insieme K ∪ {x} non è più una catena. Principio di Massimalità di Hausdorff. Ogni catena di un insieme ordinato può essere estesa ad una catena massimale. Questi due enunciati, molto simili tra loro, sono spesso usati nelle dimostrazioni. Entrambi sono equivalenti ad AC. Molti sono i teoremi che richiedono AC per la loro dimostrazione. Ecco qualche esempio (alcuni sono addirittura equivalenti ad AC, come il teorema di Tychonoff): (1) L’unione di una infinità numerabile di insiemi numerabili è ancora numerabile. (2) Ogni anello commutativo con unità ha un ideale massimale. (3) Ogni spazio vettoriale ha una base. (4) Ogni sottogruppo di un gruppo abeliano libero è libero. (5) Ogni campo ammette una chiusura algebrica. (6) Il prodotto di (infiniti) spazi compatti è compatto. (Teorema di Tychonoff) (7) In uno spazio di Banach B, ogni funzionale lineare limitato definito su un sottospazio si estende a un funzionale lineare limitato con la stessa norma su tutto B. (Teorema di Hahn–Banach) Purtroppo, AC ha anche conseguenze “negative”. Vi sono alcuni teoremi dimostrabili usando (e a volte addirittura equivalenti a) AC che forse non vorremmo avere. Di questi, il più famoso è noto come “Paradosso di Banach–Tarski” Paradosso di Banach–Tarski. Sia B = {(x, y, z) ∈ R3 | x2 +y 2 +z 2 ≤ 1} la palla unitaria dello spazio euclideo. Allora esiste una partizione {X1 , . . . , Xn , Y1 , . . . , Ym } di B e σ1 , . . . , σn , τ1 , . . . , τm isometrie di R3 tali che {σ1 (X1 ), . . . , σn (Xn )} e {τ1 (Y1 ), . . . , τm (Ym )} sono partizioni di B. In altre parole: è possibile suddividere B in un numero finito di pezzi che opportunamente traslati e ruotati formano due copie di B e cioè, mediante isometrie è possibile duplicare la sfera. Un’altra ben nota conseguenza di AC è l’esistenza di insiemi non misurabili secondo Lebesgue, e anzi l’impossibilità di avere una misura invariante per traslazioni e definita per tutti i sottoinsiemi della retta reale che estenda il concetto di “lunghezza di un intervallo”. Evidentemente le conseguenze “buone” sono superiori a quelle “cattive”, nondimeno AC ha sempre suscitato un po’ di imbarazzo fra i matematici. Molti pensano che non li riguardi, che nella matematica “vera” queste cose non capitano, che non si fa uso di enunciati esoterici come AC. Messi di fronte al fatto che senza AC non ci sarebbero molti teoremi di analisi elementare, come l’esistenza di massimi e minimi per funzioni continue, essi reagiscono accettandolo allora come fatto evidente, di cui non si deve discutere. Quando poi però devono accettare che è possibile avere 2. Conseguenze dell’assioma della scelta 9 un buon ordinamento sull’insieme dei numeri reali (e quindi, si potrebbero fare dimostrazioni per induzione usando questo ordinamento, se solo sapessimo qual è . . . , vedi ancora la lettera di Lebesgue in [Lettres]), allora cambiano discorso, dicendo che è “roba da logici”. Questo atteggiamento non è sorprendente. Un matematico è tutto sommato un essere umano, e la coerenza non è il primo tratto che associamo al carattere umano. Inoltre, nonostante affermazioni altisonanti sulla verità “assoluta” ed “eterna” della matematica, la matematica è un’attività compiuta da esseri umani in collaborazione, e ci sono aspetti psicologici e sociologici che giocano un ruolo non solo su cosa è “interessante” ma anche su cosa è “vero”. La discussione su AC è uno di questi aspetti. Come possiamo concludere? Cosa pensiamo dei vari enunciati che abbiamo visto? Una battuta, che cattura abbastanza bene l’aspetto psicologico, può aiutare: . . . l’assioma della scelta è sicuramente vero, il principio del buon ordinamento è sicuramente falso, e per quanto riguarda il lemma di Zorn, chi può dirlo? Capitolo 2 Moduli Uno dei concetti fondamentali dell’algebra è quello di spazio vettoriale. Moltissimi problemi in matematica possono essere formalizzati utilizzando gli spazi vettoriali e le applicazioni lineari fra essi e, nel caso della dimensione finita, la corrispondenza fra applicazioni lineari e matrici permette di trovare in modo esplicito nucleo e immagine di una applicazione lineare mediante il metodo di riduzione di Gauss. Questo fatto e il teorema di Rouché–Capelli rendono la teoria degli spazi vettoriali di dimensione finita una parte della Matematica estremamente importante nelle applicazioni. La ricerca di una generalizzazione del concetto di spazio vettoriale può procedere in due direzioni diverse: la prima consiste nel non richiedere più la finitezza della dimensione. Questa è una strada molto importante e cruciale nello sviluppo della matematica, ma per ottenere risultati interessanti e significativi si deve uscire dall’ambito dell’algebra ed entrare in quello dell’analisi. Gli spazi vettoriali di dimensione infinita vengono dotati di una norma, e cioè di una nozione di lunghezza di un vettore, a cui è richiesta una compatibilità con la struttura algebrica, e si richiede anche una proprietà di convergenza delle successioni di Cauchy. Si ottengono in questo modo i cosiddetti spazi di Banach e spazi di Hilbert, oggetti fondamentali per l’Analisi Matematica moderna. Notiamo che per spazi vettoriali di dimensione infinita il teorema di esistenza della base e il teorema che afferma che tutte le basi hanno lo stesso numero di elementi (e cioè che i vettori di due basi possono essere messi in corrispondenza biunivoca) sono ancora veri ma diventano piuttosto complicati da dimostrare e richiedono l’uso dell’assioma della scelta e di alcuni teoremi fondamentali sull’aritmetica dei numeri cardinali infiniti. La seconda strada prende avvio dall’analisi delle dimostrazioni dei teoremi fondamentali sugli spazi vettoriali e dalla realizzazione del fatto che in molti passi si fa un uso essenziale della possibilità di dividere, e cioè dell’esistenza dell’inverso moltiplicativo degli elementi non nulli del campo degli scalari. Altre volte invece questa proprietà non interviene e ci si può chiedere quale sia la teoria che si può ottenere usando come scalari gli elementi di un anello piuttosto che di un campo. Il concetto che si ottiene è quello di modulo, e questo sarà l’oggetto del nostro studio. 11 12 2. Moduli Non sempre il desiderio di generalizzare un concetto che si è rivelato interessante porta a risultati altrettanto interessanti e quindi, dopo aver dato la definizione precisa di modulo, vedremo molti esempi in modo da avere del materiale concreto su cui formare la nostra intuizione, convincerci dell’importanza dei moduli in Matematica e mettere in luce le prime differenze con gli spazi vettoriali. 1. Il concetto di modulo La definizione di modulo è quasi identica a quella di spazio vettoriale: l’unica differenza è che gli scalari appartengono ad un anello piuttosto che a un campo. La definizione non richiede la commutatività dell’anello A, ma in quasi tutti gli esempi che vedremo l’anello degli scalari sarà commutativo con unità. In questi primi paragrafi non faremo ipotesi sull’anello degli scalari, ma dal paragrafo 4 in poi restringeremo l’attenzione a moduli unitari su anelli commutativi. Definizione 1.1. Sia A un anello. Un modulo (sinistro) M su A è un gruppo abeliano (scritto additivamente) con una operazione di moltiplicazione per elementi di A, cioè una funzione µ:A×M →M che di solito si scrive µ(a, m) = am, tale che (1) ∀a ∈ A, ∀m, n ∈ M, a(m + n) = am + an, (2) ∀a, b ∈ A, ∀m ∈ M, (a + b)m = am + bm, (3) ∀a, b ∈ A, ∀m ∈ M, a(bm) = (ab)m. Se l’anello possiede l’unità moltiplicativa 1, si chiede anche che (4) ∀m ∈ M, 1m = m. Un modulo che soddisfa l’ultima condizione si dice modulo unitario. Quasi tutti i moduli che considereremo saranno unitari, e di solito non specificheremo questo fatto. Piuttosto, indicheremo esplicitamente il caso di moduli non unitari. Naturalmente esiste anche una nozione di modulo destro, con una moltiplicazione µ : M × A → M , data da µ(m, a) = ma, e che soddisfa l’analogo delle (1)–(4). D’ora in poi, diremo semplicemente “modulo” per intendere “modulo sinistro”. Inoltre tutti i teoremi che valgono per i moduli sinistri valgono anche, con le opportune modifiche, per i moduli destri. Un dato gruppo abeliano M può avere varie strutture di A-modulo, sia sinistro che destro. Se A è un anello commutativo, allora ogni modulo sinistro è anche un modulo destro, ponendo per definizione ma = am. L’unico punto in cui serve la commutatività è nella verifica di (3). A meno di indicazione diversa, tutti i moduli che considereremo nel seguito su anelli commutativi saranno moduli sia sinistri che destri, con la condizione am = ma. Vediamo ora degli esempi. Esempio 1.2. Ogni anello è un modulo su se stesso; questo è l’analogo di uno spazio vettoriale di dimensione 1. Esempio 1.3. Sia U ⊆ Rn un dominio (cioè un sottoinsieme aperto e connesso), e sia A = C∞ (U, R) l’anello delle funzioni di classe C∞ definite su U a valori reali. Le forme differenziali di grado k fissato su U sono un modulo su A: ha senso infatti sommare forme differenziali e moltiplicarle per una funzione differenziabile. Lo 1. Il concetto di modulo 13 stesso vale anche per i campi vettoriali definiti su U , che formano quindi anch’essi un modulo su A. Se V è una varietà differenziabile, e A = C∞ (V, R), le forme differenziali su V e i campi vettoriali su V sono, in modo analogo, moduli su A. Questo esempio fa capire che i moduli sono oggetti piuttosto naturali in matematica e che il caso in cui i coefficienti sono elementi di un anello e non di un campo occorre veramente. Quindi il concetto di modulo non è una generalizzazione artificiale. Esempio 1.4. Sia V uno spazio vettoriale sul campo K, e ϕ : V → V un’applicazione lineare (un endomorfismo). Naturalmente, V è un modulo su K, ma possiamo introdurre in V una struttura di modulo su A = K[t], l’anello dei polinomi su K in una variabile, nel modo seguente: p(t) · v = (p(ϕ))(v) per p(t) ∈ K[t] e v ∈ V dove, se p(t) = an tn + · · · + a0 , allora (p(ϕ)) è l’endomorfismo dato da an ϕn + · · · + a0 I. La struttura di V come A-modulo è strettamente legata alle proprietà di diagonalizzazione di ϕ. Osserviamo anche che su V vi sono molte strutture di A-modulo, al variare di ϕ fra gli endomorfismi di V . Affronteremo in seguito il problema di decidere quando due di queste strutture siano la stessa. Esempio 1.5. Ogni gruppo abeliano G è uno Z-modulo. Infatti basta definire, per n ∈ Z e x ∈ G, nx = x + · · · + x se n > 0, nx = (−x) + · · · + (−x) se n < 0, 0x = 0. Viceversa, se M è uno Z-modulo, allora le stesse formule di prima ci dicono che la moltiplicazione di un numero intero per un elemento di M è già determinata dalla struttura di gruppo abeliano di M . Dunque gli unici Z-moduli sono i gruppi abeliani. Esempio 1.6. Siano M e N due A-moduli. Consideriamo il modulo formato dalle coppie di elementi (m, n), con m ∈ M e n ∈ N . Possiamo addizionare queste coppie, e moltiplicarle per elementi di A nel modo seguente: (m, n) + (m0 , n0 ) = (m + m0 , n + n0 ), a(m, n) = (am, an). Questo modulo viene detto la somma diretta di M e N , ed è indicato con M ⊕ N . Allo stesso modo si può definire la somma diretta di un qualunque numero (finito) di moduli. La somma di n copie di A come modulo su se stesso si indica con An , An = A ⊕ A ⊕ · · · ⊕ A, ed è l’analogo di uno spazio vettoriale di dimensione n. An è detto modulo libero di rango n. I suoi elementi sono n-uple di elementi di A, con la somma definita componente per componente. Se m = (a1 , . . . , an ) ∈ An 14 2. Moduli e poniamo ei = (0, . . . , 1, . . . , 0), con 1 nella posizione i-esima, si ha m = a1 e1 + · · · + an en = n X ai ei i=1 e la rappresentazione è unica. L’insieme {e1 , . . . , en } è una base di An . Esempio 1.7. Ogni k-forma differenziale su Rn si può scrivere in modo unico nella forma X ω= ai1 ...ik dxi1 ∧ · · · ∧ dxik i1 <···<ik dove gli ai1 ...ik sono funzioni su Rn di classe C∞µ. Dunque il modulo delle k-forme ¶ n differenziali su Rn è un modulo libero di rango sull’anello C∞ (Rn ). k ∂ di derivazione ∂xi parziale rispetto alle variabili xi . Sia A = R[L1 , . . . , Ln ] l’anello di tutti gli operatori differenziali che si possono formare a partire dagli Li con le operazioni di somma e composizione (la composizione di operatori è commutativa perché si può scambiare l’ordine di derivazione). L’anello A è isomorfo in modo naturale all’anello dei polinomi usuali R[t1 , . . . , tn ]. Se M è un opportuno spazio di funzioni definite su Rn e infinitamente differenziabili, allora A opera su M e quindi M è un A-modulo. In particolare, possiamo prendere M uguale allo spazio dei polinomi in n variabili, allo spazio di tutte le funzioni di classe C∞ , allo spazio delle funzioni C∞ a supporto compatto, allo spazio delle funzioni analitiche reali. Tutti questi spazi di funzioni sono dunque dei moduli sull’anello dei polinomi in n variabili. Esempio 1.8. Sullo spazio Rn consideriamo gli operatori Li = Esempio 1.9. Consideriamo l’anello dei polinomi R[x1 , . . . , xn ] come un modulo M su se stesso. D’altra parte, lo possiamo considerare come un modulo sull’anello A degli operatori differenziali a coefficienti costanti. Poiché A è anch’esso un anello di polinomi, otteniamo un altro modulo N sull’anello R[x1 , . . . , xn ]. Notiamo che M e N sono lo stesso gruppo abeliano, e quello che cambia è la struttura di modulo sull’anello R[x1 , . . . , xn ], In effetti, questi due moduli non sono isomorfi. Infatti, se m ∈ N è un polinomio, esiste certamente un elemento a ∈ R[x1 , . . . , xn ] tale che am = 0: basta prendere a un operatore differenziale di ordine sufficientemente alto, per esempio maggiore del grado del polinomio m. D’altra parte, poiché R[x1 , . . . , xn ] è un dominio d’integrità, in M si ha che am = 0 implica che a = 0 oppure m = 0. In alcuni casi, se M è uno spazio di funzioni opportuno, le due strutture sono isomorfe. Tali isomorfismi, che trasformano l’operatore di derivazione in moltiplicazione per polinomi (e viceversa) hanno in genere il nome di trasformata di Fourier e sono uno strumento essenziale in molti problemi di Analisi Matematica legati allo studio delle equazioni differenziali. Esempio 1.10. Se A è un sottoanello di B, allora B è un A-modulo (ma non viceversa!) con ab (a ∈ A, b ∈ B) definito dalla moltiplicazione in B. Quindi gli anelli di polinomi A[x1 , . . . , xn ] e delle serie di potenze formali A[[x1 , . . . , xn ]] sono A-moduli. 2. Sottomoduli, quozienti e somme 15 Esempio 1.11. Più in generale, se f : A → B è un omomorfismo di anelli, allora c’è una struttura di A-modulo su B data da a · b = f (a)b ∀a ∈ A, ∀b ∈ B, dove la moltiplicazione a secondo membro è quella nell’anello B. Nell’esempio precedente f è l’inclusione A ,→ B. Esempio 1.12. Ancora più in generale, se f : A → B è un omomorfismo di anelli e M è un B-modulo, si può definire su M una struttura di A-modulo ponendo am = f (a)m ∀a ∈ A, m ∈ M. Questa struttura di A-modulo su M viene detta il pullback lungo f della struttura di B-modulo. Nell’esempio precedente, la struttura di A-modulo su B è il pullback lungo f della struttura di B come B-modulo su se stesso. Concludiamo questa serie di esempi con un esercizio che dà una definizione alternativa, ma equivalente, del concetto di modulo. Ritroveremo questa definizione in seguito, quando tratteremo di rappresentazioni di gruppi. Esercizio 1.13. Sia M un gruppo abeliano, e sia E = End(M ) = insieme di tutti gli omomorfismi di M in se stesso. In E si possono definire due operazioni: (f + g)(m) = f (m) + g(m) ∀f, g ∈ E, ∀m ∈ M, (f · g)(m) = f (g(m)) ∀f, g ∈ E, ∀m ∈ M. (1) Dimostrare che con le operazioni precedenti E è un anello (in generale non commutativo) con unità. (2) Dimostrare che M è un E-modulo unitario, con la struttura definita da: f m = f (m) ∀m ∈ M, ∀f ∈ E. (3) Dimostrare che se M ha una struttura di A-modulo, allora esiste un unico omomorfismo di anelli f : A → E tale che la struttura di A-modulo data su M è il pullback lungo f (vedi Esempio 1.12) della struttura di E-modulo descritta al punto precedente. Dunque dare una struttura di A-modulo su di un gruppo abeliano M è la stessa cosa che assegnare un omomorfismo di anelli da A in End(M ). 2. Sottomoduli, quozienti e somme Vediamo ora in modo sistematico alcune definizioni e costruzioni fondamentali. Per prima cosa, chiariamo il concetto di isomorfismo. Definizione 2.1. Siano M e N due moduli (sinistri) sull’anello A. Un omomorfismo f : M → N è un omomorfismo di gruppi abeliani tale che f (am) = af (m) ∀a ∈ A, ∀m ∈ M. L’insieme di tutti gli omomorfismi da M a N si indica con HomA (M, N ). In particolare, HomZ (M, N ) è l’insieme di tutti gli omomorfismi di gruppo fra M e N . Si ha naturalmente HomA (M, N ) ⊆ HomZ (M, N ). Esercizio 2.2. Dimostrare che HomA (M, N ) è un A-modulo (in modo naturale). 16 2. Moduli Un isomorfismo è un omomorfismo che ammette una inversa che è ancora un omomorfismo. Esercizio 2.3. Dimostrare che se f : M → N è un omomorfismo biiettivo, allora è un isomorfismo (cioè, dimostrare che la funzione inversa di un omomorfismo, quando esiste, è ancora un omomorfismo). Definizione 2.4. Sia M un modulo sull’anello A e sia N ⊆ M . Si dice che N è un sottomodulo di M se N è un sottogruppo e se an ∈ N ∀a ∈ A, ∀n ∈ N. Se consideriamo A come modulo su se stesso, allora i sottomoduli di A sono esattamente gli ideali sinistri. Notiamo che ideali diversi possono essere isomorfi come sottomoduli. In particolare, se A è un dominio d’integrità e I è un ideale di A, allora A ∼ = I come modulo se e solo se I è principale. In tal caso, se I = (x), l’isomorfismo è f : A → I dato da f (a) = ax. Infatti f è suriettiva perché I è un ideale principale generato da x, ed è iniettiva perché in un dominio d’integrità vale la legge di cancellazione del prodotto (ax = bx =⇒ a = b). Dunque se A = Z, tutti i sottomoduli non nulli sono isomorfi (come moduli!) a Z. Invece in R[x, y] l’ideale I = (x, y) di tutti i polinomi con termine noto nullo non è principale e quindi non è isomorfo a R[x, y]. Notiamo qui una prima differenza con il caso degli spazi vettoriali: come modulo su se stesso un anello è generato da un solo elemento, l’1. Per uno spazio vettoriale, questo vuol dire avere dimensione 1, e tutti i sottospazi hanno dimensione 0 oppure 1. Invece in questo caso abbiamo un sottomodulo che richiede almeno due generatori, e cioè ha bisogno di più generatori del modulo che lo contiene. Non è perciò più vero il teorema che dice che in uno spazio generato da n elementi, tutti i sottospazi sono generati da un numero minore o uguale a n di elementi. Definizione 2.5. Sia f : M → N un omomorfismo di A-moduli. Il nucleo di f è ker f = {m ∈ M | f (m) = 0} e l’immagine è Im f = {n ∈ N | ∃m ∈ M : n = f (m)}. Le definizioni di nucleo e immagine di un omomorfismo sono quelle ovvie, ed è anche immediato dimostrare che sia il nucleo che l’immagine sono dei sottomoduli di M e N rispettivamente. Sia ora N un sottomodulo dell’A-modulo M . Poiché N è un sottogruppo del gruppo abeliano M è possibile formare il gruppo quoziente M/N , i cui elementi sono le classi laterali del tipo m + N . Su M/N è possibile definire una struttura di A-modulo nel modo ovvio: a(m + N ) = am + N ∀a ∈ A, ∀m ∈ M ; la definizione è ben data perché N è un sottomodulo, e cioè aN ⊆ N , ed è immediato verificare che M/N è un modulo su A. La proiezione canonica (sul quoziente) π : M → M/N data da π(m) = m + N è un omomorfismo di A-moduli. Tutti i teoremi di omomorfismo fra gruppi e spazi vettoriali continuano a valere immutati per i moduli. Li enunciamo qui di seguito per comodità, lasciando la 2. Sottomoduli, quozienti e somme 17 dimostrazione del primo per esercizio (suggerimento: copiare la dimostrazione nel caso degli spazi vettoriali) Teorema 2.6. Sia f : M → N un omomorfismo di A-moduli. Allora: (1) f è iniettiva se e solo se ker f = {0}; (2) f induce un isomorfismo di A-moduli f¯ : M/ ker f → Im f . Teorema 2.7. Siamo N e P due sottomoduli di M . (1) N/(N ∩ P ) ∼ = (N + P )/P ; (2) se P ⊆ N , allora N/P è un sottomodulo di M/P e c’è un isomorfismo di A-moduli (M/P )/(N/P ) ∼ = M/N . Dimostrazione. Per la (1), definiamo una mappa f : N → (N + P )/P come l’inclusione N ,→ N + P seguita dalla proiezione sul quoziente. Dimostriamo che f è suriettiva: sia m + P un elemento di (N + P )/P . Per definizione dunque esistono n ∈ N e p ∈ P tali che m = n + p. Ma allora m + P = n + p + P = n + P e dunque appartiene all’immagine di N tramite f . Calcoliamo ora ker f : se n ∈ N , f (n) = n + P è nullo se e solo se n ∈ P e cioè se e solo se n ∈ N ∩ P . Dunque ker f = N ∩ P e per il Teorema 2.6(2) si ha la tesi. Nel caso (2), la (1) si riduce all’ovvio enunciato N/P ∼ = N/P , ma si può dire qualcosa di più. Prima di tutto, è immediato che N/P sia un sottomodulo di M/P . Come prima, definiamo una mappa g : M/P → M/N , data da g(m + P ) = m + N . In effetti g è ben definita: se m + P = m0 + P , allora m0 = m + p per un opportuno p ∈ P . Si ha: g(m0 ) = m0 + N = m + p + N = m + N = g(m), perché p ∈ P ⊆ N . È anche immediato verificare che g è un omomorfismo e che è suriettiva. Calcoliamo ker g: poiché g(m + P ) = m + N , si ha che g(m + P ) = 0 se e solo se m ∈ N e cioè se e solo se m + P ∈ N/P , e come prima si conclude usando il Teorema 2.6(2). ¤ Dalla definizione di sottomodulo è chiaro che l’intersezione di una famiglia, anche infinita, di sottomoduli è ancora un sottomodulo. Definizione 2.8. Sia M un A-modulo e X un sottoinsieme di M . L’intersezione di tutti i sottomoduli di M contenenti X è detto il sottomodulo generato da X, e viene indicato con L(X). Se X è finito, L(X) si dice finitamente generato. Ci sono alcuni casi particolari degni di nota: se X = ∅, allora L(X) = {0}, il sottomodulo nullo. Se X = {m} è costituito da un solo elemento, allora L(X) è detto il (sotto)modulo ciclico generato da m. Infine, se {Ni }i∈I è una famigliaSdi sottomoduli indicizzati dall’insieme I, allora il sottomodulo generato da X = i∈I Ni è detto la somma dei sottomoduli Ni . Se l’insieme I degli indici è finito, la somma di N1 , N2 , . . . , Nk si indica con N1 + N2 + · · · + Nk . Esercizio 2.9. Sia M un A-modulo, X un sottoinsieme di M , {Ni }i∈I una famiglia di sottomoduli e m ∈ M . Poniamo Am = {am | a ∈ A} (non stiamo supponendo che M sia un modulo unitario). (1) Am è un sottomodulo di M , e la mappa f : A → Am è un omomorfismo suriettivo di A-moduli. (2) Il sottomodulo ciclico C generato da m è C = {am + nm | a ∈ A, n ∈ Z} , 18 2. Moduli dove per definizione per ogni n ∈ Z si pone nm = m + · · · + m se n ≥ 0, e il suo opposto altrimenti. Notiamo che qui stiamo usando la struttura di Z-modulo del gruppo abeliano M . (3) Similmente, il sottomodulo generato da X è X X L(X) = ai mi + nj m0j | mi , m0j ∈ M, ai ∈ A, nj ∈ Z . i j Se A è un anello con unità e M è un A-modulo unitario, allora ( ) X L(X) = AX = ai mi | mi ∈ M, ai ∈ A . i (4) La somma della famiglia di sottomoduli {Ni }i∈I è formata dalle somme finite del tipo ni1 + · · · + nik , con nij ∈ Nij . Il caso (4) è identico a quello degli spazi vettoriali, mentre i casi (2) e (3) ci dicono che nel caso in cui l’anello non ha l’unità occorre prestare attenzione alla differenza fra L(X), il sottomodulo generato da X, e AX, l’insieme delle combinazioni lineari di elementi di X. Quando A non ha unità, oppure M non è un A-modulo unitario, AX potrebbe non contenere X, e per questo la definizione di L(X) è un po’ più complicata. La somma di sottomoduli è un esempio di come si possano costruire dei moduli a partire da altri. Abbiamo già visto, nell’Esempio 1.6 la definizione di somma diretta di due moduli. Studiamo ora in generale l’operazione di somma diretta. Definizione 2.10. Sia {Mi }i∈I una famiglia di A-moduli. Y M= Mi S i∈I è l’insieme delle funzioni f : I → i∈I Mi tali che f (i) ∈ Mi per ogni i. M è in modo naturale un A-modulo, con le definizioni di somma e prodotto date da (f + g)(i) = f (i) + g(i) e (af )(i) = af (i) e viene detto il prodotto diretto della famiglia di moduli {Mi }i∈I . Se almeno uno degli Mi è diverso dal modulo nullo, allora anche M non è il modulo nullo: basta definire f (i) 6= 0 ∈ Mi , f (j) = 0 ∈ Mj , ∀j 6= i e notare che non abbiamo bisogno dell’assioma della scelta perché l’elemento 0 è un elemento distinto in ognuno dei gruppi Mj . Una variante interessante è costituita dal caso in cui si considerino le funzioni “quasi ovunque nulle” e cioè Definizione 2.11. Sia {Mi }i∈I una famiglia di A-moduli. M M= Mi S i∈I è l’insieme delle funzioni f : I → i∈I Mi tali che f (i) ∈ Mi per ogni i e quasi ovunque nulle, e cioè f (i) 6= 0 solo per un numero finito di indici. M è in modo naturale un A-modulo, con le definizioni di somma e prodotto date come sopra, e viene detto la somma diretta della famiglia di moduli {Mi }i∈I . 3. Moduli liberi 19 Dalle definizioni è immediato osservare che la somma diretta di una famiglia di moduli è un sottomodulo del loro prodotto diretto e che le due costruzioni coincidono quando l’insieme I degli indici è finito. In questo caso si usa la notazione M1 ⊕ · · · ⊕ Mn . 3. Moduli liberi Abbiamo considerato prima il modulo generato da un sottoinsieme. Possiamo chiederci, in analogia con gli spazi vettoriali, cosa voglia dire che degli elementi siano linearmente indipendenti: Definizione 3.1. Sia M un A-modulo e sia X un sottoinsieme di M . X si dice linearmente indipendente se per ogni sottoinsieme finito {x1 , . . . , xn } di elementi di X e per ai ∈ A a1 x1 + · · · + an xn = 0 =⇒ ai = 0, i = 1, . . . , n. Un insieme che non è linearmente indipendente si dice linearmente dipendente. Notiamo subito una differenza fondamentale con il caso degli spazi vettoriali: se {x1 , . . . , xn } sono linearmente dipendenti, non è detto che un elemento sia combinazione lineare degli altri. Infatti, per ottenere ciò si deve dividere per un coefficiente non nullo e questo non è sempre possibile in un anello. Per esempio, l’insieme {2, 3} non è indipendente in Z, ma nessuno dei due elementi è multiplo (intero!) dell’altro. Definizione 3.2. Sia M un A-modulo e sia X un sottoinsieme di M . X viene detto base di M se X è linearmente indipendente e genera M , cioè M = L(X). Notiamo che non è detto che l’insieme X sia finito, ma comunque L(X) è formato dalle combinazioni lineari finite di elementi di X. In altre parole, stiamo facendo algebra, e ci sono solo somme finite e non serie convergenti. Inoltre, la condizione di indipendenza lineare assicura che ogni elemento ha P un’unica espressione come P a m = b m allora combinazione lineare di elementi della base: se m = i i i i i i P i (ai − bi )mi = 0 e poiché gli mi sono linearmente indipendenti, ai = bi ∀i. Esempio 3.3. Studiamo la struttura di Z-modulo di M = Q>0 , il gruppo dei numeri razionali positivi con l’operazione di prodotto. Sia p1 , p2 , p3 , . . . la successione dei numeri primi 2, 3, 5, . . . , e cioè pi = i-esimo numero primo. Per il teorema di fattorizzazione unica, ogni numero razionale positivo a/b si può scrivere in modo unico come ∞ a Y αi = pi b i=1 dove gli αi sono numeri interi (positivi o negativi) e solo un numero finito di essi è diverso da zero. Inoltre la moltiplicazione di numeri razionali corrisponde alla somma degli esponenti nelle loro fattorizzazioni e quindi M Z M= i∈N è la somma diretta di infinite copie di Z, considerato come modulo su se stesso. Gli elementi 2, 3, 5, . . . formano una base del modulo M . 20 2. Moduli Esempio 3.4. Sia N = Z[x] il gruppo additivo dell’anello dei polinomi in una variabile a coefficienti interi, considerato come Z-modulo. Ogni polinomio di N si può scrivere in modo unico come ∞ X p(x) = ai xi i=0 dove gli ai sono numeri interi (positivi o negativi) e solo un numero finito di essi è diverso da zero. La somma di polinomi è data dalla somma dei coefficienti dei monomi dello stesso grado e quindi anche M N= Z i∈N è la somma diretta di infinite copie di Z, considerato come modulo su se stesso. Gli elementi 1, x, x2 , . . . formano una base del modulo N . In particolare, Q>0 ∼ = Z[x] come Z-moduli e quindi anche come gruppi abeliani. Dalla discussione precedente è facile scrivere in modo esplicito un isomorfismo, anche se non era facile immaginarlo senza pensare alla struttura di modulo. Il teorema di esistenza della base è uno dei teoremi fondamentali della teoria degli spazi vettoriali, ma non tutti i moduli hanno una base. Anzi, è possibile caratterizzare, a meno di isomorfismo, i moduli che hanno (almeno) una base, e gli esempi precedenti ci suggeriscono l’enunciato: Teorema 3.5. Sia A un anello con unità e M un A-modulo unitario. Allora M ha una base se e solo se M è isomorfo ad una somma diretta di copie di A (considerato come modulo su se stesso). Prima di dimostrare il teorema, facciamo alcuni commenti: se M soddisfa le condizioni del teorema, M si dice modulo libero. Per definizione dunque un modulo libero ha almeno una base, ma potrebbe averne anche più di una e occorre chiedersi se due basi diverse siano sempre in corrispondenza biunivoca. Se A = K è un campo, il numero di elementi in una base viene chiamato dimensione e sappiamo che la dimensione è un invariante di uno spazio vettoriale (anche quando è infinita) e cioè K n ∼ = K m =⇒ n = m. Se A è un anello arbitrario, il numero di elementi in una base viene detto rango del modulo libero M , ma il rango non è sempre un invariante di M (vedi Esercizio 3.8). Si può dimostrare che il rango è un invariante per tutti i moduli liberi su di un anello commutativo con unità (vedi, per esempio, [Hu], IV.2, pp. 180–186, fino al corollario IV.2.12). Dimostrazione del Teorema 3.5. L Per prima cosa dimostriamo che i∈I A ha una base. Poniamo ei (i) = 1, ei (j) = 0 per j 6= i, ∀i ∈ I L L e l’insieme X = {ei }i∈I è una base di i∈I A. Infatti, se a ∈ i∈I A, per definizione a è una funzione a : I → A quasi ovunque nulla e la somma X a= a(i)ei è finita e dunque X genera i∈I L i∈I A. Sia ora X a i ei = 0 3. Moduli liberi 21 una relazione lineare fra (un numero finito di) elementi di X. Calcolando in j ∈ I si ha X ai ei (j) = aj = 0 ∀j ∈ I e dunque tutti i coefficienti sono nulli. Allora X è una base. Notiamo che è essenziale nella dimostrazione che l’anello A abbia l’unità e che il moduloL sia unitario. Viceversa, sia X = {mi }i∈I una base di M e sia f : X → i∈I A la funzione data da f (mi ) = ei , dove gli elementi ei sono definiti come prima. È possibile estendere la definizione per linearità a tutto M ponendo X X X f (m) = f aj mj = aj f (mj ) = aj ej j e f è ben definita poiché l’espressione di m come combinazione lineare è unica. La verifica che f è un isomorfismo è lasciata per esercizio. ¤ La proprietà più importante dei moduli liberi è data dal seguente teorema, che ne spiega anche il nome: Teorema 3.6. Sia A un anello con unità e sia M un A-modulo unitario. M è un modulo libero se e solo se esiste un insieme non vuoto X e una funzione α : X → M con la seguente proprietà: per ogni A-modulo unitario N e per ogni funzione f : X → N , (∗) esiste un unico omomorfismo di A-moduli ϕ : M → N tale che ϕα = f . In altre parole, la proprietà (∗) afferma che è possibile completare in modo unico il seguente diagramma commutativo: X f ² ~} N α } } /M } ϕ La proprietà (∗) che caratterizza un modulo libero è un esempio di “proprietà universale”, cioè caratterizza un oggetto tramite una proprietà, che vale in tutte le situazioni di un certo tipo, cioè è “universale”. Caratterizzazioni del genere sono molto comuni nell’algebra moderna e vedremo molti altri esempi in seguito. Un oggetto che gode di una proprietà universale è unico (se esiste), e la dimostrazione dell’unicità dipende dal fatto che la proprietà è universale, piuttosto che dalla forma specifica della proprietà. Nel Capitolo 5 vedremo la formulazione categoriale di questo principio. Il teorema afferma quindi che un modulo libero è caratterizzato da una certa proprietà universale. In alcuni libri, questa è la definizione di modulo libero, e il teorema diventa allora la dimostrazione dell’esistenza di moduli liberi. Dimostrazione. Per prima cosa, dimostriamo che un modulo libero soddisfa la proprietà (∗). Se M è libero, sia X = {xi }i∈I una base di M e α : X → M l’inclusione. Sia ora f : X → N una qualunque funzione. Se m ∈ M , si può 22 2. Moduli scrivere m = Pn i=1 ai xi in modo unico, e allora poniamo ϕ(m) = n X ai f (xi ). i=1 ϕ è ben definita, soddisfa ϕα = f ed è immediato dimostrare che è un omomorfismo. Se ora ψ è un altro omomorfismo tale che ψα = f si ha, in particolare, che per tutti gli elementi della base ϕ(xi ) = ψ(xi ) e quindi ϕ e ψ coincidono. Dunque ϕ è unica. Dimostriamo ora che se M e N soddisfano entrambi la proprietà (∗) per lo stesso insieme X, allora M ∼ = N . Siano α : X → M e β : X → N le funzioni che esistono per ipotesi. Consideriamo per prima cosa il diagramma: X α ² }| M α /M | | | idM La funzione idM : M → M completa il diagramma e, per unicità, è l’unico omomorfismo a fare ciò. Perciò, se f : M → M è un omomorfismo tale f α = α, allora f = idM . Consideriamo ora il diagramma: α /M > } ϕ } } β } } ² }~} } ψ N X poiché M soddisfa (∗), esiste una unica ψ : M → N che fa commutare il diagramma e poiché anche N soddisfa (∗), esiste una unica ϕ : N → M che fa commutare il diagramma, e cioè ϕβ = α, ψα = β. Ma allora α = ϕβ = ϕ(ψα) = (ϕψ)α e cioè ϕψ = idM e allo stesso modo ψϕ = idN , e cioè ϕ e ψ sono omomorfismi inversi l’uno dell’altro e quindi M ∼ = N . Dunque ogni modulo che soddisfi (∗) è isomorfo ad un modulo libero di base X. ¤ La conseguenza più importante di questo teorema è il seguente: Corollario 3.7. Sia M un A-modulo libero sull’insieme X. Allora per assegnare un omomorfismo f : M → N è sufficiente assegnare una funzione g : X → N . La dimostrazione è ovvia. Notiamo che questo corollario è l’anologo del teorema che dice che per assegnare una funzione lineare su uno spazio vettoriale è sufficiente assegnare i valori su una base. In effetti uno spazio vettoriale su un corpo K è un K-modulo libero su una sua base. Abbiamo visto che se due moduli liberi hanno la stessa base (o meglio, in corrispondenza biunivoca) allora sono isomorfi. Il viceversa è vero per moduli su anelli commutativi con unità, ma non è vero in generale. Ecco un esempio di un modulo libero che ha basi di cardinalità diversa. 4. Prodotti tensoriali 23 Esercizio 3.8. Sia A un anello con unità, e F un A-modulo libero con una base infinita numerabile X = {e1 , e2 , . . . }. Per esempio si può prendere A = R e F uno spazio vettoriale di dimensione infinita, oppure A = Z e F = Z[x] o F = Q>0 (vedere Esempi 3.3 e 3.4). Poniamo B = HomA (F, F ) l’insieme di tutti gli omomorfismi di A-moduli di F in se stesso. (1) Dimostrare che B è un anello (non commutativo). (2) Dimostrare che per ogni n ∈ N c’è una base di B, come modulo su se stesso, composta da n elementi. Suggerimento: {1B } è una base formata da 1 elemento; {f1 , f2 } è una base formata da due elementi, ponendo f1 (e2n ) = en , f1 (e2n−1 ) = 0 e f2 (e2n ) = 0, f2 (e2n−1 ) = en . Infatti, per ogni g ∈ B si ha g = g1 f1 + g2 f2 dove g1 (en ) = g(e2n ) e g2 (en ) = g(e2n−1 ). Trovare in modo esplicito una base formata da n elementi (almeno per n = 3 e n = 4). 4. Prodotti tensoriali D’ora in poi tutti gli anelli sono commutativi con unità. Se M è un A-modulo, possiamo addizionare i suoi elementi fra di loro, e possiamo moltiplicarli per elementi di A, ma non sappiamo come moltiplicare fra loro due elementi. Però vi sono situazioni in cui è possibile moltiplicare gli elementi di un modulo M per gli elementi di un altro modulo N , ottenendo come risultato elementi di un terzo modulo L. Per esempio, se A = C∞ (Rn ) è l’anello delle funzioni P ∂ di classe C∞ , M è il modulo dei campi di vettori fi e N è il modulo delle 1∂x i P P forme differenziali pi dxi , allora il prodotto fi pi è definito, indipendentemente dalle coordinate locali usate, ed appartiene ad A. Si può definire in modo simile il prodotto di un campo di vettori per una r-forma differenziale, e il risultato è una (r − 1)-forma differenziale. Una moltiplicazione definita su due moduli M e N a valori in L non è altro che una mappa bilineare, e cioè una mappa µ : M × N → L, scritta di solito come µ(x, y) = xy tale che (x1 + x2 )y = x1 y + x2 y ∀x1 , x2 ∈ M, ∀y ∈ N, x(y1 + y2 ) = xy1 + xy2 ∀x ∈ M, ∀y1 , y2 ∈ N, (ax)y = x(ay) = a(xy) ∀x ∈ M, ∀y ∈ N, ∀a ∈ A. Se ϕ : L → L0 è un omomorfismo, è semplice verificare che ϕ ◦ µ definisce una moltiplicazione con valori in L0 . Dunque c’è un modo per ottenere nuove moltiplicazioni a partire di quelle che si hanno già mediante omomorfismi, e ci si può chiedere se esista una “moltiplicazione universale”, e cioè una moltiplicazione dalla quale si possono dedurre tutte le altre. La risposta è sı̀, e la costruzione di questa moltiplicazione prende il nome di prodotto tensoriale. Definizione 4.1. Siano M , N due A-moduli. Il prodotto tensoriale di M e N , denotato con M ⊗A N , è un A-modulo con una mappa bilineare α : M × N → M ⊗A N, 24 2. Moduli scritta α(x, y) = x ⊗ y, tale che per ogni A-modulo L e per ogni mappa bilineare µ : M × N → L esiste un unico omomorfismo ϕ : M ⊗A N → L tale che µ(x, y) = ϕ(x ⊗ y). In altre parole, la definizione afferma che è possibile completare in modo unico il seguente diagramma commutativo: µ M ×N α v ² v M ⊗A N v v / v; L ϕ La definizione appena data è tramite una “proprietà universale”, come la definizione di modulo libero. Come abbiamo già osservato, il motivo dell’unicità è categoriale (vedi Capitolo 5), e perciò la dimostrazione è identica a quella del Teorema 3.6. L’esistenza del prodotto tensoriale sarà dimostrata mediante una costruzione esplicita. Cominciamo con l’unicità: sia P = M ⊗A N e sia α : M × N → P la mappa bilineare universale. Se consideriamo il diagramma α M ×N α ² {w w P w w / wP idP osserviamo che l’identità idP : P → P fa commutare il diagramma, ma poiché P è il prodotto tensoriale, per unicità, solo idP fa commutare il diagramma. Dunque se f : P → P è un qualunque omomorfismo tale che f α = α, allora f = idP . Siano ora P e Q due moduli che siano entrambi un prodotto tensoriale dei moduli M e N e siano α : M × N → P e β : M × N → Q le due mappe bilineari universali. Consideriamo il diagramma α / w; P ww w ww β ² w ww ψ Q {w M ×N ϕ Poiché Q è il prodotto tensoriale di M e N , esiste una unica ϕ : Q → P che fa commutare il diagramma e poiché anche P è il prodotto tensoriale di M e N , esiste una unica ψ : P → Q che fa commutare il diagramma, e cioè ϕβ = α, ψα = β. Da α = ϕβ = ϕ(ψα) = (ϕψ)α si ha ϕψ = idP e allo stesso modo ψϕ = idQ , e cioè ϕ e ψ sono omomorfismi inversi l’uno dell’altro e quindi P ∼ = Q. Costruiamo ora il prodotto tensoriale dei due moduli M e N . Sia X = M × N l’insieme di tutte le coppie (x, y) con x ∈ M e y ∈ N e sia S il modulo libero di base X. Notiamo che, anche se M e N sono finitamente generati, S in genere non 4. Prodotti tensoriali 25 lo è. Sia ora S0 il sottomodulo di S generato da tutti gli elementi del tipo (x1 + x2 , y) − (x1 , y) − (x2 , y), (x, y1 + y2 ) − (x, y1 ) − (x, y2 ), a(x, y) − (ax, y), a(x, y) − (x, ay). Allora M ⊗A N = S/S0 , e la mappa universale α : M × N → M ⊗A N è data dall’inclusione di M × N in S seguita dalla proiezione canonica, in formule α(x, y) = x ⊗ y = (x, y) + S0 . Dimostriamo ora che α cosı̀ definita è bilineare ed ha la proprietà universale. La definizione di S0 è data proprio in modo da forzare la bilinearità di α: α(x1 + x2 , y) = (x1 + x2 , y) + S0 = (x1 + x2 , y) − [(x1 + x2 , y) − (x1 , y) − (x2 , y)] + S0 = (x1 , y) + (x2 , y) + S0 = ((x1 , y) + S0 ) + ((x2 , y) + S0 ) = α(x1 , y) + α(x2 , y) e analogamente si verificano le altre condizioni per la bilinearità. Sia ora µ : M × N → L una mappa bilineare. Definiamo ϕ : S → L come ϕ(x, y) = µ(x, y). Poiché S è un modulo libero, questa definizione determina una unica mappa lineare da S a L. Se ora calcoliamo ϕ sui generatori di S0 troviamo che essi appartengono tutti al nucleo. Per esempio, ϕ ((x1 + x2 , y) − (x1 , y) − (x2 , y)) = = ϕ(x1 + x2 , y) − ϕ(x1 , y) − ϕ(x2 , y) per la linearità di ϕ = µ(x1 + x2 , y) − µ(x1 , y) − µ(x2 , y) = 0 per la bilinearità di µ Il calcolo è simile per gli altri generatori e ϕ induce una mappa su S/S0 = M ⊗A N , che è la mappa cercata. È importante osservare che non tutti gli elementi di M ⊗A N sono del tipo x ⊗ y, in quanto questi sono solo i generatori. Il tipico elemento di un prodotto tensoriale è della forma X ai (xi ⊗ yi ) cioè è una combinazione lineare di generatori. Dunque per definire una mappa da un prodotto tensoriale in un modulo si dovrebbe dare la formula per tutti gli elementi e non solo per i generatori. In questo però sta proprio l’utilità della proprietà universale: per dare una mappa lineare da M ⊗A N a L, basta dare una mappa bilineare da M ×N (cioè dall’insieme delle coppie) a L, e si ottiene la mappa indotta dal prodotto tensoriale a L. Useremo questa osservazione nel seguito tutte le volte che definiremo una mappa con dominio un prodotto tensoriale. In effetti, la costruzione esplicita del prodotto tensoriale non sarà mai usata. 26 2. Moduli Esercizio 4.2. Sia {x1 , . . . , xm } un insieme di generatori di M e {y1 , . . . , yn } un insieme di generatori di N . Dimostrare che gli elementi {xi ⊗ yj } per i = 1, . . . , m e j = 1, . . . , n sono un insieme di generatori per M ⊗A N , che è quindi finitamente generato quando M e N sono finitamente generati. Esercizio 4.3. Se M e N sono due K-spazi vettoriali di dimensione finita, allora M ⊗K N è una spazio vettoriale su K tale che dim(M ⊗K N ) = dim M · dim N. Esempio 4.4. Se M è un A-modulo, e B è un anello che è anch’esso un A-modulo, allora M ⊗A B, ha una struttura di A-modulo e anche una struttura di B-modulo, data da β(x ⊗ b) = x ⊗ βb, β ∈ B. Una tipica situazione in cui questo capita è quando A è un sottoanello di B, per esempio A = Z e B = Q, o più in generale A = dominio d’integrità e B = campo dei quozienti di A. Vediamo alcuni casi: (1) se M è uno Z-modulo, allora M ⊗Z Q è un Q-spazio vettoriale; per esempio, Zn ⊗Z Q ∼ = Qn , ma Zn ⊗Z Q = 0. Infatti, se x ∈ Zn si ha µ ¶ 1 1 1 1 x⊗ =x⊗n· =n x⊗ = nx ⊗ =0 b bn bn bn e poiché ogni elemento è combinazione lineare (a coefficienti interi) di elementi 1 del tipo x ⊗ , si ha la tesi. Dunque il prodotto tensoriale può essere nullo b anche se entrambi i fattori sono non nulli; (2) se V è uno spazio vettoriale sul campo K e L è un’estensione di K, allora V ⊗K L è uno spazio vettoriale su L. Osserviamo che dimL (V ⊗K L) = dimK V e dimK (V ⊗K L) = [L : K] dimK V . Nel caso K = R e L = C, questa operazione è detta la complessificazione di V . Esercizio 4.5. Siano M , N , e P tre A-moduli. Dimostrare che ci sono degli isomorfismi (canonici) (1) M ⊗A N ∼ = N ⊗A M ; (2) (M ⊗A N ) ⊗A P ∼ = M ⊗A (N ⊗A P ); (3) (M ⊕ N ) ⊗A P ∼ = (M ⊗A P ) ⊕ (N ⊗A P ); (4) A ⊗A M ∼ = M. ([AM], Proposition 2.14). Dunque il prodotto tensoriale di A-moduli è commutativo e associativo, si distribuisce rispetto alla somma diretta e A (come A-modulo) è l’elemento neutro. Definizione 4.6. Sia M un A-modulo. Il modulo HomA (M, A) viene detto modulo duale di M e viene denotato M ∗ . Esempio 4.7. Se M è uno spazio vettoriale, il modulo duale è quello che si chiama lo spazio vettoriale duale, e sappiamo che c’è una mappa bilineare M ∗ × M → K, data da (f, x) 7→ f (x) che è non degenere, e che induce un omomorfismo canonico ϕ : M → M ∗∗ definito da ϕ(x)(f ) = f (x). Se dim M è finita, ϕ è un isomorfismo, ma se dim M non è finita, M e M ∗∗ non sono mai isomorfi (Esercizio 12). 4. Prodotti tensoriali 27 Esempio 4.8. È importante osservare che in generale M 6∼ = M ∗ . Per esempio, se ∗ M = Zn come Z-modulo, allora Zn = 0. Esempio 4.9. Il modulo M ⊗A . . .⊗A M (r fattori) è denotato T r (M ). Se M è uno spazio vettoriale di dimensione finita, T r (M ) è lo spazio dei tensori controvarianti di grado r. T r (M ) è di importanza fondamentale per le operazioni dell’algebra multilineare, ed ha la ovvia proprietà universale: per ogni µ : M × · · · × M → L multilineare (in r variabili), esiste una unica mappa lineare f : T r (M ) → L tale che per ogni x1 , . . . , xr ∈ M si abbia f (x1 ⊗ . . . ⊗ xr ) = µ(x1 , . . . , xr ). Costruiamo ora il prodotto simmetrico e il prodotto esterno come quozienti del prodotto tensoriale. Esempio 4.10. Consideriamo il modulo M ⊗A M , e sia N il sottomodulo generato da tutti gli elementi del tipo x ⊗ y − y ⊗ x. Il quoziente (M ⊗A M )/N si dice il quadrato simmetrico di M , e viene denotato con S 2 M . È universale per tutte le mappe bilineari simmetriche definite su M × M , e cioè per tutte le moltiplicazioni commutative su M . Si può anche definire, allo stesso modo, la r-esima potenza simmetrica S r M : è il quoziente di T r (M ) per il sottomodulo generato da tutti i tensori del tipo x1 ⊗ . . . ⊗ xi ⊗ xi+1 ⊗ . . . ⊗ xr − x1 ⊗ . . . ⊗ xi+1 ⊗ xi ⊗ . . . ⊗ xr per i = 1, . . . , r − 1. Per esempio, se V è uno spazio vettoriale di dimensione n su K, e V ∗ = Hom(V, K) è il modulo (K-spazio vettoriale) delle forme lineari (cioè, polinomi omogenei di primo grado) in n variabili t1 , . . . , tn , allora S r (V ∗ ) è il modulo (K-spazio vettoriale) delle forme (cioè, polinomi omogenei) di grado r L∞ nelle variabili t1 , . . . , tn . Si ha, in questo caso, K[t1 , . . . , tn ] = r=0 S r (V ∗ ), dove si pone, per convenzione, S 0 (V ∗ ) = K. Esempio 4.11. Il prodotto esterno è il caso in cui la moltiplicazione è anticommutativa: consideriamo ancora M ⊗A M e P il sottomodulo generato da tutti gli elementi del tipo x ⊗ x. Il quoziente (M ⊗A M )/P si dice il prodotto esterno di M V2 V2 con se stesso e si denota M . L’immagine di x ⊗ y in M si scrive x ∧ y e da 0 = (x + y) ∧ (x + y) = x ∧ x + x ∧ y + y ∧ x + y ∧ y = x ∧ y + y ∧ x V2 si ha che x ∧ y = −y ∧ x. Dunque M è universale per tutte le mappe bilineari antisimmetriche V definite su M × M , e cioè tali che f (x, y) = −f (y, x). La r-esima r potenza esterna M è definita in modo analogo: è il quoziente di T r (M ) per il sottomodulo generato da tutti i tensori del tipo x1 V ⊗ . . . ⊗ xr in cui (almeno) due r fattori sono uguali. L’immagine di x1 ⊗ . . . ⊗ xr in M è denotata x1 ∧ · · · ∧ xr , ed è nulla se almeno due fattori coincidono. Dunque il prodotto “anticommuta” e cioè x1 ∧ · · · ∧ xi ∧ xi+1 ∧ · · · ∧ xr = −x1 ∧ · · · ∧ xi+1 ∧ xi ∧ · · · ∧ xr . Esercizio 4.12.VSia M finitamente generato, e siano x1 , . . . , xn generatori per M . r Dimostrare che M è finitamente generato, e un insieme di generatori è dato da xi1 ∧ xi2 ∧ · · · ∧ xir , per 1 ≤ i1 < i2 < · · · < ir ≤ n. Vr In particolare, M = 0 per r > n.µDimostrare che, se V è uno spazio vettoriale ¶ Vr n di dimensione n, allora dim V = , per r ≤ n. r 28 2. Moduli 5. Successioni esatte Sappiamo che sia il prodotto tensoriale che Hom commutano con le somme dirette finite (Esercizio 4.5 e Esercizio 9). La relazione fra Hom e prodotto tensoriale è più complicata e per essere compresa a fondo necessita di alcune nozioni di algebra omologica. Per la terminologia su categorie e funtori, si veda il Capitolo 5. Definizione 5.1. Una successione di A-moduli e omomorfismi / Mi−1 ... fi−1 / Mp fi / Mi+1 fi+1 / ... si dice esatta in Mi se vale ker fi+1 = Im fi ; si dice semplicemente esatta se è esatta in Mi per ogni i. Nella definizione di successione esatta gli Mi potrebbero essere gruppi (non necessariamente abeliani), anelli, moduli, spazi vettoriali e le funzioni fi omomorfismi appropriati. Nel seguito vedremo solo il caso di A-moduli, anche se il caso dei gruppi abeliani è molto simile. Una successione esatta corta è una successione esatta del tipo 0 /N f /M g /P /0 Dire che la successione è esatta significa che • f è iniettiva, • g è suriettiva, e • ker g = Im f . Questo in particolare implica che M/N ∼ = P . Le successioni esatte sono lo strumento fondamentale dell’algebra omologica e uno dei filoni di ricerca dell’algebra moderna è quello di caratterizzare un anello A sulla base delle proprietà delle successioni esatte di A-moduli. Sia F : ModA → ModA un funtore. F trasforma successioni in successioni e ci si può chiedere se l’immagine di una successione esatta sia ancora esatta. Un funtore si dice esatto se trasforma tutte le successioni esatte in successioni esatte. Teorema 5.2. Un funtore F è esatto se e solo se trasforma tutte le successioni esatte corte in successioni esatte corte. Dimostrazione. Una implicazione è ovvia. Supponiamo ora che F trasformi tutte le successioni esatte corte in successioni esatte corte, e sia / Mi−1 fi−1 / Mi ... fi / Mi+1 fi+1 / ... una successione esatta e ... / F (Mi−1 ) fi−1 ∗ fi ∗ / F (Mi ) f / F (Mi+1 ) i+1 ∗ / . . . la sua immagine mediante F . Dobbiamo dimostrare che Im fi−1 ∗ = ker fi ∗ . Poniamo Ki = ker fi e Pi = Im fi e consideriamo le successioni esatte corte 0 / Ki j / Mi fi / Pi /0 5. Successioni esatte 29 dove j è l’inclusione. Per ipotesi sono esatte le successioni 0 0 j∗ / F (Ki ) j∗ / F (Ki−1 ) / F (Mi ) / F (Mi−1 ) fi ∗ / F (Pi ) fi−1 ∗ /0 / F (Pi−1 ) /0 e dunque Im fi−1 ∗ = F (Pi−1 ) e ker fi ∗ = F (Ki ). Ma allora Im fi−1 ∗ = F (Pi−1 ) = F (Ki ) = ker fi ∗ perché per ipotesi Pi−1 = Ki . ¤ Studiamo ora le proprietà di esattezza del prodotto tensoriale e di Hom. Se f1 : M1 → N1 e f2 : M2 → N2 sono due omomorfismi di moduli, si può definire un omomorfismo f1 ⊗ f2 : M1 ⊗ M2 → N1 ⊗ N2 nel modo seguente: sia µ : M1 × M2 → N1 ⊗ N2 la mappa definita da µ(m1 , m2 ) = f1 (m1 ) ⊗ f2 (m2 ). È immediato verificare (dalle proprietà del prodotto tensoriale N1 ⊗ N2 ) che µ è bilineare e quindi induce una mappa lineare definita su M1 ⊗ M2 , che donotiamo con f1 ⊗ f2 . La proprietà caratteristica di questo omomorfismo è che (f1 ⊗ f2 )(m1 ⊗ m2 ) = f1 (m1 ) ⊗ f2 (m2 ). Sia ora N un A-modulo fissato. Il funtore TN : ModA → ModA è definito da: TN (M ) = M ⊗ N, TN (f ) = f ⊗ idN , ∀M ∈ ModA ; ∀f : M → P omomorfismo di A-moduli. Teorema 5.3. Se la successione (1) P f /M g /0 /Q è esatta allora la successione (2) P ⊗N f ⊗idN / M ⊗ N g⊗idN / Q ⊗ N /0 è esatta. Si riassume l’enunciato di questo teorema dicendo che il funtore TN è esatto a destra. In generale TN non è esatto, e cioè anche se f è iniettiva, non è detto che f ⊗ idN sia iniettiva. Per esempio, la successione 0 /Z f /Z g / Z2 /0 dove f (n) = 2n è esatta, ma f ⊗id / Z ⊗ Z2 Z ⊗ Z2 è la mappa nulla, e poiché Z ⊗ Z2 ∼ = Z2 6= 0 la mappa f ⊗ id non è iniettiva. Dimostrazione. • g ⊗ idN è suriettiva. Sia q ⊗ n ∈ Q ⊗ N . Poiché g : M → Q è suriettiva, esiste m ∈ M tale che g(m) = q e quindi q ⊗ n = (g ⊗ idN )(m ⊗ n) appartiene all’immagine di g ⊗ idN . Il modulo Q ⊗ N è generato dagli elementi della forma q ⊗ n, con q ∈ Q e n ∈ N , e tutti i generatori appartengono all’immagine e dunque g ⊗ idN è suriettiva. 30 2. Moduli • Im(f ⊗ idN ) ⊆ ker(g ⊗ idN ). Sia p ⊗ n ∈ P ⊗ N . Allora (g ⊗ idN )(f ⊗ idN )(p ⊗ n) = (g ⊗ idN )(f (p) ⊗ n) = g(f (p)) ⊗ n = 0 perché g(f (p)) = 0, per esattezza della (1). Osserviamo che dire che una successione è esatta implica che la composizione di due omomorfismi consecutivi è nulla, e questa proprietà si conserva automaticamente per funtorialità. Dunque questa verifica era in effetti inutile. • ker(g ⊗ idN ) ⊆ Im(f ⊗ idN ). Questa è l’unica parte non immediata della dimostrazione. Costruiamo un omomorfismo ϕ : Q ⊗ N → (M ⊗ N )/ Im(f ⊗ idN ) tale che la composizione ϕ◦(g⊗idN ) coincide con la proiezione naturale sul quoziente π : M ⊗ N → (M ⊗ N )/ Im(f ⊗ idN ). Un disegno aiuta a capire: P ⊗N f ⊗idN / M ⊗N g⊗idN / Q⊗N ll l l lll π lll ϕ ² vlll (M ⊗ N )/ Im(f ⊗ idN ) /0 Allora se x ∈ ker(g ⊗ idN ) si ha π(x) = ϕ ◦ (g ⊗ idN )(x) = 0 e dunque x ∈ ker π = Im(f ⊗ idN ), e cioè la tesi. Per definire ϕ, definiamo come sempre una mappa bilineare ψ su Q × N . Se (q, n) ∈ Q × N , per la suriettività di g esiste m ∈ M tale che g(m) = q. Definiamo allora ψ(q, n) = m ⊗ n + Im(f ⊗ idN ). Se anche m0 ∈ M è tale che g(m0 ) = q, allora g(m − m0 ) = 0 e, per l’esattezza della (1), m − m0 ∈ Im f . Dunque m ⊗ n + Im(f ⊗ idN ) = m0 ⊗ n + Im(f ⊗ idN ) e cioè ψ è ben definita. È immediato verificare che ψ è bilinearee che quindi induce la mappa lineare ϕ. La verifica che ϕ ◦ (g ⊗ idN ) = π è un esercizio. ¤ Il prodotto tensoriale dipende da due variabili, ma come sappiamo dall’Esercizio 4.5, l’ordine del prodotto non conta. Anche Hom dipende da due variabili, ma in questo caso l’ordine conta (Capitolo 5, Esempio 1.6 (5) e (6)). Sia N un A-modulo fissato. Il funtore hN : ModA → ModA è definito da: hN (M ) = Hom(N, M ), hN (f ) = f ◦ ϕ, ∀M ∈ ModA ; ∀f : M → P e ϕ ∈ Hom(N, M ). In generale, l’omorfismo indotto hN (f ) si denota con f∗ . Teorema 5.4. La successione (3) 0 /P f /M g /Q è esatta se e solo se la successione (4) 0 / Hom(N, P ) è esatta per ogni A-modulo N . f∗ / Hom(N, M ) g∗ / Hom(N, Q) 5. Successioni esatte 31 Si riassume l’enunciato di questo teorema dicendo che il funtore hN è esatto a sinistra. In generale hN non è esatto, e cioè anche se g è suriettiva, non è detto che g∗ sia suriettiva. Per esempio, la successione /Z 0 f g /Z / Z2 /0 dove f (n) = 2n è esatta, ma g∗ Hom(Z2 , Z) / Hom(Z2 , Z2 ) non è suriettiva poiché Hom(Z2 , Z) = 0 e Hom(Z2 , Z2 ) ∼ = Z2 6= 0. Dimostrazione. Supponiamo che la (3) sia esatta. • f∗ è iniettiva. Se ϕ ∈ ker f∗ , allora f ◦ ϕ ≡ 0 e cioè Im ϕ ⊆ ker f = {0} poiché f è iniettiva. Dunque ϕ è la mappa nulla e cioè f∗ è iniettiva. • Im(f∗ ) ⊆ ker(g∗ ). Come abbiamo già osservato, dire che una successione è esatta implica che la composizione di due omomorfismi consecutivi è nulla, e questa proprietà si conserva automaticamente per funtorialità. • ker(g∗ ) ⊆ Im(f∗ ). Sia ϕ : N → M tale che g ◦ ϕ = 0. Dobbiamo dimostrare che esiste ψ : N → P tale che ϕ = f ◦ ψ. Un disegno aiuta a capire: 0 f /M O g /Q > ~ @ ~~ ϕ ~~ @ ψ @ ~~~ 0 N /P `@ Sia n ∈ N . Poiché g(ϕ(n)) = 0 si ha che ϕ(n) ∈ ker g = Im f e dunque esiste p ∈ P tale che ϕ(n) = f (p). Poiché f è iniettiva, tale p è necessariamente unico e definiamo allora ψ(n) = p. Allora ϕ = f ◦ψ per costruzione, e la verifica che ψ cosı̀ definito sia un omomorfismo è un esercizio. Supponiamo ora che la (4) sia esatta per ogni A-modulo N . In particolare possiamo porre N = A e sappiamo che per ogni A-modulo M c’è un isomorfismo canonico M ∼ = Hom(A, M ), in cui all’elemento m ∈ M corrisponde l’omomorfismo ϕm : A → M definito da ϕm (1) = m (Esercizio 8). Sia f : P → M un omomorfismo e sia f∗ l’omomorfismo indotto da Hom(A, P ) a Hom(A, M ). Sia p ∈ P e sia ϕp ∈ Hom(A, P ) come descritto nell’isomorfismo precedente. Si ha f∗ (ϕp (1)) = f (ϕp (1)) = f (p) = ϕf (p) (1) e cioè f∗ (ϕp ) = ϕf (p) . Dunque applicando l’isomorfismo la successione (4), con N = A, riproduce la (3). Poiché la (4) è esatta per ipotesi, lo è anche la (3). ¤ Vediamo ora l’altro funtore Hom, quello controvariante. Sia N un A-modulo fissato. Il funtore hN : Mod◦A → ModA è definito da: hN (M ) = Hom(M, N ), N h (f ) = ϕ ◦ f, ∀M ∈ ModA ; ∀f : P → M e ϕ ∈ Hom(M, N ). In generale, l’omorfismo indotto hN (f ) si denota con f ∗ . 32 2. Moduli Teorema 5.5. La successione (5) g Q f /M /P /0 è esatta se e solo se la successione (6) 0 f∗ / Hom(P, N ) / Hom(M, N ) g∗ / Hom(Q, N ) è esatta per ogni A-modulo N . Si riassume l’enunciato di questo teorema dicendo che il funtore hN è esatto a sinistra. Notiamo che la (5) è in realtà una successione in Mod◦A , che si scrive 0 /P ◦ f◦ /M◦ g◦ / Q◦ e quindi è giusto dire che hN è esatto a sinistra. In generale hN non è esatto, e cioè anche se g ◦ è suriettiva (e cioè g iniettiva), non è detto che g ∗ sia suriettiva. Per esempio, la successione /Z 0 g /Z f / Z2 /0 dove g(n) = 2n è esatta, ma g∗ / Hom(Z, Z) Hom(Z, Z) non è suriettiva. Infatti Hom(Z, Z) ∼ = Z e se ϕ ∈ Hom(Z, Z) è data da ϕ(1) = a, allora g ∗ (ϕ)(1) = 2a è sempre pari. Dunque ψ ∈ Hom(Z, Z) data da ψ(1) = 1 non può essere nell’immagine di g ∗ . Dimostrazione. Supponiamo che la (5) sia esatta. • f ∗ è iniettiva. Se ϕ ∈ ker f ∗ , allora ϕ ◦ f ≡ 0 e cioè Im f ⊆ ker ϕ e poiché f è suriettiva, ker ϕ = P e cioè ϕ è la mappa nulla. • Im(f ∗ ) ⊆ ker(g ∗ ). Come abbiamo già osservato, dire che una successione è esatta implica che la composizione di due omomorfismi consecutivi è nulla, e questa proprietà si conserva automaticamente per funtorialità. • ker(g ∗ ) ⊆ Im(f ∗ ). Sia ϕ : M → N tale che ϕ ◦ g = 0. Dobbiamo dimostrare che esiste ψ : P → N tale che ϕ = ψ ◦ f . Un disegno aiuta a capire: g /M f /P Q@ @@ ~ @@ ϕ ~ @ ~ 0 @@ à ² ~~ ψ N /0 Sia p ∈ P . Poiché f è suriettiva, esiste m ∈ M tale che f (m) = p. Definiamo allora ψ(p) = ϕ(m). Se anche m0 ∈ M è tale che f (m0 ) = p, allora m − m0 ∈ ker f = Im g e quindi ϕ(m − m0 ) = 0. Allora ψ è ben definita. ϕ = ψ ◦ f per costruzione, e la verifica che ψ cosı̀ definito sia un omomorfismo è un esercizio. Supponiamo ora che la (6) sia esatta per ogni A-modulo N . • f è suriettiva. Sia N = P/ Im f e sia π : P → N la proiezione sul quoziente. Per ipotesi f ∗ : Hom(P, N ) → Hom(M, N ) è iniettiva e poiché f ∗ (π) = π ◦ f = 0 deve essere π = 0. Ma allora N = 0 e cioè Im f = P . • Im(g) ⊆ ker(f ). Poniamo N = P . Allora f ◦ g = g ∗ ◦ f ∗ (idP ) = 0 perché la (6) è esatta. 5. Successioni esatte 33 • ker(f ) ⊆ Im(g). Poniamo N = M/ Im g e sia π : M → N la proiezione sul quoziente. g /M f /P Q@ @@ ~ @@ π ~ @ ~ 0 @@ à ² ~~ ψ N /0 Poiché g ∗ (π) = π ◦ g = 0, per l’esattezza della (6) si ha che π ∈ Im f ∗ e cioè esiste ψ : P → N tale che π = f ∗ (ψ) = ψ ◦ f . Se ora m ∈ M è tale che f (m) = 0 si ha π(m) = ψ ◦ f (m) = 0 e quindi m ∈ ker π = Im g. ¤ Dopo aver studiato le proprietà di esattezza del prodotto tensoriale e di Hom, torniamo alla relazione che c’è fra questi due funtori. Teorema 5.6. Siano M , N e P tre A-moduli. Allora HomA (M ⊗A N, P ) ∼ = HomA (M, HomA (N, P )) Dimostrazione. La dimostrazione consiste nell’usare correttamente la proprietà universale del prodotto tensoriale per definire l’isomorfismo richiesto. Per brevità non scriviamo il suffisso A in Hom e nel prodotto tensoriale. Definiamo una mappa α : Hom(M ⊗ N, P ) → Hom(M, Hom(N, P )) nel modo seguente: se f : M ⊗ N → P è una mappa lineare, αf deve associare ad ogni elemento di M una mappa lineare da N a P . Poniamo allora [(αf )(x)](y) = f (x ⊗ y), ∀x ∈ M, ∀y ∈ N Le seguenti verifiche sono lasciate per esercizio: (1) per ogni x ∈ M e ogni f ∈ Hom(M ⊗ N, P ), la mappa (αf )(x) : N → P è lineare; (2) (αf ) : M → Hom(N, P ) è lineare; (3) α è lineare; Per dimostrare che α è un isomorfismo basta trovare l’omomorfismo inverso. Definiamo β : Hom(M, Hom(N, P )) → Hom(M ⊗ N, P ) ponendo (βg)(x, y) = [g(x)](y), dove x ∈ M , y ∈ N e g ∈ Hom(M, Hom(N, P )). La mappa βg è bilineare su M × N e definisce, per la proprietà universale del prodotto tensoriale, un omomorfismo da M ⊗ N a P . Verificare che (esercizio) (4) β è lineare; (5) αβ e βα sono le rispettive identità, e quindi sono l’inversa l’una dell’altra. Dunque α è un isomorfismo. ¤ Nel caso particolare P = A, si può riscrivere la tesi come (M ⊗A N )∗ ∼ = HomA (M, N ∗ ), formula che calcola il duale di un prodotto tensoriale di due moduli. 34 2. Moduli Esercizio 5.7. Siano M e N sono spazi vettoriali di dimensione finita. Scrivere un isomorfismo esplicito f : M ∗ ⊗ N → Hom(M, N ). Scrivere esplicitamente l’isomorfismo inverso. Fissiamo un modulo N e consideriamo i funtori TN e hN . Il teorema precedente afferma che per ogni coppia di moduli M e P c’è un isomorfismo naturale Hom(TN (M ), P ) ∼ = Hom(M, hN (P )). Nel linguaggio delle categorie si dice che il funtore TN è l’aggiunto sinistro del funtore hN , e il funtore hN è l’aggiunto destro del funtore TN . Un semplice argomento mostra che ogni funtore aggiunto sinistro è esatto a destra e ogni funtore aggiunto destro è esatto a sinistra. Esercizi In tutti gli esercizi seguenti, A indica un anello unitario. In generale, non è necessario assumere che A sia commutativo, tranne quando indicato. (1) Ogni A-modulo ciclico M è isomorfo, come A-modulo a A/J, dove J è un ideale (sinistro) di A. (2) Un A-modulo M non nullo si dice semplice se i suoi soli sottomoduli sono {0} e M. (a) Ogni A-modulo semplice è ciclico. (b) Se M è semplice, allora ogni endomorfismo (di A-modulo) è nullo oppure è un isomorfismo. (3) Se f : M → M è un omomorfismo di A-moduli tale che f 2 = f allora M = ker f ⊕ Im f (4) Se f : M → N e g : N → M sono omomorfismi tali che gf = 1M , allora N = Im f ⊕ ker g. (5) Se M è un gruppo abeliano e n ∈ N un intero positivo tale che nx = 0 per ogni x ∈ M , allora c’è una struttura di Zn -modulo naturale su M . (6) Sia M un modulo sull’anello commutativo A. Per m ∈ M poniamo Om = {a ∈ A | am = 0} (a) Om è un ideale di A. Se Om 6= 0, m viene detto un elemento di torsione di M . (b) Se A è un dominio d’integrità, l’insieme T (M ) di tutti gli elementi di torsione di M è un sottomodulo di M . (c) Mostrare, con un esempio, che (b) può essere falso per un anello commutativo A che non è un dominio. Nei prossimi punti, A è un dominio d’integrità. (d) Se f : M → N è un omomorfismo, allora f (T (M )) ⊆ T (N ); quindi la restrizione fT di f a T (M ) è un omomorfismo di moduli T (M ) → T (N ). (e) Se f : M → N è un omomorfismo iniettivo, anche fT è iniettivo. Esercizi 35 (f) Se f : M → N è un omomorfismo suriettivo, allora fT : T (M ) → T (N ) può non essere suriettivo. (g) Se f : M → N è un isomorfismo, anche fT è un isomorfismo. (7) Sia A un PID (quindi in particolare un dominio d’integrità), M un A-modulo unitario, a ∈ A e p ∈ A un primo (= irriducibile). Sia aM = {am | m ∈ M } e M [a] = {m ∈ M | am = 0}, M (p) = {m ∈ M | pn m = 0, per qualche n ≥ 0}. Dimostrare che: (a) A/(p) è un campo; (b) aM , M [a] e M (p) sono sottomoduli di M . (c) M/pM è uno spazio vettoriale su A/(p), con la moltiplicazione data da (a + (p)) · (m + pM ) = am + pM ; (d) M [p] è uno spazio vettoriale su A/(p), con la moltiplicazione data da (a + (p)) · m = am; (e) per ogni intero n > 0, ci sono isomorfismi di A-moduli (A/(pn ))[p] ∼ = A/(pn−m ), 0 ≤ m ≤ n; = A/(p), e pm (A/(pn )) ∼ L L L L (f) se M ∼ Mi allora aM ∼ aMi , M [a] ∼ Mi [a] e M (p) ∼ Mi (p). = = = = (8) Per ogni A-modulo M c’è un isomorfismo canonico M ∼ = Hom(A, M ), in cui all’elemento m ∈ M corrisponde l’omomorfismo ϕm : A → M definito da ϕm (1) = m. (9) Dimostrare che Hom commuta con le somme dirette finite, e cioè per tre Amoduli M , N e P si ha HomA (M ⊕ N, P ) ∼ = HomA (M, P ) ⊕ HomA (N, P ). (10) Dimostrare che per una famiglia di A-moduli {Mi }i∈I e un modulo N si ha à ! M Y HomA Mi , N ∼ HomA (Mi , N ) = i∈I i∈I e cioè Hom trasforma la somma diretta nel prodotto diretto. (11) Sia G un gruppo abeliano, considerato come Z-modulo, e per un intero positivo m consideriamo Zm come Z-modulo. Dimostrare che: (a) Hom(Zm , G) ∼ = G[m] = {g ∈ G | mg = 0}; (b) Hom(Zm , Zn ) ∼ = Z(m,n) ; (c) come Z-modulo si ha Z∗m = 0, cioè Hom(Zm , Z) = 0; (d) per k ≥ 1, Zm ha una struttura naturale di Zmk -modulo (Esercizio 5); come Zmk -modulo, Z∗m ∼ = Zm , cioè HomZmk (Zm , Zmk ) ∼ = Zm . (12) Sia K un campo, X un insieme infinito e sia V uno spazio vettoriale di base X. Sia K X l’insieme di tutte le funzioni f : X → K. (a) K X è uno spazio vettoriale su K, con le operazioni di somma di funzioni e moltiplicazione di uno scalare per una funzione; (b) c’è un isomorfismo V ∗ ∼ = K X come K-spazi vettoriali; X |X| (c) dimK K = |K| (d) concludere che dimK V ∗ > dimK V e quindi V e V ∗ non sono isomorfi. (13) Sia P un gruppo abeliano, considerato come Z-modulo. (a) per ogni m > 0, P ⊗ Zm ∼ = P/mP ; 36 2. Moduli ∼ Zc , dove c = (m, n) è il massimo comun divisore. (b) Zm ⊗ Zn = (14) Sia P un gruppo abeliano di torsione, cioè tale che T (P ) = P , e Q il gruppo additivo dei numeri razionali, considerati come Z-moduli. (a) P ⊗Z Q = 0; (b) Q ⊗Z Q ∼ = Q; (15) Dare esempi di un anello A e A-moduli M e N tali che M ⊗A N 6= M ⊗Z N (16) Sia A un anello commutativo con unità, I un ideale di A e M un A-modulo. C’è un isomorfismo A/I ⊗A M ∼ = M/IM (17) Sia A un anello commutativo e I, J due ideali. C’è un isomorfismo A/I ⊗A A/J ∼ = A/(I + J) Capitolo 3 Moduli di tipo finito In questo capitolo studieremo l’importante classe dei moduli finitamente generati, che corrispondono agli spazi vettoriali di dimensione finita. Tutti gli anelli sono commutativi con unità, e tutti i moduli sono unitari. Ricordiamo che un modulo si dice finitamente generato o di tipo finito se esiste un insieme finito X = {x1 , . . . , xn } che genera M , e in particolare se X = {x} è formato da un solo elemento, M è detto modulo ciclico. Ogni anello A come modulo su se stesso, e più in generale ogni modulo libero di rango finito è finitamente generato. Ogni gruppo abeliano finito è uno Z-modulo finitamente generato. 1. Moduli Noetheriani Una proprietà importante degli spazi vettoriali di dimensione finita è che ogni sottospazio ha ancora dimensione finita (minore o uguale a quella dello spazio). Possiamo dunque chiederci se un sottomodulo di un modulo finitamente generato sia ancora finitamente generato. È facile vedere che questo non è vero. Esempio 1.1. Sia A un anello e sia B = A[x1 , x2 , . . . ] l’anello dei polinomi in infinite variabili. Come modulo su se stesso, B è finitamente generato da 1, ma l’ideale I = {p ∈ B | il termine noto di p è nullo} non è finitamente generato. Infatti, sia X = {p1 , . . . , pn } un qualunque insieme finito di polinomi in I. Poiché in ogni polinomio c’è un numero finito di monomi, in X vi è in tutto solo una quantità finita di variabili. Possiamo dunque trovare xk ∈ I che non compare in nessun pi ∈ X e che quindi non può essere generato dai polinomi in X. Dunque per avere una nozione utile non basta chiedere che un modulo sia finitamente generato. Il modo più semplice per imporre condizioni di finitezza è tramite “chain conditions”, e cioè condizioni sulle catene di sottomoduli. Teorema 1.2. Sia M un modulo sull’anello commutativo con unità A. Le seguenti condizioni sono equivalenti: (1) Ogni sottomodulo di M è finitamente generato. 37 38 3. Moduli di tipo finito (2) Ogni catena ascendente di sottomoduli N1 ⊆ N2 ⊆ · · · ⊆ Nm ⊆ · · · è stazionaria, e cioè esiste k ∈ N tale che Nk = Nk+1 = · · · (3) Ogni insieme non vuoto di sottomoduli di M ha un elemento massimale, e cioè un sottomodulo che non è contenuto propriamente in nessun altro sottomodulo dell’insieme. Dimostrazione. S (1) =⇒ (2) Data una catena N1 ⊆ · · · ⊆ Nm ⊆ · · · poniamo N = m≥1 Nm . È facile verificare che N è un sottomodulo e quindi per ipotesi è finitamente generato da x1 , . . . , xn . Poiché ogni xi è un elemento di qualche NSj , e la catena è crescente, esiste un indice k tale che xi ∈ Nk per ogni i. Dunque m≥1 Nm ⊆ Nk , e quindi Ni = Nk per ogni i ≥ k. (2) =⇒ (3) Immediato dal lemma di Zorn. (3) =⇒ (1) Sia N un sottomodulo di M e sia T = {P ⊆ N | P è un sottomodulo finitamente generato}. T non è vuoto perché {0} ∈ T e dunque, per ipotesi, T ha un elemento massimale P0 . Se P0 6= N , allora esiste un elemento x ∈ N \P0 e il sottomodulo P1 = P0 +Ax è ancora finitamente generato e contiene strettamente P0 , che quindi non è massimale. Allora N = P0 è finitamente generato. ¤ Definizione 1.3. Sia M un A-modulo. Se M soddisfa una delle condizioni del teorema precedente (e quindi tutte), M si dice Noetheriano. Un anello A si dice Noetheriano se A è Noetheriano come A-modulo. Un modulo Noetheriano è il giusto analogo di uno spazio vettoriale di dimensione finita. Notiamo che non si può chiedere, nemmeno in un modulo Noetheriano, che il numero di generatori di un sottomodulo sia minore o uguale al numero di generatori del modulo: basta ricordare l’esempio A = K[x, y] come modulo su stesso. A ha 1 generatore, ma l’ideale I = (x, y) non è principale e richiede (almeno) due generatori (Dimostreremo fra breve che A è Noetheriano). Un’altra importante proprietà di uno spazio vettoriale di dimensione finita è la seguente: ogni catena strettamente crescente V1 ( V2 ( . . . V k ( . . . è finita. Questa proprietà è vera in ogni modulo Noetheriano. Quali anelli sono Noetheriani? Ovviamente un campo K è Noetheriano e tutti i PID sono Noetheriani, dunque per esempio Z e K[x]. Quest’ultima affermazione è un caso particolare del celebre teorema della base di Hilbert. Prima di affrontare la dimostrazione del teorema della base, vediamo alcune proprietà dei moduli Noetheriani. Teorema 1.4. Sia N un sottomodulo di M . Allora M è Noetheriano se e solo se N e M/N sono entrambi Noetheriani. Dimostrazione. Supponiamo che M sia Noetheriano. Ogni catena crescente di sottomoduli di N è anche una catena crescente in M e quindi è stazionaria. Dunque N è Noetheriano. Se {Pi } è una catena di sottomoduli in M/N e π : M → M/N è la proiezione canonica, {Qi = π −1 (Pi )} è una catena in M e quindi è stazionaria. 1. Moduli Noetheriani 39 Poiché π è suriettiva, π(π −1 (Pi ) = Pi e quindi anche la catena {Pi } è stazionaria e M/N è Noetheriano. Viceversa, siano N e M/N Noetheriani, π : M → M/N la proiezione canonica e sia {Mi } una catena di sottomoduli in M . Poniamo Ni = N ∩ Mi e Pi = π(Mi ). Otteniamo allora due catene in N e M/N , che sono stazionarie. Sia k ∈ N tale che Ni = Nk per ogni i ≥ k e Pi = Pk per ogni i ≥ k. Dimostriamo che anche Mi = Mk per ogni i ≥ k. Sia infatti x ∈ Mi e consideriamo π(x) ∈ Pi = Pk . Dunque esiste y ∈ Mk tale che π(x) = π(y) e cioè x − y = n ∈ ker π = N . Poiché la catena è crescente, sia x che y appartengono a Mi e quindi n ∈ N ∩Mi = Ni = Nk = N ∩Mk . Dunque n ∈ Mk e perciò x = y + n ∈ Mk . ¤ Da questo teorema si ottengono immediatamente molte delle proprietà essenziali dei moduli Noetheriani. Corollario 1.5. (1) L’immagine di un modulo Noetheriano è Noetheriano. (2) La somma diretta (finita) di moduli Noetheriani è un modulo Noetheriano. (3) Se A è un anello Noetheriano e M un A-modulo finitamente generato, allora M è Noetheriano. (4) Se A è un anello Noetheriano e I un ideale, allora A/I è un anello Noetheriano. Dimostrazione. Ln Ln La (1) è immediata. Se M = i=1 Mi , allora M1 è un sottomodulo di M e M/M1 = i=2 Mi e per induzione sul numero di addendi si ha la (2). Se M è finitamente generato da x1 , . . . , xn , allora c’è un omomorfismo suriettivo Ln L n f : i=1 A → M dato da f (ei ) = xi , dove ei = (0, . . . , 1, . . . , 0). Per la (2) i=1 A è Noetheriano e allora per la (1) M è Noetheriano, cioè la (3). Per dimostrare (4), osserviamo che A/I è Noetheriano come A-modulo. Sia ora J ⊆ A/I un ideale. J è un A-sottomodulo e quindi esistono x1 , . . . , xn tali che J = Ax1 + · · · + Axn . Ma nell’anello A/I, si ha Ax = (A/I)x e quindi x1 , . . . , xn sono generatori di J come A/I-modulo, cioè come ideale. Dunque A/I è un anello Noetheriano. ¤ Oltre ai campi e ai PID non abbiamo ancora altri esempi di anelli Noetheriani. Dimostriamo ora il teorema della base di Hilbert, che dice che la proprietà di essere Noetheriano si conserva passando da un anello all’anello dei polinomi. Teorema della base di Hilbert. Sia A un anello Noetheriano. Allora l’anello dei polinomi A[x] è Noetheriano. Dimostrazione. ([Re], p. 48. È essenzialmente la stessa dimostrazione che si trova in [vdW]). Sia J ⊆ A[x] un ideale. Dimostriamo che J è finitamente generato. Definiamo l’ideale dei coefficienti direttori di grado n in J come Jn = {a ∈ A | ∃f ∈ J del tipo f = axn + bn−1 xn−1 + · · · + b0 }. Allora Jn è un ideale di A e Jn ⊆ Jn+1 (esercizio!). Poiché A è Noetheriano, usando la condizione sulle catene si ottiene un intero m tale che Jm = Jm+1 = · · · 40 3. Moduli di tipo finito Ognuno degli ideali Ji è finitamente generato e sia ai1 , . . . , aini un insieme di generatori. Per definizione, ognuno di questi elementi di A è il coefficiente direttore di un polinomio in Ji e dunque sia fik = aik xi + · · · ∈ Ji . Affermiamo che l’insieme {fik | i = 0, 1, . . . , m, k = 1, . . . , ni } è un insieme di generatori di J. Sia infatti g ∈ J, con deg g = h e sia bxh il termine direttore di g. Allora b ∈ Jh e quindi b è una combinazione lineare X b= cjk ajk , dove j = h se h ≤ m, j = m altrimenti. k Consideriamo allora g1 = g − xm−j X cjk fjk ; k per costruzione, il termine di grado m in g1 è nullo e quindi deg g1 < deg g. Dunque, per induzione, si può scrivere g come combinazione lineare degli fik , che quindi sono generatori. ¤ Osserviamo che, anche se sembra che abbiamo costruito esplicitamente un insieme di generatori, questa dimostrazione è non costruttiva: non sappiamo infatti come ottenere esplicitamente i generatori {aik } degli ideali Ji . In effetti, l’affermazione dell’esistenza di questi insiemi di generatori usa l’assioma della scelta. Questa teorema è famoso anche perché la sua dimostrazione è stata una delle prime dimostrazioni di esistenza non costruttive. Quando Hilbert lo dimostrò (Math. Annalen, 36 (1890) p. 473 e seguenti), usandolo per risolvere un famoso problema in Teoria degli Invarianti, molti non credettero alla validità della dimostrazione, al punto che si dice che Paul Gordan, il massimo esperto del tempo di Teoria degli Invarianti, abbia commentato: “Questa non è matematica, è teologia”. La struttura della dimostrazione originale di Hilbert è all’incirca la seguente, come spiegato da Hilbert stesso a p. 478 dell’articolo citato: prendiamo un “sistema di forme” (noi diremmo un “insieme di polinomi”), caratterizzato da una proprietà che per ogni polinomio può valere oppure no (la proprietà in questione è “essere nell’ideale”). A questo punto supponiamo che non ci sia una base finita. Allora prendiamo f1 e poi f2 , f3 , e cosı̀ via, in modo che nessun fi sia combinazione lineare dei precedenti. Poniamo, per brevità, A(B, f ) per indicare la proprietà: B è una base finita, e f è combinazione lineare degli elementi di B. Abbiamo dunque un insieme di polinomi, e dall’ipotesi che sia falso che esiste B tale che per ogni f : A(B, f ) Hilbert conclude che allora per ogni B : esiste f tale che A(B, f ) non è vera e poi applica questo ai B costruiti l’uno dopo l’altro come sopra. Dunque Hilbert forma la negazione di un quantificatore (non esiste B) in cui gli elementi quantificati sono insiemi. Se a noi questo ragionamento sembra perfettamente normale (oltre che giusto), questo è solo il riflesso di quanto la percezione della Matematica e dei suoi oggetti sia cambiata dai tempi di Hilbert ai nostri. 2. Moduli su domini a ideali principali 41 L’abitudine a parlare di insiemi in termini generali è comune dai tempi di Dedekind, ma una cosa è formare un insieme infinito di numeri e dare un nome agli elementi individuali dell’insieme, tutta un’altra è considerare l’insieme di tutti gli insiemi B (una infinità di “secondo ordine”) e negare dei quantificatori su questo insieme, cosa che richiede necessariamente considerare questa infinità come una “infinità attuale”. Qui, probabilmente, Gordan ritenne che la Matematica stesse toccando la Teologia. 2. Moduli su domini a ideali principali La teoria degli spazi vettoriali di dimensione finita è, dal punto di vista del paragrafo precedente, la teoria dei moduli Noetheriani su di un campo. Proseguendo, il passo successivo è esaminare la teoria dei moduli finitamente generati su un PID. In questo paragrafo dimostreremo un teorema di struttura valido per tutti i moduli finitamente generati su di un PID e vedremo il significato concreto in due situazioni molto importanti: Z-moduli, e cioè gruppi abeliani finitamente generati, e K[x]moduli, cioè la teoria delle forme canoniche per le matrici quadrate (forma canonica razionale e di Jordan). È possibile dare una dimostrazione un po’ più semplice del teorema di struttura nel caso in cui l’anello sia euclideo, usando l’algebra lineare e le cosiddette “operazioni elementari” sulle matrici, ottenendo in questo modo una dimostrazione costruttiva. Qui vedremo invece una dimostrazione valida in generale per tutti i PID, seguendo le linee dei Capitoli 10 e 11 di [Sharp]. Sappiamo che in generale un sottomodulo di un modulo libero non è più libero, come mostra l’esempio dell’ideale (x, y) in K[x, y]. Questo non capita in un PID: tutti gli ideali sono principali, e dunque tutti i sottomoduli di A sono ancora liberi (di rango 1). Ci si può chiedere se questo valga per un qualunque modulo libero e non solo per l’anello stesso, e la risposta è sı̀: su un PID, ogni sottomodulo di un modulo libero è ancora libero. La dimostrazione è piuttosto semplice (vedere per esempio, [vdW], Capitolo 12, Paragrafo 2. L’enunciato è per moduli su un anello euclideo, ma la dimostrazione vale anche su un PID), ma per avere un teorema di struttura per tutti i moduli finitamente generati, questo fatto non è sufficiente: occorre sapere come un sottomodulo libero sta dentro un modulo libero, e per avere la risposta completa (che comprende anche l’enunciato precedente) è necessario più lavoro. Sia dunque ALun PID e M un A-modulo finitamente generato dagli elementi n x1 , . . . , xn . F = i=1 A è un modulo libero di rango n ed esiste un omomorfismo suriettivo f : F → M , e perciò M ∼ = F/H, dove H = ker f . Come abbiamo detto, anche H è un modulo libero. Sia allora h1 , . . . , hm una base di H. Se potessimo (come capita per gli spazi vettoriali) “completare la base” per ottenere una base di F , allora il quoziente sarebbe libero, di rango n − m. In generale questo non è possibile: per esempio, se F = Z e H = (2), allora nessuna base di H si completa a una base di F , però in questo caso sappiamo che F/H ∼ = Z2 è un modulo ciclico, e cioè con un solo generatore. Questo è quasi quello che capita: in effetti M è sempre somma diretta (finita) di moduli ciclici. Dunque adesso che sappiamo la risposta, ci impegnamo per avere una dimostrazione. L’enunciato preciso a cui miriamo è: 42 3. Moduli di tipo finito Ln Teorema. Se F = i=1 A è un modulo libero finitamente generato sul PID A, e H è un sottomodulo, allora esiste una base e1 , . . . , en di F , un intero k ≤ n e degli elementi a1 , . . . , ak ∈ A tali che a1 e1 , . . . , ak ek è una base di H. Da questo teorema è immediato ottenere che M∼ = F/H = n−k M A ⊕ A/(a1 ) ⊕ · · · ⊕ A/(ak ) i=1 Dopo aver ottenuto l’esistenza di una tale decomposizione, affronteremo il problema della sua unicità. Sia A un anello commutativo con unità, e sia F un A-modulo libero di rango n. Sia e1 , . . . , en una base di F e sia y ∈ F . Allora si può scrivere, in modo unico, y = c1 e1 + · · · + cn en , ci ∈ A. Definizione 2.1. L’ideale C(y) = (c1 , . . . , cn ) si dice il contenuto di y. Lemma 2.2. C(y) dipende solo da y, e non dalla base scelta in F . Dimostrazione. Sia e01 , . . . , e0n un’altra base di F , e sia y = c01 e01 +· · ·+c0n e0n l’unica espressione di y nella nuova base. Poiché abbiamo due basi, possiamo scrivere per i = 1, . . . , n n n X X e0i = aij ej , e ei = bij e0j j=1 j=1 e quindi y= n X i=1 Poiché e01 , ..., e0n ci ei = n X n X ci bij e0j i=1 j=1 è una base, si ha = à n n X X j=1 c0j = (c01 , . . . , c0n ) Pn ! ci bij e0j = i=1 i=1 ci bij n X c0j e0j j=1 e quindi ⊆ (c1 , . . . , cn ) L’inclusione opposta si ottiene scambiando i ruoli delle due basi. ¤ Passiamo ora ai PID, e dimostriamo che ogni elemento di un modulo libero, a meno di multipli, può far parte di una base. Lemma 2.3. Sia A un PID, sia F un A-modulo libero finitamente generato e sia y ∈ F . Sia cy un generatore dell’ideale C(y). Allora esiste una base f1 , . . . , fn di F tale che y = cy f1 . Dimostrazione. Sia e1 , . . . , en una base fissata di F e facciamo induzione su n. Per n = 1, y = be1 , e quindi C(y) = (b) = (cy ), e cioè b = ucy , con u invertibile in A. Ponendo f1 = ue1 , si ha y = cy f1 e {f1 } è la base cercata. Sia ora n > 1 e scriviamo y = c1 e1 + · · · + cn en e dunque C(y) = (c1 , . . . , cn ) = (cy ). Notiamo che y = 0 se e solo se cy = 0 e supponiamo quindi che y 6= 0. Poniamo z = c2 e2 + · · · + cn en , in modo da scrivere y = c1 e1 + z. Gli elementi e2 , . . . , en formano una base del sottomodulo libero F 0 ⊂ F , e per induzione esiste una base g2 , . . . , gn di F 0 tale che z = cz g2 , dove cz è un generatore dell’ideale contenuto 2. Moduli su domini a ideali principali 43 C(z). (Attenzione: l’ideale C(z) è lo stesso, sia che consideriamo z ∈ F che z ∈ F 0 ). Si ha quindi C(y) = (cy ) = (c1 , cz ) e perciò c1 = scy , cz = tcy , e inoltre possiamo scrivere cy = uc1 + vcz . Allora cy = uc1 + vcz = uscy + vtcy = (us + vt)cy e poiché siamo in un dominio e cy 6= 0, si ha us + vt = 1. Poniamo f1 = se1 + tg2 , f2 = ve1 − ug2 , fi = gi , i≥3 Osserviamo che cy f1 = scy e1 + tcy g2 = c1 e1 + cz g2 = c1 e1 + z = y quindi y è il multiplo giusto di f1 . Resta da dimostrare che {fi } è una base. Per prima cosa, osserviamo che uf1 + tf2 = use1 + utg2 + vte1 − utg2 = (us + vt)e1 = e1 e allo stesso modo vf1 − sf2 = g2 e quindi f1 , . . . , fn generano il sottomodulo generato da e1 , g2 , . . . , gn e cioè tutto F . Supponiamo ora che esistano degli elementi ai ∈ A tali che a1 f1 +· · ·+an fn = 0. Allora n X a1 (se1 + tg2 ) + a2 (ve1 − ug2 ) + ai gi = 0 i=3 e cioè (a1 s + a2 v)e1 + (a1 t − a2 u)g2 + n X ai gi = 0. i=3 Poiché g2 , . . . , gn è una base di F 0 , e Ae1 ⊕ F 0 = F , anche e1 , g2 , . . . , gn è una base di F e quindi ai = 0 per i ≥ 3 e a1 s + a2 v = a1 t − a2 u = 0. Usando ancora us + vt = 1 si ottiene facilmente che a1 = a2 = 0 e cioè f1 , . . . , fn sono una base di F come richiesto. ¤ L’idea della dimostrazione dovrebbe essere chiara, a questo punto: vogliamo usare il Lemma 2.3 e fare induzione sul rango del sottomodulo. Per questo, abbiamo bisogno di un criterio in base alla quale scegliere il primo elemento della base. L’idea è di scegliere un vettore “massimale” in qualche senso, e il seguente lemma dice come effettuare la scelta. Lemma 2.4. Sia A un PID, sia F un A-modulo libero finitamente generato e sia H un sottomodulo di F . Sia z ∈ H tale che l’ideale C(z) sia massimale fra tutti gli ideali della forma C(y), y ∈ H. Allora in modo che C(z) = P C(y) ⊆ C(z), per ogni y ∈ H, y∈H C(y). 44 3. Moduli di tipo finito Dimostrazione. Per iniziare, osserviamo che un elemento z come nell’enunciato esiste, perché A è Noetheriano (Teorema 1.2), e sia cz un generatore di C(z). Per il Lemma 2.3 esiste una base f1 , . . . , fn di F tale P che z = cz f1 . Consideriamo ora y ∈ H, e scriviamo y = i ai fi . Dobbiamo dimostrare che C(y) ⊆ C(z). Poiché A è un PID, l’ideale somma C(z) + (a1 ) = (cz , a1 ) = (t) è principale, generato da t. Dunque t = ucz + va1 . Consideriamo l’elemento n X uz + vy = ucz f1 + va1 f1 + · · · + van fn = tf1 + a i f1 ; i=2 si ha: C(z) = (cz ) ⊆ (t) ⊆ (t, a2 , . . . , an ) = C(uz + vy) e poiché uz +vy ∈ H, si deve avere uguaglianza per la massimalità di C(z). Dunque C(z) = (cz ) = (cz , a1 ) = (t) e quindi a1 ∈ C(z). Inoltre, sempre per la massimalità, C(z) = (t, a2 , . . . , an ) = C(uz + vy), e quindi a2 , . . . , an ∈ C(z) e perciò C(y) = (a1 , a2 , . . . an ) ⊆ C(z). ¤ Siamo ora pronti a dimostrare il teorema annunciato in precedenza, con una aggiunta importante. Teorema 2.5. Sia A un PID, sia F un A-modulo libero finitamente generato di rango n e sia H un sottomodulo di F . Allora esiste una base e1 , . . . , en di F , e elementi a1 , . . . , an ∈ A tali che (1) (a1 ) ⊇ (a2 ) ⊇ · · · ⊇ (an ) (o, equivalentemente ai | ai+1 per ogni i); (2) H è generato da a1 e1 , a2 e2 , . . . , an en . Notiamo che è possibile che qualcuno degli elementi ai sia nullo. In questo caso, la (1) dice che se aj = 0 allora aj+1 = · · · = an = 0. Dimostrazione. Naturalmente, la dimostrazione è per induzione sul rango n di F : se n = 1, allora F ∼ = A, e poiché A è un PID, la dimostrazione è immediata. Supponiamo ora di aver dimostrato il teorema per tutti i moduli liberi di rango minore o uguale a n − 1. Per il Lemma 2.4 esiste z ∈ H tale che C(z) ⊇ C(y), per ogni y ∈ H, e per il Lemma 2.3 esiste una base f1 , . . . , fn di F tale che z = cz f1 . Consideriamo allora il sottomodulo F 0 di base f2 , . . . , fn e poniamo H 0 = H ∩ F 0 . F 0 è libero di rango n − 1 e H 0 è un suo sottomodulo e, per ipotesi induttiva, esiste una base e2 , . . . , en di F 0 e degli elementi a2 , . . . , an tali che (a2 ) ⊇ (a3 ) ⊇ · · · ⊇ (an ) e H 0 è generato da a2 e2 , a3 e3 , . . . , an en . Poniamo e1 = f1 e a1 = cz . La tesi del teorema si ottiene verificando che e1 , e2 , . . . , en e a1 , a2 , . . . , an hanno le proprietà richieste. Poiché f2 , . . . , fn e e2 , . . . , en generano entrambe il sottomodulo F 0 , è chiaro che e1 , e2 , . . . , en genera F . Se ora b1 e1 + b2 e2 + · · · + bn en = 0, si ha b1 e1 = −b2 e2 −· · ·−bn en e poiché Ae1 ∩F 0 = 0 otteniamo b1 = 0, e anche b2 = · · · = bn = 0 perché e2 , . . . , en è una base. Dunque e1 , e2 , . . . , en è una base di F . 2. Moduli su domini a ideali principali 45 Dalla definizione di contenuto, C(a2 e2 ) = (a2 ), e poiché a2 e2 ∈ H per la scelta di z si ha: (a1 ) = C(z) ⊇ C(a2 e2 ) = (a2 ) e dunque la (1) è dimostrata. Infine, dimostriamo che H è generato da a1 e1 , . . . , an en . Poiché a1 e1 = z ∈ H, è chiaro che il sottomodulo generato da a1 e1 , . . . , an en è contenuto in H. Se ora y ∈ H è un elemento arbitrario, possiamo scrivere y = s1 e1 + · · · + sn en e si ha (s1 ) ⊆ C(y) ⊆ C(z) = (a1 ) e cioè s1 = ta1 . Sottraendo, y − tz = s2 e2 + · · · + sn en ∈ H 0 e quindi y − tz è combinazione lineare di a2 e2 , . . . , an en , per ipotesi induttiva. Poiché tz = ta1 e1 , si ha che y è combinazione lineare di a1 e1 , . . . , an en come richiesto. ¤ Corollario 2.6. Sia A un PID, sia F un A-modulo libero finitamente generato di rango n e sia H un sottomodulo di F . Allora H è libero, e rank H ≤ rank F . Dimostrazione. Per il teorema precedente esiste una base e1 , . . . , en di F tale che H sia generato da a1 e1 , . . . , an en , con ai | ai+1 per ogni i. Sia k = max{i | ai 6= 0}. Ovviamente k ≤ n. Allora H è generato da a1 e1 , . . . , ak ek , e supponiamo di avere una relazione b1 (a1 e1 ) + · · · + bk (ak ek ) = 0 di dipendenza lineare fra i generatori. Poiché gli ei sono indipendenti, abbiamo che bi ai = 0 per ogni i e poiché A è un dominio e ai 6= 0 deve essere bi = 0. ¤ Enunciamo esplicitamente, per chiarezza, il risultato che abbiamo ottenuto: Teorema 2.7. Sia A un PID e sia M un modulo finitamente generato su A. Allora M è somma diretta di moduli ciclici, nella forma ∼ Am ⊕ A/(a1 ) ⊕ · · · ⊕ A/(ak ) M= e gli elementi a1 , . . . , ak ∈ A sono tali che (a1 ) ⊇ (a2 ) ⊇ · · · ⊇ (ak ) o, equivalentemente, ai | ai+1 per ogni i. Gli elementi ai si chiamano i fattori invarianti del modulo M . Ricaviamo ora una forma diversa, in cui gli elementi che generano gli ideali sono potenze di primi. Ricordiamo che in un anello A un elemento c si dice irriducibile se c = ab implica che a oppure b è invertibile in A mentre c si dice primo se c | ab implica che c | a oppure c | b. Un elemento primo è sempre irriducibile e, in un UFD, ogni elemento irriducibile è primo. Per esempio, in Z i primi sono ovviamente i numeri primi, mentre in k[x] i primi sono i polinomi irriducibili. Definizione 2.8. Sia A un anello, I e J due ideali. I e J si dicono comassimali se I + J = A. Esercizio 2.9. In un PID, due ideali sono comassimali se e solo se i loro generatori sono coprimi. 46 3. Moduli di tipo finito Sia A un anello e I1 , . . . , In ideali di A. C’è un omomorfismo (di anelli) ϕ : A → A/I1 × · · · × A/In dato da ϕ(x) = (x + I1 , . . . , x + In ). Lemma 2.10. ϕ è suriettiva se e solo se Ir e Is sono comassimali per ogni r 6= s. Nota: questo non è altro che il teorema cinese del resto. Dimostrazione. Supponiamo che ϕ sia suriettiva e dimostriamo, per esempio, che I1 e I2 sono comassimali. Per la suriettività di ϕ esiste un elemento x ∈ A tale che ϕ(x) = (1, 0, . . . , 0), e cioè x ≡ 1 (mod I1 ) e x ≡ 0 (mod I2 ). Allora 1 = (1 − x) + x ∈ I1 + I2 e quindi I1 e I2 sono comassimali. Dimostriamo ora, per esempio, che se gli ideali sono a due a due comassimali allora esiste x ∈ A tale che ϕ(x) = (1, 0, . . . , 0). Poiché I1 + Ir = A per r 6= 1, abbiamo elementi ur ∈ I1 e vr ∈ Ir tali che ur + vr = 1. Poniamo n n Y Y x= vr = (1 − ur ) r=2 r=2 Dalla prima espressione è chiaro che per r 6= 1, x ∈ Ir e cioè x ≡ 0 (mod Ir ) mentre, sviluppando il prodotto nella seconda si ha x ≡ 1 (mod I1 ). Dunque ϕ(x) = (1, 0, . . . , 0). ¤ Torniamo alla decomposizione di un modulo. Sia A un PID, e sia a ∈ A. Poiché A è UFD, scriviamo la decomposizione di a come a = upt11 . . . ptkk dove i primi pi sono a due a due coprimi e quindi gli ideali che generano sono a due a due comassimali. Abbiamo allora Teorema 2.11. C’è un isomorfismo (di anelli e di A-moduli) ¡ ¢ ¡ ¢ f : A/(a) → A/ pt11 ⊕ · · · ⊕ A/ ptkk Dimostrazione. È una conseguenza immediata del lemma precedente: f è l’omomorfismo indotto da ϕ, osservando che n \ ¡ ti ¢ ker ϕ = pi = (a). i=1 ¤ Da questo e dal Teorema 2.7 si ottiene immediatamente Teorema 2.12. Sia A un PID e sia M un modulo finitamente generato su A. Allora M è somma diretta di moduli ciclici, nella forma ¡ ¢ ¡ ¢ ∼ Am ⊕ A/ pt1 ⊕ · · · ⊕ A/ ptk M= 1 k dove gli elementi pi sono primi dell’anello A. Osservazione. Non stiamo affermando che gli elementi pi nell’enunciato precedente sono a due a due coprimi, anzi, un elemento si può presentare più volte. Le potenze ptii si chiamano i divisori elementari del modulo M . 2. Moduli su domini a ideali principali 47 Vediamo alcuni esempi di queste due decomposizioni diverse. Il caso più semplice è quello dei gruppi abeliani, che sono Z-moduli. Per esempio Z2 ⊕ Z6 ∼ = Z2 ⊕ Z2 ⊕ Z3 ; a sinistra abbiamo il primo tipo di decomposizione, mentre a destra la decomposizione è tramite potenze di primi. Un altro esempio è Z12 ∼ = Z3 ⊕ Z22 . I teoremi di decomposizione che abbiamo appena visto dicono che tutti i gruppi abeliani finitamente generati, e quindi in particolare tutti i gruppi abeliani finiti, sono della forma precedente. Dimostreremo ora che entrambe le decomposizioni precedenti hanno proprietà di unicità e per farlo utilizzeremo in modo essenziale i risultati degli esercizi 6 e 7. Nel seguito, A sarà sempre un PID, e sia M∼ = Am ⊕ A/(a1 ) ⊕ · · · ⊕ A/(ak ) una qualunque decomposizione di M in cui nessuno degli elementi ai è nullo oppure invertibile. Sia K il campo dei quozienti di A. Il prodotto tensoriale M ⊗A K dipende solo da M e non dalla decomposizione. Il prodotto tensoriale commuta con le somme dirette finite (Esercizio 4.5) e quindi M ⊗A K ∼ = (A ⊗A K)m ⊕ (A/(a1 ) ⊗A K) ⊕ · · · ⊕ (A/(ak ) ⊗A K) ∼ = Km poiché A⊗A K = K e A/(ai )⊗A K = 0, ragionando come nell’Esempio 4.4. Dunque il numero degli addendi liberi presenti in una qualunque decomposizione di M è uguale alla dimensione, come K-spazio vettoriale, di M ⊗A K e quindi non dipende dalla decomposizione. Studiamo ora il comportamento degli addendi non liberi. Lemma 2.13. Sia M un modulo finitamente generato su A, e sia T (M ) il sottomodulo di torsione. Allora M = F ⊕ T (M ), dove F è un sottomodulo di M che è libero. Dimostrazione. Utilizziamo l’isomorfismo f : Am ⊕ A/(a1 ) ⊕ · · · ⊕ A/(ak ) → M dato dal Teorema 2.7, dove nessuno degli elementi ai è nullo oppure invertibile. È immediato vedere che l’immagine di Am è F e l’immagine di A/(a1 ) ⊕ · · · ⊕ A/(ak ) è T (M ). ¤ Dunque la somma di tutti gli addendi non liberi non dipende dalla decomposizione perché è isomorfa al sottomodulo di torsione di M . Possiamo dunque supporre che M = T (M ) e dimostreremo innanzitutto l’unicità della decomposizione del Teorema 2.12 mediante potenze di primi. Teorema 2.14. Sia A un PID e sia ¡ ¢ ¡ ¢ M∼ = A/ (q1s1 ) ⊕ · · · ⊕ A/ (qssk ) = A/ pt11 ⊕ · · · ⊕ A/ pthh ∼ dove i pi e i qj sono primi dell’anello A. Allora h = k e, a meno dell’ordine, ptii = qisi . 48 3. Moduli di tipo finito Dimostrazione. Osserviamo che, se M è un qualunque A-modulo e a, b ∈ A e m ∈ M sono tali che am = bm = 0, allora cm = 0, dove c = (a, b) è il massimo comun divisore poiché in un PID si ha c = au + bv. Ricordiamo inoltre che per un primo p ∈ A, M (p) = {m ∈ M | pn m = 0, per qualche n ≥ 0}. Ogni elemento in A/(pt ) è annullato da pt , e se (p) 6= (q), cioè se p e q sono primi non associati allora, per l’osservazione appena fatta, (A/(pn ))(q) = 0. Dunque dall’esercizio 7 abbiamo che, per ogni primo p, M (p) è formato dagli addendi della decomposizione della forma A/(pti ) e quindi possiamo supporre che ¡ ¢ ¡ ¢ M∼ = A/ (ps1 ) ⊕ · · · ⊕ A/ (psk ) = A/ pt1 ⊕ · · · ⊕ A/ pth ∼ con t1 ≤ t2 ≤ · · · ≤ th e s1 ≤ s2 ≤ · · · ≤ sk . Per prima cosa dimostriamo che h = k. Dall’esercizio 7 si ha ¡ ¢h ¡ ¢k M [p] ∼ = A/(p) ∼ = A/(p) e poiché M [p] è uno spazio vettoriale sul campo A/(p), si ha che h = k = dim M [p]. Sia ora w il primo intero per cui ti = si per ogni i < w e tw 6= sw , per esempio tw < sw , e consideriamo il sottomodulo ptw M . Ancora dall’esercizio 7 vediamo che nella prima decomposizione tutti gli addendi fino a A/(ptw ) vengono annullati, e tutti gli altri sono ancora della forma A modulo una potenza di p e quindi vi sono al più h − w addendi non nulli, mentre nella seconda gli addendi annullati sono solo fino a A/(psw−1 ) e quindi ci sono almeno h − w + 1 addendi non nulli. Ma questo contraddice quello che abbiamo appena dimostrato (in due decomposizioni il numero degli addendi è lo stesso) e questo conclude la dimostrazione dell’unicità. ¤ 3. La forma canonica di Jordan Sia k un campo, V un k-spazio vettoriale di dimensione finita e ϕ : V → V un endomorfismo. V ha una struttura di k[x]-modulo come abbiamo visto nell’Esempio 1.4, ponendo xv = ϕ(v) ed estendendo nel modo ovvio. La struttura di k[x]-modulo dipende dall’endomorfismo ϕ, e ci possiamo chiedere quando due tali moduli siano isomorfi. Indichiamo con Vϕ il k[x]-modulo determinato dall’endomorfismo ϕ. Teorema 3.1. Se ϕ e ψ sono due endomorfismi di V , allora Vϕ ∼ = Vψ come k[x]-moduli se e solo se ϕ e ψ sono simili. Dimostrazione. Un isomorfismo g : Vϕ → Vψ di k[x]-moduli è un isomorfismo di gruppi abeliani, tale che g(αv) = αg(v) per ogni α ∈ k e v ∈ V , e cioè un’applicazione lineare, e tale che g(xv) = xg(v) per ogni v ∈ V . Quest’ultima condizione significa che g(ϕ(v)) = ψ(g(v)), ∀v ∈ V e cioè ϕ = g −1 ◦ ψ ◦ g, e quindi ϕ e ψ sono simili. ¤ 3. La forma canonica di Jordan 49 Dunque le classi di isomorfismo delle strutture di k[x]-modulo su V sono le classi di similitudine degli endomorfismi di V in se stesso. Poiché V ha dimensione finita su k, è anche finitamente generato come k[x]-modulo (basta usare gli stessi generatori) e poiché k[x] è un PID possiamo applicare i teoremi di decomposizione appena visti per descrivere le classi di isomorfismo, e quindi le classi di similitudine. Le classi di similitudine dipendono dal campo k e la descrizione che vedremo, detta forma canonica di Jordan, è valida per tutti i campi algebricamente chiusi (per esempio k = C). Iniziamo con alcune osservazioni: (1) un sottoinsieme U di V è un k[x]-sottomodulo se e solo se è un sottospazio vettoriale e se xv = ϕ(v) ∈ U per ogni v ∈ U , e cioè U è un sottomodulo se e solo se è un sottospazio invariante rispetto a ϕ; (2) V non ha addendi liberi, e cioè isomorfi a k[x], ancora in virtù della dimensionalità finita come spazio vettoriale (k[x] non ha dimensione finita su k). Dunque V è somma diretta di moduli ciclici tutti di torsione; (3) consideriamo l’annullatore Ann(V ) = {p(x) | p(ϕ)(v) = 0 per ogni v ∈ V }; Ann(V ) è un ideale di k[x] e quindi principale. Poiché ogni addendo di V è di torsione, esiste almeno un polinomio non nullo p(x) ∈ Ann(V ) (per esempio, il prodotto di tutti i generatori degli ideali che compaiono nella decomposizione). Il generatore monico dell’ideale Ann(V ) viene detto polinomio minimo di ϕ. Dal teorema di decomposizione e dalla (1) abbiamo che V è somma diretta di sottospazi U1 , . . . , Ut invarianti per ϕ, e questi sottospazi sono moduli ciclici. Se scegliamo una base di V come unione delle basi dei sottospazi invarianti, abbiamo che la matrice A di ϕ rispetto a questa base ha una forma “a blocchi” A1 0 . . . 0 0 A2 . . . 0 A= . .. .. .. . . 0 0 ... At dove Ai è la matrice dell’endomorfismo ϕ ristretto al sottospazio Ui . Per avere una forma canonica basta dunque capire la forma delle matrici Ai . Usando la seconda forma del teorema di decomposizione, abbiamo che esistono (e sono unici) dei polinomi p1 (x), . . . , pt (x), irriducibili su k, tali che Ui ∼ = k[x]/ (pi (x)si ) ; poiché k è algebricamente chiuso i polinomi irriducibili sono polinomi di primo grado, e quindi esistono degli elementi a1 , . . . , at ∈ k tali che pi (x) = x − ai . Dunque ci interessa trovare una base conveniente per descrivere il k[x]-modulo ciclico U = k[x]/ ((x − a)s ) . 50 3. Moduli di tipo finito Definizione 3.2. Sia k un campo, a ∈ k e n ∈ N. La matrice elementare di Jordan associata ad a e n è la matrice n × n a 1 0 ... 0 0 0 a 1 . . . 0 0 0 0 a . . . 0 0 J(a, n) = . . . .. .. .. .. .. . . 0 0 0 . . . a 1 0 0 0 ... 0 a che ha tutti gli elementi della diagonale principale uguali ad a, tutti 1 sulla diagonale ‘superiore’ e tutti gli altri elementi uguali a 0. Teorema 3.3. Sia U uno spazio vettoriale su k e sia ϕ : U → U un endomorfismo. Allora U ∼ = k[x]/ ((x − a)n ) se e solo se esiste una base di U tale che la matrice di ϕ è J(a, n), dove n = dimk U . Dimostrazione. Supponiamo che U ∼ = k[x]/ ((x − a)n ), e sia u ∈ U il vettore che n corrisponde all’elemento 1 + (x − a) tramite l’isomorfismo dato. Osserviamo che (x − a)n−1 u 6= 0, perché (x − a)n−1 6= 0 modulo (x − a)n . Poiché U è generato come k[x]-modulo da u, ogni elemento di U è della forma gu, per qualche g(x) ∈ k[x]; il sottoanello k[(x−a)] contiene k e anche x = (x−a)+a e quindi k[(x − a)] = k[x] cioè ogni polinomio g(x) ∈ k[x] può essere scritto come un polinomio in (x − a) a coefficienti in k (questa affermazione non è nient’altro che lo sviluppo di Taylor del polinomio g(x) in x = a). Consideriamo gli elementi: v1 = (x − a)n−1 u, n−j vj = (x − a) v2 = (x − a)n−2 u, u, ..., ... vn = (x − a)0 u = u; poiché (x − a)n u = 0, i vettori v1 , . . . , vn generano U come spazio vettoriale su k. Supponiamo che ci sia una relazione di dipendenza lineare X bi vi = i n X bi (x − a)n−i u = 0, i=1 e sia j l’indice più grande per cui bj 6= 0. Moltiplicando la relazione precedente per (x − a)j−1 si ottiene bj (x − a)j−1 vj = bj (x − a)n−1 u = 0 e questa è una contraddizione, perché (x − a)n−1 u 6= 0. Dunque bi = 0 per ogni i, e quindi v1 , . . . , vn formano una base di U . Notiamo che vi−1 = (x − a)vi , per i = 2, . . . , n e quindi ϕ(vi ) = xvi = vi−1 + avi , per i = 2, . . . , n ϕ(v1 ) = av1 e perciò la matrice di ϕ nella base v1 , . . . , vn è J(a, n). L’implicazione inversa è un semplice esercizio. ¤ Notiamo che per ϕ come nel teorema precedente, a è l’unico autovalore, di molteplicità (algebrica) n, mentre v1 è l’unico autovettore, e quindi l’autospazio Ua 4. Algebre di divisione finite 51 ha dimensione 1. In particolare, un endomorfismo la cui matrice è una matrice elementare di Jordan non è diagonalizzabile, a meno che n = 1. Possiamo riassumere la discussione fatta nel seguente Teorema 3.4. Sia V uno spazio vettoriale di dimensione finita su un campo algebricamente chiuso k e sia ϕ un endomorfismo di V . Allora esiste una base di V per cui la matrice A di ϕ è del tipo J(a1 , n1 ) 0 ... 0 0 J(a2 , n2 ) . . . 0 A= .. .. .. . . . 0 0 ... J(as , ns ) dove ogni blocco J(ai , ni ) è una matrice elementare di Jordan. Inoltre la forma precedente è unicamente determinata, a parte l’ordine in cui compaiono i blocchi. Notiamo che gli ai non sono necessariamente distinti. Concludiamo osservando che gli ai sono gli autovalori di ϕ, e che ogni blocco dà origine ad un solo autovalore. Dunque ϕ è diagonalizzabile se e solo se ni = 1 per ogni i (e cioè s = n). Notiamo anche che se ϕ e ψ sono due endomorfismi sullo stesso spazio V , allora per il Teorema 3.1 ϕ e ψ sono simili se e solo se hanno la stessa forma canonica di Jordan. 4. Algebre di divisione finite Un campo K è un anello in cui ogni elemento ha inverso moltiplicativo e in cui la moltiplicazione è commutiva. Ci possiamo chiedere se queste due proprietà siano indipendenti. Definizione 4.1. Sia D un anello con unità tale che ogni elemento a 6= 0 abbia un inverso, e cioè un elemento a−1 tale che aa−1 = a−1 a = 1. Allora D si dice un’algebra di divisione oppure un corpo (non commutativo). La domanda è quindi: esistono algebre di divisione che non siano campi? La risposta è si, come mostra l’esempio dei quaternioni H, che vedremo nel capitolo seguente. Se però supponiamo che D sia finita, allora la risposta è no, come afferma il seguente teorema di Wedderburn: Teorema 4.2 (Wedderburn). Sia D un’algebra di divisione finita. Allora D è un campo (cioè la moltiplicazione è commutativa). Dunque ogni algebra di divisione finita è un campo finito, e cioè un campo di Galois. La struttura dei campi finiti è completamente nota. La dimostrazione che segue è elementare, e si basa su alcune semplici considerazioni di teoria dei gruppi, in particolare la cosiddetta equazione delle classi, e sulle proprietà elementari dei polinomi ciclotomici su Q. Iniziamo quindi a ricordare questi fatti. Azioni di un gruppo su un insieme finito. Ricordiamo alcune definizioni. 52 3. Moduli di tipo finito Definizione 4.3. Sia G un gruppo e X un insieme. Una azione di G su X è una funzione G × X → X (di solito denotata (g, x) 7→ g.x) tale che per ogni x ∈ X e ogni g1 , g2 ∈ G si ha e.x = x, (g1 g2 ).x = g1 .(g2 .x), dove e ∈ G è l’elemento neutro. Denotiamo con S(X) il gruppo simmetrico sull’insieme X e cioè S(X) è l’insieme delle funzioni biiettive di X in se stesso con l’operazione di composizione. Un’azione di G su X può anche essere descritta come un omomorfismo di gruppi ϕ : G → S(X), e la corrispondenza fra le due definizioni è ϕ(g)(x) = g.x. Proposizione 4.4. Sia G un gruppo che opera sull’insieme X. (1) La relazione su X definita da x ∼ x0 ⇐⇒ ∃g ∈ G : x0 = g.x è una relazione di equivalenza; (2) per ogni x ∈ X, Gx = {g ∈ G | g.x = x} è un sottogruppo di G. Le classi di equivalenza si chiamano orbite, e si indicano con G.x, e il sottogruppo Gx si dice lo stabilizzatore di x, o anche il gruppo di isotropia di x. Teorema 4.5. C’è una corrispondenza biunivoca fra l’orbita di un elemento x e l’insieme delle classi laterali dello stabilizzatore Gx . Dimostrazione. La mappa che associa alla classe laterale gGx l’elemento g.x appartenente all’orbita G.x è ben definita e iniettiva, poiché g.x = h.x ⇐⇒ x = (g −1 h).x ⇐⇒ g −1 h ∈ Gx ⇐⇒ gGx = hGx ed è suriettiva perché tutti gli elementi dell’orbita G.x sono della forma g.x. ¤ L’unica azione che considereremo è la coniugazione di G su se stesso: se g ∈ G e x ∈ G definiamo g.x = g −1 xg. Le orbite di questa azione si dicono classi coniugate e l’orbita di x si dice classe di coniugio di x. Si verifica che lo stabilizzatore Gx è il centralizzatore di x: Gx = CG (x) = {g ∈ G | gx = xg}. Sia ora G un gruppo finito. Applicando il teorema precedente all’azione di coniugazione, e denotando con x̄1 , . . . , x̄n le classi di coniugio distinte si ha n X (1) |G| = [G : CG (xi )] i=1 dove |G| denota l’ordine del gruppo finito G. L’equazione (1) si chiama equazione delle classi del gruppo G. Sia Z(G) = {g ∈ G | gx = xg ∀x ∈ G} il centro di G, cioè l’insieme degli elementi che commutano con tutti gli elementi di G. Z(G) è un sottogruppo normale e x ∈ Z(G) se e solo se CG (x) = G e quindi x è l’unico elemento della sua classe di coniugio. Si può allora riscrivere l’equazione delle classi come m X (2) |G| = |Z(G)| + [G : CG (xi )] i=1 dove x̄1 , . . . , x̄m sono le classi di coniugio distinte per cui xi ∈ / Z(G) e quindi [G : CG (xi )] > 1 per ogni i. Anche la (2) viene detta equazione delle classi, ed è la forma che useremo in seguito. 4. Algebre di divisione finite 53 Polinomi ciclotomici su Q. Sia n un intero positivo e sia f (x) = xn − 1 ∈ Q[x]. Il campo di spezzamento di f (x) è detto estensione ciclotomica di ordine n di Q, e verrà denotato con Kn . Dunque in Kn esistono tutte le radici n-esime dell’unità. 2πi Se ζ è una radice n-esima primitiva dell’unità, per esempio ζ = e n , allora 2 n−1 Kn = Q(ζ). Infatti Q(ζ) contiene 1, ζ, ζ , . . . , ζ e poiché ζ è una radice primitiva, tutti questi elementi sono distinti. Dunque Q(ζ) contiene tutte le radici di xn − 1 e quindi Q(ζ) è un campo di spezzamento di xn − 1. Definizione 4.6. Sia n un intero positivo. L’n-esimo polinomio ciclotomico su Q è il polinomio monico gn (x) = (x − ζ1 )(x − ζ2 ) · · · (x − ζr ) dove ζ1 , . . . , ζr sono tutte le radici n-esime primitive dell’unità distinte in Kn . Per esempio, g1 (x) = x − 1 g2 (x) = x − (−1) = x + 1 à √ ! √ !à −1 − 3i −1 + 3i x− = x2 + x + 1 g3 (x) = x − 2 2 g4 (x) = (x − i)(x + i) = x2 + 1 Il grado di gn (x) è il numero di radici n-esime primitive dell’unità distinte e quindi deg gn (x) = ϕ(x), dove ϕ è la funzione di Eulero. Proposizione 4.7. Sia gn (x) l’n-esimo polinomio ciclotomico su Q. Y (1) xn − 1 = gd (x); d|n (2) gn (x) è un polinomio a coefficienti interi. Dimostrazione. Sia ζ una radice n-esima primitiva dell’unità. Il gruppo ciclico G = hζi ha n elementi e contiene tutte le radici d-esime dell’unità per ogni d che divide n. Un elemento η ∈ G è una radice d-esima primitiva dell’unità se e solo se il suo ordine, denotato con |η|, è uguale a d. Quindi, per d | n si ha Y gd (x) = (x − η) η∈G |η|=d e perciò xn − 1 = Y η∈G e cioè la (1). (x − η) = Y Y Y = (x − η) gd (x) d|n η∈G |η|=d d|n 54 3. Moduli di tipo finito Dimostriamo ora la (2) per induzione su n. Per n = 1 si ha g1 (x) = x − 1 e quindi la tesi è vera. Supponiamo ora vera la (2) per tutti i k < n e poniamo Y f (x) = gd (x). d|n d<n Per induzione, f (x) è a coefficienti interi, e xn − 1 = f (x)gn (x) in Q[x]. Ma poiché f (x) è monico, eseguendo la divisione di xn − 1 per f (x) si ha che tutti i coefficienti del quoziente sono interi, e cioè gn (x) è a coefficienti interi. ¤ Si può dimostrare che i polinomi ciclotomici gn (x) sono irriducibili in Q[x], e quindi il grado dell’estensione ciclotomica di ordine n è ϕ(n). La dimostrazione del teorema di Wedderburn. Sia D un’algebra di divisione finita e sia K = {a ∈ D | ax = xa ∀x ∈ D} il centro di D. Dimostriamo che K è un campo. Infatti se a, b ∈ K allora per ogni x ∈ D si ha (a − b)x = ax − bx = xa − xb = x(a − b) e quindi a − b ∈ D, e dunque K è un sottogruppo di D. Allo stesso modo si dimostra che se a, b ∈ K allora ab ∈ K. Infine, se a ∈ K e a 6= 0, per ogni x ∈ D si ha ax = xa e moltiplicando per a−1 a destra e a sinistra si ha xa−1 = a−1 x e quindi a−1 ∈ K. Allora K è un campo finito e sia |K| = q ≥ 2 (ricordiamo che q = pa dove p è primo). Il campo K è un sottoanello dell’anello D e quindi D è uno spazio vettoriale su K, di dimensione finita perché D è finito, e sia n = dimK D. Allora |D| = q n , potenza di un primo. La tesi è che D = K e cioè n = 1. L’idea è studiare il sottogruppo K ∗ di D∗ (ricordiamo che per un anello A, A∗ indica il gruppo moltiplicativo degli elementi invertibili di A) e poiché D∗ = D \ {0} e K ∗ = K \ {0}, sappiamo che |D∗ | = q n − 1 e |K ∗ | = q − 1. Possiamo usare l’equazione delle classi di D∗ , nella forma (2), per mettere in relazione gli ordini di D∗ e K ∗ e dimostrare che n = 1. Per usare l’equazione delle classi occorre conoscere l’azione di D∗ su se stesso per coniugio. Se a ∈ D∗ , poniamo N (a) = {d ∈ D | ad = da}. Come in precedenza per K, si dimostra che N (a) è un sottoanello di divisione di D che contiene K, e quindi N (a) è anch’esso uno spazio vettoriale su K. Dunque l’ordine |N (a)| = q r , per un opportuno r. Poiché N (a) è un anello di divisione contenuto in D, anche D è uno spazio vettoriale su N (a) e quindi |D| = |N (a)|s = q rs = q n e cioè r divide n. Per ogni a ∈ D, N (a)∗ = CD∗ (a), il centralizzatore di a in D∗ , e ha indice qn − 1 , con r | n. [D∗ : N (a)∗ ] = r q −1 Scriviamo l’equazione delle classi: (3) q n − 1 = (q − 1) + k X qn − 1 q ri − 1 i=1 dove (q − 1) è l’ordine del centro K ∗ e ri | n, ri 6= n per i = 1, . . . , k. 4. Algebre di divisione finite 55 Se r | n e r 6= n, poniamo fr (x) = coefficienti interi, ma addirittura xn − 1 . Si ha che fr (x) è un polinomio a xr − 1 fr (x) = gn (x) · hr (x) dove gn (x) è l’n-esimo polinomio Q ciclotomico e hr (x)Q∈ Z[x]. Infatti, dalla Proposizione 4.7 si ha che xn − 1 = d|n gd (x) e xr − 1 = d|r gd (x). Dunque Y Y gd (x) = gn (x) · (xr − 1) · hr (x). xn − 1 = gn (x) · gd (x) · d|r d|n, d-r Osserviamo che hr (x) è a coefficienti interi perché fr (x) è a coefficienti interi e gn (x) è a coefficienti interi e monico. Calcolando gn (x) per x = q si ha che gn (q) | q n − 1 ma anche, per quello che qn − 1 abbiamo appena dimostrato, che gn (q) | fr (q) = r per ogni r che divide n. q −1 Allora, dall’equazione (3), si ha gn (q) | q − 1. O • • • ζ •XXXXXXXX XXXXX XXXXX XXXXX X• / • q 1 • D’altra parte, se ζ ∈ C è una radice n-esima dell’unità, ζ 6= 1, si ha la disuguaglianza fra i valori assoluti |q − ζ| > |q − 1| = q − 1 e perciò ¯ ¯ ¯Y ¯ Y ¯ ¯ |gn (q)| = ¯ (q − ζi )¯ = |q − ζi | > q − 1 ¯ ¯ i i che è una contraddizione a meno che n = 1 (non ci sono radici dell’unità diverse da 1). ¤ Capitolo 4 Anelli non commutativi In questo breve capitolo vedremo alcuni importanti esempi di anelli non commutativi. Gli esempi sono scelti per la loro importanza nella Teoria delle Rappresentazioni, e conoscere a fondo questi esempi sarà utile per comprendere meglio i risultati che vedremo in seguito. Cercheremo anche di mettere in evidenza le proprietà che non valgono in generale nel caso non commutativo, per acquisire un po’ di intuizione. D’ora in poi la parola anello significherà anello non necessariamente commutativo, ma in generale con unità. Prima di cominciare, vediamo alcune definizioni. I concetti di omomorfismo, isomorfismo, nucleo, immagine e sottoanello non hanno bisogno di modifiche. Se I è un sottogruppo del gruppo additivo di A, e aI ⊆ I per ogni a ∈ A, allora I è un ideale sinistro di A, e analogamente se Ia ⊆ I per ogni a ∈ A, allora I è un ideale destro di A. Se I è un ideale sia destro che sinistro, è detto un ideale bilatero, o semplicemente un ideale. È possibile avere ideali destri ma non sinistri e viceversa. Per costruire l’anello quoziente A/I è essenziale che I sia un ideale bilatero (altrimenti la moltiplicazione fra classi non è ben definita). In un anello A l’insieme degli elementi che commutano con tutti gli elementi di A è detto il centro di A, e viene denotato Z(A): Z(A) = {a ∈ A | ax = xa per ogni x ∈ A}. Z(A) è un sottoanello (commutativo) di A e A è uno Z(A)-modulo in modo naturale. Se B è un qualunque sottoanello di Z(A), allora diciamo che A è una B-algebra, oppure una algebra su B. Se A1 e A2 sono B-algebre, allora sia A1 che A2 contengono B (nel loro centro) e un omomorfismo di algebre f : A1 → A2 è un omomorfismo di anelli tale che f (b) = b per ogni b ∈ B. Se B = K è un campo, allora una K-algebra A è un anello che è anche uno spazio vettoriale su K. La dimensione di A come spazio vettoriale su K è detto il rango di A. Quando diciamo che un anello A è un’algebra (senza specificare su quale altro anello) intendiamo che A è una K-algebra, per un opportuno campo K, 57 58 4. Anelli non commutativi e cioè un’algebra è un anello che è uno spazio vettoriale su di un campo contenuto nel centro dell’anello. 1. Algebre di endomorfismi L’esempio più tipico di anello non commutativo è dato dall’algebra degli endomorfismi di uno spazio vettoriale, o più in generale di un modulo. Se V è uno spazio vettoriale di dimensione finita sul campo K, allora l’anello EndK (V ) = {f : V → V | f lineare} è un anello con le operazioni di somma e composizione di omomorfismi. Naturalmente EndK (V ) non è commutativo, a meno che dim V = 1, e in tal caso si ha EndK (V ) = V ∼ = K. La moltiplicazione per un elemento di K è un endomorfismo di V , che commuta con tutti gli altri endomorfismi. Dunque K è contenuto nel centro di EndK (V ) che quindi è una K-algebra. Fissando una base {v1 , . . . , vn } in V e rappresentando ogni endomorfismo mediante una matrice quadrata si ha un isomorfismo EndK (V ) ∼ = M (n, K) con l’anello delle matrici quadrate di dimensione n a coefficienti in K. Da questo osserviamo che il rango di EndK (V ) come K-algebra è n2 . Una base di EndK (V ) come spazio vettoriale è data dagli endomorfismi fij dove fij (vj ) = vi , fij (vk ) = 0 per k 6= j sugli elementi della base fissata. fij è rappresentato dalla matrice Eij che ha 1 in posizione (i, j) e 0 altrove. In termini di questa base, si può scrivere la moltiplicazione come Eij Ekl = 0, se j 6= k Eij Ejl = Eil . Questo modo di definire un’algebra, mediante una base come spazio vettoriale e poi definendo la moltiplicazione fra gli elementi della base, è molto conveniente e verrà usato spesso nel seguito. Naturalmente, non tutte le regole di moltiplicazione danno un’algebra: si deve verificare che la moltiplicazione che risulta sia associativa e che esista l’unità. Possiamo generalizzare l’esempio precedente considerando A un anello commutativo con unità e M un A-modulo. Allora EndA (M ) = {f : M → M | f omomorfismo di A-moduli} è un anello, in generale non commutativo. Se M è libero di rango n si può di nuovo identificare EndA (M ) con l’anello della matrici n × n a coefficienti in A. Un’altra generalizzazione è considerare uno spazio vettoriale V di dimensione infinita. Di solito EndK (V ) non ha proprietà interessanti (o facili da ottenere), a meno di imporre qualche restrizione su V . L’esempio più importante è V = spazio di Banach complesso e B(V ) = {f : V → V | f operatore lineare limitato}. Ricordiamo che per un operatore su uno spazio di Banach limitato è equivalente a continuo. Se V ha dimensione finita, allora ogni operatore lineare è continuo, e quindi ritroviamo l’esempio precedente. 1. Algebre di endomorfismi 59 Sia D un’algebra di divisione non commutativa (e quindi non finita). Notiamo che il centro Z(D) è un campo, e D è uno spazio vettoriale su Z(D). Dunque D è una K-algebra, per ogni sottocampo K ⊆ Z(D). L’esempio più noto di algebra di divisione non commutativa è dato dall’anello dei quaternioni H, che si può definire come un’algebra di rango 4 su R, con base 1, i, j, k, e legge di moltiplicazione i2 = j 2 = k 2 = −1, ij = k, ji = −k, jk = i, kj = −i, ki = j, ik = −j; per ricordare la regola, pensiamo a (i, j, k) come un ciclo, e il prodotto di due elementi è il terzo se seguiamo l’ordine ciclico, e il suo opposto altrimenti. Dunque ogni quaternione si scrive q = a + bi + cj + dk, con a, b, c, d ∈ R, e definiamo, in √ analogia con i numeri complessi, il coniugato q̄ = a − bi − cj − dk e il modulo |q| = a2 + b2 + c2 + d2 . Si verifica immediatamente che q q̄ = q̄q = |q|2 ∈ R e q1 q2 = q¯1 q¯2 da cui segue che, se q 6= 0, allora q̄/|q|2 è l’inverso di q. Se D è un’algebra di divisione e V un D-modulo sinistro di rango n, allora V ha tutte le proprietà di uno spazio vettoriale e tutti i teoremi di algebra lineare valgono per V , con un’unica, significativa, differenza. Supponiamo che V abbia una base v1 , . . . , vn e siano ϕ e ψ due endomorfismi, rappresentati, rispetto alla base data, dalle matrici A = (aij ) e B = (bkl ). Allora la matrice C che rappresenta la composizione ϕψ è data da X cil = bkl aik . k In altre parole, nella solita formula di moltiplicazione di matrici, dobbiamo scambiare l’ordine dei fattori. Dunque non è vero che EndD (V ) è isomorfo all’anello delle matrici quadrate n × n su D. Consideriamo, per esempio, il caso n = 1. Allora V = D e l’azione di D su se stesso è per moltiplicazione a sinistra. Sia ora a ∈ D e sia fa : D → D definita da fa (x) = xa, e notiamo che fa (1) = a, e cioè a è determinato dal valore della funzione su una base di V . f è lineare: infatti fa (bx) = (bx)a = b(xa) = bfa (x), e osserviamo chega (x) = ax non è lineare. La funzione ϕ : EndD (D) → D data da ϕ(f ) = f (1) è un isomorfismo di gruppi abeliani, ma non è un omomorfismo di anelli, poiché ϕ(fa ◦ fb ) = (fa ◦ fb )(1) = fa (fb (1)) = fa (b) = ba 6= ab = ϕ(fa )ϕ(fb ). In generale, se dimD V = n, sia {v1 , . . . , vn } una base e sia f : V → V un omomorfismo. Se poniamo, come al solito, f (vi ) = a1i v1 + · · · + ani vn , allora A = (aij ) è la matrice che rappresenta f nella base data. Per un vettore v = b1 v1 + · · · + bn vn calcoliamo f (v); per linearità si ottiene: X X X X X X f (v) = f bj vj = bj f (vj ) = bj aij vi = bj aij vi j j j i i j e vediamo che la formula è la stessa (come indici della sommatoria) del caso commutativo, ma la moltiplicazione è scambiata. Allo stesso modo si dimostra che la matrice della composizione di due omomorfismi è quella scritta più in alto. 60 4. Anelli non commutativi Definizione 1.1. Due anelli A e A0 si dicono opposti oppure anti-isomorfi se esiste f : A → A0 biunivoca tale che f (a + b) = f (a) + f (b), f (ab) = f (b)f (a). Se f : A → A è un anti-isomorfismo, f viene detta involuzione. Esempi di involuzioni sono t : M (n, A) → M (n, A), dove A è un anello commutativo, data da t(C) = matrice trasposta di C, e c : H → H data dalla coniugazione c(q) = q̄. Per ogni anello A esiste un anello Aop anti-isomorfo ad A: basta prendere gli stessi elementi di A, con la stessa somma e con il prodotto fra a e b dato da ba. Allora l’identità è un anti-isomorfismo fra A e Aop . Possiamo riassumere la discussione precedente nel Teorema 1.2. Se D è un’algebra di divisione e V un D-spazio vettoriale di dimensione finita n, allora l’anello delle trasformazioni lineari EndD (V ) è isomorfo all’anello delle matrici quadrate M (n, Dop ) a coefficienti nell’algebra di divisione opposta Dop . Determiniamo ora gli ideali in un’algebra di endomorfismi. Sia V uno spazio vettoriale di dimensione finita sull’algebra di divisione D, e sia W un sottospazio. W determina due ideali, uno sinistro e l’altro destro, come segue: (1) WI = {ϕ ∈ EndD (V ) | W ⊆ ker ϕ}, (2) IW = {ϕ ∈ EndD (V ) | Im ϕ ⊆ W }. Verifichiamo, per esempio, che W I è un ideale sinistro. Siano ϕ, ψ ∈ W I e sia w ∈ W : (ϕ + ψ)(w) = ϕ(w) + ψ(w) = 0 e dunque ϕ + ψ ∈ W I. Sia ora ϕ ∈ W I, ψ ∈ EndD (V ) e w ∈ W : (ψϕ)(w) = ψ(ϕ(w)) = ψ(0) = 0 e dunque ψϕ ∈ W I. Dunque W I è un ideale sinistro. La verifica che IW è un ideale destro è simile. Proposizione 1.3. Sia I un ideale sinistro in EndD (V ). Allora I = opportuno sottospazio W di L. W I, per un Dimostrazione. Dato l’ideale sinistro I, definiamo W come \ W = {x ∈ V | ϕ(x) = 0 per ogni ϕ ∈ I} = ker ϕ ϕ∈I Se ϕ ∈ I allora W ⊆ ker ϕ e cioè I ⊆ W I. Dimostriamo l’inclusione opposta. Osserviamo che se f, g ∈ EndD (V ) sono tali che ker g ⊆ ker f allora esiste h ∈ EndD (V ) tale che f = hg: V g f ~ ~ /V ~> ² ~ h V Dalla catena di inclusioni ker g ⊆ ker f ⊆ V , possiamo trovare una base u1 , . . . , uk , v1 , . . . , vn , w1 , . . . , wm di V in modo che gli ui siano una base di ker g, e gli ui , vj siano una base di ker f . Allora gli elementi g(v1 ), . . . , g(wm ) sono una base di Im g 1. Algebre di endomorfismi 61 e quindi sono linearmente indipendenti, e possono essere completati mediante e1 , . . . , ek ad una base di V . Definiamo h come segue h(g(vi )) = f (vi ) = 0 h(g(wj )) = f (wj ) h(ei ) = arbitrario e la verifica che f = gh è immediata. Dunque basta dimostrare che esiste gW ∈ I tale che ker gW = W . L’ideale I è un sottospazio dello spazio vettoriale EndD (V ) e sia ϕ1 , . . . , ϕk una sua base. Allora \ W = ker ϕ = ker ϕ1 ∩ · · · ∩ ker ϕk ϕ∈I e per provare l’esistenza di gW , e concludere la dimostrazione basta, per induzione, provare il lemma che segue. ¤ Lemma 1.4. Siano ϕ1 , ϕ2 ∈ EndD (V ). Allora esistono h1 , h2 ∈ EndD (V ) tali che, ponendo ϕ = h1 ϕ1 + h2 ϕ2 , si ha ker ϕ = ker ϕ1 ∩ ker ϕ2 . Dimostrazione. Sia W = ker ϕ1 ∩ ker ϕ2 . Per il teorema di completamento della base si possono trovare due sottospazi U e T tali che ker ϕ1 = W ⊕ U ker ϕ2 = W ⊕ T e dunque ker ϕ1 + ker ϕ2 = W ⊕ U ⊕ T. Sia poi F un sottospazio tale che V = W ⊕ U ⊕ T ⊕ F , e scegliamo basi {wi }, {ui }, {ti }, {fi } di questi sottospazi, in modo che l’unione sia una base di V . Definiamo ora h1 : i vettori {ϕ1 (ti )}, {ϕ1 (fi )} sono una base di Im ϕ1 e quindi sono linearmente indipendenti, e possono essere completati mediante e1 , . . . , ek ad una base di V . Definiamo h1 come segue h1 (ϕ1 (ti )) = ti h1 (ϕ1 (fi )) = fi h1 (ei ) = arbitrario e si ottiene, per h1 ϕ1 , h1 (ϕ1 (wi )) = 0 h1 (ϕ1 (ui )) = 0 h1 (ϕ1 (ti )) = ti h1 (ϕ1 (fi )) = fi Allo stesso modo, i vettori {ϕ2 (ui )}, {ϕ2 (fi )} sono una base di Im ϕ2 e quindi sono linearmente indipendenti, e possono essere completati mediante g1 , . . . , gs ad una base di V . Definiamo h2 come segue h2 (ϕ2 (ui )) = ui h2 (gi ) = arbitrario h2 (ϕ2 (fi )) = 0 62 4. Anelli non commutativi e si ottiene, per h2 ϕ2 , h2 (ϕ2 (wi )) = 0 h2 (ϕ2 (ui )) = ui h2 (ϕ2 (ti )) = 0 h2 (ϕ2 (fi )) = 0 Sommando si ha che, per ϕ = h1 ϕ1 + h2 ϕ2 ϕ(wi ) = 0 ϕ(ui ) = ui ϕ(ti ) = ti ϕ(fi ) = fi e quindi ker ϕ = W , come richiesto. ¤ In modo simile si può provare che ogni ideale destro J è della forma J = IW . Si può però anche usare la dualità fra V e V ∗ = HomD (V, D), considerando, per un sottospazio W di V , il sottospazio duale W ∗ = {g ∈ V ∗ | g(W ) = 0}. W ∗ è anche detto l’annullatore di W . Per ogni f ∈ EndD (V ) c’è, per funtorialità, un f ∗ ∈ EndD (V ∗ ) definito da f ∗ (g) = g ◦ f . Per esercizio, verificare che: • la mappa ϕ : EndD (V ) → EndD (V ∗ ) data da ϕ(f ) = f ∗ è un antiisomorfismo, e (quindi) porta ideali destri in ideali sinistri e ideali sinistri in ideali destri; • ϕ(IW ) = W ∗ I e ϕ (W I) = IW ∗ ; • ϕ−1 (IW ∗ ) = W I e ϕ−1 (W ∗ I) = IW ; Questo, insieme alla proposizione precedente, dimostra che ogni ideale destro di EndD (V ) è della forma IW . Proposizione 1.5. Sia I un ideale bilatero in EndD (V ). Allora I = (0) oppure I = EndD (V ). Dimostrazione. Poiché I è un ideale sinistro, esiste un sottospazio W tale che I = W I = {ϕ | ϕ(W ) = 0}. Se W = {0}, allora I = EndD (V ). Sia quindi x ∈ W , x 6= 0, e sia ϕ ∈ I. Sia ora ψ ∈ EndD (V ); poiché I è un ideale destro, ϕψ ∈ I e quindi ϕ(ψ(x)) = 0. Al variare di ψ, otteniamo che ψ(x) può essere un qualunque vettore in V , e quindi ϕ = 0. Dunque I = 0. ¤ Definizione 1.6. Sia A un anello. A si dice semplice se gli unici ideali di A sono (0) e A. Nel caso commutativo, un anello semplice è un campo. EndD (V ) è un anello semplice che non è un’algebra di divisione. Questa differenza è legata alla descrizione degli ideali in un anello non commutativo. Sia A un anello, e sia x ∈ A. L’ideale principale (x) generato da x è, per definizione, il più piccolo ideale che contiene x. Se A è commutativo con unità, allora (x) = Ax, e da questo segue immediatamente che (x) = A se e solo se x è invertibile. Se A non è commutativo, Ax è solo un ideale sinistro. In generale si ha Proposizione 1.7. Sia A un anello con unità, e x ∈ A. Allora ( ) X (x) = ai xbi | ai , bi ∈ A . i 2. L’algebra gruppo K[G] 63 Dimostrazione. Esercizio. Dimostrare che l’insieme descritto nell’enunciato è un ideale (bilatero) e che contiene ogni ideale che contiene x. Il fatto che A abbia l’unità è essenziale (se A non ha unità, l’insieme descritto non contiene necessariamente x). ¤ P Dunque se (x) = A, possiamo solo dire che esistono elementi ai , bi ∈ A tali che i ai xbi = 1, e questo non basta per dire che x è invertibile. 2. L’algebra gruppo K[G] Sia G un gruppo finito e sia K un campo. Per ogni elemento g ∈ G, sia eg un simbolo, e consideriamo lo spazio vettoriale V su K che ha per base gli elementi eg . La dimensione di V è l’ordine del gruppo. Su V definiamo una moltiplicazione come segue: eg eh = egh , ∀g, h ∈ G ed estendiamo per linearità. L’anello cosı̀ ottenuto si chiama l’algebra gruppo di G e viene denotata K[G]. Di solito, si identifica il simbolo eg con l’elementoPcorrispondente g ∈ G, e quindi ogni elemento di K[G] è una combinazione lineare g∈G ag g, dove i coefficienti ag sono in K. Se scriviamo il prodotto di due elementi X X X ag g · bg g = cg g g∈G g∈G g∈G come combinazione lineare degli elementi della base, allora la formula che esprime i coefficienti cg in termini di ag e bg è: X cg = ah bh−1 g h∈G Se e è l’elemento neutro di G allora e ∈ K[G] è l’unità dell’anello. Più in generale, gli elementi di G sono invertibili in K[G] e l’inverso è lo stesso che in G, naturalmente. Se H è un sottogruppo Pdi G, allora K[H] è un sottoanello di K[G], Possiamo pensare a un elemento g∈G ag g come una funzione a : G → K, data da a(g) = ag . In questo modo, K[G] non è altro che lo spazio delle funzioni da G a K, con la somma data da (a + b)(g) = a(g) + b(g) e la moltiplicazione data da c(g) = X a(g)b(h−1 g) h∈G Questa formula è la base per la generalizzazione a gruppi infiniti. Per esempio, se G = {z ∈ C | |z| = 1} è il gruppo dei numeri complessi unitari, scrivendo z = eiϕ , si osserva subito che una funzione su G è una funzione in ϕ periodica di periodo 2π. Possiamo allora definire R[G] come l’algebra delle funzioni periodiche (continue e assolutamente integrabili) con moltiplicazione che porta α(ϕ), β(ϕ) nella funzione Z 2π 1 α(t)β(ϕ − t) dt γ(ϕ) = 2π 0 e cioè γ è la convoluzione delle funzioni α e β. 64 4. Anelli non commutativi Osserviamo però che questa definizione non è completamente corretta, perché manca l’elemento unità. Infatti, l’unità corrisponde alla funzione delta di Dirac dell’elemento neutro, funzione che non è continua (e non è nemmeno una funzione, ma una distribuzione). Poiché non ha molto senso considerare una distribuzione periodica, si rimedia in un altro modo, più algebrico, cercando di immergere R[G] in un anello con unità. È sempre possibile immergere ogni anello in un anello con unità. Sia A un anello senza unità e sia A0 = A ⊕ Z, come gruppi abeliani. Definiamo il prodotto come segue (a, n) · (b, m) = (ab + nb + ma, nm) dove ma, nb ∈ A sono i multipli interi degli elementi a, b ∈ A. A0 è un anello, commutativo se e solo se lo è A, con unità (0, 1). Il sottoinsieme degli elementi della forma (a, 0) è un ideale di A0 . Esercizio 2.1. Sia A un anello con unità, e applichiamo la costruzione precedente. L’anello A0 che si ottiene è isomorfo ad A? L’unico teorema che citiamo per le algebre gruppo è il seguente: Teorema 2.2 (Maschke). Sia G un gruppo finito, e sia K un campo algebricamente chiuso di caratteristica 0, oppure di caratteristica p tale che p non divide l’ordine del gruppo G. Allora esistono interi positivi n1 , . . . , nt tali che K[G] ∼ = M (n1 , K) × · · · × M (nt , K) come K-algebre. Questo teorema è alla base dello studio delle rappresentazioni lineari dei gruppi finiti sui campi algebricamente chiusi. Capitolo 5 Categorie e funtori La teoria delle categorie nasce dall’osservazione che nella matematica moderna non sono solo gli oggetti (per esempio, gruppi, anelli, moduli, spazi topologici, varietà differenziabili, . . . ) ad essere importanti ma anche le funzioni fra di essi. Inoltre spesso un enunciato è sufficientemente generale da valere in una grande quantità di situazioni apparentemente differenti. Sorge quindi l’esigenza di avere un linguaggio unificato in cui effettuare tutte queste costruzioni, una volta per tutte. In questo capitolo enunceremo le definizioni di categoria, funtore e trasformazione naturale. Vedremo poi alcune costruzioni categoriali, come prodotti, coprodotti, oggetti liberi e la definizione di alcuni funtori molto usati, come Hom e prodotto tensoriale. 1. Categorie Il primo concetto è quello di categoria. Definizione 1.1. Una categoria C è composta dai seguenti dati: (1) Una classe Ob C i cui elementi sono detti oggetti di C. (2) Una collezione di insiemi Hom(X, Y ), uno per ogni coppia ordinata di oggetti X, Y ∈ Ob C, i cui elementi sono detti morfismi da X a Y ; i morfismi sono denotati ϕ : X → Y . (3) Una collezione di funzioni Hom(X, Y ) × Hom(Y, Z) −→ Hom(X, Z), una per ogni terna ordinata X, Y, Z ∈ Ob C. Ogni funzione di questa collezione associa ad una coppia di morfismi ϕ : X → Y , ψ : Y → Z un morfismo da X a Z, denotato con ψ ◦ ϕ, o più semplicemente ψϕ : X → Z detto la composizione o il prodotto di ϕ e ψ. Questi dati devono soddisfare le seguenti proprietà: (1) Ogni morfismo ϕ determina unicamente una coppia ordinata X, Y ∈ Ob C tale che ϕ ∈ Hom(X, Y ). In altre parole, gli insiemi Hom(X, Y ) sono a due a due disgiunti. 65 66 5. Categorie e funtori (2) Per ogni X ∈ Ob C esiste un morfismo identico idX : X → X; esso è unicamente determinato dalle condizioni idX ◦ϕ = ϕ, ψ ◦ idX = ψ, ogni volta che le composizioni sono definite. (3) La composizione di morfismi è associativa: (ξψ)ϕ = ξ(ψϕ) per ogni ϕ : X → Y , ψ : Y → Z, ξ : Z → W . Osserviamo che Ob C non è, in generale, un insieme ma solo una classe. Quindi una categoria non è descrivibile (in senso stretto) nella teoria di Zermelo–Fraenkel. Una trattazione formale ci porterebbe lontano, ma possiamo dare brevemente alcuni cenni della teoria degli insiemi di Gödel–Bernays, che ha come concetti primitivi quello di classe e di appartenenza. Due classi sono uguali se e solo se hanno gli stessi elementi (cioè per le classi vale l’assiome dell’estensione ZF 1) e l’assioma di formazione per le classi afferma che per ogni proprietà P (x) con una variabile libera esprimibile nel linguaggio del primo ordine (connettivi logici e quantificatori universale e esistenziale) esiste una classe, in simboli ∀P ∃y : ∀z z ∈ y ⇐⇒ P (z). Questa classe si indica con y = {z | P (z)}, e cioè per le classi vale l’assioma del sottoinsieme (ZF 7) senza restrizioni. Con questa terminologia una classe A è un insieme se e solo se esiste una classe B tale che A ∈ B. In un certo senso, un insieme è una classe che non è “troppo grande”. Gli altri assiomi della teoria di Gödel–Bernays descrivono il comportamento delle classi e degli insiemi in modo del tutto equivalente alla teoria di Zermelo–Fraenkel e la differenza fra i due linguaggi è solo data dal fatto di poter parlare più facilmente, in Gödel–Bernays, di oggetti che non sono insiemi. Per definire in modo appropriato una categoria questo è essenziale perché, per molte categorie di interesse, Ob C non è un insieme. Questo capita per tutte le categorie dell’Esempio 1.3. Definizione 1.2. In una categoria C un morfismo f : A → B è una equivalenza se esiste un morfismo g : B → A tale che gf = idA e f g = idB . Se esiste una equivalenza f : A → B, gli oggetti A e B sono detti equivalenti. Vediamo subito alcuni esempi. È immediato verificare che in ognuno dei seguenti casi le condizioni della definizione di categoria sono soddisfatte. Se in un qualche caso non risulta evidente, è bene convincersene scrivendo tutti i dettagli. Esempio 1.3. (1) La categoria Sets degli insiemi: gli oggetti sono tutti gli insiemi, i morfismi Hom(X, Y ) sono tutte le funzioni da X a Y . (2) La categoria Top degli spazi topologici: gli oggetti sono gli spazi topologici, i morfismi sono le funzioni continue. (3) La categoria Simp dei complessi simpliciali: gli oggetti sono i complessi simpliciali, i morfismi le mappe simpliciali. (4) La categoria Pair delle coppie: gli oggetti sono coppie (X, A) dove X è uno spazio topologico e A è un suo sottospazio. I morfismi Hom((X, A), (Y, B)) sono le funzioni continue f : X → Y tali che f (A) ⊆ B. Un caso particolare di questa costruzione è la categoria Top∗ degli spazi puntati, i cui 1. Categorie (5) (6) (7) (8) 67 oggetti sono le coppie (X, x) dove X è uno spazio topologico e x ∈ X, con i morfismi definiti come sopra. La categoria Grp: gli oggetti sono i gruppi, i morfismi sono gli omomorfismi di gruppo. La categoria Ab: gli oggetti sono i gruppi abeliani, i morfismi sono gli omomorfismi di gruppo. La categoria ModA : gli oggetti sono tutti gli A-moduli (sinistri), i morfismi sono gli omomorfismi di moduli. La categoria k-Vect: gli oggetti sono gli spazi vettoriali su k, i morfismi le applicazioni lineari. Se C è una categoria, in genere si scrive X ∈ C invece di X ∈ Ob C per indicare S che X è un oggetto di C. L’insieme X,Y ∈C Hom(X, Y ) di tutti i morfismi della categoria C si indica con Mor(C). La definizione di una categoria comprende solo proprietà riguardo la composizione di morfismi e non dice niente sul comportamento degli oggetti. In generale, un enunciato concreto in una categoria è che certe composizioni di morfismi sono uguali, per esempio che ψϕ = ϕ0 ψ 0 . In tali casi, invece di scrivere le formule, è più conveniente dire che il diagramma X ϕ /Y ϕ0 ² /Z ψ0 ² U ψ è commutativo. In tutti gli esempi precedenti, gli oggetti sono insiemi con delle strutture addizionali e i morfismi sono funzioni che rispettano queste strutture. Vediamo ora degli esempi in cui gli oggetti sono insiemi con struttura, ma i morfismi non sono funzioni. Esempio 1.4. (1) La categoria Toph: gli oggetti sono gli spazi topologici, i morfismi sono le classi di omotopia delle funzioni continue da X a Y . In questo caso, se f ∈ Hom(X, Y ) e se x ∈ X non ha senso considerare f (x), perché f non è una funzione, ma solo una classe di equivalenza di funzioni e dunque il suo valore in un punto non è determinato. Questa è la categoria più usata quando si studia l’omotopia. (2) La categoria Rel delle relazioni: gli oggetti sono gli insiemi, i morfismi sono i sottoinsiemi del prodotto cartesiano: Hom(X, Y ) = {ϕ | ϕ ⊆ X × Y } È strano usare la lettera ϕ per indicare un sottoinsieme, ma in questo modo possiamo definire la composizione di ϕ : X → Y e ψ : Y → Z come segue: ψ ◦ ϕ = {(x, z) ∈ X × Z | ∃y ∈ Y : (x, y) ∈ ϕ, (y, z) ∈ ψ} Il morfismo identità è la diagonale del prodotto idX = {(x, x), x ∈ X} ⊆ X × X. 68 5. Categorie e funtori (3) A volte è utile considerare come categoria una particolare struttura. Sia I un insieme parzialmente ordinato. La categoria C(I) ha per oggetti gli elementi di I e Hom(i, j) ha un solo elemento se i ≤ j ed è vuoto altrimenti. Naturalmente conoscere quali insiemi di morfismi sono vuoti e quali no è equivalente a conoscere l’ordinamento di I. Osserviamo anche che in questo caso Ob C = I è un insieme. Il secondo concetto è quello di funtore. Definizione 1.5. Un funtore F da una categoria C a una categoria D, denotato con F : C → D, è dato da: (1) Una funzione Ob C → Ob D, che assegna ad ogni X ∈ Ob C un oggetto F (X) ∈ Ob D. (2) Una funzione Mor C → Mor D, che assegna ad ogni ϕ ∈ Mor C un morfismo F (ϕ) ∈ Mor D in modo che se ϕ : X → Y allora F (ϕ) : F (X) → F (Y ). Questi dati devono soddisfare la seguente condizione: F (ψ ◦ ϕ) = F (ψ) ◦ F (ϕ) per ogni coppia di morfismi ψ, ϕ per cui sia definita la composizione. In particolare, F (idX ) = idF (X) . Vediamo alcuni esempi. In tutti i casi è necessario un po’ di lavoro per definire i morfismi indotti. Esempio 1.6. (1) La realizzazione geometrica | · | : Simp → Top che ad un complesso simpliciale K associa la sua realizzazione geometrica |K|, e ad una mappa simpliciale la corrispondente funzione continua. (2) Il gruppo fondamentale π1 : Top∗ → Grp che ad uno spazio topologico X con punto base x assegna il suo gruppo fondamentale, i cui elementi sono le classi di omotopia delle funzioni continue f : (S 1 , 1) → (X, x). (3) Il gruppo di omologia simpliciale Hi : Simp → Ab che associa ad un complesso simpliciale il suo i-esimo gruppo di omologia simpliciale Hi (X, Z). (4) Il gruppo di omologia singolare Hi : Top → Ab che associa ad uno spazio topologico X il suo i-esimo gruppo di omologia singolare Hi (X, Z). (5) Il funtore Hom(−, N ) : ModA → ModA che associa ad ogni A-modulo M il modulo Hom(M, N ) e ad ogni omomorfismo f : M → M 0 l’omomorfismo f ∗ : Hom(M 0 , N ) → Hom(M, N ) definito da f ∗ (ϕ) = ϕ ◦ f . (6) Il funtore Hom(N, −) : ModA → ModA che associa ad ogni A-modulo M il modulo Hom(N, M ) e ad ogni omomorfismo f : M → M 0 l’omomorfismo f∗ : Hom(N, M ) → Hom(N, M 0 ) definito da f∗ (ϕ) = f ◦ ϕ. (7) Il funtore − ⊗ N : ModA → ModA che associa ad ogni A-modulo M il modulo M ⊗ N e ad ogni omomorfismo f : M → M 0 l’omomorfismo f ⊗ idN : M ⊗ N → M 0 ⊗ N . I funtori che abbiamo definito sono usualmente detti covarianti, perché rispettano l’ordine della composizione dei morfismi nelle categorie C e D. Esistono anche i funtori controvarianti, nella cui definizione si richiede che F (ψϕ) = F (ϕ)F (ψ). Un esempio tipico di funtore controvariante è dato dai gruppi di coomologia. Il funtore 2. Alcune costruzioni 69 Hom(−, N ) dell’esempio 5 è controvariante. Tuttavia, può essere più conveniente fare “l’inversione delle frecce” nella categoria iniziale C. Formalmente, definiamo la categoria duale C◦ come segue: Ob C◦ = Ob C, ma un oggetto X ∈ Ob C pensato come oggetto in C◦ verrà denotato con X ◦ ; HomC◦ (X ◦ , Y ◦ ) = HomC (Y, X), e a ogni ϕ : Y → X associamo ϕ◦ : X ◦ → Y ◦ ; infine definiamo la composizione e l’identità come ϕ◦ ◦ ψ ◦ = (ψϕ)◦ , idX ◦ = (idX )◦ . Con queste definizioni, un funtore controvariante G : C → D è un funtore (covariante) G : C◦ → D. Dunque nell’esempio 5 possiamo pensare Hom(−, N ) come un funtore (covariante) da Mod◦A a ModA . L’ultimo concetto che introduciamo è quello di morfismo di funtori o trasformazione naturale. La definizione precisa è la seguente: Definizione 1.7. Siano F , G due funtori da C a D. Una trasformazione naturale o morfismo di funtori da F a G, che si denota con t : F → G, è una famiglia di morfismi nella categoria D: t(X) : F (X) → G(X), uno per ogni oggetto X ∈ Ob C, che soddisfa la seguente condizione: per ogni morfismo ϕ : X → Y in C il diagramma F (X) t(X) F (ϕ) ² G(X) / G(X) G(ϕ) t(Y ) ² / G(Y ) è commutativo. 2. Alcune costruzioni Molti concetti categoriali sono definiti in termini di proprietà universali, in modo da garantire l’unicità dell’oggetto definito. La questione dell’esistenza deve poi essere decisa nelle varie categorie d’interesse. Cominciamo con il prodotto. Definizione 2.1. Sia C una categoria e {Ai }i∈I una famiglia di oggetti di C. Un prodotto per la famiglia {Ai }i∈I è un oggetto P di C con una famiglia di morfismi {πi : P → Ai }i∈I tale che, per ogni oggetto B di C e per ogni famiglia di morfismi {ϕi : B → Ai }i∈I , esiste un unico morfismo ϕ : B → P tale che πi ◦ ϕ = ϕi per tutti gli i ∈ I. Y Il prodotto della famiglia {Ai }i∈I si indica di solito con Ai . i∈I Esercizio 2.2. Disegnare un diagramma commutativo che esprima la definizione del prodotto. La proprietà caratteristica di un prodotto è di avere le “proiezioni sui fattori”. Notiamo che in generale non ci sono mappe canoniche da un fattore nel prodotto, come è evidente già nel caso del prodotto X × Y di due fattori. Non sempre 70 5. Categorie e funtori il prodotto di una famiglia di oggetti esiste. Dimostrare che nei casi seguenti il prodotto è quello indicato: (1) (2) (3) (4) (5) in in in in in Sets, il prodotto cartesiano degli insiemi della famiglia; Top, il prodotto cartesiano degli insiemi con la topologia prodotto; Grp, il prodotto diretto di gruppi; Ab, il prodotto diretto di gruppi; ModA , il prodotto diretto di moduli. Poiché le definizioni categoriali sono tutte date in termini di oggetti e di morfismi, “rovesciando le frecce” si ottiene la definizione dell’oggetto “duale”. Definizione 2.3. Sia C una categoria e {Ai }i∈I una famiglia di oggetti di C. Un coprodotto o somma per la famiglia {Ai }i∈I è un oggetto S di C con una famiglia di morfismi {ιi : Ai → S}i∈I tale che, per ogni oggetto B di C e per ogni famiglia di morfismi {ψi : Ai → B}i∈I , esiste un unico morfismo ψ : S → B tale che ψ ◦ ιi = ψi per tutti gli i ∈ I. a Il coprodotto della famiglia {Ai }i∈I si indica di solito con Ai . i∈I Esercizio 2.4. In quali delle categorie viste in precedenza esiste sempre il coprodotto di una famiglia di oggetti? La proprietà caratteristica di un coprodotto è di avere le “immersioni canoniche degli addendi”. Questo può aiutare a capire quali possano essere i coprodotti in Sets e Top. Gli oggetti di una categoria non sono necessariamente insiemi, né i morfismi sono necessariamente funzioni nel senso usuale della parola. Quando questo capita, la categoria si dice concreta. Per esempio, Sets oppure ModA sono categorie concrete, mentre Toph oppure Rel non lo sono. La prossima definizione ha senso solo in una categoria concreta. Definizione 2.5. Sia F un oggetto di una categoria concreta C, X un insieme non vuoto e i : X → F una funzione (fra insiemi). F è libero sull’insieme X se per ogni oggetto A di C e per ogni funzione f : X → A fra insiemi, esiste un unico morfismo di C ϕ : F → A tale che ϕi = f come funzioni fra insiemi da X ad A. La proprietà caratteristica di un oggetto libero F è che, per definire un morfismo con dominio F basta specificare le immagini degli elementi del sottoinsieme X. Come abbiamo visto nel Capitolo 2, in ModA esistono oggetti liberi e sono unici. La dimostrazione dell’unicità è alquanto formale, e in effetti è solo un caso particolare del seguente concetto generale. Definizione 2.6. Un oggetto I in una categoria C è detto universale o iniziale se per ogni oggetto C di C esiste uno e un solo morfismo I → C. Un oggetto T di C è detto couniversale o terminale se per ogni oggetto C di C esiste uno e un solo morfismo C → T . Teorema 2.7. In una categoria, due qualunque oggetti iniziali (terminali) sono equivalenti mediante una unica equivalenza. 2. Alcune costruzioni 71 Dimostrazione. Siano I e J due oggetti iniziali. Poiché I è iniziale c’è un unico morfismo f : I → J e, poiché J è iniziale, c’è un unico morfismo g : J → I. La composizione gf è un morfismo da I in I come anche idI . Poiché I è universale, esiste un solo morfismo da I in I e quindi gf = idI . Allo stesso modo, poiché anche J è iniziale, f g = idJ . Dunque f : I → J è una equivalenza fra I e J ed è l’unica. Rovesciando le frecce, si ha l’equivalenza per oggetti terminali. ¤ Esempio 2.8. In Sets un insieme formato da un solo elemento è terminale. Esiste un oggetto iniziale? In Grp, il gruppo banale G = {e} è sia iniziale che terminale. Lo stesso vale in ModA e in k-Vect. Per dimostrare l’unicità di un oggetto che gode di certe proprietà in una categoria basta quindi trovare un’altra categoria in cui questo oggetto sia iniziale o terminale. In effetti, tutte le definizioni tramite proprietà universali possono essere riscritte costruendo una opportuna categoria in cui l’oggetto definito risulti iniziale o terminale. Esempio 2.9. Sia X un insieme e C una categoria concreta. Definiamo una nuova categoria DX come segue: un oggetto di DX è una funzione fra insiemi f : X → A, per un oggetto A di C. Un morfismo in DX da f : X → A a g : X → B è un morfismo h : A → B in C tale che il diagramma ~ ~~ ~ ~ ~~ ~ f A X@ @@ g @@ @@ @à h /B commuta, e cioè g = hf . Per ogni A ∈ C abbiamo l’identità 1A : A → A. Se f : X → A è un oggetto di DX , è chiaro che 1A è l’identità dell’oggetto f . Cosa è un oggetto iniziale in DX ? È un oggetto i : X → F (cioè una funzione fra insiemi di codominio F ∈ C) tale che, per ogni oggetto f : X → A esiste uno e un solo morfismo in DX da i a f e cioè esiste uno e un solo morfismo (in C) ϕ : F → A tale che f = ϕi. Quindi, un oggetto di C libero sull’insieme X è un oggetto iniziale di DX , ed è quindi unico, se esiste. Allo stesso modo, si può dimostrare l’unicità del prodotto o del coprodotto di una famiglia di oggetti trovando una opportuna categoria in cui il prodotto oppure il coprodotto siano oggetti iniziali oppure terminali. Lasciamo per esercizio la determinazione di queste categorie. Bibliografia [AM] M. F. Atiyah, I. G. MacDonald, Introduction to Commutative Algebra, Addison–Wesley, 1969 [An] A. Andretta, Istituzioni di Logica Matematica. Dispense del corso disponibili all’indirizzo www.dm.unito.it/personalpages/andretta/index.htm [Lettres] R. Baire, E. Borel, J. Hadamard, H. Lebesgue, Bull. Soc. Math. France, 33, (1905), pp. 261–273, ripubblicato in traduzione inglese in G. H. Moore, Zermelo’s axiom of choice : its origins, development, and influence, Springer–Verlag, 1982, pp. 311–320 [Dev] K. J. Devlin, Fundamentals of Contemporary Set Theory, Springer–Verlag, 1979 [FuHa] W. Fulton, J. Harris, Representation Theory: A First Course, Springer 1991 [Hu] T. W. Hungerford, Algebra, Springer–Verlag, 1974 [Ma] J. I. Manin, “Assioma/Postulato”, in Enciclopedia Einaudi, volume 1, Einaudi 1977 [NaNe] E. Nagel, J. R. Newman, La prova di Gödel, Boringhieri, 1974 [NaSt] M.A. Naimark, A.I. Štern, Teoria delle rappresentazioni dei gruppi, Editori Riuniti (anche in inglese, Theory of group representations, Springer GMW 246) [Re] M. Reid, Undergraduate Algebraic Geometry, London Mathematical Society Student Texts 12, Cambridge University Press, 1990 [Se] J.-P. Serre, Linear Representation of Finite Groups, Springer–Verlag, 1977 [Shaf] I. R. Shafarevich, Basic Notion in Algebra, Springer 1997, pubblicato originariamente come Algebra I, Encyclopaedia of Mathematical Sciences, Vol. 11 [Sharp] R. Y. Sharp, Steps in Commutative Algebra, London Mathematical Society Student Texts 19, Cambridge University Press, 1990 [vdW] B. L. van der Waerden, Algebra, (settima ed., 2 volumi), Frederick Ungar Publishing Co., 1970 73