Dispense di Algebra File - math

Istituzioni di Algebra
per la
Laurea Specialistica in Matematica
Università di Torino
Alberto Albano
Dipartimento di Matematica, Università di Torino, Via Carlo Alberto 10, 10123 Torino, ITALY
E-mail address: [email protected]
URL: http://www.dm.unito.it/personalpages/albano/index.htm
Indice
Capitolo 1.
Il Sistema Assiomatico di Zermelo e Fraenkel
§1. Gli assiomi
§2. Conseguenze dell’assioma della scelta
Capitolo 2.
§1.
§2.
§3.
§4.
§5.
Moduli
Il concetto di modulo
Sottomoduli, quozienti e somme
Moduli liberi
Prodotti tensoriali
Successioni esatte
Esercizi
1
1
6
11
12
15
19
23
28
34
Capitolo 3. Moduli di tipo finito
§1. Moduli Noetheriani
§2. Moduli su domini a ideali principali
§3. La forma canonica di Jordan
§4. Algebre di divisione finite
37
37
41
48
51
Capitolo 4. Anelli non commutativi
§1. Algebre di endomorfismi
§2. L’algebra gruppo K[G]
57
58
63
Capitolo 5. Categorie e funtori
§1. Categorie
§2. Alcune costruzioni
65
65
69
Bibliografia
73
iii
Capitolo 1
Il Sistema Assiomatico di
Zermelo e Fraenkel
In questo primo capitolo presentiamo il sistema assiomatico di Zermelo–Fraenkel,
su cui è basata tutta la matematica moderna. Nel primo paragrafo enunceremo
gli assiomi, con qualche commento sul loro significato, e nel secondo discuteremo
più in dettaglio l’assioma della scelta e alcune sue importanti conseguenze, come il
lemma di Zorn, il principio del buon ordinamento e l’induzione transfinita.
Una discussione completa sul significato degli assiomi in matematica, e in particolare degli assiomi della teoria degli insiemi, si trova in [Ma]. Un’altra fonte utile
è [An], dove si trovano sviluppati in dettaglio molti degli argomenti che qui sono
solo accennati.
1. Gli assiomi
Nell’enunciare gli assiomi useremo un linguaggio non completamente formale. Sviluppare in modo strettamente formale l’assiomatica della teoria degli insiemi richiede un lavoro notevole, e per questo rimandiamo a un corso di Istituzioni di Logica
Matematica. Scriveremo le formule, quando necessario, utilizzando gli usuali simboli logici. Il sistema assiomatico che descriveremo ha 10 assiomi. L’ultimo di
questi è l’assioma della scelta, e ha una posizione un po’ particolare rispetto agli
altri. Di solito il sistema formato dai primi nove viene detto ZF, e quello con tutti
e dieci ZFC (e cioè ZF + C, dove C = choice, scelta in inglese)
Nella teoria degli insiemi vi è un solo tipo di oggetto primitivo, l’insieme e una
sola relazione fra insiemi, l’appartenenza. Per dire che un insieme appartiene ad un
altro si scrive
x∈y
che si legge “x appartiene ad y” oppure “x è un elemento di y”. Di solito, siamo
abituati a distinguere fra “insiemi” ed “elementi”, ma in effetti basta un solo concetto primitivo. Il primo assioma dice che un insieme è determinato unicamente
1
2
1. Il Sistema Assiomatico di Zermelo e Fraenkel
dalla collezione dei suoi elementi e non da altre informazioni, come per esempio
l’ordine dei suoi elementi.
ZF 1. Assioma dell’estensione. Due insiemi x e y sono uguali se e solo se ogni
elemento dell’insieme x è un elemento dell’insieme y e ogni elemento dell’insieme y
è un elemento dell’insieme x.
In simboli
(1)
∀x∀y
x = y ⇐⇒ [∀z
z ∈ x ⇐⇒ z ∈ y]
Se ogni elemento di x è un elemento di y scriviamo x ⊆ y e leggiamo “x è un
sottoinsieme di y”.
ZF 2. Assioma dell’insieme vuoto. Esiste un insieme che non contiene elementi.
In simboli
(2)
∃z ∀x x ∈
/z
Dall’assioma di estensione segue che l’insieme vuoto è unico, e si indica con il
simbolo ∅. Osserviamo anche che ∅ ⊆ x per ogni insieme x.
Tutti i rimanenti assiomi garantiscono l’esistenza di insiemi aventi opportune
proprietà o risultanti da appropriate costruzioni.
ZF 3. Assioma della coppia. Per ogni due insiemi x e y esiste un insieme z i cui
elementi sono solo x e y.
In simboli
(3)
∀x∀y ∃z :
∀w w ∈ z ⇐⇒ [w = x ∨ w = y]
Questo insieme si denota con z = {x, y}. Osserviamo che x e y non sono necessariamente distinti, e si ha allora z = {x, x} = {x}. Dunque, dato un insieme x,
l’assioma della coppia afferma, in particolare, l’esistenza di un insieme {x} che
ha come unico elemento x. È importante ricordarsi che x 6= {x}. In particolare,
x ∈ {x}, ma dimostreremo che x ∈
/ x. In effetti, uno degli scopi dell’assiomatica di
Zermelo–Fraenkel è di escludere l’affermazione x ∈ x, poiché da questa si possino
derivare delle contraddizioni (paradosso di Russell).
A partire dall’esistenza della coppia, si può definire la coppia ordinata di due
insiemi hx, yi ponendo, per definizione
hx, yi = {x, {x, y}}.
Lo scopo di questa definizione è avere
hx, yi = hu, vi ⇐⇒ x = u ∧ y = v,
cosa che si verifica facilmente usando gli assiomi che abbiamo già. La nozione di
coppia ordinata sarà utile per definire le corrispondenze fra insiemi e le funzioni.
ZF 4. Assioma dell’unione. Per ogni insieme x esiste un insieme y tale che l’insieme z è un elemento di y se e solo se z è elemento di un elemento di x.
In simboli
(4)
∀x ∃y :
∀z z ∈ y ⇐⇒ [∃w : z ∈ w ∧ w ∈ x]
L’insieme y è l’unione di tutti gli elementi di tutti gli elementi di x, e si scrive
[
y=
x.
1. Gli assiomi
3
S
La notazione non S
è quella che siamo
S abituati ad usare: per esempio,Sn {x1 , x2 } di
solito si scrive x1 x2 , l’unione {x1 , x2 , . . . , xn } di solito si scrive i=1 xi , e cosı̀
via.
ZF 5. Assioma dell’insieme potenza. Per ogni insieme x esiste un insieme y tale che
gli elementi di y siano tutti e soli i sottoinsiemi di x.
In simboli
(5)
∀x ∃y :
∀z z ∈ y ⇐⇒ z ⊆ x
Naturalmente, y è l’insieme delle parti di x, (o insieme potenza, in inglese power
set) e useremo la notazione y = P(x).
Quali insiemi possiamo costruire a partire dagli assiomi che abbiamo? L’assioma dell’insieme vuoto garantisce che c’è almeno un insieme, ∅, e usando l’assioma
della coppia, dell’unione e dell’insieme potenza possiamo costruire la sequenza di
insiemi:
∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}, . . .
ottenuta “collezionando” via via gli insiemi già costruiti. Si vede subito che ogni
insieme che si ottiene in questo modo ha un numero finito di elementi. Se vogliamo
parlare di insiemi infiniti dobbiamo avere un assioma apposito. Definiamo la nozione
di “seguente”: se x è un insieme, l’insieme seguente è x0 = x ∪ {x}. Per esempio,
∅0 = ∅ ∪ {∅} = {∅},
∅00 = {∅} ∪ {{∅}} = {∅, {∅}}
ZF 6. Assioma dell’infinito. Esiste un insieme x che ha ∅ come elemento e per
ogni y ∈ x anche y 0 ∈ x.
In simboli
(6)
∃x :
∅ ∈ x ∧ [∀y y ∈ x =⇒ y 0 ∈ x]
È immediato riconoscere in questo assioma la base del principio di induzione e la
costruzione stessa dell’insieme dei numeri naturali. L’assioma dell’infinito afferma
che i numeri naturali formano un insieme e si possono considerare come una “infinità
conclusa”, e cioè possono essere considerati tutti contemporaneamente, e non solo
uno dopo l’altro.
Notiamo però che, per l’assioma dell’insieme potenza, esiste l’insieme delle parti
di questo insieme infinito, e Cantor scoprı̀ che questa nuova infinità è maggiore di
quella iniziale, e cosı̀ via. Dunque, l’esistenza di un solo insieme infinito implica
l’esistenza di infiniti insiemi infiniti, tutti di cardinalità maggiore uno dell’altro.
Ora che abbiamo moltissimi insiemi, grandi quanto vogliamo, possiamo costruire altri insiemi come “sottoinsiemi” di insiemi già dati. Si tratta di stabilire se
riusciamo a individuare solo alcuni fra i sottoinsiemi di un insieme, e non ottenerli
tutti contemporaneamente come ci permette l’assioma dell’insieme potenza.
ZF 7. Assioma del sottoinsieme. Per ogni insieme x e per ogni proprietà P di un
insieme, esiste un insieme y tale che z ∈ y se e solo se z ∈ x e z gode della
proprietà P .
In simboli
(7)
∀x ∀P ∃y :
∀z z ∈ y ⇐⇒ z ∈ x ∧ P (z)
Di solito si scrive y = {z ∈ x | P (z)}. Questo assioma viene anche chiamato
assioma di comprensione o assioma di separazione.
4
1. Il Sistema Assiomatico di Zermelo e Fraenkel
Nella formulazione di questo assioma è evidente l’incertezza di significato dell’espressione “proprietà di insiemi”. Formulare con precisione questo significato è
molto difficile nel linguaggio naturale che stiamo usando; diciamo solo che una proprietà è espressa mediante una “frase” che contiene solo simboli per rappresentare
insiemi e le parole (o i simboli corrispondenti) “non”, “e”, “oppure”, “se . . . allora
. . . ”, “per ogni”, “esiste”, “uguale”, “essere elemento”, loro sinonimi, e che è costruita “regolarmente”. Proprio dire cosa è una frase costruita regolarmente è la
difficoltà maggiore e necessita l’introduzione di un linguaggio formale e la nozione
di correttezza sintattica. Rimandiamo a [An] per una trattazione più completa.
Piuttosto che tentare di definire con precisione “proprietà”, vediamone almeno
alcune, che corrispondono a costruzioni ben note. Se P (u) è la proprietà u ∈ v,
allora per ogni insieme x l’assioma del sottoinsieme garantisce l’esistenza dell’intersezione y = x ∩ v. Se P (u) è la proprietà u ∈
/ v, allora si ha il complemento
y = x \ v.
Osserviamo infine che l’assioma del sottoinsieme è in realtà uno “schema di
assiomi”, e cioè abbiamo un assioma per ogni proprietà P . Dunque ZF contiene
infiniti assiomi e non solo 10, come avevamo affermato al’inizio della discussione.
In virtù del teorema di incompletezza di Gödel (vedi, per esempio, [NaNe]), questo
non è un difetto grave. Anche i due prossimi assiomi sono schemi di assiomi.
In matematica le funzioni hanno un ruolo importante, e il prossimo assioma
dice, intuitivamente, che l’immagine di un insieme è un insieme. Per enunciare
con precisione l’assioma, ricordiamo la definizione di prodotto cartesiano di insiemi
e cioè l’insieme delle coppie ordinate il cui primo elemento appartiene a x e il
secondo a y. Osserviamo che se u ∈ x e v ∈ y, allora {u, v} ∈ P(x ∪ y) e hu, vi =
{u, {u, v}} ∈ P(P(x ∪ y)). Il prodotto cartesiano x × y è definito da
x × y = {z ∈ P(P(x ∪ y)) | ∃u ∈ x ∃v ∈ y : z = hu, vi}
e dagli assiomi dell’insieme potenza e del sottoinsieme si ha che è un insieme.
Ricordiamo che una relazione binaria fra gli insiemi x e y è un sottoinsieme di x×y,
e una funzione da x a y è una relazione binaria f ⊆ x × y tale che per ogni u ∈ x
esiste un unico v ∈ y tale che hu, vi ∈ f .
ZF 8. Assioma del rimpiazzamento. Sia P una proprietà di coppie ordinate di insiemi
tale che per tutti gli elementi x di un certo insieme u e per tutti gli insiemi y e z se
le coppie hx, yi e hx, zi godono di P , allora y = z. Allora esiste un insieme v tale
che y ∈ v se e solo se esiste x ∈ u tale che la coppia hx, yi gode della proprietà P
In simboli
(8) ∀u ∀P
[∀x ∈ u ∀y∀z P (hx, yi) ∧ P (hx, zi) =⇒ y = z] =⇒
[∃v ∀t t ∈ v ⇐⇒ ∃s ∈ u P (hs, ti)]
Dopo aver letto con cura l’enunciato, capiamo che l’ipotesi è che P definisce una
funzione sull’insieme u (in realtà, P può essere una proprietà un po’ più generale
di una funzione, ma ristretta a u definisce essenzialmente una funzione) e la conclusione garantita dall’assioma è che esiste un insieme v che è l’immagine della
funzione.
1. Gli assiomi
5
L’assioma del sottoinsieme garantisce l’esistenza di un insieme per ogni proprietà, e cioè per ogni formula “sintatticamente corretta”, ma solo come sottoinsieme di un insieme già dato. Ci si può chiedere se si possa ampliare questo assioma,
e cioè se data una proprietà P si possa postulare l’esistenza di un insieme formato
da tutti gli insiemi che soddisfano P . Questa era l’idea originale di Cantor e Frege
(e cioè “insieme = proprietà”), ma il paradosso di Russell mise presto in evidenza
che non è sufficiente che la frase che definisce P sia corretta grammaticalmente.
Ci devono essere delle restrizioni semantiche, e cioè di significato. Il paradosso di
Russell nasce dall’affermazione che
V = {x | x ∈
/ x}
sia un insieme. Allora V ∈ V =⇒ V ∈
/ V e anche V ∈
/ V =⇒ V ∈ V , una
contraddizione. Una possibile soluzione a questo dilemma è impedire che V ∈ V
sia vero.
ZF 9. Assioma della fondazione. Sia P una proprietà degli insiemi, e supponiamo
che esista un insieme y che gode di P . Allora esiste un insieme x che gode di P e
tale che ogni suo elemento non gode di P .
In simboli
(9)
∀P
[∃y P (y)] =⇒ [∃x P (x) ∧ ∀z P (z) =⇒ z ∈
/ x]
Lemma 1.1. Per ogni insieme x,
x∈
/ x.
Dimostrazione. Sia P (u) la proprietà u ∈ u. Se esiste un insieme y tale che P (y),
e cioè y ∈ y, per l’assioma della fondazione esiste un altro insieme x tale che
(i) x ∈ x,
(ii) ∀z ∈ x, z ∈
/z
Dalla (i) x ∈ x, e quindi dalla (ii) si ha che x ∈
/ x e dunque una contraddizione.
Dunque non può esistere nessun insieme y tale che y ∈ y e questa è la tesi.
¤
Dunque
V = {x | x ∈
/ x}
è la totalità di tutti gli insiemi dell’universo di Zermelo–Frankel, ma V non è un
insieme, altrimenti dovrebbe essere V ∈ V , impossibile per gli insiemi di ZF. In
questo modo si evita il paradosso di Russell. Nulla vieta che ci siano altri paradossi
meno immediati e non ancora scoperti, ma per ora (in poco più di cento anni) non
ne sono stati trovati.
L’ultimo assioma è il celebre assioma della scelta:
ZF 10. Assioma della scelta. Per ogni insieme x non vuoto esiste una funzione f
che ad ogni sottoinsieme non vuoto di x assegna un suo elemento.
In simboli
(10)
∀x [x 6= ∅] =⇒ ∃f : P(x) \ ∅ → x ∧ [∀y y ⊆ x ∧ y 6= ∅ =⇒ f (y) ∈ y]
L’assioma della scelta viene spesso abbreviato AC (Axiom of Choice), specialmente nei libri in inglese.
6
1. Il Sistema Assiomatico di Zermelo e Fraenkel
AC afferma la possibilità di scegliere un elemento da ogni sottoinsieme di un
insieme dato, e di poter fare tutte queste scelte simultaneamente. È evidente che se
l’insieme x è finito, non c’è bisogno dell’assioma della scelta per l’esistenza della funzione f . Dunque AC è un’affermazione vera nel caso finito che vogliamo valga anche
nel caso infinito. È appena il caso di notare che vi sono molte dimostrazioni matematiche che richiedono questo assioma, e molte di queste erano considerate valide
anche prima che Zermelo usasse questa forma nella sua famosa dimostrazione del
principio del buon ordinamento nel 1904. Nel prossimo paragrafo vedremo alcune
conseguenze di questo assioma, di uso corrente nelle dimostrazioni matematiche.
Gödel, nel 1940, ha dimostrato che AC è consistente con gli altri assiomi usuali
della teoria degli insiemi, nella formulazione di Zermelo–Fraenkel, e cioè non si può
dimostrare la negazione di AC in ZF. Paul Cohen, nel 1963 ha dimostrato che AC è
indipendente dagli altri assiomi, e cioè non può essere dimostrato in ZF.
Dunque accettare o meno AC è una questione di scelta (il gioco di parole è
voluto). La matematica contemporanea ha accettato AC e lo considera un assioma
indispensabile. Vi è una corrente in Matematica, detta Costruttivismo, che non
accetta AC e considera corrette solo dimostrazioni di esistenza in cui sia possibile
“costruire” esplicitamente l’oggetto di cui si afferma l’esistenza. Molti teoremi
della matematica contemporanea (e anche della matematica dell’Ottocento) sono
fuori dalla portata dei metodi costruttivi, per esempio il teorema di Weierstrass
sull’esistenza di massimi e minini di funzioni continue.
Per una interessante discussione sull’assioma della scelta, condotta da Emil Borel, Henri Lebesgue, Jacques Hadamard e Robert Baire nel 1905, vedere [Lettres].
Proprio la controversia che si sviluppò sulla dimostrazione di Zermelo del principio
del buon ordinamento portò quest’ultimo alle ricerche sui fondamenti della teoria degli insiemi che culminarono nella formulazione del sistema assiomatico che
abbiamo appena descritto.
2. Conseguenze dell’assioma della scelta
Vedremo, in questo paragrafo, alcuni enunciati equivalenti all’assioma della scelta
in ZF. Questo vuol dire che, assumendo solo gli assiomi ZF 1–9 si può dimostrare
che AC vale se e solo se vale uno di questi enunciati. Dunque accettare AC o uno
di questi come assioma è logicamente equivalente, ma può essere psicologicamente
differente. E in effetti, forse è proprio AC ad essere il più intuitivamente “vero”.
Non riporteremo le dimostrazioni. In [An] e in [Dev] Capitolo II.9 le dimostrazioni di equivalenza sono basate sulla teoria dei numeri ordinali, mentre in [vdW],
Volume I, Capitolo 9 vi sono delle dimostrazioni dirette dei teoremi seguenti sulla
base di AC.
Molte delle riformulazioni dell’assioma della scelta riguardano gli insiemi ordinati, e abbiamo perciò bisogno di ricordare alcune definizioni. Sia X un insieme.
Definizione 2.1. Una relazione ≤ su X si dice un ordine se è riflessiva, antisimmetrica e transitiva, e cioè
(1) a ≤ a per ogni a ∈ X;
(2) a ≤ b e b ≤ a =⇒ a = b;
(3) a ≤ b e b ≤ c =⇒ a ≤ c.
2. Conseguenze dell’assioma della scelta
7
Se per ogni coppia di elementi a, b ∈ X vale una delle a ≤ b oppure b ≤ a, allora
l’ordine è detto totale e X è detto linearmente ordinato (o totalmente ordinato),
altrimenti l’ordine è detto parziale. La relazione a ≤ b si legge a precede b oppure a
è minore o uguale a b. C’è anche un simbolo di “minore stretto” con il significato
solito, e cioè a < b se e solo se a ≤ b e a 6= b.
Esempi ben noti sono l’ordinamento dei numeri naturali, interi, razionali e
reali. Questi ordini sono totali. Un esempio di ordinamento parziale è quello dato
dall’inclusione fra i sottoinsiemi di un insieme Z definito da A ≤ B se e solo se
A ⊆ B.
Se X è ordinato, un elemento a ∈ X si dice minimo se per ogni b ∈ X, a ≤ b, e
analogamente per il massimo. È chiaro che il minimo (massimo) se esiste, è unico.
Definizione 2.2. Un insieme X si dice bene ordinato se ogni sottoinsieme di X ha
un minimo.
Per esempio N, con l’ordinamento solito, è bene ordinato. Z non è bene
ordinato, ma può essere bene ordinato da un altro ordinamento, per esempio
0, 1, −1, 2, −2, 3, −3, . . .
oppure
1, 2, 3, . . . ; 0, −1, −2, −3, . . .
in cui ogni positivo precede tutti i negativi.
L’insieme dei razionali Q non è bene ordinato dall’ordinamento solito, ma poiché è numerabile può essere bene ordinato usando una corrispondenza biunivoca
con N e trasportando l’ordine. Dunque tutti gli insiemi numerabili possono essere
bene ordinati (e anche quelli finiti, naturalmente).
L’insieme R dei numeri reali non è bene ordinato dall’ordinamento solito, e
non è nemmeno numerabile. Esiste su R un buon ordinamento? La risposta non è
ovvia, e costruire esplicitamente un buon ordinamento risulta a prima vista molto
difficile.
Principio del Buon Ordinamento. Ogni insieme X può essere bene ordinato.
Fu proprio nel dimostrare questo teorema che Zermelo usò in modo esplicito
AC (che non era ancora un assioma), dando cosı̀ inizio alla discussione sulla sua
verità o necessità di essere accettato. A questo proposito, i commenti di Lebesgue
nella terza lettera in [Lettres] sono ancora oggi molto interessanti.
Definizione 2.3. Sia M un sottoinsieme di un insieme parzialmente ordinato X.
Se per ogni x ∈ M si ha x ≤ s, allora s si dice un maggiorante di M . Se esiste
un maggiorante m di M tale che m ≤ s per ogni maggiorante s di M , allora m è
unico, e viene detto estremo superiore di M .
L’enunciato originale del lemma di Zorn riguarda l’ordinamento dei sottoinsiemi
di un insieme. Sia dunque X un insieme e ordiniamo (parzialmente) l’insieme delle
parti P(X) con l’inclusione. Un sottoinsieme C di P(X) totalmente ordinato si dice
una catena. Un sottoinsieme A di P(X) si dice chiuso se per ogni catena, contiene
anche l’unione della catena. Un elemento di A si dice massimale se non è contenuto
in nessun altro elemento di A. Possiamo definire questi concetti per qualunque
ordine: se M è un qualunque insieme parzialmente ordinato, un sottoinsieme è
una catena se è totalmente ordinato, è chiuso se con ogni catena contiene anche
8
1. Il Sistema Assiomatico di Zermelo e Fraenkel
l’estremo superiore della catena e un elemento x ∈ M è massimale se per ogni
y ∈ M , x ≤ y =⇒ x = y.
Lemma di Zorn. Ogni sottoinsieme chiuso A di M contiene almeno un elemento
massimale.
Una catena K di M si dice massimale se per ogni x ∈ M , se x ∈
/ K allora
l’insieme K ∪ {x} non è più una catena.
Principio di Massimalità di Hausdorff. Ogni catena di un insieme ordinato
può essere estesa ad una catena massimale.
Questi due enunciati, molto simili tra loro, sono spesso usati nelle dimostrazioni.
Entrambi sono equivalenti ad AC.
Molti sono i teoremi che richiedono AC per la loro dimostrazione. Ecco qualche
esempio (alcuni sono addirittura equivalenti ad AC, come il teorema di Tychonoff):
(1) L’unione di una infinità numerabile di insiemi numerabili è ancora numerabile.
(2) Ogni anello commutativo con unità ha un ideale massimale.
(3) Ogni spazio vettoriale ha una base.
(4) Ogni sottogruppo di un gruppo abeliano libero è libero.
(5) Ogni campo ammette una chiusura algebrica.
(6) Il prodotto di (infiniti) spazi compatti è compatto. (Teorema di Tychonoff)
(7) In uno spazio di Banach B, ogni funzionale lineare limitato definito su un
sottospazio si estende a un funzionale lineare limitato con la stessa norma
su tutto B. (Teorema di Hahn–Banach)
Purtroppo, AC ha anche conseguenze “negative”. Vi sono alcuni teoremi dimostrabili usando (e a volte addirittura equivalenti a) AC che forse non vorremmo avere.
Di questi, il più famoso è noto come “Paradosso di Banach–Tarski”
Paradosso di Banach–Tarski. Sia B = {(x, y, z) ∈ R3 | x2 +y 2 +z 2 ≤ 1} la palla
unitaria dello spazio euclideo. Allora esiste una partizione {X1 , . . . , Xn , Y1 , . . . , Ym }
di B e σ1 , . . . , σn , τ1 , . . . , τm isometrie di R3 tali che {σ1 (X1 ), . . . , σn (Xn )} e
{τ1 (Y1 ), . . . , τm (Ym )} sono partizioni di B.
In altre parole: è possibile suddividere B in un numero finito di pezzi che
opportunamente traslati e ruotati formano due copie di B e cioè, mediante isometrie
è possibile duplicare la sfera.
Un’altra ben nota conseguenza di AC è l’esistenza di insiemi non misurabili
secondo Lebesgue, e anzi l’impossibilità di avere una misura invariante per traslazioni e definita per tutti i sottoinsiemi della retta reale che estenda il concetto di
“lunghezza di un intervallo”.
Evidentemente le conseguenze “buone” sono superiori a quelle “cattive”, nondimeno AC ha sempre suscitato un po’ di imbarazzo fra i matematici. Molti pensano
che non li riguardi, che nella matematica “vera” queste cose non capitano, che non
si fa uso di enunciati esoterici come AC. Messi di fronte al fatto che senza AC non ci
sarebbero molti teoremi di analisi elementare, come l’esistenza di massimi e minimi
per funzioni continue, essi reagiscono accettandolo allora come fatto evidente, di
cui non si deve discutere. Quando poi però devono accettare che è possibile avere
2. Conseguenze dell’assioma della scelta
9
un buon ordinamento sull’insieme dei numeri reali (e quindi, si potrebbero fare dimostrazioni per induzione usando questo ordinamento, se solo sapessimo qual è . . . ,
vedi ancora la lettera di Lebesgue in [Lettres]), allora cambiano discorso, dicendo
che è “roba da logici”.
Questo atteggiamento non è sorprendente. Un matematico è tutto sommato un
essere umano, e la coerenza non è il primo tratto che associamo al carattere umano.
Inoltre, nonostante affermazioni altisonanti sulla verità “assoluta” ed “eterna” della
matematica, la matematica è un’attività compiuta da esseri umani in collaborazione, e ci sono aspetti psicologici e sociologici che giocano un ruolo non solo su cosa
è “interessante” ma anche su cosa è “vero”. La discussione su AC è uno di questi
aspetti.
Come possiamo concludere? Cosa pensiamo dei vari enunciati che abbiamo
visto? Una battuta, che cattura abbastanza bene l’aspetto psicologico, può aiutare:
. . . l’assioma della scelta è sicuramente vero, il principio del buon
ordinamento è sicuramente falso, e per quanto riguarda il lemma
di Zorn, chi può dirlo?
Capitolo 2
Moduli
Uno dei concetti fondamentali dell’algebra è quello di spazio vettoriale. Moltissimi
problemi in matematica possono essere formalizzati utilizzando gli spazi vettoriali e
le applicazioni lineari fra essi e, nel caso della dimensione finita, la corrispondenza
fra applicazioni lineari e matrici permette di trovare in modo esplicito nucleo e
immagine di una applicazione lineare mediante il metodo di riduzione di Gauss.
Questo fatto e il teorema di Rouché–Capelli rendono la teoria degli spazi vettoriali
di dimensione finita una parte della Matematica estremamente importante nelle
applicazioni.
La ricerca di una generalizzazione del concetto di spazio vettoriale può procedere in due direzioni diverse: la prima consiste nel non richiedere più la finitezza
della dimensione. Questa è una strada molto importante e cruciale nello sviluppo della matematica, ma per ottenere risultati interessanti e significativi si deve
uscire dall’ambito dell’algebra ed entrare in quello dell’analisi. Gli spazi vettoriali
di dimensione infinita vengono dotati di una norma, e cioè di una nozione di lunghezza di un vettore, a cui è richiesta una compatibilità con la struttura algebrica,
e si richiede anche una proprietà di convergenza delle successioni di Cauchy. Si
ottengono in questo modo i cosiddetti spazi di Banach e spazi di Hilbert, oggetti
fondamentali per l’Analisi Matematica moderna. Notiamo che per spazi vettoriali
di dimensione infinita il teorema di esistenza della base e il teorema che afferma
che tutte le basi hanno lo stesso numero di elementi (e cioè che i vettori di due basi
possono essere messi in corrispondenza biunivoca) sono ancora veri ma diventano
piuttosto complicati da dimostrare e richiedono l’uso dell’assioma della scelta e di
alcuni teoremi fondamentali sull’aritmetica dei numeri cardinali infiniti.
La seconda strada prende avvio dall’analisi delle dimostrazioni dei teoremi fondamentali sugli spazi vettoriali e dalla realizzazione del fatto che in molti passi si
fa un uso essenziale della possibilità di dividere, e cioè dell’esistenza dell’inverso
moltiplicativo degli elementi non nulli del campo degli scalari. Altre volte invece
questa proprietà non interviene e ci si può chiedere quale sia la teoria che si può
ottenere usando come scalari gli elementi di un anello piuttosto che di un campo. Il
concetto che si ottiene è quello di modulo, e questo sarà l’oggetto del nostro studio.
11
12
2. Moduli
Non sempre il desiderio di generalizzare un concetto che si è rivelato interessante porta a risultati altrettanto interessanti e quindi, dopo aver dato la definizione
precisa di modulo, vedremo molti esempi in modo da avere del materiale concreto su cui formare la nostra intuizione, convincerci dell’importanza dei moduli in
Matematica e mettere in luce le prime differenze con gli spazi vettoriali.
1. Il concetto di modulo
La definizione di modulo è quasi identica a quella di spazio vettoriale: l’unica
differenza è che gli scalari appartengono ad un anello piuttosto che a un campo.
La definizione non richiede la commutatività dell’anello A, ma in quasi tutti gli
esempi che vedremo l’anello degli scalari sarà commutativo con unità. In questi
primi paragrafi non faremo ipotesi sull’anello degli scalari, ma dal paragrafo 4 in
poi restringeremo l’attenzione a moduli unitari su anelli commutativi.
Definizione 1.1. Sia A un anello. Un modulo (sinistro) M su A è un gruppo
abeliano (scritto additivamente) con una operazione di moltiplicazione per elementi
di A, cioè una funzione
µ:A×M →M
che di solito si scrive µ(a, m) = am, tale che
(1) ∀a ∈ A, ∀m, n ∈ M, a(m + n) = am + an,
(2) ∀a, b ∈ A, ∀m ∈ M, (a + b)m = am + bm,
(3) ∀a, b ∈ A, ∀m ∈ M, a(bm) = (ab)m.
Se l’anello possiede l’unità moltiplicativa 1, si chiede anche che
(4) ∀m ∈ M, 1m = m.
Un modulo che soddisfa l’ultima condizione si dice modulo unitario. Quasi tutti
i moduli che considereremo saranno unitari, e di solito non specificheremo questo
fatto. Piuttosto, indicheremo esplicitamente il caso di moduli non unitari.
Naturalmente esiste anche una nozione di modulo destro, con una moltiplicazione µ : M × A → M , data da µ(m, a) = ma, e che soddisfa l’analogo delle
(1)–(4). D’ora in poi, diremo semplicemente “modulo” per intendere “modulo sinistro”. Inoltre tutti i teoremi che valgono per i moduli sinistri valgono anche, con
le opportune modifiche, per i moduli destri.
Un dato gruppo abeliano M può avere varie strutture di A-modulo, sia sinistro
che destro. Se A è un anello commutativo, allora ogni modulo sinistro è anche un
modulo destro, ponendo per definizione ma = am. L’unico punto in cui serve la
commutatività è nella verifica di (3). A meno di indicazione diversa, tutti i moduli
che considereremo nel seguito su anelli commutativi saranno moduli sia sinistri che
destri, con la condizione am = ma.
Vediamo ora degli esempi.
Esempio 1.2. Ogni anello è un modulo su se stesso; questo è l’analogo di uno
spazio vettoriale di dimensione 1.
Esempio 1.3. Sia U ⊆ Rn un dominio (cioè un sottoinsieme aperto e connesso),
e sia A = C∞ (U, R) l’anello delle funzioni di classe C∞ definite su U a valori reali.
Le forme differenziali di grado k fissato su U sono un modulo su A: ha senso infatti
sommare forme differenziali e moltiplicarle per una funzione differenziabile. Lo
1. Il concetto di modulo
13
stesso vale anche per i campi vettoriali definiti su U , che formano quindi anch’essi
un modulo su A.
Se V è una varietà differenziabile, e A = C∞ (V, R), le forme differenziali su V
e i campi vettoriali su V sono, in modo analogo, moduli su A.
Questo esempio fa capire che i moduli sono oggetti piuttosto naturali in matematica e che il caso in cui i coefficienti sono elementi di un anello e non di un
campo occorre veramente. Quindi il concetto di modulo non è una generalizzazione
artificiale.
Esempio 1.4. Sia V uno spazio vettoriale sul campo K, e ϕ : V → V un’applicazione lineare (un endomorfismo). Naturalmente, V è un modulo su K, ma possiamo
introdurre in V una struttura di modulo su A = K[t], l’anello dei polinomi su K
in una variabile, nel modo seguente:
p(t) · v = (p(ϕ))(v)
per p(t) ∈ K[t] e v ∈ V
dove, se p(t) = an tn + · · · + a0 , allora (p(ϕ)) è l’endomorfismo dato da an ϕn +
· · · + a0 I. La struttura di V come A-modulo è strettamente legata alle proprietà
di diagonalizzazione di ϕ. Osserviamo anche che su V vi sono molte strutture di
A-modulo, al variare di ϕ fra gli endomorfismi di V . Affronteremo in seguito il
problema di decidere quando due di queste strutture siano la stessa.
Esempio 1.5. Ogni gruppo abeliano G è uno Z-modulo. Infatti basta definire, per
n ∈ Z e x ∈ G,
nx = x + · · · + x se n > 0,
nx = (−x) + · · · + (−x) se n < 0,
0x = 0.
Viceversa, se M è uno Z-modulo, allora le stesse formule di prima ci dicono che
la moltiplicazione di un numero intero per un elemento di M è già determinata
dalla struttura di gruppo abeliano di M . Dunque gli unici Z-moduli sono i gruppi
abeliani.
Esempio 1.6. Siano M e N due A-moduli. Consideriamo il modulo formato dalle
coppie di elementi (m, n), con m ∈ M e n ∈ N . Possiamo addizionare queste
coppie, e moltiplicarle per elementi di A nel modo seguente:
(m, n) + (m0 , n0 ) = (m + m0 , n + n0 ),
a(m, n) = (am, an).
Questo modulo viene detto la somma diretta di M e N , ed è indicato con M ⊕ N .
Allo stesso modo si può definire la somma diretta di un qualunque numero (finito)
di moduli. La somma di n copie di A come modulo su se stesso si indica con An ,
An = A ⊕ A ⊕ · · · ⊕ A,
ed è l’analogo di uno spazio vettoriale di dimensione n. An è detto modulo libero
di rango n. I suoi elementi sono n-uple di elementi di A, con la somma definita
componente per componente. Se
m = (a1 , . . . , an ) ∈ An
14
2. Moduli
e poniamo ei = (0, . . . , 1, . . . , 0), con 1 nella posizione i-esima, si ha
m = a1 e1 + · · · + an en =
n
X
ai ei
i=1
e la rappresentazione è unica. L’insieme {e1 , . . . , en } è una base di An .
Esempio 1.7. Ogni k-forma differenziale su Rn si può scrivere in modo unico nella
forma
X
ω=
ai1 ...ik dxi1 ∧ · · · ∧ dxik
i1 <···<ik
dove gli ai1 ...ik sono funzioni su Rn di classe C∞µ. Dunque
il modulo delle k-forme
¶
n
differenziali su Rn è un modulo libero di rango
sull’anello C∞ (Rn ).
k
∂
di derivazione
∂xi
parziale rispetto alle variabili xi . Sia A = R[L1 , . . . , Ln ] l’anello di tutti gli operatori differenziali che si possono formare a partire dagli Li con le operazioni di
somma e composizione (la composizione di operatori è commutativa perché si può
scambiare l’ordine di derivazione). L’anello A è isomorfo in modo naturale all’anello
dei polinomi usuali R[t1 , . . . , tn ].
Se M è un opportuno spazio di funzioni definite su Rn e infinitamente differenziabili, allora A opera su M e quindi M è un A-modulo. In particolare, possiamo
prendere M uguale allo spazio dei polinomi in n variabili, allo spazio di tutte le
funzioni di classe C∞ , allo spazio delle funzioni C∞ a supporto compatto, allo spazio
delle funzioni analitiche reali. Tutti questi spazi di funzioni sono dunque dei moduli
sull’anello dei polinomi in n variabili.
Esempio 1.8. Sullo spazio Rn consideriamo gli operatori Li =
Esempio 1.9. Consideriamo l’anello dei polinomi R[x1 , . . . , xn ] come un modulo M
su se stesso. D’altra parte, lo possiamo considerare come un modulo sull’anello A
degli operatori differenziali a coefficienti costanti. Poiché A è anch’esso un anello di
polinomi, otteniamo un altro modulo N sull’anello R[x1 , . . . , xn ]. Notiamo che M
e N sono lo stesso gruppo abeliano, e quello che cambia è la struttura di modulo
sull’anello R[x1 , . . . , xn ],
In effetti, questi due moduli non sono isomorfi. Infatti, se m ∈ N è un polinomio, esiste certamente un elemento a ∈ R[x1 , . . . , xn ] tale che am = 0: basta
prendere a un operatore differenziale di ordine sufficientemente alto, per esempio maggiore del grado del polinomio m. D’altra parte, poiché R[x1 , . . . , xn ] è un
dominio d’integrità, in M si ha che am = 0 implica che a = 0 oppure m = 0.
In alcuni casi, se M è uno spazio di funzioni opportuno, le due strutture sono
isomorfe. Tali isomorfismi, che trasformano l’operatore di derivazione in moltiplicazione per polinomi (e viceversa) hanno in genere il nome di trasformata di Fourier
e sono uno strumento essenziale in molti problemi di Analisi Matematica legati allo
studio delle equazioni differenziali.
Esempio 1.10. Se A è un sottoanello di B, allora B è un A-modulo (ma non
viceversa!) con ab (a ∈ A, b ∈ B) definito dalla moltiplicazione in B. Quindi gli
anelli di polinomi A[x1 , . . . , xn ] e delle serie di potenze formali A[[x1 , . . . , xn ]] sono
A-moduli.
2. Sottomoduli, quozienti e somme
15
Esempio 1.11. Più in generale, se f : A → B è un omomorfismo di anelli, allora
c’è una struttura di A-modulo su B data da
a · b = f (a)b
∀a ∈ A, ∀b ∈ B,
dove la moltiplicazione a secondo membro è quella nell’anello B. Nell’esempio
precedente f è l’inclusione A ,→ B.
Esempio 1.12. Ancora più in generale, se f : A → B è un omomorfismo di anelli
e M è un B-modulo, si può definire su M una struttura di A-modulo ponendo
am = f (a)m
∀a ∈ A, m ∈ M.
Questa struttura di A-modulo su M viene detta il pullback lungo f della struttura
di B-modulo. Nell’esempio precedente, la struttura di A-modulo su B è il pullback
lungo f della struttura di B come B-modulo su se stesso.
Concludiamo questa serie di esempi con un esercizio che dà una definizione
alternativa, ma equivalente, del concetto di modulo. Ritroveremo questa definizione
in seguito, quando tratteremo di rappresentazioni di gruppi.
Esercizio 1.13. Sia M un gruppo abeliano, e sia E = End(M ) = insieme di tutti
gli omomorfismi di M in se stesso. In E si possono definire due operazioni:
(f + g)(m) = f (m) + g(m)
∀f, g ∈ E, ∀m ∈ M,
(f · g)(m) = f (g(m))
∀f, g ∈ E, ∀m ∈ M.
(1) Dimostrare che con le operazioni precedenti E è un anello (in generale
non commutativo) con unità.
(2) Dimostrare che M è un E-modulo unitario, con la struttura definita da:
f m = f (m)
∀m ∈ M, ∀f ∈ E.
(3) Dimostrare che se M ha una struttura di A-modulo, allora esiste un unico
omomorfismo di anelli f : A → E tale che la struttura di A-modulo data
su M è il pullback lungo f (vedi Esempio 1.12) della struttura di E-modulo
descritta al punto precedente.
Dunque dare una struttura di A-modulo su di un gruppo abeliano M è la stessa
cosa che assegnare un omomorfismo di anelli da A in End(M ).
2. Sottomoduli, quozienti e somme
Vediamo ora in modo sistematico alcune definizioni e costruzioni fondamentali. Per
prima cosa, chiariamo il concetto di isomorfismo.
Definizione 2.1. Siano M e N due moduli (sinistri) sull’anello A. Un omomorfismo f : M → N è un omomorfismo di gruppi abeliani tale che
f (am) = af (m)
∀a ∈ A, ∀m ∈ M.
L’insieme di tutti gli omomorfismi da M a N si indica con HomA (M, N ). In
particolare, HomZ (M, N ) è l’insieme di tutti gli omomorfismi di gruppo fra M e N .
Si ha naturalmente HomA (M, N ) ⊆ HomZ (M, N ).
Esercizio 2.2. Dimostrare che HomA (M, N ) è un A-modulo (in modo naturale).
16
2. Moduli
Un isomorfismo è un omomorfismo che ammette una inversa che è ancora un
omomorfismo.
Esercizio 2.3. Dimostrare che se f : M → N è un omomorfismo biiettivo, allora
è un isomorfismo (cioè, dimostrare che la funzione inversa di un omomorfismo,
quando esiste, è ancora un omomorfismo).
Definizione 2.4. Sia M un modulo sull’anello A e sia N ⊆ M . Si dice che N è
un sottomodulo di M se N è un sottogruppo e se
an ∈ N
∀a ∈ A, ∀n ∈ N.
Se consideriamo A come modulo su se stesso, allora i sottomoduli di A sono
esattamente gli ideali sinistri. Notiamo che ideali diversi possono essere isomorfi
come sottomoduli. In particolare, se A è un dominio d’integrità e I è un ideale
di A, allora A ∼
= I come modulo se e solo se I è principale. In tal caso, se I = (x),
l’isomorfismo è f : A → I dato da f (a) = ax. Infatti f è suriettiva perché I è un
ideale principale generato da x, ed è iniettiva perché in un dominio d’integrità vale
la legge di cancellazione del prodotto (ax = bx =⇒ a = b).
Dunque se A = Z, tutti i sottomoduli non nulli sono isomorfi (come moduli!)
a Z. Invece in R[x, y] l’ideale I = (x, y) di tutti i polinomi con termine noto nullo
non è principale e quindi non è isomorfo a R[x, y].
Notiamo qui una prima differenza con il caso degli spazi vettoriali: come modulo su se stesso un anello è generato da un solo elemento, l’1. Per uno spazio
vettoriale, questo vuol dire avere dimensione 1, e tutti i sottospazi hanno dimensione 0 oppure 1. Invece in questo caso abbiamo un sottomodulo che richiede almeno
due generatori, e cioè ha bisogno di più generatori del modulo che lo contiene. Non
è perciò più vero il teorema che dice che in uno spazio generato da n elementi, tutti
i sottospazi sono generati da un numero minore o uguale a n di elementi.
Definizione 2.5. Sia f : M → N un omomorfismo di A-moduli. Il nucleo di f è
ker f = {m ∈ M | f (m) = 0}
e l’immagine è
Im f = {n ∈ N | ∃m ∈ M : n = f (m)}.
Le definizioni di nucleo e immagine di un omomorfismo sono quelle ovvie, ed è
anche immediato dimostrare che sia il nucleo che l’immagine sono dei sottomoduli
di M e N rispettivamente.
Sia ora N un sottomodulo dell’A-modulo M . Poiché N è un sottogruppo del
gruppo abeliano M è possibile formare il gruppo quoziente M/N , i cui elementi
sono le classi laterali del tipo m + N . Su M/N è possibile definire una struttura di
A-modulo nel modo ovvio:
a(m + N ) = am + N
∀a ∈ A, ∀m ∈ M ;
la definizione è ben data perché N è un sottomodulo, e cioè aN ⊆ N , ed è immediato
verificare che M/N è un modulo su A. La proiezione canonica (sul quoziente)
π : M → M/N data da π(m) = m + N è un omomorfismo di A-moduli.
Tutti i teoremi di omomorfismo fra gruppi e spazi vettoriali continuano a valere
immutati per i moduli. Li enunciamo qui di seguito per comodità, lasciando la
2. Sottomoduli, quozienti e somme
17
dimostrazione del primo per esercizio (suggerimento: copiare la dimostrazione nel
caso degli spazi vettoriali)
Teorema 2.6. Sia f : M → N un omomorfismo di A-moduli. Allora:
(1) f è iniettiva se e solo se ker f = {0};
(2) f induce un isomorfismo di A-moduli f¯ : M/ ker f → Im f .
Teorema 2.7. Siamo N e P due sottomoduli di M .
(1) N/(N ∩ P ) ∼
= (N + P )/P ;
(2) se P ⊆ N , allora N/P è un sottomodulo di M/P e c’è un isomorfismo di
A-moduli (M/P )/(N/P ) ∼
= M/N .
Dimostrazione. Per la (1), definiamo una mappa f : N → (N + P )/P come
l’inclusione N ,→ N + P seguita dalla proiezione sul quoziente. Dimostriamo che f
è suriettiva: sia m + P un elemento di (N + P )/P . Per definizione dunque esistono
n ∈ N e p ∈ P tali che m = n + p. Ma allora m + P = n + p + P = n + P e
dunque appartiene all’immagine di N tramite f . Calcoliamo ora ker f : se n ∈ N ,
f (n) = n + P è nullo se e solo se n ∈ P e cioè se e solo se n ∈ N ∩ P . Dunque
ker f = N ∩ P e per il Teorema 2.6(2) si ha la tesi.
Nel caso (2), la (1) si riduce all’ovvio enunciato N/P ∼
= N/P , ma si può dire
qualcosa di più. Prima di tutto, è immediato che N/P sia un sottomodulo di M/P .
Come prima, definiamo una mappa g : M/P → M/N , data da g(m + P ) = m + N .
In effetti g è ben definita: se m + P = m0 + P , allora m0 = m + p per un opportuno
p ∈ P . Si ha: g(m0 ) = m0 + N = m + p + N = m + N = g(m), perché p ∈ P ⊆ N . È
anche immediato verificare che g è un omomorfismo e che è suriettiva. Calcoliamo
ker g: poiché g(m + P ) = m + N , si ha che g(m + P ) = 0 se e solo se m ∈ N e cioè
se e solo se m + P ∈ N/P , e come prima si conclude usando il Teorema 2.6(2). ¤
Dalla definizione di sottomodulo è chiaro che l’intersezione di una famiglia,
anche infinita, di sottomoduli è ancora un sottomodulo.
Definizione 2.8. Sia M un A-modulo e X un sottoinsieme di M . L’intersezione
di tutti i sottomoduli di M contenenti X è detto il sottomodulo generato da X, e
viene indicato con L(X).
Se X è finito, L(X) si dice finitamente generato. Ci sono alcuni casi particolari
degni di nota: se X = ∅, allora L(X) = {0}, il sottomodulo nullo. Se X = {m} è
costituito da un solo elemento, allora L(X) è detto il (sotto)modulo ciclico generato
da m. Infine, se {Ni }i∈I è una famigliaSdi sottomoduli indicizzati dall’insieme I,
allora il sottomodulo generato da X = i∈I Ni è detto la somma dei sottomoduli Ni . Se l’insieme I degli indici è finito, la somma di N1 , N2 , . . . , Nk si indica con
N1 + N2 + · · · + Nk .
Esercizio 2.9. Sia M un A-modulo, X un sottoinsieme di M , {Ni }i∈I una famiglia
di sottomoduli e m ∈ M . Poniamo Am = {am | a ∈ A} (non stiamo supponendo
che M sia un modulo unitario).
(1) Am è un sottomodulo di M , e la mappa f : A → Am è un omomorfismo
suriettivo di A-moduli.
(2) Il sottomodulo ciclico C generato da m è
C = {am + nm | a ∈ A, n ∈ Z} ,
18
2. Moduli
dove per definizione per ogni n ∈ Z si pone nm = m + · · · + m se n ≥ 0, e
il suo opposto altrimenti. Notiamo che qui stiamo usando la struttura di
Z-modulo del gruppo abeliano M .
(3) Similmente, il sottomodulo generato da X è


X

X
L(X) =
ai mi +
nj m0j | mi , m0j ∈ M, ai ∈ A, nj ∈ Z .


i
j
Se A è un anello con unità e M è un A-modulo unitario, allora
(
)
X
L(X) = AX =
ai mi | mi ∈ M, ai ∈ A .
i
(4) La somma della famiglia di sottomoduli {Ni }i∈I è formata dalle somme
finite del tipo ni1 + · · · + nik , con nij ∈ Nij .
Il caso (4) è identico a quello degli spazi vettoriali, mentre i casi (2) e (3) ci
dicono che nel caso in cui l’anello non ha l’unità occorre prestare attenzione alla differenza fra L(X), il sottomodulo generato da X, e AX, l’insieme delle combinazioni
lineari di elementi di X. Quando A non ha unità, oppure M non è un A-modulo
unitario, AX potrebbe non contenere X, e per questo la definizione di L(X) è un
po’ più complicata.
La somma di sottomoduli è un esempio di come si possano costruire dei moduli
a partire da altri. Abbiamo già visto, nell’Esempio 1.6 la definizione di somma
diretta di due moduli. Studiamo ora in generale l’operazione di somma diretta.
Definizione 2.10. Sia {Mi }i∈I una famiglia di A-moduli.
Y
M=
Mi
S
i∈I
è l’insieme delle funzioni f : I → i∈I Mi tali che f (i) ∈ Mi per ogni i. M è
in modo naturale un A-modulo, con le definizioni di somma e prodotto date da
(f + g)(i) = f (i) + g(i) e (af )(i) = af (i) e viene detto il prodotto diretto della
famiglia di moduli {Mi }i∈I .
Se almeno uno degli Mi è diverso dal modulo nullo, allora anche M non è il
modulo nullo: basta definire f (i) 6= 0 ∈ Mi , f (j) = 0 ∈ Mj , ∀j 6= i e notare che
non abbiamo bisogno dell’assioma della scelta perché l’elemento 0 è un elemento
distinto in ognuno dei gruppi Mj .
Una variante interessante è costituita dal caso in cui si considerino le funzioni
“quasi ovunque nulle” e cioè
Definizione 2.11. Sia {Mi }i∈I una famiglia di A-moduli.
M
M=
Mi
S
i∈I
è l’insieme delle funzioni f : I → i∈I Mi tali che f (i) ∈ Mi per ogni i e quasi
ovunque nulle, e cioè f (i) 6= 0 solo per un numero finito di indici. M è in modo
naturale un A-modulo, con le definizioni di somma e prodotto date come sopra, e
viene detto la somma diretta della famiglia di moduli {Mi }i∈I .
3. Moduli liberi
19
Dalle definizioni è immediato osservare che la somma diretta di una famiglia
di moduli è un sottomodulo del loro prodotto diretto e che le due costruzioni coincidono quando l’insieme I degli indici è finito. In questo caso si usa la notazione
M1 ⊕ · · · ⊕ Mn .
3. Moduli liberi
Abbiamo considerato prima il modulo generato da un sottoinsieme. Possiamo chiederci, in analogia con gli spazi vettoriali, cosa voglia dire che degli elementi siano
linearmente indipendenti:
Definizione 3.1. Sia M un A-modulo e sia X un sottoinsieme di M . X si dice
linearmente indipendente se per ogni sottoinsieme finito {x1 , . . . , xn } di elementi
di X e per ai ∈ A
a1 x1 + · · · + an xn = 0 =⇒ ai = 0,
i = 1, . . . , n.
Un insieme che non è linearmente indipendente si dice linearmente dipendente.
Notiamo subito una differenza fondamentale con il caso degli spazi vettoriali: se
{x1 , . . . , xn } sono linearmente dipendenti, non è detto che un elemento sia combinazione lineare degli altri. Infatti, per ottenere ciò si deve dividere per un coefficiente
non nullo e questo non è sempre possibile in un anello. Per esempio, l’insieme
{2, 3} non è indipendente in Z, ma nessuno dei due elementi è multiplo (intero!)
dell’altro.
Definizione 3.2. Sia M un A-modulo e sia X un sottoinsieme di M . X viene
detto base di M se X è linearmente indipendente e genera M , cioè M = L(X).
Notiamo che non è detto che l’insieme X sia finito, ma comunque L(X) è formato dalle combinazioni lineari finite di elementi di X. In altre parole, stiamo facendo
algebra, e ci sono solo somme finite e non serie convergenti. Inoltre, la condizione
di indipendenza lineare assicura che ogni elemento ha P
un’unica espressione
come
P
a
m
=
b
m
allora
combinazione
lineare
di
elementi
della
base:
se
m
=
i
i
i
i
i
i
P
i (ai − bi )mi = 0 e poiché gli mi sono linearmente indipendenti, ai = bi ∀i.
Esempio 3.3. Studiamo la struttura di Z-modulo di M = Q>0 , il gruppo dei numeri razionali positivi con l’operazione di prodotto. Sia p1 , p2 , p3 , . . . la successione
dei numeri primi 2, 3, 5, . . . , e cioè pi = i-esimo numero primo. Per il teorema di
fattorizzazione unica, ogni numero razionale positivo a/b si può scrivere in modo
unico come
∞
a Y αi
=
pi
b
i=1
dove gli αi sono numeri interi (positivi o negativi) e solo un numero finito di essi
è diverso da zero. Inoltre la moltiplicazione di numeri razionali corrisponde alla
somma degli esponenti nelle loro fattorizzazioni e quindi
M
Z
M=
i∈N
è la somma diretta di infinite copie di Z, considerato come modulo su se stesso. Gli
elementi 2, 3, 5, . . . formano una base del modulo M .
20
2. Moduli
Esempio 3.4. Sia N = Z[x] il gruppo additivo dell’anello dei polinomi in una
variabile a coefficienti interi, considerato come Z-modulo. Ogni polinomio di N si
può scrivere in modo unico come
∞
X
p(x) =
ai xi
i=0
dove gli ai sono numeri interi (positivi o negativi) e solo un numero finito di essi
è diverso da zero. La somma di polinomi è data dalla somma dei coefficienti dei
monomi dello stesso grado e quindi anche
M
N=
Z
i∈N
è la somma diretta di infinite copie di Z, considerato come modulo su se stesso. Gli
elementi 1, x, x2 , . . . formano una base del modulo N .
In particolare, Q>0 ∼
= Z[x] come Z-moduli e quindi anche come gruppi abeliani.
Dalla discussione precedente è facile scrivere in modo esplicito un isomorfismo,
anche se non era facile immaginarlo senza pensare alla struttura di modulo.
Il teorema di esistenza della base è uno dei teoremi fondamentali della teoria
degli spazi vettoriali, ma non tutti i moduli hanno una base. Anzi, è possibile
caratterizzare, a meno di isomorfismo, i moduli che hanno (almeno) una base, e gli
esempi precedenti ci suggeriscono l’enunciato:
Teorema 3.5. Sia A un anello con unità e M un A-modulo unitario. Allora M ha
una base se e solo se M è isomorfo ad una somma diretta di copie di A (considerato
come modulo su se stesso).
Prima di dimostrare il teorema, facciamo alcuni commenti: se M soddisfa le
condizioni del teorema, M si dice modulo libero. Per definizione dunque un modulo
libero ha almeno una base, ma potrebbe averne anche più di una e occorre chiedersi
se due basi diverse siano sempre in corrispondenza biunivoca. Se A = K è un
campo, il numero di elementi in una base viene chiamato dimensione e sappiamo
che la dimensione è un invariante di uno spazio vettoriale (anche quando è infinita)
e cioè K n ∼
= K m =⇒ n = m. Se A è un anello arbitrario, il numero di elementi
in una base viene detto rango del modulo libero M , ma il rango non è sempre un
invariante di M (vedi Esercizio 3.8). Si può dimostrare che il rango è un invariante
per tutti i moduli liberi su di un anello commutativo con unità (vedi, per esempio,
[Hu], IV.2, pp. 180–186, fino al corollario IV.2.12).
Dimostrazione del Teorema 3.5.
L
Per prima cosa dimostriamo che i∈I A ha una base. Poniamo
ei (i) = 1, ei (j) = 0 per j 6= i,
∀i ∈ I
L
L
e l’insieme X = {ei }i∈I è una base di i∈I A. Infatti, se a ∈ i∈I A, per definizione a è una funzione a : I → A quasi ovunque nulla e la somma
X
a=
a(i)ei
è finita e dunque X genera
i∈I
L
i∈I
A. Sia ora
X
a i ei = 0
3. Moduli liberi
21
una relazione lineare fra (un numero finito di) elementi di X. Calcolando in j ∈ I
si ha
X
ai ei (j) = aj = 0
∀j ∈ I
e dunque tutti i coefficienti sono nulli. Allora X è una base. Notiamo che è essenziale
nella dimostrazione che l’anello A abbia l’unità e che il moduloL
sia unitario.
Viceversa, sia X = {mi }i∈I una base di M e sia f : X → i∈I A la funzione
data da f (mi ) = ei , dove gli elementi ei sono definiti come prima. È possibile
estendere la definizione per linearità a tutto M ponendo


X
X
X
f (m) = f 
aj mj  =
aj f (mj ) =
aj ej
j
e f è ben definita poiché l’espressione di m come combinazione lineare è unica. La
verifica che f è un isomorfismo è lasciata per esercizio.
¤
La proprietà più importante dei moduli liberi è data dal seguente teorema, che
ne spiega anche il nome:
Teorema 3.6. Sia A un anello con unità e sia M un A-modulo unitario. M è un
modulo libero se e solo se esiste un insieme non vuoto X e una funzione α : X → M
con la seguente proprietà:
per ogni A-modulo unitario N e per ogni funzione f : X → N ,
(∗)
esiste un unico omomorfismo di A-moduli ϕ : M → N tale che
ϕα = f .
In altre parole, la proprietà (∗) afferma che è possibile completare in modo unico il
seguente diagramma commutativo:
X
f
² ~}
N
α
}
}
/M
}
ϕ
La proprietà (∗) che caratterizza un modulo libero è un esempio di “proprietà
universale”, cioè caratterizza un oggetto tramite una proprietà, che vale in tutte le
situazioni di un certo tipo, cioè è “universale”. Caratterizzazioni del genere sono
molto comuni nell’algebra moderna e vedremo molti altri esempi in seguito. Un
oggetto che gode di una proprietà universale è unico (se esiste), e la dimostrazione
dell’unicità dipende dal fatto che la proprietà è universale, piuttosto che dalla forma
specifica della proprietà. Nel Capitolo 5 vedremo la formulazione categoriale di
questo principio.
Il teorema afferma quindi che un modulo libero è caratterizzato da una certa
proprietà universale. In alcuni libri, questa è la definizione di modulo libero, e il
teorema diventa allora la dimostrazione dell’esistenza di moduli liberi.
Dimostrazione. Per prima cosa, dimostriamo che un modulo libero soddisfa la
proprietà (∗). Se M è libero, sia X = {xi }i∈I una base di M e α : X → M
l’inclusione. Sia ora f : X → N una qualunque funzione. Se m ∈ M , si può
22
2. Moduli
scrivere m =
Pn
i=1
ai xi in modo unico, e allora poniamo
ϕ(m) =
n
X
ai f (xi ).
i=1
ϕ è ben definita, soddisfa ϕα = f ed è immediato dimostrare che è un omomorfismo.
Se ora ψ è un altro omomorfismo tale che ψα = f si ha, in particolare, che per tutti
gli elementi della base ϕ(xi ) = ψ(xi ) e quindi ϕ e ψ coincidono. Dunque ϕ è unica.
Dimostriamo ora che se M e N soddisfano entrambi la proprietà (∗) per lo
stesso insieme X, allora M ∼
= N . Siano α : X → M e β : X → N le funzioni che
esistono per ipotesi. Consideriamo per prima cosa il diagramma:
X
α
² }|
M
α
/M
|
|
| idM
La funzione idM : M → M completa il diagramma e, per unicità, è l’unico omomorfismo a fare ciò. Perciò, se f : M → M è un omomorfismo tale f α = α, allora
f = idM .
Consideriamo ora il diagramma:
α
/M
>
}
ϕ } }
β } }
² }~} } ψ
N
X
poiché M soddisfa (∗), esiste una unica ψ : M → N che fa commutare il diagramma
e poiché anche N soddisfa (∗), esiste una unica ϕ : N → M che fa commutare il
diagramma, e cioè
ϕβ = α,
ψα = β.
Ma allora α = ϕβ = ϕ(ψα) = (ϕψ)α e cioè ϕψ = idM e allo stesso modo ψϕ = idN ,
e cioè ϕ e ψ sono omomorfismi inversi l’uno dell’altro e quindi M ∼
= N . Dunque
ogni modulo che soddisfi (∗) è isomorfo ad un modulo libero di base X.
¤
La conseguenza più importante di questo teorema è il seguente:
Corollario 3.7. Sia M un A-modulo libero sull’insieme X. Allora per assegnare
un omomorfismo f : M → N è sufficiente assegnare una funzione g : X → N .
La dimostrazione è ovvia. Notiamo che questo corollario è l’anologo del teorema
che dice che per assegnare una funzione lineare su uno spazio vettoriale è sufficiente
assegnare i valori su una base. In effetti uno spazio vettoriale su un corpo K è un
K-modulo libero su una sua base.
Abbiamo visto che se due moduli liberi hanno la stessa base (o meglio, in
corrispondenza biunivoca) allora sono isomorfi. Il viceversa è vero per moduli su
anelli commutativi con unità, ma non è vero in generale. Ecco un esempio di un
modulo libero che ha basi di cardinalità diversa.
4. Prodotti tensoriali
23
Esercizio 3.8. Sia A un anello con unità, e F un A-modulo libero con una base
infinita numerabile X = {e1 , e2 , . . . }. Per esempio si può prendere A = R e F
uno spazio vettoriale di dimensione infinita, oppure A = Z e F = Z[x] o F =
Q>0 (vedere Esempi 3.3 e 3.4). Poniamo B = HomA (F, F ) l’insieme di tutti gli
omomorfismi di A-moduli di F in se stesso.
(1) Dimostrare che B è un anello (non commutativo).
(2) Dimostrare che per ogni n ∈ N c’è una base di B, come modulo su se
stesso, composta da n elementi.
Suggerimento: {1B } è una base formata da 1 elemento; {f1 , f2 } è una base formata
da due elementi, ponendo f1 (e2n ) = en , f1 (e2n−1 ) = 0 e f2 (e2n ) = 0, f2 (e2n−1 ) =
en . Infatti, per ogni g ∈ B si ha g = g1 f1 + g2 f2 dove g1 (en ) = g(e2n ) e g2 (en ) =
g(e2n−1 ). Trovare in modo esplicito una base formata da n elementi (almeno per
n = 3 e n = 4).
4. Prodotti tensoriali
D’ora in poi tutti gli anelli sono commutativi con unità.
Se M è un A-modulo, possiamo addizionare i suoi elementi fra di loro, e possiamo moltiplicarli per elementi di A, ma non sappiamo come moltiplicare fra loro
due elementi. Però vi sono situazioni in cui è possibile moltiplicare gli elementi di
un modulo M per gli elementi di un altro modulo N , ottenendo come risultato elementi di un terzo modulo L. Per esempio, se A = C∞ (Rn ) è l’anello delle funzioni
P
∂
di classe C∞ , M è il modulo dei campi di vettori
fi
e N è il modulo delle 1∂x
i
P
P
forme differenziali
pi dxi , allora il prodotto
fi pi è definito, indipendentemente
dalle coordinate locali usate, ed appartiene ad A. Si può definire in modo simile il
prodotto di un campo di vettori per una r-forma differenziale, e il risultato è una
(r − 1)-forma differenziale.
Una moltiplicazione definita su due moduli M e N a valori in L non è altro
che una mappa bilineare, e cioè una mappa µ : M × N → L, scritta di solito come
µ(x, y) = xy tale che
(x1 + x2 )y = x1 y + x2 y
∀x1 , x2 ∈ M, ∀y ∈ N,
x(y1 + y2 ) = xy1 + xy2
∀x ∈ M, ∀y1 , y2 ∈ N,
(ax)y = x(ay) = a(xy)
∀x ∈ M, ∀y ∈ N, ∀a ∈ A.
Se ϕ : L → L0 è un omomorfismo, è semplice verificare che ϕ ◦ µ definisce
una moltiplicazione con valori in L0 . Dunque c’è un modo per ottenere nuove
moltiplicazioni a partire di quelle che si hanno già mediante omomorfismi, e ci si
può chiedere se esista una “moltiplicazione universale”, e cioè una moltiplicazione
dalla quale si possono dedurre tutte le altre. La risposta è sı̀, e la costruzione di
questa moltiplicazione prende il nome di prodotto tensoriale.
Definizione 4.1. Siano M , N due A-moduli. Il prodotto tensoriale di M e N ,
denotato con M ⊗A N , è un A-modulo con una mappa bilineare
α : M × N → M ⊗A N,
24
2. Moduli
scritta α(x, y) = x ⊗ y, tale che per ogni A-modulo L e per ogni mappa bilineare
µ : M × N → L esiste un unico omomorfismo ϕ : M ⊗A N → L tale che µ(x, y) =
ϕ(x ⊗ y).
In altre parole, la definizione afferma che è possibile completare in modo unico
il seguente diagramma commutativo:
µ
M ×N
α
v
² v
M ⊗A N
v
v
/
v; L
ϕ
La definizione appena data è tramite una “proprietà universale”, come la definizione di modulo libero. Come abbiamo già osservato, il motivo dell’unicità
è categoriale (vedi Capitolo 5), e perciò la dimostrazione è identica a quella del
Teorema 3.6. L’esistenza del prodotto tensoriale sarà dimostrata mediante una
costruzione esplicita.
Cominciamo con l’unicità: sia P = M ⊗A N e sia α : M × N → P la mappa
bilineare universale. Se consideriamo il diagramma
α
M ×N
α
² {w w
P
w
w
/
wP
idP
osserviamo che l’identità idP : P → P fa commutare il diagramma, ma poiché P è
il prodotto tensoriale, per unicità, solo idP fa commutare il diagramma. Dunque
se f : P → P è un qualunque omomorfismo tale che f α = α, allora f = idP .
Siano ora P e Q due moduli che siano entrambi un prodotto tensoriale dei
moduli M e N e siano α : M × N → P e β : M × N → Q le due mappe bilineari
universali. Consideriamo il diagramma
α
/
w; P
ww w
ww
β
² w ww ψ
Q {w
M ×N
ϕ
Poiché Q è il prodotto tensoriale di M e N , esiste una unica ϕ : Q → P che fa
commutare il diagramma e poiché anche P è il prodotto tensoriale di M e N , esiste
una unica ψ : P → Q che fa commutare il diagramma, e cioè
ϕβ = α,
ψα = β.
Da α = ϕβ = ϕ(ψα) = (ϕψ)α si ha ϕψ = idP e allo stesso modo ψϕ = idQ , e cioè
ϕ e ψ sono omomorfismi inversi l’uno dell’altro e quindi P ∼
= Q.
Costruiamo ora il prodotto tensoriale dei due moduli M e N . Sia X = M × N
l’insieme di tutte le coppie (x, y) con x ∈ M e y ∈ N e sia S il modulo libero di
base X. Notiamo che, anche se M e N sono finitamente generati, S in genere non
4. Prodotti tensoriali
25
lo è. Sia ora S0 il sottomodulo di S generato da tutti gli elementi del tipo
(x1 + x2 , y) − (x1 , y) − (x2 , y),
(x, y1 + y2 ) − (x, y1 ) − (x, y2 ),
a(x, y) − (ax, y),
a(x, y) − (x, ay).
Allora M ⊗A N = S/S0 , e la mappa universale α : M × N → M ⊗A N è data
dall’inclusione di M × N in S seguita dalla proiezione canonica, in formule
α(x, y) = x ⊗ y = (x, y) + S0 .
Dimostriamo ora che α cosı̀ definita è bilineare ed ha la proprietà universale. La
definizione di S0 è data proprio in modo da forzare la bilinearità di α:
α(x1 + x2 , y) = (x1 + x2 , y) + S0
= (x1 + x2 , y) − [(x1 + x2 , y) − (x1 , y) − (x2 , y)] + S0
= (x1 , y) + (x2 , y) + S0
= ((x1 , y) + S0 ) + ((x2 , y) + S0 )
= α(x1 , y) + α(x2 , y)
e analogamente si verificano le altre condizioni per la bilinearità.
Sia ora µ : M × N → L una mappa bilineare. Definiamo ϕ : S → L come
ϕ(x, y) = µ(x, y).
Poiché S è un modulo libero, questa definizione determina una unica mappa lineare
da S a L. Se ora calcoliamo ϕ sui generatori di S0 troviamo che essi appartengono
tutti al nucleo. Per esempio,
ϕ ((x1 + x2 , y) − (x1 , y) − (x2 , y)) =
= ϕ(x1 + x2 , y) − ϕ(x1 , y) − ϕ(x2 , y)
per la linearità di ϕ
= µ(x1 + x2 , y) − µ(x1 , y) − µ(x2 , y) = 0
per la bilinearità di µ
Il calcolo è simile per gli altri generatori e ϕ induce una mappa su S/S0 = M ⊗A N ,
che è la mappa cercata.
È importante osservare che non tutti gli elementi di M ⊗A N sono del tipo
x ⊗ y, in quanto questi sono solo i generatori. Il tipico elemento di un prodotto
tensoriale è della forma
X
ai (xi ⊗ yi )
cioè è una combinazione lineare di generatori. Dunque per definire una mappa
da un prodotto tensoriale in un modulo si dovrebbe dare la formula per tutti gli
elementi e non solo per i generatori. In questo però sta proprio l’utilità della
proprietà universale: per dare una mappa lineare da M ⊗A N a L, basta dare una
mappa bilineare da M ×N (cioè dall’insieme delle coppie) a L, e si ottiene la mappa
indotta dal prodotto tensoriale a L. Useremo questa osservazione nel seguito tutte
le volte che definiremo una mappa con dominio un prodotto tensoriale. In effetti,
la costruzione esplicita del prodotto tensoriale non sarà mai usata.
26
2. Moduli
Esercizio 4.2. Sia {x1 , . . . , xm } un insieme di generatori di M e {y1 , . . . , yn } un
insieme di generatori di N . Dimostrare che gli elementi {xi ⊗ yj } per i = 1, . . . , m
e j = 1, . . . , n sono un insieme di generatori per M ⊗A N , che è quindi finitamente
generato quando M e N sono finitamente generati.
Esercizio 4.3. Se M e N sono due K-spazi vettoriali di dimensione finita, allora
M ⊗K N è una spazio vettoriale su K tale che
dim(M ⊗K N ) = dim M · dim N.
Esempio 4.4. Se M è un A-modulo, e B è un anello che è anch’esso un A-modulo,
allora M ⊗A B, ha una struttura di A-modulo e anche una struttura di B-modulo,
data da
β(x ⊗ b) = x ⊗ βb,
β ∈ B.
Una tipica situazione in cui questo capita è quando A è un sottoanello di B, per
esempio A = Z e B = Q, o più in generale A = dominio d’integrità e B = campo
dei quozienti di A. Vediamo alcuni casi:
(1) se M è uno Z-modulo, allora M ⊗Z Q è un Q-spazio vettoriale; per esempio,
Zn ⊗Z Q ∼
= Qn , ma Zn ⊗Z Q = 0. Infatti, se x ∈ Zn si ha
µ
¶
1
1
1
1
x⊗ =x⊗n·
=n x⊗
= nx ⊗
=0
b
bn
bn
bn
e poiché ogni elemento è combinazione lineare (a coefficienti interi) di elementi
1
del tipo x ⊗ , si ha la tesi. Dunque il prodotto tensoriale può essere nullo
b
anche se entrambi i fattori sono non nulli;
(2) se V è uno spazio vettoriale sul campo K e L è un’estensione di K, allora
V ⊗K L è uno spazio vettoriale su L. Osserviamo che dimL (V ⊗K L) = dimK V
e dimK (V ⊗K L) = [L : K] dimK V . Nel caso K = R e L = C, questa
operazione è detta la complessificazione di V .
Esercizio 4.5. Siano M , N , e P tre A-moduli. Dimostrare che ci sono degli
isomorfismi (canonici)
(1) M ⊗A N ∼
= N ⊗A M ;
(2) (M ⊗A N ) ⊗A P ∼
= M ⊗A (N ⊗A P );
(3) (M ⊕ N ) ⊗A P ∼
= (M ⊗A P ) ⊕ (N ⊗A P );
(4) A ⊗A M ∼
= M.
([AM], Proposition 2.14). Dunque il prodotto tensoriale di A-moduli è commutativo e associativo, si distribuisce rispetto alla somma diretta e A (come A-modulo)
è l’elemento neutro.
Definizione 4.6. Sia M un A-modulo. Il modulo HomA (M, A) viene detto modulo
duale di M e viene denotato M ∗ .
Esempio 4.7. Se M è uno spazio vettoriale, il modulo duale è quello che si chiama
lo spazio vettoriale duale, e sappiamo che c’è una mappa bilineare M ∗ × M → K,
data da (f, x) 7→ f (x) che è non degenere, e che induce un omomorfismo canonico
ϕ : M → M ∗∗ definito da ϕ(x)(f ) = f (x). Se dim M è finita, ϕ è un isomorfismo,
ma se dim M non è finita, M e M ∗∗ non sono mai isomorfi (Esercizio 12).
4. Prodotti tensoriali
27
Esempio 4.8. È importante osservare che in generale M 6∼
= M ∗ . Per esempio, se
∗
M = Zn come Z-modulo, allora Zn = 0.
Esempio 4.9. Il modulo M ⊗A . . .⊗A M (r fattori) è denotato T r (M ). Se M è uno
spazio vettoriale di dimensione finita, T r (M ) è lo spazio dei tensori controvarianti
di grado r. T r (M ) è di importanza fondamentale per le operazioni dell’algebra
multilineare, ed ha la ovvia proprietà universale: per ogni µ : M × · · · × M → L
multilineare (in r variabili), esiste una unica mappa lineare f : T r (M ) → L tale
che per ogni x1 , . . . , xr ∈ M si abbia f (x1 ⊗ . . . ⊗ xr ) = µ(x1 , . . . , xr ).
Costruiamo ora il prodotto simmetrico e il prodotto esterno come quozienti del
prodotto tensoriale.
Esempio 4.10. Consideriamo il modulo M ⊗A M , e sia N il sottomodulo generato
da tutti gli elementi del tipo x ⊗ y − y ⊗ x. Il quoziente (M ⊗A M )/N si dice il
quadrato simmetrico di M , e viene denotato con S 2 M . È universale per tutte le
mappe bilineari simmetriche definite su M × M , e cioè per tutte le moltiplicazioni
commutative su M . Si può anche definire, allo stesso modo, la r-esima potenza
simmetrica S r M : è il quoziente di T r (M ) per il sottomodulo generato da tutti i
tensori del tipo
x1 ⊗ . . . ⊗ xi ⊗ xi+1 ⊗ . . . ⊗ xr − x1 ⊗ . . . ⊗ xi+1 ⊗ xi ⊗ . . . ⊗ xr
per i = 1, . . . , r − 1. Per esempio, se V è uno spazio vettoriale di dimensione n
su K, e V ∗ = Hom(V, K) è il modulo (K-spazio vettoriale) delle forme lineari
(cioè, polinomi omogenei di primo grado) in n variabili t1 , . . . , tn , allora S r (V ∗ )
è il modulo (K-spazio vettoriale) delle forme (cioè, polinomi omogenei)
di grado r
L∞
nelle variabili t1 , . . . , tn . Si ha, in questo caso, K[t1 , . . . , tn ] = r=0 S r (V ∗ ), dove
si pone, per convenzione, S 0 (V ∗ ) = K.
Esempio 4.11. Il prodotto esterno è il caso in cui la moltiplicazione è anticommutativa: consideriamo ancora M ⊗A M e P il sottomodulo generato da tutti gli
elementi del tipo x ⊗ x. Il quoziente (M ⊗A M )/P si dice il prodotto esterno di M
V2
V2
con se stesso e si denota
M . L’immagine di x ⊗ y in
M si scrive x ∧ y e da
0 = (x + y) ∧ (x + y) = x ∧ x + x ∧ y + y ∧ x + y ∧ y = x ∧ y + y ∧ x
V2
si ha che x ∧ y = −y ∧ x. Dunque
M è universale per tutte le mappe bilineari
antisimmetriche V
definite su M × M , e cioè tali che f (x, y) = −f (y, x). La r-esima
r
potenza esterna
M è definita in modo analogo: è il quoziente di T r (M ) per il
sottomodulo generato da tutti i tensori del tipo x1 V
⊗ . . . ⊗ xr in cui (almeno) due
r
fattori sono uguali. L’immagine di x1 ⊗ . . . ⊗ xr in
M è denotata x1 ∧ · · · ∧ xr ,
ed è nulla se almeno due fattori coincidono. Dunque il prodotto “anticommuta” e
cioè
x1 ∧ · · · ∧ xi ∧ xi+1 ∧ · · · ∧ xr = −x1 ∧ · · · ∧ xi+1 ∧ xi ∧ · · · ∧ xr .
Esercizio 4.12.VSia M finitamente generato, e siano x1 , . . . , xn generatori per M .
r
Dimostrare che
M è finitamente generato, e un insieme di generatori è dato da
xi1 ∧ xi2 ∧ · · · ∧ xir , per 1 ≤ i1 < i2 < · · · < ir ≤ n.
Vr
In particolare,
M = 0 per r > n.µDimostrare
che, se V è uno spazio vettoriale
¶
Vr
n
di dimensione n, allora dim
V =
, per r ≤ n.
r
28
2. Moduli
5. Successioni esatte
Sappiamo che sia il prodotto tensoriale che Hom commutano con le somme dirette
finite (Esercizio 4.5 e Esercizio 9). La relazione fra Hom e prodotto tensoriale è
più complicata e per essere compresa a fondo necessita di alcune nozioni di algebra
omologica. Per la terminologia su categorie e funtori, si veda il Capitolo 5.
Definizione 5.1. Una successione di A-moduli e omomorfismi
/ Mi−1
...
fi−1
/ Mp
fi
/ Mi+1
fi+1
/ ...
si dice esatta in Mi se vale
ker fi+1 = Im fi ;
si dice semplicemente esatta se è esatta in Mi per ogni i.
Nella definizione di successione esatta gli Mi potrebbero essere gruppi (non
necessariamente abeliani), anelli, moduli, spazi vettoriali e le funzioni fi omomorfismi appropriati. Nel seguito vedremo solo il caso di A-moduli, anche se il caso dei
gruppi abeliani è molto simile.
Una successione esatta corta è una successione esatta del tipo
0
/N
f
/M
g
/P
/0
Dire che la successione è esatta significa che
• f è iniettiva,
• g è suriettiva, e
• ker g = Im f .
Questo in particolare implica che M/N ∼
= P . Le successioni esatte sono lo strumento fondamentale dell’algebra omologica e uno dei filoni di ricerca dell’algebra moderna è quello di caratterizzare un anello A sulla base delle proprietà delle successioni
esatte di A-moduli.
Sia F : ModA → ModA un funtore. F trasforma successioni in successioni e
ci si può chiedere se l’immagine di una successione esatta sia ancora esatta. Un
funtore si dice esatto se trasforma tutte le successioni esatte in successioni esatte.
Teorema 5.2. Un funtore F è esatto se e solo se trasforma tutte le successioni
esatte corte in successioni esatte corte.
Dimostrazione. Una implicazione è ovvia. Supponiamo ora che F trasformi tutte
le successioni esatte corte in successioni esatte corte, e sia
/ Mi−1 fi−1 / Mi
...
fi
/ Mi+1
fi+1
/ ...
una successione esatta e
...
/ F (Mi−1 )
fi−1 ∗
fi ∗
/ F (Mi )
f
/ F (Mi+1 ) i+1 ∗ / . . .
la sua immagine mediante F . Dobbiamo dimostrare che Im fi−1 ∗ = ker fi ∗ .
Poniamo Ki = ker fi e Pi = Im fi e consideriamo le successioni esatte corte
0
/ Ki
j
/ Mi
fi
/ Pi
/0
5. Successioni esatte
29
dove j è l’inclusione. Per ipotesi sono esatte le successioni
0
0
j∗
/ F (Ki )
j∗
/ F (Ki−1 )
/ F (Mi )
/ F (Mi−1 )
fi ∗
/ F (Pi )
fi−1 ∗
/0
/ F (Pi−1 )
/0
e dunque Im fi−1 ∗ = F (Pi−1 ) e ker fi ∗ = F (Ki ). Ma allora
Im fi−1 ∗ = F (Pi−1 ) = F (Ki ) = ker fi ∗
perché per ipotesi Pi−1 = Ki .
¤
Studiamo ora le proprietà di esattezza del prodotto tensoriale e di Hom.
Se f1 : M1 → N1 e f2 : M2 → N2 sono due omomorfismi di moduli, si può
definire un omomorfismo f1 ⊗ f2 : M1 ⊗ M2 → N1 ⊗ N2 nel modo seguente: sia
µ : M1 × M2 → N1 ⊗ N2 la mappa definita da µ(m1 , m2 ) = f1 (m1 ) ⊗ f2 (m2 ).
È immediato verificare (dalle proprietà del prodotto tensoriale N1 ⊗ N2 ) che µ è
bilineare e quindi induce una mappa lineare definita su M1 ⊗ M2 , che donotiamo
con f1 ⊗ f2 . La proprietà caratteristica di questo omomorfismo è che
(f1 ⊗ f2 )(m1 ⊗ m2 ) = f1 (m1 ) ⊗ f2 (m2 ).
Sia ora N un A-modulo fissato. Il funtore TN : ModA → ModA è definito da:
TN (M ) = M ⊗ N,
TN (f ) = f ⊗ idN ,
∀M ∈ ModA ;
∀f : M → P omomorfismo di A-moduli.
Teorema 5.3. Se la successione
(1)
P
f
/M
g
/0
/Q
è esatta allora la successione
(2)
P ⊗N
f ⊗idN
/ M ⊗ N g⊗idN / Q ⊗ N
/0
è esatta.
Si riassume l’enunciato di questo teorema dicendo che il funtore TN è esatto a
destra. In generale TN non è esatto, e cioè anche se f è iniettiva, non è detto che
f ⊗ idN sia iniettiva. Per esempio, la successione
0
/Z
f
/Z
g
/ Z2
/0
dove f (n) = 2n è esatta, ma
f ⊗id
/ Z ⊗ Z2
Z ⊗ Z2
è la mappa nulla, e poiché Z ⊗ Z2 ∼
= Z2 6= 0 la mappa f ⊗ id non è iniettiva.
Dimostrazione.
• g ⊗ idN è suriettiva. Sia q ⊗ n ∈ Q ⊗ N . Poiché g : M → Q è suriettiva,
esiste m ∈ M tale che g(m) = q e quindi q ⊗ n = (g ⊗ idN )(m ⊗ n) appartiene
all’immagine di g ⊗ idN . Il modulo Q ⊗ N è generato dagli elementi della forma
q ⊗ n, con q ∈ Q e n ∈ N , e tutti i generatori appartengono all’immagine e dunque
g ⊗ idN è suriettiva.
30
2. Moduli
• Im(f ⊗ idN ) ⊆ ker(g ⊗ idN ). Sia p ⊗ n ∈ P ⊗ N . Allora
(g ⊗ idN )(f ⊗ idN )(p ⊗ n) = (g ⊗ idN )(f (p) ⊗ n) = g(f (p)) ⊗ n = 0
perché g(f (p)) = 0, per esattezza della (1). Osserviamo che dire che una successione è esatta implica che la composizione di due omomorfismi consecutivi è nulla,
e questa proprietà si conserva automaticamente per funtorialità. Dunque questa
verifica era in effetti inutile.
• ker(g ⊗ idN ) ⊆ Im(f ⊗ idN ). Questa è l’unica parte non immediata della
dimostrazione. Costruiamo un omomorfismo
ϕ : Q ⊗ N → (M ⊗ N )/ Im(f ⊗ idN )
tale che la composizione ϕ◦(g⊗idN ) coincide con la proiezione naturale sul quoziente
π : M ⊗ N → (M ⊗ N )/ Im(f ⊗ idN ). Un disegno aiuta a capire:
P ⊗N
f ⊗idN
/ M ⊗N
g⊗idN
/ Q⊗N
ll
l
l
lll
π
lll ϕ
²
vlll
(M ⊗ N )/ Im(f ⊗ idN )
/0
Allora se x ∈ ker(g ⊗ idN ) si ha π(x) = ϕ ◦ (g ⊗ idN )(x) = 0 e dunque x ∈ ker π =
Im(f ⊗ idN ), e cioè la tesi.
Per definire ϕ, definiamo come sempre una mappa bilineare ψ su Q × N . Se
(q, n) ∈ Q × N , per la suriettività di g esiste m ∈ M tale che g(m) = q. Definiamo
allora
ψ(q, n) = m ⊗ n + Im(f ⊗ idN ).
Se anche m0 ∈ M è tale che g(m0 ) = q, allora g(m − m0 ) = 0 e, per l’esattezza
della (1), m − m0 ∈ Im f . Dunque
m ⊗ n + Im(f ⊗ idN ) = m0 ⊗ n + Im(f ⊗ idN )
e cioè ψ è ben definita. È immediato verificare che ψ è bilinearee che quindi induce
la mappa lineare ϕ. La verifica che ϕ ◦ (g ⊗ idN ) = π è un esercizio.
¤
Il prodotto tensoriale dipende da due variabili, ma come sappiamo dall’Esercizio 4.5, l’ordine del prodotto non conta. Anche Hom dipende da due variabili, ma
in questo caso l’ordine conta (Capitolo 5, Esempio 1.6 (5) e (6)).
Sia N un A-modulo fissato. Il funtore hN : ModA → ModA è definito da:
hN (M ) = Hom(N, M ),
hN (f ) = f ◦ ϕ,
∀M ∈ ModA ;
∀f : M → P e ϕ ∈ Hom(N, M ).
In generale, l’omorfismo indotto hN (f ) si denota con f∗ .
Teorema 5.4. La successione
(3)
0
/P
f
/M
g
/Q
è esatta se e solo se la successione
(4)
0
/ Hom(N, P )
è esatta per ogni A-modulo N .
f∗
/ Hom(N, M )
g∗
/ Hom(N, Q)
5. Successioni esatte
31
Si riassume l’enunciato di questo teorema dicendo che il funtore hN è esatto a
sinistra. In generale hN non è esatto, e cioè anche se g è suriettiva, non è detto che
g∗ sia suriettiva. Per esempio, la successione
/Z
0
f
g
/Z
/ Z2
/0
dove f (n) = 2n è esatta, ma
g∗
Hom(Z2 , Z)
/ Hom(Z2 , Z2 )
non è suriettiva poiché Hom(Z2 , Z) = 0 e Hom(Z2 , Z2 ) ∼
= Z2 6= 0.
Dimostrazione. Supponiamo che la (3) sia esatta.
• f∗ è iniettiva. Se ϕ ∈ ker f∗ , allora f ◦ ϕ ≡ 0 e cioè Im ϕ ⊆ ker f = {0} poiché
f è iniettiva. Dunque ϕ è la mappa nulla e cioè f∗ è iniettiva.
• Im(f∗ ) ⊆ ker(g∗ ). Come abbiamo già osservato, dire che una successione è
esatta implica che la composizione di due omomorfismi consecutivi è nulla, e questa
proprietà si conserva automaticamente per funtorialità.
• ker(g∗ ) ⊆ Im(f∗ ). Sia ϕ : N → M tale che g ◦ ϕ = 0. Dobbiamo dimostrare
che esiste ψ : N → P tale che ϕ = f ◦ ψ. Un disegno aiuta a capire:
0
f
/M
O
g
/Q
>
~
@
~~
ϕ ~~
@
ψ
@ ~~~ 0
N
/P
`@
Sia n ∈ N . Poiché g(ϕ(n)) = 0 si ha che ϕ(n) ∈ ker g = Im f e dunque esiste
p ∈ P tale che ϕ(n) = f (p). Poiché f è iniettiva, tale p è necessariamente unico e
definiamo allora
ψ(n) = p.
Allora ϕ = f ◦ψ per costruzione, e la verifica che ψ cosı̀ definito sia un omomorfismo
è un esercizio.
Supponiamo ora che la (4) sia esatta per ogni A-modulo N . In particolare
possiamo porre N = A e sappiamo che per ogni A-modulo M c’è un isomorfismo
canonico M ∼
= Hom(A, M ), in cui all’elemento m ∈ M corrisponde l’omomorfismo
ϕm : A → M definito da ϕm (1) = m (Esercizio 8). Sia f : P → M un omomorfismo
e sia f∗ l’omomorfismo indotto da Hom(A, P ) a Hom(A, M ). Sia p ∈ P e sia
ϕp ∈ Hom(A, P ) come descritto nell’isomorfismo precedente. Si ha
f∗ (ϕp (1)) = f (ϕp (1)) = f (p) = ϕf (p) (1)
e cioè f∗ (ϕp ) = ϕf (p) . Dunque applicando l’isomorfismo la successione (4), con
N = A, riproduce la (3). Poiché la (4) è esatta per ipotesi, lo è anche la (3).
¤
Vediamo ora l’altro funtore Hom, quello controvariante. Sia N un A-modulo
fissato. Il funtore hN : Mod◦A → ModA è definito da:
hN (M ) = Hom(M, N ),
N
h (f ) = ϕ ◦ f,
∀M ∈ ModA ;
∀f : P → M e ϕ ∈ Hom(M, N ).
In generale, l’omorfismo indotto hN (f ) si denota con f ∗ .
32
2. Moduli
Teorema 5.5. La successione
(5)
g
Q
f
/M
/P
/0
è esatta se e solo se la successione
(6)
0
f∗
/ Hom(P, N )
/ Hom(M, N )
g∗
/ Hom(Q, N )
è esatta per ogni A-modulo N .
Si riassume l’enunciato di questo teorema dicendo che il funtore hN è esatto a
sinistra. Notiamo che la (5) è in realtà una successione in Mod◦A , che si scrive
0
/P ◦
f◦
/M◦
g◦
/ Q◦
e quindi è giusto dire che hN è esatto a sinistra. In generale hN non è esatto, e cioè
anche se g ◦ è suriettiva (e cioè g iniettiva), non è detto che g ∗ sia suriettiva. Per
esempio, la successione
/Z
0
g
/Z
f
/ Z2
/0
dove g(n) = 2n è esatta, ma
g∗
/ Hom(Z, Z)
Hom(Z, Z)
non è suriettiva. Infatti Hom(Z, Z) ∼
= Z e se ϕ ∈ Hom(Z, Z) è data da ϕ(1) = a,
allora g ∗ (ϕ)(1) = 2a è sempre pari. Dunque ψ ∈ Hom(Z, Z) data da ψ(1) = 1 non
può essere nell’immagine di g ∗ .
Dimostrazione. Supponiamo che la (5) sia esatta.
• f ∗ è iniettiva. Se ϕ ∈ ker f ∗ , allora ϕ ◦ f ≡ 0 e cioè Im f ⊆ ker ϕ e poiché f
è suriettiva, ker ϕ = P e cioè ϕ è la mappa nulla.
• Im(f ∗ ) ⊆ ker(g ∗ ). Come abbiamo già osservato, dire che una successione è
esatta implica che la composizione di due omomorfismi consecutivi è nulla, e questa
proprietà si conserva automaticamente per funtorialità.
• ker(g ∗ ) ⊆ Im(f ∗ ). Sia ϕ : M → N tale che ϕ ◦ g = 0. Dobbiamo dimostrare
che esiste ψ : P → N tale che ϕ = ψ ◦ f . Un disegno aiuta a capire:
g
/M f /P
Q@
@@
~
@@ ϕ
~
@
~
0 @@
à ² ~~ ψ
N
/0
Sia p ∈ P . Poiché f è suriettiva, esiste m ∈ M tale che f (m) = p. Definiamo allora
ψ(p) = ϕ(m). Se anche m0 ∈ M è tale che f (m0 ) = p, allora m − m0 ∈ ker f = Im g
e quindi ϕ(m − m0 ) = 0. Allora ψ è ben definita. ϕ = ψ ◦ f per costruzione, e la
verifica che ψ cosı̀ definito sia un omomorfismo è un esercizio.
Supponiamo ora che la (6) sia esatta per ogni A-modulo N .
• f è suriettiva. Sia N = P/ Im f e sia π : P → N la proiezione sul quoziente.
Per ipotesi f ∗ : Hom(P, N ) → Hom(M, N ) è iniettiva e poiché f ∗ (π) = π ◦ f = 0
deve essere π = 0. Ma allora N = 0 e cioè Im f = P .
• Im(g) ⊆ ker(f ). Poniamo N = P . Allora f ◦ g = g ∗ ◦ f ∗ (idP ) = 0 perché la
(6) è esatta.
5. Successioni esatte
33
• ker(f ) ⊆ Im(g). Poniamo N = M/ Im g e sia π : M → N la proiezione sul
quoziente.
g
/M f /P
Q@
@@
~
@@ π
~
@
~
0 @@
à ² ~~ ψ
N
/0
Poiché g ∗ (π) = π ◦ g = 0, per l’esattezza della (6) si ha che π ∈ Im f ∗ e cioè esiste
ψ : P → N tale che π = f ∗ (ψ) = ψ ◦ f . Se ora m ∈ M è tale che f (m) = 0 si ha
π(m) = ψ ◦ f (m) = 0 e quindi m ∈ ker π = Im g.
¤
Dopo aver studiato le proprietà di esattezza del prodotto tensoriale e di Hom,
torniamo alla relazione che c’è fra questi due funtori.
Teorema 5.6. Siano M , N e P tre A-moduli. Allora
HomA (M ⊗A N, P ) ∼
= HomA (M, HomA (N, P ))
Dimostrazione. La dimostrazione consiste nell’usare correttamente la proprietà
universale del prodotto tensoriale per definire l’isomorfismo richiesto. Per brevità
non scriviamo il suffisso A in Hom e nel prodotto tensoriale.
Definiamo una mappa α : Hom(M ⊗ N, P ) → Hom(M, Hom(N, P )) nel modo
seguente: se f : M ⊗ N → P è una mappa lineare, αf deve associare ad ogni
elemento di M una mappa lineare da N a P . Poniamo allora
[(αf )(x)](y) = f (x ⊗ y),
∀x ∈ M, ∀y ∈ N
Le seguenti verifiche sono lasciate per esercizio:
(1) per ogni x ∈ M e ogni f ∈ Hom(M ⊗ N, P ), la mappa
(αf )(x) : N → P
è lineare;
(2) (αf ) : M → Hom(N, P ) è lineare;
(3) α è lineare;
Per dimostrare che α è un isomorfismo basta trovare l’omomorfismo inverso. Definiamo β : Hom(M, Hom(N, P )) → Hom(M ⊗ N, P ) ponendo
(βg)(x, y) = [g(x)](y),
dove x ∈ M , y ∈ N e g ∈ Hom(M, Hom(N, P )). La mappa βg è bilineare su M × N
e definisce, per la proprietà universale del prodotto tensoriale, un omomorfismo
da M ⊗ N a P . Verificare che (esercizio)
(4) β è lineare;
(5) αβ e βα sono le rispettive identità, e quindi sono l’inversa l’una dell’altra.
Dunque α è un isomorfismo.
¤
Nel caso particolare P = A, si può riscrivere la tesi come
(M ⊗A N )∗ ∼
= HomA (M, N ∗ ),
formula che calcola il duale di un prodotto tensoriale di due moduli.
34
2. Moduli
Esercizio 5.7. Siano M e N sono spazi vettoriali di dimensione finita. Scrivere un isomorfismo esplicito f : M ∗ ⊗ N → Hom(M, N ). Scrivere esplicitamente
l’isomorfismo inverso.
Fissiamo un modulo N e consideriamo i funtori TN e hN . Il teorema precedente
afferma che per ogni coppia di moduli M e P c’è un isomorfismo naturale
Hom(TN (M ), P ) ∼
= Hom(M, hN (P )).
Nel linguaggio delle categorie si dice che il funtore TN è l’aggiunto sinistro del funtore hN , e il funtore hN è l’aggiunto destro del funtore TN . Un semplice argomento
mostra che ogni funtore aggiunto sinistro è esatto a destra e ogni funtore aggiunto
destro è esatto a sinistra.
Esercizi
In tutti gli esercizi seguenti, A indica un anello unitario. In generale, non è
necessario assumere che A sia commutativo, tranne quando indicato.
(1) Ogni A-modulo ciclico M è isomorfo, come A-modulo a A/J, dove J è un ideale
(sinistro) di A.
(2) Un A-modulo M non nullo si dice semplice se i suoi soli sottomoduli sono {0}
e M.
(a) Ogni A-modulo semplice è ciclico.
(b) Se M è semplice, allora ogni endomorfismo (di A-modulo) è nullo oppure
è un isomorfismo.
(3) Se f : M → M è un omomorfismo di A-moduli tale che f 2 = f allora
M = ker f ⊕ Im f
(4) Se f : M → N e g : N → M sono omomorfismi tali che gf = 1M , allora
N = Im f ⊕ ker g.
(5) Se M è un gruppo abeliano e n ∈ N un intero positivo tale che nx = 0 per
ogni x ∈ M , allora c’è una struttura di Zn -modulo naturale su M .
(6) Sia M un modulo sull’anello commutativo A. Per m ∈ M poniamo
Om = {a ∈ A | am = 0}
(a) Om è un ideale di A. Se Om 6= 0, m viene detto un elemento di torsione
di M .
(b) Se A è un dominio d’integrità, l’insieme T (M ) di tutti gli elementi di
torsione di M è un sottomodulo di M .
(c) Mostrare, con un esempio, che (b) può essere falso per un anello commutativo A che non è un dominio.
Nei prossimi punti, A è un dominio d’integrità.
(d) Se f : M → N è un omomorfismo, allora f (T (M )) ⊆ T (N ); quindi la
restrizione fT di f a T (M ) è un omomorfismo di moduli T (M ) → T (N ).
(e) Se f : M → N è un omomorfismo iniettivo, anche fT è iniettivo.
Esercizi
35
(f) Se f : M → N è un omomorfismo suriettivo, allora fT : T (M ) → T (N )
può non essere suriettivo.
(g) Se f : M → N è un isomorfismo, anche fT è un isomorfismo.
(7) Sia A un PID (quindi in particolare un dominio d’integrità), M un A-modulo
unitario, a ∈ A e p ∈ A un primo (= irriducibile). Sia aM = {am | m ∈ M } e
M [a] = {m ∈ M | am = 0}, M (p) = {m ∈ M | pn m = 0, per qualche n ≥ 0}.
Dimostrare che:
(a) A/(p) è un campo;
(b) aM , M [a] e M (p) sono sottomoduli di M .
(c) M/pM è uno spazio vettoriale su A/(p), con la moltiplicazione data da
(a + (p)) · (m + pM ) = am + pM ;
(d) M [p] è uno spazio vettoriale su A/(p), con la moltiplicazione data da
(a + (p)) · m = am;
(e) per ogni intero n > 0, ci sono isomorfismi di A-moduli
(A/(pn ))[p] ∼
= A/(pn−m ), 0 ≤ m ≤ n;
= A/(p), e pm (A/(pn )) ∼
L
L
L
L
(f) se M ∼
Mi allora aM ∼
aMi , M [a] ∼
Mi [a] e M (p) ∼
Mi (p).
=
=
=
=
(8) Per ogni A-modulo M c’è un isomorfismo canonico M ∼
= Hom(A, M ), in cui
all’elemento m ∈ M corrisponde l’omomorfismo ϕm : A → M definito da
ϕm (1) = m.
(9) Dimostrare che Hom commuta con le somme dirette finite, e cioè per tre Amoduli M , N e P si ha
HomA (M ⊕ N, P ) ∼
= HomA (M, P ) ⊕ HomA (N, P ).
(10) Dimostrare che per una famiglia di A-moduli {Mi }i∈I e un modulo N si ha
Ã
!
M
Y
HomA
Mi , N ∼
HomA (Mi , N )
=
i∈I
i∈I
e cioè Hom trasforma la somma diretta nel prodotto diretto.
(11) Sia G un gruppo abeliano, considerato come Z-modulo, e per un intero positivo m consideriamo Zm come Z-modulo. Dimostrare che:
(a) Hom(Zm , G) ∼
= G[m] = {g ∈ G | mg = 0};
(b) Hom(Zm , Zn ) ∼
= Z(m,n) ;
(c) come Z-modulo si ha Z∗m = 0, cioè Hom(Zm , Z) = 0;
(d) per k ≥ 1, Zm ha una struttura naturale di Zmk -modulo (Esercizio 5);
come Zmk -modulo, Z∗m ∼
= Zm , cioè HomZmk (Zm , Zmk ) ∼
= Zm .
(12) Sia K un campo, X un insieme infinito e sia V uno spazio vettoriale di base
X. Sia K X l’insieme di tutte le funzioni f : X → K.
(a) K X è uno spazio vettoriale su K, con le operazioni di somma di funzioni
e moltiplicazione di uno scalare per una funzione;
(b) c’è un isomorfismo V ∗ ∼
= K X come K-spazi vettoriali;
X
|X|
(c) dimK K = |K|
(d) concludere che dimK V ∗ > dimK V e quindi V e V ∗ non sono isomorfi.
(13) Sia P un gruppo abeliano, considerato come Z-modulo.
(a) per ogni m > 0, P ⊗ Zm ∼
= P/mP ;
36
2. Moduli
∼ Zc , dove c = (m, n) è il massimo comun divisore.
(b) Zm ⊗ Zn =
(14) Sia P un gruppo abeliano di torsione, cioè tale che T (P ) = P , e Q il gruppo
additivo dei numeri razionali, considerati come Z-moduli.
(a) P ⊗Z Q = 0;
(b) Q ⊗Z Q ∼
= Q;
(15) Dare esempi di un anello A e A-moduli M e N tali che
M ⊗A N 6= M ⊗Z N
(16) Sia A un anello commutativo con unità, I un ideale di A e M un A-modulo.
C’è un isomorfismo
A/I ⊗A M ∼
= M/IM
(17) Sia A un anello commutativo e I, J due ideali. C’è un isomorfismo
A/I ⊗A A/J ∼
= A/(I + J)
Capitolo 3
Moduli di tipo finito
In questo capitolo studieremo l’importante classe dei moduli finitamente generati,
che corrispondono agli spazi vettoriali di dimensione finita. Tutti gli anelli sono
commutativi con unità, e tutti i moduli sono unitari.
Ricordiamo che un modulo si dice finitamente generato o di tipo finito se esiste
un insieme finito X = {x1 , . . . , xn } che genera M , e in particolare se X = {x} è
formato da un solo elemento, M è detto modulo ciclico.
Ogni anello A come modulo su se stesso, e più in generale ogni modulo libero
di rango finito è finitamente generato. Ogni gruppo abeliano finito è uno Z-modulo
finitamente generato.
1. Moduli Noetheriani
Una proprietà importante degli spazi vettoriali di dimensione finita è che ogni sottospazio ha ancora dimensione finita (minore o uguale a quella dello spazio). Possiamo
dunque chiederci se un sottomodulo di un modulo finitamente generato sia ancora
finitamente generato. È facile vedere che questo non è vero.
Esempio 1.1. Sia A un anello e sia B = A[x1 , x2 , . . . ] l’anello dei polinomi in
infinite variabili. Come modulo su se stesso, B è finitamente generato da 1, ma
l’ideale I = {p ∈ B | il termine noto di p è nullo} non è finitamente generato.
Infatti, sia X = {p1 , . . . , pn } un qualunque insieme finito di polinomi in I. Poiché
in ogni polinomio c’è un numero finito di monomi, in X vi è in tutto solo una
quantità finita di variabili. Possiamo dunque trovare xk ∈ I che non compare in
nessun pi ∈ X e che quindi non può essere generato dai polinomi in X.
Dunque per avere una nozione utile non basta chiedere che un modulo sia
finitamente generato. Il modo più semplice per imporre condizioni di finitezza è
tramite “chain conditions”, e cioè condizioni sulle catene di sottomoduli.
Teorema 1.2. Sia M un modulo sull’anello commutativo con unità A. Le seguenti
condizioni sono equivalenti:
(1) Ogni sottomodulo di M è finitamente generato.
37
38
3. Moduli di tipo finito
(2) Ogni catena ascendente di sottomoduli
N1 ⊆ N2 ⊆ · · · ⊆ Nm ⊆ · · ·
è stazionaria, e cioè esiste k ∈ N tale che Nk = Nk+1 = · · ·
(3) Ogni insieme non vuoto di sottomoduli di M ha un elemento massimale,
e cioè un sottomodulo che non è contenuto propriamente in nessun altro
sottomodulo dell’insieme.
Dimostrazione.
S
(1) =⇒ (2) Data una catena N1 ⊆ · · · ⊆ Nm ⊆ · · · poniamo N = m≥1 Nm .
È facile verificare che N è un sottomodulo e quindi per ipotesi è finitamente generato
da x1 , . . . , xn . Poiché ogni xi è un elemento di qualche NSj , e la catena è crescente,
esiste un indice k tale che xi ∈ Nk per ogni i. Dunque m≥1 Nm ⊆ Nk , e quindi
Ni = Nk per ogni i ≥ k.
(2) =⇒ (3) Immediato dal lemma di Zorn.
(3) =⇒ (1) Sia N un sottomodulo di M e sia
T = {P ⊆ N | P è un sottomodulo finitamente generato}.
T non è vuoto perché {0} ∈ T e dunque, per ipotesi, T ha un elemento massimale
P0 . Se P0 6= N , allora esiste un elemento x ∈ N \P0 e il sottomodulo P1 = P0 +Ax è
ancora finitamente generato e contiene strettamente P0 , che quindi non è massimale.
Allora N = P0 è finitamente generato.
¤
Definizione 1.3. Sia M un A-modulo. Se M soddisfa una delle condizioni del
teorema precedente (e quindi tutte), M si dice Noetheriano. Un anello A si dice
Noetheriano se A è Noetheriano come A-modulo.
Un modulo Noetheriano è il giusto analogo di uno spazio vettoriale di dimensione finita. Notiamo che non si può chiedere, nemmeno in un modulo Noetheriano,
che il numero di generatori di un sottomodulo sia minore o uguale al numero di generatori del modulo: basta ricordare l’esempio A = K[x, y] come modulo su stesso.
A ha 1 generatore, ma l’ideale I = (x, y) non è principale e richiede (almeno) due
generatori (Dimostreremo fra breve che A è Noetheriano).
Un’altra importante proprietà di uno spazio vettoriale di dimensione finita è la
seguente: ogni catena strettamente crescente
V1 ( V2 ( . . . V k ( . . .
è finita. Questa proprietà è vera in ogni modulo Noetheriano.
Quali anelli sono Noetheriani? Ovviamente un campo K è Noetheriano e tutti
i PID sono Noetheriani, dunque per esempio Z e K[x]. Quest’ultima affermazione
è un caso particolare del celebre teorema della base di Hilbert. Prima di affrontare la dimostrazione del teorema della base, vediamo alcune proprietà dei moduli
Noetheriani.
Teorema 1.4. Sia N un sottomodulo di M . Allora M è Noetheriano se e solo se
N e M/N sono entrambi Noetheriani.
Dimostrazione. Supponiamo che M sia Noetheriano. Ogni catena crescente di
sottomoduli di N è anche una catena crescente in M e quindi è stazionaria. Dunque
N è Noetheriano. Se {Pi } è una catena di sottomoduli in M/N e π : M → M/N è
la proiezione canonica, {Qi = π −1 (Pi )} è una catena in M e quindi è stazionaria.
1. Moduli Noetheriani
39
Poiché π è suriettiva, π(π −1 (Pi ) = Pi e quindi anche la catena {Pi } è stazionaria e
M/N è Noetheriano.
Viceversa, siano N e M/N Noetheriani, π : M → M/N la proiezione canonica
e sia {Mi } una catena di sottomoduli in M . Poniamo Ni = N ∩ Mi e Pi = π(Mi ).
Otteniamo allora due catene in N e M/N , che sono stazionarie. Sia k ∈ N tale che
Ni = Nk per ogni i ≥ k e Pi = Pk per ogni i ≥ k. Dimostriamo che anche Mi = Mk
per ogni i ≥ k. Sia infatti x ∈ Mi e consideriamo π(x) ∈ Pi = Pk . Dunque esiste
y ∈ Mk tale che π(x) = π(y) e cioè x − y = n ∈ ker π = N . Poiché la catena è
crescente, sia x che y appartengono a Mi e quindi n ∈ N ∩Mi = Ni = Nk = N ∩Mk .
Dunque n ∈ Mk e perciò x = y + n ∈ Mk .
¤
Da questo teorema si ottengono immediatamente molte delle proprietà essenziali dei moduli Noetheriani.
Corollario 1.5.
(1) L’immagine di un modulo Noetheriano è Noetheriano.
(2) La somma diretta (finita) di moduli Noetheriani è un modulo Noetheriano.
(3) Se A è un anello Noetheriano e M un A-modulo finitamente generato,
allora M è Noetheriano.
(4) Se A è un anello Noetheriano e I un ideale, allora A/I è un anello
Noetheriano.
Dimostrazione.
Ln
Ln La (1) è immediata.
Se M = i=1 Mi , allora M1 è un sottomodulo di M e M/M1 = i=2 Mi e
per induzione sul numero di addendi si ha la (2).
Se M è finitamente generato da x1 , . . . , xn , allora c’è un omomorfismo suriettivo
Ln
L
n
f : i=1 A → M dato da f (ei ) = xi , dove ei = (0, . . . , 1, . . . , 0). Per la (2) i=1 A
è Noetheriano e allora per la (1) M è Noetheriano, cioè la (3).
Per dimostrare (4), osserviamo che A/I è Noetheriano come A-modulo. Sia ora
J ⊆ A/I un ideale. J è un A-sottomodulo e quindi esistono x1 , . . . , xn tali che
J = Ax1 + · · · + Axn . Ma nell’anello A/I, si ha Ax = (A/I)x e quindi x1 , . . . , xn
sono generatori di J come A/I-modulo, cioè come ideale. Dunque A/I è un anello
Noetheriano.
¤
Oltre ai campi e ai PID non abbiamo ancora altri esempi di anelli Noetheriani.
Dimostriamo ora il teorema della base di Hilbert, che dice che la proprietà di essere
Noetheriano si conserva passando da un anello all’anello dei polinomi.
Teorema della base di Hilbert. Sia A un anello Noetheriano. Allora l’anello
dei polinomi A[x] è Noetheriano.
Dimostrazione. ([Re], p. 48. È essenzialmente la stessa dimostrazione che si
trova in [vdW]).
Sia J ⊆ A[x] un ideale. Dimostriamo che J è finitamente generato. Definiamo
l’ideale dei coefficienti direttori di grado n in J come
Jn = {a ∈ A | ∃f ∈ J del tipo f = axn + bn−1 xn−1 + · · · + b0 }.
Allora Jn è un ideale di A e Jn ⊆ Jn+1 (esercizio!). Poiché A è Noetheriano, usando
la condizione sulle catene si ottiene un intero m tale che
Jm = Jm+1 = · · ·
40
3. Moduli di tipo finito
Ognuno degli ideali Ji è finitamente generato e sia ai1 , . . . , aini un insieme di
generatori. Per definizione, ognuno di questi elementi di A è il coefficiente direttore
di un polinomio in Ji e dunque sia fik = aik xi + · · · ∈ Ji . Affermiamo che l’insieme
{fik | i = 0, 1, . . . , m, k = 1, . . . , ni }
è un insieme di generatori di J. Sia infatti g ∈ J, con deg g = h e sia bxh il termine
direttore di g. Allora b ∈ Jh e quindi b è una combinazione lineare
X
b=
cjk ajk , dove j = h se h ≤ m, j = m altrimenti.
k
Consideriamo allora
g1 = g − xm−j
X
cjk fjk ;
k
per costruzione, il termine di grado m in g1 è nullo e quindi deg g1 < deg g. Dunque,
per induzione, si può scrivere g come combinazione lineare degli fik , che quindi sono
generatori.
¤
Osserviamo che, anche se sembra che abbiamo costruito esplicitamente un insieme di generatori, questa dimostrazione è non costruttiva: non sappiamo infatti come
ottenere esplicitamente i generatori {aik } degli ideali Ji . In effetti, l’affermazione
dell’esistenza di questi insiemi di generatori usa l’assioma della scelta.
Questa teorema è famoso anche perché la sua dimostrazione è stata una delle prime dimostrazioni di esistenza non costruttive. Quando Hilbert lo dimostrò
(Math. Annalen, 36 (1890) p. 473 e seguenti), usandolo per risolvere un famoso
problema in Teoria degli Invarianti, molti non credettero alla validità della dimostrazione, al punto che si dice che Paul Gordan, il massimo esperto del tempo di
Teoria degli Invarianti, abbia commentato: “Questa non è matematica, è teologia”.
La struttura della dimostrazione originale di Hilbert è all’incirca la seguente,
come spiegato da Hilbert stesso a p. 478 dell’articolo citato:
prendiamo un “sistema di forme” (noi diremmo un “insieme di polinomi”),
caratterizzato da una proprietà che per ogni polinomio può valere oppure
no (la proprietà in questione è “essere nell’ideale”). A questo punto supponiamo che non ci sia una base finita. Allora prendiamo f1 e poi f2 , f3 ,
e cosı̀ via, in modo che nessun fi sia combinazione lineare dei precedenti.
Poniamo, per brevità, A(B, f ) per indicare la proprietà:
B è una base finita, e f è combinazione lineare degli elementi di B.
Abbiamo dunque un insieme di polinomi, e dall’ipotesi che sia falso che
esiste B tale che per ogni f : A(B, f )
Hilbert conclude che allora
per ogni B : esiste f tale che A(B, f ) non è vera
e poi applica questo ai B costruiti l’uno dopo l’altro come sopra.
Dunque Hilbert forma la negazione di un quantificatore (non esiste B) in cui
gli elementi quantificati sono insiemi. Se a noi questo ragionamento sembra perfettamente normale (oltre che giusto), questo è solo il riflesso di quanto la percezione
della Matematica e dei suoi oggetti sia cambiata dai tempi di Hilbert ai nostri.
2. Moduli su domini a ideali principali
41
L’abitudine a parlare di insiemi in termini generali è comune dai tempi di
Dedekind, ma una cosa è formare un insieme infinito di numeri e dare un nome agli
elementi individuali dell’insieme, tutta un’altra è considerare l’insieme di tutti gli
insiemi B (una infinità di “secondo ordine”) e negare dei quantificatori su questo
insieme, cosa che richiede necessariamente considerare questa infinità come una
“infinità attuale”. Qui, probabilmente, Gordan ritenne che la Matematica stesse
toccando la Teologia.
2. Moduli su domini a ideali principali
La teoria degli spazi vettoriali di dimensione finita è, dal punto di vista del paragrafo
precedente, la teoria dei moduli Noetheriani su di un campo. Proseguendo, il passo
successivo è esaminare la teoria dei moduli finitamente generati su un PID. In
questo paragrafo dimostreremo un teorema di struttura valido per tutti i moduli
finitamente generati su di un PID e vedremo il significato concreto in due situazioni
molto importanti: Z-moduli, e cioè gruppi abeliani finitamente generati, e K[x]moduli, cioè la teoria delle forme canoniche per le matrici quadrate (forma canonica
razionale e di Jordan).
È possibile dare una dimostrazione un po’ più semplice del teorema di struttura nel caso in cui l’anello sia euclideo, usando l’algebra lineare e le cosiddette
“operazioni elementari” sulle matrici, ottenendo in questo modo una dimostrazione
costruttiva. Qui vedremo invece una dimostrazione valida in generale per tutti i
PID, seguendo le linee dei Capitoli 10 e 11 di [Sharp].
Sappiamo che in generale un sottomodulo di un modulo libero non è più libero,
come mostra l’esempio dell’ideale (x, y) in K[x, y]. Questo non capita in un PID:
tutti gli ideali sono principali, e dunque tutti i sottomoduli di A sono ancora liberi
(di rango 1). Ci si può chiedere se questo valga per un qualunque modulo libero e
non solo per l’anello stesso, e la risposta è sı̀: su un PID, ogni sottomodulo di un
modulo libero è ancora libero. La dimostrazione è piuttosto semplice (vedere per
esempio, [vdW], Capitolo 12, Paragrafo 2. L’enunciato è per moduli su un anello
euclideo, ma la dimostrazione vale anche su un PID), ma per avere un teorema
di struttura per tutti i moduli finitamente generati, questo fatto non è sufficiente:
occorre sapere come un sottomodulo libero sta dentro un modulo libero, e per avere
la risposta completa (che comprende anche l’enunciato precedente) è necessario più
lavoro.
Sia dunque ALun PID e M un A-modulo finitamente generato dagli elementi
n
x1 , . . . , xn . F = i=1 A è un modulo libero di rango n ed esiste un omomorfismo
suriettivo f : F → M , e perciò M ∼
= F/H, dove H = ker f . Come abbiamo detto,
anche H è un modulo libero. Sia allora h1 , . . . , hm una base di H. Se potessimo
(come capita per gli spazi vettoriali) “completare la base” per ottenere una base
di F , allora il quoziente sarebbe libero, di rango n − m. In generale questo non è
possibile: per esempio, se F = Z e H = (2), allora nessuna base di H si completa a
una base di F , però in questo caso sappiamo che F/H ∼
= Z2 è un modulo ciclico, e
cioè con un solo generatore. Questo è quasi quello che capita: in effetti M è sempre
somma diretta (finita) di moduli ciclici. Dunque adesso che sappiamo la risposta,
ci impegnamo per avere una dimostrazione. L’enunciato preciso a cui miriamo è:
42
3. Moduli di tipo finito
Ln
Teorema. Se F = i=1 A è un modulo libero finitamente generato sul PID A, e
H è un sottomodulo, allora esiste una base e1 , . . . , en di F , un intero k ≤ n e degli
elementi a1 , . . . , ak ∈ A tali che a1 e1 , . . . , ak ek è una base di H.
Da questo teorema è immediato ottenere che
M∼
= F/H =
n−k
M
A ⊕ A/(a1 ) ⊕ · · · ⊕ A/(ak )
i=1
Dopo aver ottenuto l’esistenza di una tale decomposizione, affronteremo il problema
della sua unicità.
Sia A un anello commutativo con unità, e sia F un A-modulo libero di rango n.
Sia e1 , . . . , en una base di F e sia y ∈ F . Allora si può scrivere, in modo unico,
y = c1 e1 + · · · + cn en ,
ci ∈ A.
Definizione 2.1. L’ideale C(y) = (c1 , . . . , cn ) si dice il contenuto di y.
Lemma 2.2. C(y) dipende solo da y, e non dalla base scelta in F .
Dimostrazione. Sia e01 , . . . , e0n un’altra base di F , e sia y = c01 e01 +· · ·+c0n e0n l’unica espressione di y nella nuova base. Poiché abbiamo due basi, possiamo scrivere
per i = 1, . . . , n
n
n
X
X
e0i =
aij ej , e ei =
bij e0j
j=1
j=1
e quindi
y=
n
X
i=1
Poiché
e01 ,
...,
e0n
ci ei =
n X
n
X
ci bij e0j
i=1 j=1
è una base, si ha
=
à n
n
X
X
j=1
c0j
=
(c01 , . . . , c0n )
Pn
!
ci bij
e0j =
i=1
i=1 ci bij
n
X
c0j e0j
j=1
e quindi
⊆ (c1 , . . . , cn )
L’inclusione opposta si ottiene scambiando i ruoli delle due basi.
¤
Passiamo ora ai PID, e dimostriamo che ogni elemento di un modulo libero, a
meno di multipli, può far parte di una base.
Lemma 2.3. Sia A un PID, sia F un A-modulo libero finitamente generato e sia
y ∈ F . Sia cy un generatore dell’ideale C(y). Allora esiste una base f1 , . . . , fn di
F tale che y = cy f1 .
Dimostrazione. Sia e1 , . . . , en una base fissata di F e facciamo induzione su n.
Per n = 1, y = be1 , e quindi C(y) = (b) = (cy ), e cioè b = ucy , con u invertibile
in A. Ponendo f1 = ue1 , si ha y = cy f1 e {f1 } è la base cercata.
Sia ora n > 1 e scriviamo y = c1 e1 + · · · + cn en e dunque
C(y) = (c1 , . . . , cn ) = (cy ).
Notiamo che y = 0 se e solo se cy = 0 e supponiamo quindi che y 6= 0. Poniamo
z = c2 e2 + · · · + cn en , in modo da scrivere y = c1 e1 + z. Gli elementi e2 , . . . , en
formano una base del sottomodulo libero F 0 ⊂ F , e per induzione esiste una base
g2 , . . . , gn di F 0 tale che z = cz g2 , dove cz è un generatore dell’ideale contenuto
2. Moduli su domini a ideali principali
43
C(z). (Attenzione: l’ideale C(z) è lo stesso, sia che consideriamo z ∈ F che z ∈ F 0 ).
Si ha quindi
C(y) = (cy ) = (c1 , cz )
e perciò c1 = scy , cz = tcy , e inoltre possiamo scrivere cy = uc1 + vcz . Allora
cy = uc1 + vcz = uscy + vtcy = (us + vt)cy
e poiché siamo in un dominio e cy 6= 0, si ha us + vt = 1. Poniamo
f1 = se1 + tg2 ,
f2 = ve1 − ug2 ,
fi = gi ,
i≥3
Osserviamo che
cy f1 = scy e1 + tcy g2 = c1 e1 + cz g2 = c1 e1 + z = y
quindi y è il multiplo giusto di f1 . Resta da dimostrare che {fi } è una base. Per
prima cosa, osserviamo che
uf1 + tf2 = use1 + utg2 + vte1 − utg2 = (us + vt)e1 = e1
e allo stesso modo vf1 − sf2 = g2 e quindi f1 , . . . , fn generano il sottomodulo
generato da e1 , g2 , . . . , gn e cioè tutto F .
Supponiamo ora che esistano degli elementi ai ∈ A tali che a1 f1 +· · ·+an fn = 0.
Allora
n
X
a1 (se1 + tg2 ) + a2 (ve1 − ug2 ) +
ai gi = 0
i=3
e cioè
(a1 s + a2 v)e1 + (a1 t − a2 u)g2 +
n
X
ai gi = 0.
i=3
Poiché g2 , . . . , gn è una base di F 0 , e Ae1 ⊕ F 0 = F , anche e1 , g2 , . . . , gn è una
base di F e quindi ai = 0 per i ≥ 3 e
a1 s + a2 v = a1 t − a2 u = 0.
Usando ancora us + vt = 1 si ottiene facilmente che a1 = a2 = 0 e cioè f1 , . . . , fn
sono una base di F come richiesto.
¤
L’idea della dimostrazione dovrebbe essere chiara, a questo punto: vogliamo
usare il Lemma 2.3 e fare induzione sul rango del sottomodulo. Per questo, abbiamo
bisogno di un criterio in base alla quale scegliere il primo elemento della base. L’idea
è di scegliere un vettore “massimale” in qualche senso, e il seguente lemma dice come
effettuare la scelta.
Lemma 2.4. Sia A un PID, sia F un A-modulo libero finitamente generato e sia
H un sottomodulo di F . Sia z ∈ H tale che l’ideale C(z) sia massimale fra tutti gli
ideali della forma C(y), y ∈ H. Allora
in modo che C(z) =
P
C(y) ⊆ C(z), per ogni y ∈ H,
y∈H
C(y).
44
3. Moduli di tipo finito
Dimostrazione. Per iniziare, osserviamo che un elemento z come nell’enunciato
esiste, perché A è Noetheriano (Teorema 1.2), e sia cz un generatore di C(z). Per
il Lemma 2.3 esiste una base f1 , . . . , fn di F tale
P che z = cz f1 .
Consideriamo ora y ∈ H, e scriviamo y = i ai fi . Dobbiamo dimostrare che
C(y) ⊆ C(z). Poiché A è un PID, l’ideale somma C(z) + (a1 ) = (cz , a1 ) = (t) è
principale, generato da t. Dunque t = ucz + va1 .
Consideriamo l’elemento
n
X
uz + vy = ucz f1 + va1 f1 + · · · + van fn = tf1 +
a i f1 ;
i=2
si ha:
C(z) = (cz ) ⊆ (t) ⊆ (t, a2 , . . . , an ) = C(uz + vy)
e poiché uz +vy ∈ H, si deve avere uguaglianza per la massimalità di C(z). Dunque
C(z) = (cz ) = (cz , a1 ) = (t) e quindi a1 ∈ C(z). Inoltre, sempre per la massimalità,
C(z) = (t, a2 , . . . , an ) = C(uz + vy), e quindi a2 , . . . , an ∈ C(z) e perciò
C(y) = (a1 , a2 , . . . an ) ⊆ C(z).
¤
Siamo ora pronti a dimostrare il teorema annunciato in precedenza, con una
aggiunta importante.
Teorema 2.5. Sia A un PID, sia F un A-modulo libero finitamente generato di
rango n e sia H un sottomodulo di F . Allora esiste una base e1 , . . . , en di F , e
elementi a1 , . . . , an ∈ A tali che
(1) (a1 ) ⊇ (a2 ) ⊇ · · · ⊇ (an ) (o, equivalentemente ai | ai+1 per ogni i);
(2) H è generato da a1 e1 , a2 e2 , . . . , an en .
Notiamo che è possibile che qualcuno degli elementi ai sia nullo. In questo caso,
la (1) dice che se aj = 0 allora aj+1 = · · · = an = 0.
Dimostrazione. Naturalmente, la dimostrazione è per induzione sul rango n di F :
se n = 1, allora F ∼
= A, e poiché A è un PID, la dimostrazione è immediata.
Supponiamo ora di aver dimostrato il teorema per tutti i moduli liberi di rango
minore o uguale a n − 1. Per il Lemma 2.4 esiste z ∈ H tale che C(z) ⊇ C(y), per
ogni y ∈ H, e per il Lemma 2.3 esiste una base f1 , . . . , fn di F tale che z = cz f1 .
Consideriamo allora il sottomodulo F 0 di base f2 , . . . , fn e poniamo H 0 = H ∩ F 0 .
F 0 è libero di rango n − 1 e H 0 è un suo sottomodulo e, per ipotesi induttiva,
esiste una base e2 , . . . , en di F 0 e degli elementi a2 , . . . , an tali che
(a2 ) ⊇ (a3 ) ⊇ · · · ⊇ (an )
e H 0 è generato da a2 e2 , a3 e3 , . . . , an en . Poniamo e1 = f1 e a1 = cz . La tesi del
teorema si ottiene verificando che e1 , e2 , . . . , en e a1 , a2 , . . . , an hanno le proprietà
richieste.
Poiché f2 , . . . , fn e e2 , . . . , en generano entrambe il sottomodulo F 0 , è chiaro
che e1 , e2 , . . . , en genera F . Se ora b1 e1 + b2 e2 + · · · + bn en = 0, si ha b1 e1 =
−b2 e2 −· · ·−bn en e poiché Ae1 ∩F 0 = 0 otteniamo b1 = 0, e anche b2 = · · · = bn = 0
perché e2 , . . . , en è una base. Dunque e1 , e2 , . . . , en è una base di F .
2. Moduli su domini a ideali principali
45
Dalla definizione di contenuto, C(a2 e2 ) = (a2 ), e poiché a2 e2 ∈ H per la scelta
di z si ha:
(a1 ) = C(z) ⊇ C(a2 e2 ) = (a2 )
e dunque la (1) è dimostrata.
Infine, dimostriamo che H è generato da a1 e1 , . . . , an en . Poiché a1 e1 = z ∈ H,
è chiaro che il sottomodulo generato da a1 e1 , . . . , an en è contenuto in H. Se ora
y ∈ H è un elemento arbitrario, possiamo scrivere y = s1 e1 + · · · + sn en e si ha
(s1 ) ⊆ C(y) ⊆ C(z) = (a1 )
e cioè s1 = ta1 . Sottraendo,
y − tz = s2 e2 + · · · + sn en ∈ H 0
e quindi y − tz è combinazione lineare di a2 e2 , . . . , an en , per ipotesi induttiva.
Poiché tz = ta1 e1 , si ha che y è combinazione lineare di a1 e1 , . . . , an en come
richiesto.
¤
Corollario 2.6. Sia A un PID, sia F un A-modulo libero finitamente generato di
rango n e sia H un sottomodulo di F . Allora H è libero, e rank H ≤ rank F .
Dimostrazione. Per il teorema precedente esiste una base e1 , . . . , en di F tale che
H sia generato da a1 e1 , . . . , an en , con ai | ai+1 per ogni i. Sia k = max{i | ai 6= 0}.
Ovviamente k ≤ n. Allora H è generato da a1 e1 , . . . , ak ek , e supponiamo di avere
una relazione
b1 (a1 e1 ) + · · · + bk (ak ek ) = 0
di dipendenza lineare fra i generatori. Poiché gli ei sono indipendenti, abbiamo che
bi ai = 0 per ogni i e poiché A è un dominio e ai 6= 0 deve essere bi = 0.
¤
Enunciamo esplicitamente, per chiarezza, il risultato che abbiamo ottenuto:
Teorema 2.7. Sia A un PID e sia M un modulo finitamente generato su A. Allora
M è somma diretta di moduli ciclici, nella forma
∼ Am ⊕ A/(a1 ) ⊕ · · · ⊕ A/(ak )
M=
e gli elementi a1 , . . . , ak ∈ A sono tali che
(a1 ) ⊇ (a2 ) ⊇ · · · ⊇ (ak )
o, equivalentemente, ai | ai+1 per ogni i.
Gli elementi ai si chiamano i fattori invarianti del modulo M .
Ricaviamo ora una forma diversa, in cui gli elementi che generano gli ideali sono
potenze di primi. Ricordiamo che in un anello A un elemento c si dice irriducibile
se c = ab implica che a oppure b è invertibile in A mentre c si dice primo se c | ab
implica che c | a oppure c | b. Un elemento primo è sempre irriducibile e, in un
UFD, ogni elemento irriducibile è primo. Per esempio, in Z i primi sono ovviamente
i numeri primi, mentre in k[x] i primi sono i polinomi irriducibili.
Definizione 2.8. Sia A un anello, I e J due ideali. I e J si dicono comassimali se
I + J = A.
Esercizio 2.9. In un PID, due ideali sono comassimali se e solo se i loro generatori
sono coprimi.
46
3. Moduli di tipo finito
Sia A un anello e I1 , . . . , In ideali di A. C’è un omomorfismo (di anelli)
ϕ : A → A/I1 × · · · × A/In
dato da ϕ(x) = (x + I1 , . . . , x + In ).
Lemma 2.10. ϕ è suriettiva se e solo se Ir e Is sono comassimali per ogni r 6= s.
Nota: questo non è altro che il teorema cinese del resto.
Dimostrazione. Supponiamo che ϕ sia suriettiva e dimostriamo, per esempio, che
I1 e I2 sono comassimali. Per la suriettività di ϕ esiste un elemento x ∈ A tale che
ϕ(x) = (1, 0, . . . , 0), e cioè x ≡ 1 (mod I1 ) e x ≡ 0 (mod I2 ). Allora
1 = (1 − x) + x ∈ I1 + I2
e quindi I1 e I2 sono comassimali.
Dimostriamo ora, per esempio, che se gli ideali sono a due a due comassimali
allora esiste x ∈ A tale che ϕ(x) = (1, 0, . . . , 0). Poiché I1 + Ir = A per r 6= 1,
abbiamo elementi ur ∈ I1 e vr ∈ Ir tali che ur + vr = 1. Poniamo
n
n
Y
Y
x=
vr =
(1 − ur )
r=2
r=2
Dalla prima espressione è chiaro che per r 6= 1, x ∈ Ir e cioè x ≡ 0 (mod Ir )
mentre, sviluppando il prodotto nella seconda si ha x ≡ 1 (mod I1 ). Dunque
ϕ(x) = (1, 0, . . . , 0).
¤
Torniamo alla decomposizione di un modulo. Sia A un PID, e sia a ∈ A. Poiché
A è UFD, scriviamo la decomposizione di a come
a = upt11 . . . ptkk
dove i primi pi sono a due a due coprimi e quindi gli ideali che generano sono a due
a due comassimali. Abbiamo allora
Teorema 2.11. C’è un isomorfismo (di anelli e di A-moduli)
¡ ¢
¡ ¢
f : A/(a) → A/ pt11 ⊕ · · · ⊕ A/ ptkk
Dimostrazione. È una conseguenza immediata del lemma precedente: f è l’omomorfismo indotto da ϕ, osservando che
n
\
¡ ti ¢
ker ϕ =
pi = (a).
i=1
¤
Da questo e dal Teorema 2.7 si ottiene immediatamente
Teorema 2.12. Sia A un PID e sia M un modulo finitamente generato su A.
Allora M è somma diretta di moduli ciclici, nella forma
¡ ¢
¡ ¢
∼ Am ⊕ A/ pt1 ⊕ · · · ⊕ A/ ptk
M=
1
k
dove gli elementi pi sono primi dell’anello A.
Osservazione. Non stiamo affermando che gli elementi pi nell’enunciato precedente sono a due a due coprimi, anzi, un elemento si può presentare più volte. Le
potenze ptii si chiamano i divisori elementari del modulo M .
2. Moduli su domini a ideali principali
47
Vediamo alcuni esempi di queste due decomposizioni diverse. Il caso più semplice è quello dei gruppi abeliani, che sono Z-moduli. Per esempio
Z2 ⊕ Z6 ∼
= Z2 ⊕ Z2 ⊕ Z3 ;
a sinistra abbiamo il primo tipo di decomposizione, mentre a destra la decomposizione è tramite potenze di primi. Un altro esempio è
Z12 ∼
= Z3 ⊕ Z22 .
I teoremi di decomposizione che abbiamo appena visto dicono che tutti i gruppi
abeliani finitamente generati, e quindi in particolare tutti i gruppi abeliani finiti,
sono della forma precedente.
Dimostreremo ora che entrambe le decomposizioni precedenti hanno proprietà
di unicità e per farlo utilizzeremo in modo essenziale i risultati degli esercizi 6 e 7.
Nel seguito, A sarà sempre un PID, e sia
M∼
= Am ⊕ A/(a1 ) ⊕ · · · ⊕ A/(ak )
una qualunque decomposizione di M in cui nessuno degli elementi ai è nullo oppure
invertibile. Sia K il campo dei quozienti di A. Il prodotto tensoriale M ⊗A K
dipende solo da M e non dalla decomposizione. Il prodotto tensoriale commuta
con le somme dirette finite (Esercizio 4.5) e quindi
M ⊗A K ∼
= (A ⊗A K)m ⊕ (A/(a1 ) ⊗A K) ⊕ · · · ⊕ (A/(ak ) ⊗A K) ∼
= Km
poiché A⊗A K = K e A/(ai )⊗A K = 0, ragionando come nell’Esempio 4.4. Dunque
il numero degli addendi liberi presenti in una qualunque decomposizione di M è
uguale alla dimensione, come K-spazio vettoriale, di M ⊗A K e quindi non dipende
dalla decomposizione. Studiamo ora il comportamento degli addendi non liberi.
Lemma 2.13. Sia M un modulo finitamente generato su A, e sia T (M ) il sottomodulo di torsione. Allora M = F ⊕ T (M ), dove F è un sottomodulo di M che è
libero.
Dimostrazione. Utilizziamo l’isomorfismo
f : Am ⊕ A/(a1 ) ⊕ · · · ⊕ A/(ak ) → M
dato dal Teorema 2.7, dove nessuno degli elementi ai è nullo oppure invertibile. È
immediato vedere che l’immagine di Am è F e l’immagine di A/(a1 ) ⊕ · · · ⊕ A/(ak )
è T (M ).
¤
Dunque la somma di tutti gli addendi non liberi non dipende dalla decomposizione perché è isomorfa al sottomodulo di torsione di M . Possiamo dunque supporre che M = T (M ) e dimostreremo innanzitutto l’unicità della decomposizione
del Teorema 2.12 mediante potenze di primi.
Teorema 2.14. Sia A un PID e sia
¡ ¢
¡ ¢
M∼
= A/ (q1s1 ) ⊕ · · · ⊕ A/ (qssk )
= A/ pt11 ⊕ · · · ⊕ A/ pthh ∼
dove i pi e i qj sono primi dell’anello A. Allora h = k e, a meno dell’ordine,
ptii = qisi .
48
3. Moduli di tipo finito
Dimostrazione. Osserviamo che, se M è un qualunque A-modulo e a, b ∈ A e
m ∈ M sono tali che am = bm = 0, allora cm = 0, dove c = (a, b) è il massimo
comun divisore poiché in un PID si ha c = au + bv.
Ricordiamo inoltre che per un primo p ∈ A,
M (p) = {m ∈ M | pn m = 0, per qualche n ≥ 0}.
Ogni elemento in A/(pt ) è annullato da pt , e se (p) 6= (q), cioè se p e q sono primi
non associati allora, per l’osservazione appena fatta, (A/(pn ))(q) = 0. Dunque
dall’esercizio 7 abbiamo che, per ogni primo p, M (p) è formato dagli addendi della
decomposizione della forma A/(pti ) e quindi possiamo supporre che
¡ ¢
¡ ¢
M∼
= A/ (ps1 ) ⊕ · · · ⊕ A/ (psk )
= A/ pt1 ⊕ · · · ⊕ A/ pth ∼
con t1 ≤ t2 ≤ · · · ≤ th e s1 ≤ s2 ≤ · · · ≤ sk .
Per prima cosa dimostriamo che h = k. Dall’esercizio 7 si ha
¡
¢h ¡
¢k
M [p] ∼
= A/(p) ∼
= A/(p)
e poiché M [p] è uno spazio vettoriale sul campo A/(p), si ha che h = k = dim M [p].
Sia ora w il primo intero per cui ti = si per ogni i < w e tw 6= sw , per esempio
tw < sw , e consideriamo il sottomodulo ptw M . Ancora dall’esercizio 7 vediamo che
nella prima decomposizione tutti gli addendi fino a A/(ptw ) vengono annullati, e
tutti gli altri sono ancora della forma A modulo una potenza di p e quindi vi sono
al più h − w addendi non nulli, mentre nella seconda gli addendi annullati sono
solo fino a A/(psw−1 ) e quindi ci sono almeno h − w + 1 addendi non nulli. Ma
questo contraddice quello che abbiamo appena dimostrato (in due decomposizioni
il numero degli addendi è lo stesso) e questo conclude la dimostrazione dell’unicità.
¤
3. La forma canonica di Jordan
Sia k un campo, V un k-spazio vettoriale di dimensione finita e ϕ : V → V un endomorfismo. V ha una struttura di k[x]-modulo come abbiamo visto nell’Esempio 1.4,
ponendo
xv = ϕ(v)
ed estendendo nel modo ovvio. La struttura di k[x]-modulo dipende dall’endomorfismo ϕ, e ci possiamo chiedere quando due tali moduli siano isomorfi. Indichiamo
con Vϕ il k[x]-modulo determinato dall’endomorfismo ϕ.
Teorema 3.1. Se ϕ e ψ sono due endomorfismi di V , allora Vϕ ∼
= Vψ come
k[x]-moduli se e solo se ϕ e ψ sono simili.
Dimostrazione. Un isomorfismo g : Vϕ → Vψ di k[x]-moduli è un isomorfismo di
gruppi abeliani, tale che g(αv) = αg(v) per ogni α ∈ k e v ∈ V , e cioè un’applicazione lineare, e tale che g(xv) = xg(v) per ogni v ∈ V . Quest’ultima condizione
significa che
g(ϕ(v)) = ψ(g(v)),
∀v ∈ V
e cioè ϕ = g −1 ◦ ψ ◦ g, e quindi ϕ e ψ sono simili.
¤
3. La forma canonica di Jordan
49
Dunque le classi di isomorfismo delle strutture di k[x]-modulo su V sono le
classi di similitudine degli endomorfismi di V in se stesso. Poiché V ha dimensione
finita su k, è anche finitamente generato come k[x]-modulo (basta usare gli stessi
generatori) e poiché k[x] è un PID possiamo applicare i teoremi di decomposizione
appena visti per descrivere le classi di isomorfismo, e quindi le classi di similitudine.
Le classi di similitudine dipendono dal campo k e la descrizione che vedremo, detta
forma canonica di Jordan, è valida per tutti i campi algebricamente chiusi (per
esempio k = C).
Iniziamo con alcune osservazioni:
(1) un sottoinsieme U di V è un k[x]-sottomodulo se e solo se è un sottospazio
vettoriale e se xv = ϕ(v) ∈ U per ogni v ∈ U , e cioè U è un sottomodulo se e
solo se è un sottospazio invariante rispetto a ϕ;
(2) V non ha addendi liberi, e cioè isomorfi a k[x], ancora in virtù della dimensionalità finita come spazio vettoriale (k[x] non ha dimensione finita su k).
Dunque V è somma diretta di moduli ciclici tutti di torsione;
(3) consideriamo l’annullatore
Ann(V ) = {p(x) | p(ϕ)(v) = 0 per ogni v ∈ V };
Ann(V ) è un ideale di k[x] e quindi principale. Poiché ogni addendo di V è di
torsione, esiste almeno un polinomio non nullo p(x) ∈ Ann(V ) (per esempio, il
prodotto di tutti i generatori degli ideali che compaiono nella decomposizione).
Il generatore monico dell’ideale Ann(V ) viene detto polinomio minimo di ϕ.
Dal teorema di decomposizione e dalla (1) abbiamo che V è somma diretta di
sottospazi U1 , . . . , Ut invarianti per ϕ, e questi sottospazi sono moduli ciclici. Se
scegliamo una base di V come unione delle basi dei sottospazi invarianti, abbiamo
che la matrice A di ϕ rispetto a questa base ha una forma “a blocchi”


A1 0 . . . 0
 0 A2 . . . 0 


A= .
..
.. 
 ..
.
. 
0
0
...
At
dove Ai è la matrice dell’endomorfismo ϕ ristretto al sottospazio Ui . Per avere una
forma canonica basta dunque capire la forma delle matrici Ai .
Usando la seconda forma del teorema di decomposizione, abbiamo che esistono
(e sono unici) dei polinomi p1 (x), . . . , pt (x), irriducibili su k, tali che
Ui ∼
= k[x]/ (pi (x)si ) ;
poiché k è algebricamente chiuso i polinomi irriducibili sono polinomi di primo
grado, e quindi esistono degli elementi a1 , . . . , at ∈ k tali che
pi (x) = x − ai .
Dunque ci interessa trovare una base conveniente per descrivere il k[x]-modulo
ciclico
U = k[x]/ ((x − a)s ) .
50
3. Moduli di tipo finito
Definizione 3.2. Sia k un campo, a ∈ k e n ∈ N. La matrice elementare di Jordan
associata ad a e n è la matrice n × n


a 1 0 ... 0 0
0 a 1 . . . 0 0


0 0 a . . . 0 0


J(a, n) =  . . .
.. .. 
 .. .. ..
. .


0 0 0 . . . a 1
0 0 0 ... 0 a
che ha tutti gli elementi della diagonale principale uguali ad a, tutti 1 sulla diagonale
‘superiore’ e tutti gli altri elementi uguali a 0.
Teorema 3.3. Sia U uno spazio vettoriale su k e sia ϕ : U → U un endomorfismo.
Allora U ∼
= k[x]/ ((x − a)n ) se e solo se esiste una base di U tale che la matrice
di ϕ è J(a, n), dove n = dimk U .
Dimostrazione. Supponiamo che U ∼
= k[x]/ ((x − a)n ), e sia u ∈ U il vettore che
n
corrisponde all’elemento 1 + (x − a) tramite l’isomorfismo dato. Osserviamo che
(x − a)n−1 u 6= 0, perché (x − a)n−1 6= 0 modulo (x − a)n .
Poiché U è generato come k[x]-modulo da u, ogni elemento di U è della forma
gu, per qualche g(x) ∈ k[x]; il sottoanello k[(x−a)] contiene k e anche x = (x−a)+a
e quindi k[(x − a)] = k[x] cioè ogni polinomio g(x) ∈ k[x] può essere scritto come
un polinomio in (x − a) a coefficienti in k (questa affermazione non è nient’altro
che lo sviluppo di Taylor del polinomio g(x) in x = a). Consideriamo gli elementi:
v1 = (x − a)n−1 u,
n−j
vj = (x − a)
v2 = (x − a)n−2 u,
u,
...,
...
vn = (x − a)0 u = u;
poiché (x − a)n u = 0, i vettori v1 , . . . , vn generano U come spazio vettoriale su k.
Supponiamo che ci sia una relazione di dipendenza lineare
X
bi vi =
i
n
X
bi (x − a)n−i u = 0,
i=1
e sia j l’indice più grande per cui bj 6= 0. Moltiplicando la relazione precedente per
(x − a)j−1 si ottiene
bj (x − a)j−1 vj = bj (x − a)n−1 u = 0
e questa è una contraddizione, perché (x − a)n−1 u 6= 0. Dunque bi = 0 per ogni i,
e quindi v1 , . . . , vn formano una base di U .
Notiamo che vi−1 = (x − a)vi , per i = 2, . . . , n e quindi
ϕ(vi ) = xvi = vi−1 + avi ,
per i = 2, . . . , n
ϕ(v1 ) = av1
e perciò la matrice di ϕ nella base v1 , . . . , vn è J(a, n).
L’implicazione inversa è un semplice esercizio.
¤
Notiamo che per ϕ come nel teorema precedente, a è l’unico autovalore, di
molteplicità (algebrica) n, mentre v1 è l’unico autovettore, e quindi l’autospazio Ua
4. Algebre di divisione finite
51
ha dimensione 1. In particolare, un endomorfismo la cui matrice è una matrice elementare di Jordan non è diagonalizzabile, a meno che n = 1. Possiamo riassumere
la discussione fatta nel seguente
Teorema 3.4. Sia V uno spazio vettoriale di dimensione finita su un campo algebricamente chiuso k e sia ϕ un endomorfismo di V . Allora esiste una base di V
per cui la matrice A di ϕ è del tipo


J(a1 , n1 )
0
...
0


0
J(a2 , n2 ) . . .
0


A=

..
..
..


.
.
.
0
0
...
J(as , ns )
dove ogni blocco J(ai , ni ) è una matrice elementare di Jordan. Inoltre la forma
precedente è unicamente determinata, a parte l’ordine in cui compaiono i blocchi.
Notiamo che gli ai non sono necessariamente distinti.
Concludiamo osservando che gli ai sono gli autovalori di ϕ, e che ogni blocco
dà origine ad un solo autovalore. Dunque ϕ è diagonalizzabile se e solo se ni = 1
per ogni i (e cioè s = n).
Notiamo anche che se ϕ e ψ sono due endomorfismi sullo stesso spazio V , allora
per il Teorema 3.1 ϕ e ψ sono simili se e solo se hanno la stessa forma canonica di
Jordan.
4. Algebre di divisione finite
Un campo K è un anello in cui ogni elemento ha inverso moltiplicativo e in cui la
moltiplicazione è commutiva. Ci possiamo chiedere se queste due proprietà siano
indipendenti.
Definizione 4.1. Sia D un anello con unità tale che ogni elemento a 6= 0 abbia
un inverso, e cioè un elemento a−1 tale che aa−1 = a−1 a = 1. Allora D si dice
un’algebra di divisione oppure un corpo (non commutativo).
La domanda è quindi: esistono algebre di divisione che non siano campi? La
risposta è si, come mostra l’esempio dei quaternioni H, che vedremo nel capitolo
seguente. Se però supponiamo che D sia finita, allora la risposta è no, come afferma
il seguente teorema di Wedderburn:
Teorema 4.2 (Wedderburn). Sia D un’algebra di divisione finita. Allora D è un
campo (cioè la moltiplicazione è commutativa).
Dunque ogni algebra di divisione finita è un campo finito, e cioè un campo di
Galois. La struttura dei campi finiti è completamente nota.
La dimostrazione che segue è elementare, e si basa su alcune semplici considerazioni di teoria dei gruppi, in particolare la cosiddetta equazione delle classi, e sulle
proprietà elementari dei polinomi ciclotomici su Q. Iniziamo quindi a ricordare
questi fatti.
Azioni di un gruppo su un insieme finito. Ricordiamo alcune definizioni.
52
3. Moduli di tipo finito
Definizione 4.3. Sia G un gruppo e X un insieme. Una azione di G su X è una
funzione G × X → X (di solito denotata (g, x) 7→ g.x) tale che per ogni x ∈ X e
ogni g1 , g2 ∈ G si ha
e.x = x,
(g1 g2 ).x = g1 .(g2 .x),
dove e ∈ G è l’elemento neutro.
Denotiamo con S(X) il gruppo simmetrico sull’insieme X e cioè S(X) è l’insieme delle funzioni biiettive di X in se stesso con l’operazione di composizione.
Un’azione di G su X può anche essere descritta come un omomorfismo di gruppi
ϕ : G → S(X), e la corrispondenza fra le due definizioni è ϕ(g)(x) = g.x.
Proposizione 4.4. Sia G un gruppo che opera sull’insieme X.
(1) La relazione su X definita da
x ∼ x0 ⇐⇒ ∃g ∈ G : x0 = g.x
è una relazione di equivalenza;
(2) per ogni x ∈ X, Gx = {g ∈ G | g.x = x} è un sottogruppo di G.
Le classi di equivalenza si chiamano orbite, e si indicano con G.x, e il sottogruppo Gx si dice lo stabilizzatore di x, o anche il gruppo di isotropia di x.
Teorema 4.5. C’è una corrispondenza biunivoca fra l’orbita di un elemento x e
l’insieme delle classi laterali dello stabilizzatore Gx .
Dimostrazione. La mappa che associa alla classe laterale gGx l’elemento g.x
appartenente all’orbita G.x è ben definita e iniettiva, poiché
g.x = h.x ⇐⇒ x = (g −1 h).x ⇐⇒ g −1 h ∈ Gx ⇐⇒ gGx = hGx
ed è suriettiva perché tutti gli elementi dell’orbita G.x sono della forma g.x.
¤
L’unica azione che considereremo è la coniugazione di G su se stesso: se g ∈ G e
x ∈ G definiamo g.x = g −1 xg. Le orbite di questa azione si dicono classi coniugate
e l’orbita di x si dice classe di coniugio di x. Si verifica che lo stabilizzatore Gx è
il centralizzatore di x: Gx = CG (x) = {g ∈ G | gx = xg}.
Sia ora G un gruppo finito. Applicando il teorema precedente all’azione di
coniugazione, e denotando con x̄1 , . . . , x̄n le classi di coniugio distinte si ha
n
X
(1)
|G| =
[G : CG (xi )]
i=1
dove |G| denota l’ordine del gruppo finito G. L’equazione (1) si chiama equazione
delle classi del gruppo G.
Sia Z(G) = {g ∈ G | gx = xg ∀x ∈ G} il centro di G, cioè l’insieme degli
elementi che commutano con tutti gli elementi di G. Z(G) è un sottogruppo normale
e x ∈ Z(G) se e solo se CG (x) = G e quindi x è l’unico elemento della sua classe di
coniugio. Si può allora riscrivere l’equazione delle classi come
m
X
(2)
|G| = |Z(G)| +
[G : CG (xi )]
i=1
dove x̄1 , . . . , x̄m sono le classi di coniugio distinte per cui xi ∈
/ Z(G) e quindi
[G : CG (xi )] > 1 per ogni i. Anche la (2) viene detta equazione delle classi, ed è la
forma che useremo in seguito.
4. Algebre di divisione finite
53
Polinomi ciclotomici su Q.
Sia n un intero positivo e sia f (x) = xn − 1 ∈ Q[x]. Il campo di spezzamento
di f (x) è detto estensione ciclotomica di ordine n di Q, e verrà denotato con Kn .
Dunque in Kn esistono tutte le radici n-esime dell’unità.
2πi
Se ζ è una radice n-esima primitiva dell’unità, per esempio ζ = e n , allora
2
n−1
Kn = Q(ζ). Infatti Q(ζ) contiene 1, ζ, ζ , . . . , ζ
e poiché ζ è una radice
primitiva, tutti questi elementi sono distinti. Dunque Q(ζ) contiene tutte le radici
di xn − 1 e quindi Q(ζ) è un campo di spezzamento di xn − 1.
Definizione 4.6. Sia n un intero positivo. L’n-esimo polinomio ciclotomico su Q
è il polinomio monico
gn (x) = (x − ζ1 )(x − ζ2 ) · · · (x − ζr )
dove ζ1 , . . . , ζr sono tutte le radici n-esime primitive dell’unità distinte in Kn .
Per esempio,
g1 (x) = x − 1
g2 (x) = x − (−1) = x + 1
Ã
√ !
√ !Ã
−1 − 3i
−1 + 3i
x−
= x2 + x + 1
g3 (x) = x −
2
2
g4 (x) = (x − i)(x + i) = x2 + 1
Il grado di gn (x) è il numero di radici n-esime primitive dell’unità distinte e
quindi deg gn (x) = ϕ(x), dove ϕ è la funzione di Eulero.
Proposizione 4.7. Sia gn (x) l’n-esimo polinomio ciclotomico su Q.
Y
(1) xn − 1 =
gd (x);
d|n
(2) gn (x) è un polinomio a coefficienti interi.
Dimostrazione. Sia ζ una radice n-esima primitiva dell’unità. Il gruppo ciclico
G = hζi ha n elementi e contiene tutte le radici d-esime dell’unità per ogni d che
divide n. Un elemento η ∈ G è una radice d-esima primitiva dell’unità se e solo se
il suo ordine, denotato con |η|, è uguale a d. Quindi, per d | n si ha
Y
gd (x) =
(x − η)
η∈G
|η|=d
e perciò

xn − 1 =
Y
η∈G
e cioè la (1).
(x − η) =

Y Y
 Y

=
(x
−
η)
gd (x)


d|n
η∈G
|η|=d
d|n
54
3. Moduli di tipo finito
Dimostriamo ora la (2) per induzione su n. Per n = 1 si ha g1 (x) = x − 1 e
quindi la tesi è vera. Supponiamo ora vera la (2) per tutti i k < n e poniamo
Y
f (x) =
gd (x).
d|n
d<n
Per induzione, f (x) è a coefficienti interi, e xn − 1 = f (x)gn (x) in Q[x]. Ma poiché
f (x) è monico, eseguendo la divisione di xn − 1 per f (x) si ha che tutti i coefficienti
del quoziente sono interi, e cioè gn (x) è a coefficienti interi.
¤
Si può dimostrare che i polinomi ciclotomici gn (x) sono irriducibili in Q[x], e
quindi il grado dell’estensione ciclotomica di ordine n è ϕ(n).
La dimostrazione del teorema di Wedderburn. Sia D un’algebra di divisione
finita e sia K = {a ∈ D | ax = xa ∀x ∈ D} il centro di D. Dimostriamo che K è
un campo. Infatti se a, b ∈ K allora per ogni x ∈ D si ha (a − b)x = ax − bx =
xa − xb = x(a − b) e quindi a − b ∈ D, e dunque K è un sottogruppo di D. Allo
stesso modo si dimostra che se a, b ∈ K allora ab ∈ K. Infine, se a ∈ K e a 6= 0,
per ogni x ∈ D si ha ax = xa e moltiplicando per a−1 a destra e a sinistra si ha
xa−1 = a−1 x e quindi a−1 ∈ K.
Allora K è un campo finito e sia |K| = q ≥ 2 (ricordiamo che q = pa dove
p è primo). Il campo K è un sottoanello dell’anello D e quindi D è uno spazio
vettoriale su K, di dimensione finita perché D è finito, e sia n = dimK D. Allora
|D| = q n , potenza di un primo.
La tesi è che D = K e cioè n = 1. L’idea è studiare il sottogruppo K ∗ di D∗
(ricordiamo che per un anello A, A∗ indica il gruppo moltiplicativo degli elementi
invertibili di A) e poiché D∗ = D \ {0} e K ∗ = K \ {0}, sappiamo che |D∗ | = q n − 1
e |K ∗ | = q − 1. Possiamo usare l’equazione delle classi di D∗ , nella forma (2), per
mettere in relazione gli ordini di D∗ e K ∗ e dimostrare che n = 1.
Per usare l’equazione delle classi occorre conoscere l’azione di D∗ su se stesso
per coniugio. Se a ∈ D∗ , poniamo
N (a) = {d ∈ D | ad = da}.
Come in precedenza per K, si dimostra che N (a) è un sottoanello di divisione di D
che contiene K, e quindi N (a) è anch’esso uno spazio vettoriale su K. Dunque
l’ordine |N (a)| = q r , per un opportuno r. Poiché N (a) è un anello di divisione
contenuto in D, anche D è uno spazio vettoriale su N (a) e quindi |D| = |N (a)|s =
q rs = q n e cioè r divide n.
Per ogni a ∈ D, N (a)∗ = CD∗ (a), il centralizzatore di a in D∗ , e ha indice
qn − 1
, con r | n.
[D∗ : N (a)∗ ] = r
q −1
Scriviamo l’equazione delle classi:
(3)
q n − 1 = (q − 1) +
k
X
qn − 1
q ri − 1
i=1
dove (q − 1) è l’ordine del centro K ∗ e ri | n, ri 6= n per i = 1, . . . , k.
4. Algebre di divisione finite
55
Se r | n e r 6= n, poniamo fr (x) =
coefficienti interi, ma addirittura
xn − 1
. Si ha che fr (x) è un polinomio a
xr − 1
fr (x) = gn (x) · hr (x)
dove gn (x) è l’n-esimo polinomio
Q ciclotomico e hr (x)Q∈ Z[x]. Infatti, dalla Proposizione 4.7 si ha che xn − 1 = d|n gd (x) e xr − 1 = d|r gd (x). Dunque
Y
Y
gd (x) = gn (x) · (xr − 1) · hr (x).
xn − 1 = gn (x) ·
gd (x) ·
d|r
d|n, d-r
Osserviamo che hr (x) è a coefficienti interi perché fr (x) è a coefficienti interi e
gn (x) è a coefficienti interi e monico.
Calcolando gn (x) per x = q si ha che gn (q) | q n − 1 ma anche, per quello che
qn − 1
abbiamo appena dimostrato, che gn (q) | fr (q) = r
per ogni r che divide n.
q −1
Allora, dall’equazione (3), si ha
gn (q) | q − 1.
O
•
•
•
ζ
•XXXXXXXX
XXXXX
XXXXX
XXXXX
X• /
•
q
1
•
D’altra parte, se ζ ∈ C è una radice n-esima dell’unità, ζ 6= 1, si ha la
disuguaglianza fra i valori assoluti
|q − ζ| > |q − 1| = q − 1
e perciò
¯
¯
¯Y
¯ Y
¯
¯
|gn (q)| = ¯ (q − ζi )¯ =
|q − ζi | > q − 1
¯
¯
i
i
che è una contraddizione a meno che n = 1 (non ci sono radici dell’unità diverse da
1).
¤
Capitolo 4
Anelli non commutativi
In questo breve capitolo vedremo alcuni importanti esempi di anelli non commutativi. Gli esempi sono scelti per la loro importanza nella Teoria delle Rappresentazioni,
e conoscere a fondo questi esempi sarà utile per comprendere meglio i risultati che
vedremo in seguito. Cercheremo anche di mettere in evidenza le proprietà che non
valgono in generale nel caso non commutativo, per acquisire un po’ di intuizione.
D’ora in poi la parola anello significherà anello non necessariamente commutativo, ma in generale con unità.
Prima di cominciare, vediamo alcune definizioni. I concetti di omomorfismo,
isomorfismo, nucleo, immagine e sottoanello non hanno bisogno di modifiche.
Se I è un sottogruppo del gruppo additivo di A, e aI ⊆ I per ogni a ∈ A, allora
I è un ideale sinistro di A, e analogamente se Ia ⊆ I per ogni a ∈ A, allora I è
un ideale destro di A. Se I è un ideale sia destro che sinistro, è detto un ideale
bilatero, o semplicemente un ideale. È possibile avere ideali destri ma non sinistri
e viceversa. Per costruire l’anello quoziente A/I è essenziale che I sia un ideale
bilatero (altrimenti la moltiplicazione fra classi non è ben definita).
In un anello A l’insieme degli elementi che commutano con tutti gli elementi
di A è detto il centro di A, e viene denotato Z(A):
Z(A) = {a ∈ A | ax = xa per ogni x ∈ A}.
Z(A) è un sottoanello (commutativo) di A e A è uno Z(A)-modulo in modo naturale.
Se B è un qualunque sottoanello di Z(A), allora diciamo che A è una B-algebra,
oppure una algebra su B.
Se A1 e A2 sono B-algebre, allora sia A1 che A2 contengono B (nel loro centro)
e un omomorfismo di algebre f : A1 → A2 è un omomorfismo di anelli tale che
f (b) = b per ogni b ∈ B.
Se B = K è un campo, allora una K-algebra A è un anello che è anche uno
spazio vettoriale su K. La dimensione di A come spazio vettoriale su K è detto
il rango di A. Quando diciamo che un anello A è un’algebra (senza specificare su
quale altro anello) intendiamo che A è una K-algebra, per un opportuno campo K,
57
58
4. Anelli non commutativi
e cioè un’algebra è un anello che è uno spazio vettoriale su di un campo contenuto
nel centro dell’anello.
1. Algebre di endomorfismi
L’esempio più tipico di anello non commutativo è dato dall’algebra degli endomorfismi di uno spazio vettoriale, o più in generale di un modulo.
Se V è uno spazio vettoriale di dimensione finita sul campo K, allora l’anello
EndK (V ) = {f : V → V | f lineare}
è un anello con le operazioni di somma e composizione di omomorfismi. Naturalmente EndK (V ) non è commutativo, a meno che dim V = 1, e in tal caso si ha
EndK (V ) = V ∼
= K. La moltiplicazione per un elemento di K è un endomorfismo
di V , che commuta con tutti gli altri endomorfismi. Dunque K è contenuto nel
centro di EndK (V ) che quindi è una K-algebra. Fissando una base {v1 , . . . , vn } in
V e rappresentando ogni endomorfismo mediante una matrice quadrata si ha un
isomorfismo
EndK (V ) ∼
= M (n, K)
con l’anello delle matrici quadrate di dimensione n a coefficienti in K. Da questo
osserviamo che il rango di EndK (V ) come K-algebra è n2 . Una base di EndK (V )
come spazio vettoriale è data dagli endomorfismi fij dove
fij (vj ) = vi ,
fij (vk ) = 0 per k 6= j
sugli elementi della base fissata. fij è rappresentato dalla matrice Eij che ha 1 in posizione (i, j) e 0 altrove. In termini di questa base, si può scrivere la moltiplicazione
come
Eij Ekl = 0, se j 6= k
Eij Ejl = Eil .
Questo modo di definire un’algebra, mediante una base come spazio vettoriale e
poi definendo la moltiplicazione fra gli elementi della base, è molto conveniente e
verrà usato spesso nel seguito. Naturalmente, non tutte le regole di moltiplicazione
danno un’algebra: si deve verificare che la moltiplicazione che risulta sia associativa
e che esista l’unità.
Possiamo generalizzare l’esempio precedente considerando A un anello commutativo con unità e M un A-modulo. Allora
EndA (M ) = {f : M → M | f omomorfismo di A-moduli}
è un anello, in generale non commutativo. Se M è libero di rango n si può di nuovo
identificare EndA (M ) con l’anello della matrici n × n a coefficienti in A.
Un’altra generalizzazione è considerare uno spazio vettoriale V di dimensione
infinita. Di solito EndK (V ) non ha proprietà interessanti (o facili da ottenere), a
meno di imporre qualche restrizione su V . L’esempio più importante è V = spazio
di Banach complesso e
B(V ) = {f : V → V | f operatore lineare limitato}.
Ricordiamo che per un operatore su uno spazio di Banach limitato è equivalente
a continuo. Se V ha dimensione finita, allora ogni operatore lineare è continuo, e
quindi ritroviamo l’esempio precedente.
1. Algebre di endomorfismi
59
Sia D un’algebra di divisione non commutativa (e quindi non finita). Notiamo
che il centro Z(D) è un campo, e D è uno spazio vettoriale su Z(D). Dunque D è
una K-algebra, per ogni sottocampo K ⊆ Z(D).
L’esempio più noto di algebra di divisione non commutativa è dato dall’anello
dei quaternioni H, che si può definire come un’algebra di rango 4 su R, con base 1,
i, j, k, e legge di moltiplicazione
i2 = j 2 = k 2 = −1,
ij = k, ji = −k,
jk = i, kj = −i,
ki = j, ik = −j;
per ricordare la regola, pensiamo a (i, j, k) come un ciclo, e il prodotto di due
elementi è il terzo se seguiamo l’ordine ciclico, e il suo opposto altrimenti.
Dunque ogni quaternione si scrive q = a + bi + cj + dk, con a, b, c, d ∈ R, e
definiamo, in √
analogia con i numeri complessi, il coniugato q̄ = a − bi − cj − dk e il
modulo |q| = a2 + b2 + c2 + d2 . Si verifica immediatamente che
q q̄ = q̄q = |q|2 ∈ R
e q1 q2 = q¯1 q¯2
da cui segue che, se q 6= 0, allora q̄/|q|2 è l’inverso di q.
Se D è un’algebra di divisione e V un D-modulo sinistro di rango n, allora
V ha tutte le proprietà di uno spazio vettoriale e tutti i teoremi di algebra lineare
valgono per V , con un’unica, significativa, differenza. Supponiamo che V abbia una
base v1 , . . . , vn e siano ϕ e ψ due endomorfismi, rappresentati, rispetto alla base
data, dalle matrici A = (aij ) e B = (bkl ). Allora la matrice C che rappresenta la
composizione ϕψ è data da
X
cil =
bkl aik .
k
In altre parole, nella solita formula di moltiplicazione di matrici, dobbiamo scambiare l’ordine dei fattori. Dunque non è vero che EndD (V ) è isomorfo all’anello
delle matrici quadrate n × n su D.
Consideriamo, per esempio, il caso n = 1. Allora V = D e l’azione di D su se
stesso è per moltiplicazione a sinistra. Sia ora a ∈ D e sia fa : D → D definita
da fa (x) = xa, e notiamo che fa (1) = a, e cioè a è determinato dal valore della
funzione su una base di V . f è lineare: infatti fa (bx) = (bx)a = b(xa) = bfa (x), e
osserviamo chega (x) = ax non è lineare.
La funzione ϕ : EndD (D) → D data da ϕ(f ) = f (1) è un isomorfismo di gruppi
abeliani, ma non è un omomorfismo di anelli, poiché
ϕ(fa ◦ fb ) = (fa ◦ fb )(1) = fa (fb (1)) = fa (b) = ba 6= ab = ϕ(fa )ϕ(fb ).
In generale, se dimD V = n, sia {v1 , . . . , vn } una base e sia f : V → V un omomorfismo. Se poniamo, come al solito, f (vi ) = a1i v1 + · · · + ani vn , allora A = (aij ) è
la matrice che rappresenta f nella base data. Per un vettore v = b1 v1 + · · · + bn vn
calcoliamo f (v); per linearità si ottiene:




X
X
X X
X X

f (v) = f 
bj vj  =
bj f (vj ) =
bj
aij vi =
bj aij  vi
j
j
j
i
i
j
e vediamo che la formula è la stessa (come indici della sommatoria) del caso commutativo, ma la moltiplicazione è scambiata. Allo stesso modo si dimostra che la
matrice della composizione di due omomorfismi è quella scritta più in alto.
60
4. Anelli non commutativi
Definizione 1.1. Due anelli A e A0 si dicono opposti oppure anti-isomorfi se esiste
f : A → A0 biunivoca tale che
f (a + b) = f (a) + f (b),
f (ab) = f (b)f (a).
Se f : A → A è un anti-isomorfismo, f viene detta involuzione. Esempi di
involuzioni sono t : M (n, A) → M (n, A), dove A è un anello commutativo, data da
t(C) = matrice trasposta di C, e c : H → H data dalla coniugazione c(q) = q̄.
Per ogni anello A esiste un anello Aop anti-isomorfo ad A: basta prendere
gli stessi elementi di A, con la stessa somma e con il prodotto fra a e b dato da
ba. Allora l’identità è un anti-isomorfismo fra A e Aop . Possiamo riassumere la
discussione precedente nel
Teorema 1.2. Se D è un’algebra di divisione e V un D-spazio vettoriale di dimensione finita n, allora l’anello delle trasformazioni lineari EndD (V ) è isomorfo
all’anello delle matrici quadrate M (n, Dop ) a coefficienti nell’algebra di divisione
opposta Dop .
Determiniamo ora gli ideali in un’algebra di endomorfismi. Sia V uno spazio
vettoriale di dimensione finita sull’algebra di divisione D, e sia W un sottospazio.
W determina due ideali, uno sinistro e l’altro destro, come segue:
(1)
WI
= {ϕ ∈ EndD (V ) | W ⊆ ker ϕ},
(2)
IW = {ϕ ∈ EndD (V ) | Im ϕ ⊆ W }.
Verifichiamo, per esempio, che W I è un ideale sinistro. Siano ϕ, ψ ∈ W I e sia
w ∈ W : (ϕ + ψ)(w) = ϕ(w) + ψ(w) = 0 e dunque ϕ + ψ ∈ W I. Sia ora ϕ ∈ W I,
ψ ∈ EndD (V ) e w ∈ W :
(ψϕ)(w) = ψ(ϕ(w)) = ψ(0) = 0
e dunque ψϕ ∈ W I. Dunque W I è un ideale sinistro. La verifica che IW è un ideale
destro è simile.
Proposizione 1.3. Sia I un ideale sinistro in EndD (V ). Allora I =
opportuno sottospazio W di L.
W I,
per un
Dimostrazione. Dato l’ideale sinistro I, definiamo W come
\
W = {x ∈ V | ϕ(x) = 0 per ogni ϕ ∈ I} =
ker ϕ
ϕ∈I
Se ϕ ∈ I allora W ⊆ ker ϕ e cioè I ⊆ W I. Dimostriamo l’inclusione opposta.
Osserviamo che se f, g ∈ EndD (V ) sono tali che ker g ⊆ ker f allora esiste
h ∈ EndD (V ) tale che f = hg:
V
g
f
~
~
/V
~>
² ~ h
V
Dalla catena di inclusioni ker g ⊆ ker f ⊆ V , possiamo trovare una base u1 , . . . , uk ,
v1 , . . . , vn , w1 , . . . , wm di V in modo che gli ui siano una base di ker g, e gli ui , vj
siano una base di ker f . Allora gli elementi g(v1 ), . . . , g(wm ) sono una base di Im g
1. Algebre di endomorfismi
61
e quindi sono linearmente indipendenti, e possono essere completati mediante e1 ,
. . . , ek ad una base di V . Definiamo h come segue
h(g(vi )) = f (vi ) = 0
h(g(wj )) = f (wj )
h(ei ) = arbitrario
e la verifica che f = gh è immediata.
Dunque basta dimostrare che esiste gW ∈ I tale che ker gW = W . L’ideale I
è un sottospazio dello spazio vettoriale EndD (V ) e sia ϕ1 , . . . , ϕk una sua base.
Allora
\
W =
ker ϕ = ker ϕ1 ∩ · · · ∩ ker ϕk
ϕ∈I
e per provare l’esistenza di gW , e concludere la dimostrazione basta, per induzione,
provare il lemma che segue.
¤
Lemma 1.4. Siano ϕ1 , ϕ2 ∈ EndD (V ). Allora esistono h1 , h2 ∈ EndD (V ) tali
che, ponendo ϕ = h1 ϕ1 + h2 ϕ2 , si ha
ker ϕ = ker ϕ1 ∩ ker ϕ2 .
Dimostrazione. Sia W = ker ϕ1 ∩ ker ϕ2 . Per il teorema di completamento della
base si possono trovare due sottospazi U e T tali che
ker ϕ1 = W ⊕ U
ker ϕ2 = W ⊕ T
e dunque
ker ϕ1 + ker ϕ2 = W ⊕ U ⊕ T.
Sia poi F un sottospazio tale che V = W ⊕ U ⊕ T ⊕ F , e scegliamo basi {wi }, {ui },
{ti }, {fi } di questi sottospazi, in modo che l’unione sia una base di V . Definiamo
ora h1 : i vettori {ϕ1 (ti )}, {ϕ1 (fi )} sono una base di Im ϕ1 e quindi sono linearmente
indipendenti, e possono essere completati mediante e1 , . . . , ek ad una base di V .
Definiamo h1 come segue
h1 (ϕ1 (ti )) = ti
h1 (ϕ1 (fi )) = fi
h1 (ei ) = arbitrario
e si ottiene, per h1 ϕ1 ,
h1 (ϕ1 (wi )) = 0
h1 (ϕ1 (ui )) = 0
h1 (ϕ1 (ti )) = ti
h1 (ϕ1 (fi )) = fi
Allo stesso modo, i vettori {ϕ2 (ui )}, {ϕ2 (fi )} sono una base di Im ϕ2 e quindi sono
linearmente indipendenti, e possono essere completati mediante g1 , . . . , gs ad una
base di V . Definiamo h2 come segue
h2 (ϕ2 (ui )) = ui
h2 (gi ) = arbitrario
h2 (ϕ2 (fi )) = 0
62
4. Anelli non commutativi
e si ottiene, per h2 ϕ2 ,
h2 (ϕ2 (wi )) = 0
h2 (ϕ2 (ui )) = ui
h2 (ϕ2 (ti )) = 0
h2 (ϕ2 (fi )) = 0
Sommando si ha che, per ϕ = h1 ϕ1 + h2 ϕ2
ϕ(wi ) = 0
ϕ(ui ) = ui
ϕ(ti ) = ti
ϕ(fi ) = fi
e quindi ker ϕ = W , come richiesto.
¤
In modo simile si può provare che ogni ideale destro J è della forma J = IW .
Si può però anche usare la dualità fra V e V ∗ = HomD (V, D), considerando, per
un sottospazio W di V , il sottospazio duale
W ∗ = {g ∈ V ∗ | g(W ) = 0}.
W ∗ è anche detto l’annullatore di W . Per ogni f ∈ EndD (V ) c’è, per funtorialità,
un f ∗ ∈ EndD (V ∗ ) definito da f ∗ (g) = g ◦ f . Per esercizio, verificare che:
• la mappa ϕ : EndD (V ) → EndD (V ∗ ) data da ϕ(f ) = f ∗ è un antiisomorfismo, e (quindi) porta ideali destri in ideali sinistri e ideali sinistri
in ideali destri;
• ϕ(IW ) = W ∗ I e ϕ (W I) = IW ∗ ;
• ϕ−1 (IW ∗ ) = W I e ϕ−1 (W ∗ I) = IW ;
Questo, insieme alla proposizione precedente, dimostra che ogni ideale destro di
EndD (V ) è della forma IW .
Proposizione 1.5. Sia I un ideale bilatero in EndD (V ). Allora I = (0) oppure
I = EndD (V ).
Dimostrazione. Poiché I è un ideale sinistro, esiste un sottospazio W tale che
I = W I = {ϕ | ϕ(W ) = 0}. Se W = {0}, allora I = EndD (V ). Sia quindi x ∈ W ,
x 6= 0, e sia ϕ ∈ I. Sia ora ψ ∈ EndD (V ); poiché I è un ideale destro, ϕψ ∈ I e
quindi ϕ(ψ(x)) = 0. Al variare di ψ, otteniamo che ψ(x) può essere un qualunque
vettore in V , e quindi ϕ = 0. Dunque I = 0.
¤
Definizione 1.6. Sia A un anello. A si dice semplice se gli unici ideali di A sono
(0) e A.
Nel caso commutativo, un anello semplice è un campo. EndD (V ) è un anello semplice che non è un’algebra di divisione. Questa differenza è legata alla
descrizione degli ideali in un anello non commutativo.
Sia A un anello, e sia x ∈ A. L’ideale principale (x) generato da x è, per
definizione, il più piccolo ideale che contiene x. Se A è commutativo con unità,
allora (x) = Ax, e da questo segue immediatamente che (x) = A se e solo se x è
invertibile. Se A non è commutativo, Ax è solo un ideale sinistro. In generale si ha
Proposizione 1.7. Sia A un anello con unità, e x ∈ A. Allora
(
)
X
(x) =
ai xbi | ai , bi ∈ A .
i
2. L’algebra gruppo K[G]
63
Dimostrazione. Esercizio. Dimostrare che l’insieme descritto nell’enunciato è un
ideale (bilatero) e che contiene ogni ideale che contiene x. Il fatto che A abbia l’unità
è essenziale (se A non ha unità, l’insieme descritto non contiene necessariamente x).
¤
P Dunque se (x) = A, possiamo solo dire che esistono elementi ai , bi ∈ A tali che
i ai xbi = 1, e questo non basta per dire che x è invertibile.
2. L’algebra gruppo K[G]
Sia G un gruppo finito e sia K un campo. Per ogni elemento g ∈ G, sia eg un
simbolo, e consideriamo lo spazio vettoriale V su K che ha per base gli elementi eg .
La dimensione di V è l’ordine del gruppo. Su V definiamo una moltiplicazione come
segue:
eg eh = egh , ∀g, h ∈ G
ed estendiamo per linearità. L’anello cosı̀ ottenuto si chiama l’algebra gruppo di G
e viene denotata K[G].
Di solito, si identifica il simbolo eg con l’elementoPcorrispondente g ∈ G, e quindi
ogni elemento di K[G] è una combinazione lineare g∈G ag g, dove i coefficienti ag
sono in K. Se scriviamo il prodotto di due elementi

 
 

X
X
X

ag g  · 
bg g  = 
cg g 
g∈G
g∈G
g∈G
come combinazione lineare degli elementi della base, allora la formula che esprime
i coefficienti cg in termini di ag e bg è:
X
cg =
ah bh−1 g
h∈G
Se e è l’elemento neutro di G allora e ∈ K[G] è l’unità dell’anello. Più in
generale, gli elementi di G sono invertibili in K[G] e l’inverso è lo stesso che in G,
naturalmente. Se H è un sottogruppo
Pdi G, allora K[H] è un sottoanello di K[G],
Possiamo pensare a un elemento g∈G ag g come una funzione a : G → K, data
da a(g) = ag . In questo modo, K[G] non è altro che lo spazio delle funzioni da G
a K, con la somma data da
(a + b)(g) = a(g) + b(g)
e la moltiplicazione data da
c(g) =
X
a(g)b(h−1 g)
h∈G
Questa formula è la base per la generalizzazione a gruppi infiniti. Per esempio,
se G = {z ∈ C | |z| = 1} è il gruppo dei numeri complessi unitari, scrivendo z = eiϕ ,
si osserva subito che una funzione su G è una funzione in ϕ periodica di periodo 2π.
Possiamo allora definire R[G] come l’algebra delle funzioni periodiche (continue e
assolutamente integrabili) con moltiplicazione che porta α(ϕ), β(ϕ) nella funzione
Z 2π
1
α(t)β(ϕ − t) dt
γ(ϕ) =
2π 0
e cioè γ è la convoluzione delle funzioni α e β.
64
4. Anelli non commutativi
Osserviamo però che questa definizione non è completamente corretta, perché
manca l’elemento unità. Infatti, l’unità corrisponde alla funzione delta di Dirac
dell’elemento neutro, funzione che non è continua (e non è nemmeno una funzione,
ma una distribuzione). Poiché non ha molto senso considerare una distribuzione
periodica, si rimedia in un altro modo, più algebrico, cercando di immergere R[G]
in un anello con unità.
È sempre possibile immergere ogni anello in un anello con unità. Sia A un
anello senza unità e sia A0 = A ⊕ Z, come gruppi abeliani. Definiamo il prodotto
come segue
(a, n) · (b, m) = (ab + nb + ma, nm)
dove ma, nb ∈ A sono i multipli interi degli elementi a, b ∈ A. A0 è un anello,
commutativo se e solo se lo è A, con unità (0, 1). Il sottoinsieme degli elementi
della forma (a, 0) è un ideale di A0 .
Esercizio 2.1. Sia A un anello con unità, e applichiamo la costruzione precedente.
L’anello A0 che si ottiene è isomorfo ad A?
L’unico teorema che citiamo per le algebre gruppo è il seguente:
Teorema 2.2 (Maschke). Sia G un gruppo finito, e sia K un campo algebricamente
chiuso di caratteristica 0, oppure di caratteristica p tale che p non divide l’ordine
del gruppo G. Allora esistono interi positivi n1 , . . . , nt tali che
K[G] ∼
= M (n1 , K) × · · · × M (nt , K)
come K-algebre.
Questo teorema è alla base dello studio delle rappresentazioni lineari dei gruppi
finiti sui campi algebricamente chiusi.
Capitolo 5
Categorie e funtori
La teoria delle categorie nasce dall’osservazione che nella matematica moderna non
sono solo gli oggetti (per esempio, gruppi, anelli, moduli, spazi topologici, varietà
differenziabili, . . . ) ad essere importanti ma anche le funzioni fra di essi. Inoltre
spesso un enunciato è sufficientemente generale da valere in una grande quantità di
situazioni apparentemente differenti. Sorge quindi l’esigenza di avere un linguaggio
unificato in cui effettuare tutte queste costruzioni, una volta per tutte.
In questo capitolo enunceremo le definizioni di categoria, funtore e trasformazione naturale. Vedremo poi alcune costruzioni categoriali, come prodotti, coprodotti,
oggetti liberi e la definizione di alcuni funtori molto usati, come Hom e prodotto
tensoriale.
1. Categorie
Il primo concetto è quello di categoria.
Definizione 1.1. Una categoria C è composta dai seguenti dati:
(1) Una classe Ob C i cui elementi sono detti oggetti di C.
(2) Una collezione di insiemi Hom(X, Y ), uno per ogni coppia ordinata di
oggetti X, Y ∈ Ob C, i cui elementi sono detti morfismi da X a Y ; i
morfismi sono denotati ϕ : X → Y .
(3) Una collezione di funzioni
Hom(X, Y ) × Hom(Y, Z) −→ Hom(X, Z),
una per ogni terna ordinata X, Y, Z ∈ Ob C. Ogni funzione di questa
collezione associa ad una coppia di morfismi ϕ : X → Y , ψ : Y → Z un
morfismo da X a Z, denotato con ψ ◦ ϕ, o più semplicemente ψϕ : X → Z
detto la composizione o il prodotto di ϕ e ψ.
Questi dati devono soddisfare le seguenti proprietà:
(1) Ogni morfismo ϕ determina unicamente una coppia ordinata X, Y ∈ Ob C
tale che ϕ ∈ Hom(X, Y ). In altre parole, gli insiemi Hom(X, Y ) sono a
due a due disgiunti.
65
66
5. Categorie e funtori
(2) Per ogni X ∈ Ob C esiste un morfismo identico idX : X → X; esso è
unicamente determinato dalle condizioni idX ◦ϕ = ϕ, ψ ◦ idX = ψ, ogni
volta che le composizioni sono definite.
(3) La composizione di morfismi è associativa:
(ξψ)ϕ = ξ(ψϕ)
per ogni ϕ : X → Y , ψ : Y → Z, ξ : Z → W .
Osserviamo che Ob C non è, in generale, un insieme ma solo una classe. Quindi
una categoria non è descrivibile (in senso stretto) nella teoria di Zermelo–Fraenkel.
Una trattazione formale ci porterebbe lontano, ma possiamo dare brevemente alcuni
cenni della teoria degli insiemi di Gödel–Bernays, che ha come concetti primitivi
quello di classe e di appartenenza.
Due classi sono uguali se e solo se hanno gli stessi elementi (cioè per le classi
vale l’assiome dell’estensione ZF 1) e l’assioma di formazione per le classi afferma
che per ogni proprietà P (x) con una variabile libera esprimibile nel linguaggio del
primo ordine (connettivi logici e quantificatori universale e esistenziale) esiste una
classe, in simboli
∀P ∃y : ∀z z ∈ y ⇐⇒ P (z).
Questa classe si indica con y = {z | P (z)}, e cioè per le classi vale l’assioma del
sottoinsieme (ZF 7) senza restrizioni.
Con questa terminologia una classe A è un insieme se e solo se esiste una
classe B tale che A ∈ B. In un certo senso, un insieme è una classe che non è
“troppo grande”.
Gli altri assiomi della teoria di Gödel–Bernays descrivono il comportamento delle classi e degli insiemi in modo del tutto equivalente alla teoria di Zermelo–Fraenkel
e la differenza fra i due linguaggi è solo data dal fatto di poter parlare più facilmente,
in Gödel–Bernays, di oggetti che non sono insiemi. Per definire in modo appropriato una categoria questo è essenziale perché, per molte categorie di interesse, Ob C
non è un insieme. Questo capita per tutte le categorie dell’Esempio 1.3.
Definizione 1.2. In una categoria C un morfismo f : A → B è una equivalenza
se esiste un morfismo g : B → A tale che gf = idA e f g = idB . Se esiste una
equivalenza f : A → B, gli oggetti A e B sono detti equivalenti.
Vediamo subito alcuni esempi. È immediato verificare che in ognuno dei seguenti casi le condizioni della definizione di categoria sono soddisfatte. Se in un
qualche caso non risulta evidente, è bene convincersene scrivendo tutti i dettagli.
Esempio 1.3.
(1) La categoria Sets degli insiemi: gli oggetti sono tutti gli insiemi, i morfismi
Hom(X, Y ) sono tutte le funzioni da X a Y .
(2) La categoria Top degli spazi topologici: gli oggetti sono gli spazi topologici,
i morfismi sono le funzioni continue.
(3) La categoria Simp dei complessi simpliciali: gli oggetti sono i complessi
simpliciali, i morfismi le mappe simpliciali.
(4) La categoria Pair delle coppie: gli oggetti sono coppie (X, A) dove X è uno
spazio topologico e A è un suo sottospazio. I morfismi Hom((X, A), (Y, B))
sono le funzioni continue f : X → Y tali che f (A) ⊆ B. Un caso particolare di questa costruzione è la categoria Top∗ degli spazi puntati, i cui
1. Categorie
(5)
(6)
(7)
(8)
67
oggetti sono le coppie (X, x) dove X è uno spazio topologico e x ∈ X, con
i morfismi definiti come sopra.
La categoria Grp: gli oggetti sono i gruppi, i morfismi sono gli omomorfismi
di gruppo.
La categoria Ab: gli oggetti sono i gruppi abeliani, i morfismi sono gli
omomorfismi di gruppo.
La categoria ModA : gli oggetti sono tutti gli A-moduli (sinistri), i morfismi
sono gli omomorfismi di moduli.
La categoria k-Vect: gli oggetti sono gli spazi vettoriali su k, i morfismi le
applicazioni lineari.
Se C è una categoria, in genere si scrive
X ∈ C invece di X ∈ Ob C per indicare
S
che X è un oggetto di C. L’insieme X,Y ∈C Hom(X, Y ) di tutti i morfismi della
categoria C si indica con Mor(C).
La definizione di una categoria comprende solo proprietà riguardo la composizione di morfismi e non dice niente sul comportamento degli oggetti. In generale,
un enunciato concreto in una categoria è che certe composizioni di morfismi sono
uguali, per esempio che ψϕ = ϕ0 ψ 0 . In tali casi, invece di scrivere le formule, è più
conveniente dire che il diagramma
X
ϕ
/Y
ϕ0
²
/Z
ψ0
²
U
ψ
è commutativo.
In tutti gli esempi precedenti, gli oggetti sono insiemi con delle strutture addizionali e i morfismi sono funzioni che rispettano queste strutture. Vediamo ora
degli esempi in cui gli oggetti sono insiemi con struttura, ma i morfismi non sono
funzioni.
Esempio 1.4.
(1) La categoria Toph: gli oggetti sono gli spazi topologici, i morfismi sono le
classi di omotopia delle funzioni continue da X a Y . In questo caso, se
f ∈ Hom(X, Y ) e se x ∈ X non ha senso considerare f (x), perché f non
è una funzione, ma solo una classe di equivalenza di funzioni e dunque il
suo valore in un punto non è determinato. Questa è la categoria più usata
quando si studia l’omotopia.
(2) La categoria Rel delle relazioni: gli oggetti sono gli insiemi, i morfismi
sono i sottoinsiemi del prodotto cartesiano:
Hom(X, Y ) = {ϕ | ϕ ⊆ X × Y }
È strano usare la lettera ϕ per indicare un sottoinsieme, ma in questo
modo possiamo definire la composizione di ϕ : X → Y e ψ : Y → Z come
segue:
ψ ◦ ϕ = {(x, z) ∈ X × Z | ∃y ∈ Y : (x, y) ∈ ϕ, (y, z) ∈ ψ}
Il morfismo identità è la diagonale del prodotto
idX = {(x, x), x ∈ X} ⊆ X × X.
68
5. Categorie e funtori
(3) A volte è utile considerare come categoria una particolare struttura. Sia
I un insieme parzialmente ordinato. La categoria C(I) ha per oggetti
gli elementi di I e Hom(i, j) ha un solo elemento se i ≤ j ed è vuoto
altrimenti. Naturalmente conoscere quali insiemi di morfismi sono vuoti e
quali no è equivalente a conoscere l’ordinamento di I. Osserviamo anche
che in questo caso Ob C = I è un insieme.
Il secondo concetto è quello di funtore.
Definizione 1.5. Un funtore F da una categoria C a una categoria D, denotato
con F : C → D, è dato da:
(1) Una funzione Ob C → Ob D, che assegna ad ogni X ∈ Ob C un oggetto
F (X) ∈ Ob D.
(2) Una funzione Mor C → Mor D, che assegna ad ogni ϕ ∈ Mor C un morfismo
F (ϕ) ∈ Mor D in modo che se ϕ : X → Y allora F (ϕ) : F (X) → F (Y ).
Questi dati devono soddisfare la seguente condizione:
F (ψ ◦ ϕ) = F (ψ) ◦ F (ϕ)
per ogni coppia di morfismi ψ, ϕ per cui sia definita la composizione. In particolare,
F (idX ) = idF (X) .
Vediamo alcuni esempi. In tutti i casi è necessario un po’ di lavoro per definire
i morfismi indotti.
Esempio 1.6.
(1) La realizzazione geometrica | · | : Simp → Top che ad un complesso simpliciale K associa la sua realizzazione geometrica |K|, e ad una mappa
simpliciale la corrispondente funzione continua.
(2) Il gruppo fondamentale π1 : Top∗ → Grp che ad uno spazio topologico X
con punto base x assegna il suo gruppo fondamentale, i cui elementi sono
le classi di omotopia delle funzioni continue f : (S 1 , 1) → (X, x).
(3) Il gruppo di omologia simpliciale Hi : Simp → Ab che associa ad un complesso simpliciale il suo i-esimo gruppo di omologia simpliciale Hi (X, Z).
(4) Il gruppo di omologia singolare Hi : Top → Ab che associa ad uno spazio
topologico X il suo i-esimo gruppo di omologia singolare Hi (X, Z).
(5) Il funtore Hom(−, N ) : ModA → ModA che associa ad ogni A-modulo M il
modulo Hom(M, N ) e ad ogni omomorfismo f : M → M 0 l’omomorfismo
f ∗ : Hom(M 0 , N ) → Hom(M, N ) definito da f ∗ (ϕ) = ϕ ◦ f .
(6) Il funtore Hom(N, −) : ModA → ModA che associa ad ogni A-modulo M il
modulo Hom(N, M ) e ad ogni omomorfismo f : M → M 0 l’omomorfismo
f∗ : Hom(N, M ) → Hom(N, M 0 ) definito da f∗ (ϕ) = f ◦ ϕ.
(7) Il funtore − ⊗ N : ModA → ModA che associa ad ogni A-modulo M il
modulo M ⊗ N e ad ogni omomorfismo f : M → M 0 l’omomorfismo
f ⊗ idN : M ⊗ N → M 0 ⊗ N .
I funtori che abbiamo definito sono usualmente detti covarianti, perché rispettano l’ordine della composizione dei morfismi nelle categorie C e D. Esistono anche
i funtori controvarianti, nella cui definizione si richiede che F (ψϕ) = F (ϕ)F (ψ). Un
esempio tipico di funtore controvariante è dato dai gruppi di coomologia. Il funtore
2. Alcune costruzioni
69
Hom(−, N ) dell’esempio 5 è controvariante. Tuttavia, può essere più conveniente
fare “l’inversione delle frecce” nella categoria iniziale C.
Formalmente, definiamo la categoria duale C◦ come segue: Ob C◦ = Ob C,
ma un oggetto X ∈ Ob C pensato come oggetto in C◦ verrà denotato con X ◦ ;
HomC◦ (X ◦ , Y ◦ ) = HomC (Y, X), e a ogni ϕ : Y → X associamo ϕ◦ : X ◦ → Y ◦ ;
infine definiamo la composizione e l’identità come
ϕ◦ ◦ ψ ◦ = (ψϕ)◦ ,
idX ◦ = (idX )◦ .
Con queste definizioni, un funtore controvariante G : C → D è un funtore (covariante) G : C◦ → D. Dunque nell’esempio 5 possiamo pensare Hom(−, N ) come un
funtore (covariante) da Mod◦A a ModA .
L’ultimo concetto che introduciamo è quello di morfismo di funtori o trasformazione naturale. La definizione precisa è la seguente:
Definizione 1.7. Siano F , G due funtori da C a D. Una trasformazione naturale
o morfismo di funtori da F a G, che si denota con t : F → G, è una famiglia di
morfismi nella categoria D:
t(X) : F (X) → G(X),
uno per ogni oggetto X ∈ Ob C, che soddisfa la seguente condizione: per ogni
morfismo ϕ : X → Y in C il diagramma
F (X)
t(X)
F (ϕ)
²
G(X)
/ G(X)
G(ϕ)
t(Y )
²
/ G(Y )
è commutativo.
2. Alcune costruzioni
Molti concetti categoriali sono definiti in termini di proprietà universali, in modo da
garantire l’unicità dell’oggetto definito. La questione dell’esistenza deve poi essere
decisa nelle varie categorie d’interesse.
Cominciamo con il prodotto.
Definizione 2.1. Sia C una categoria e {Ai }i∈I una famiglia di oggetti di C. Un
prodotto per la famiglia {Ai }i∈I è un oggetto P di C con una famiglia di morfismi
{πi : P → Ai }i∈I tale che, per ogni oggetto B di C e per ogni famiglia di morfismi
{ϕi : B → Ai }i∈I , esiste un unico morfismo ϕ : B → P tale che πi ◦ ϕ = ϕi per
tutti gli i ∈ I.
Y
Il prodotto della famiglia {Ai }i∈I si indica di solito con
Ai .
i∈I
Esercizio 2.2. Disegnare un diagramma commutativo che esprima la definizione
del prodotto.
La proprietà caratteristica di un prodotto è di avere le “proiezioni sui fattori”.
Notiamo che in generale non ci sono mappe canoniche da un fattore nel prodotto,
come è evidente già nel caso del prodotto X × Y di due fattori. Non sempre
70
5. Categorie e funtori
il prodotto di una famiglia di oggetti esiste. Dimostrare che nei casi seguenti il
prodotto è quello indicato:
(1)
(2)
(3)
(4)
(5)
in
in
in
in
in
Sets, il prodotto cartesiano degli insiemi della famiglia;
Top, il prodotto cartesiano degli insiemi con la topologia prodotto;
Grp, il prodotto diretto di gruppi;
Ab, il prodotto diretto di gruppi;
ModA , il prodotto diretto di moduli.
Poiché le definizioni categoriali sono tutte date in termini di oggetti e di morfismi, “rovesciando le frecce” si ottiene la definizione dell’oggetto “duale”.
Definizione 2.3. Sia C una categoria e {Ai }i∈I una famiglia di oggetti di C. Un
coprodotto o somma per la famiglia {Ai }i∈I è un oggetto S di C con una famiglia di
morfismi {ιi : Ai → S}i∈I tale che, per ogni oggetto B di C e per ogni famiglia di
morfismi {ψi : Ai → B}i∈I , esiste un unico morfismo ψ : S → B tale che ψ ◦ ιi = ψi
per tutti gli i ∈ I.
a
Il coprodotto della famiglia {Ai }i∈I si indica di solito con
Ai .
i∈I
Esercizio 2.4. In quali delle categorie viste in precedenza esiste sempre il coprodotto di una famiglia di oggetti?
La proprietà caratteristica di un coprodotto è di avere le “immersioni canoniche
degli addendi”. Questo può aiutare a capire quali possano essere i coprodotti in
Sets e Top.
Gli oggetti di una categoria non sono necessariamente insiemi, né i morfismi
sono necessariamente funzioni nel senso usuale della parola. Quando questo capita,
la categoria si dice concreta. Per esempio, Sets oppure ModA sono categorie concrete, mentre Toph oppure Rel non lo sono. La prossima definizione ha senso solo
in una categoria concreta.
Definizione 2.5. Sia F un oggetto di una categoria concreta C, X un insieme non
vuoto e i : X → F una funzione (fra insiemi). F è libero sull’insieme X se per ogni
oggetto A di C e per ogni funzione f : X → A fra insiemi, esiste un unico morfismo
di C ϕ : F → A tale che ϕi = f come funzioni fra insiemi da X ad A.
La proprietà caratteristica di un oggetto libero F è che, per definire un morfismo
con dominio F basta specificare le immagini degli elementi del sottoinsieme X.
Come abbiamo visto nel Capitolo 2, in ModA esistono oggetti liberi e sono
unici. La dimostrazione dell’unicità è alquanto formale, e in effetti è solo un caso
particolare del seguente concetto generale.
Definizione 2.6. Un oggetto I in una categoria C è detto universale o iniziale se
per ogni oggetto C di C esiste uno e un solo morfismo I → C. Un oggetto T di C
è detto couniversale o terminale se per ogni oggetto C di C esiste uno e un solo
morfismo C → T .
Teorema 2.7. In una categoria, due qualunque oggetti iniziali (terminali) sono
equivalenti mediante una unica equivalenza.
2. Alcune costruzioni
71
Dimostrazione. Siano I e J due oggetti iniziali. Poiché I è iniziale c’è un unico
morfismo f : I → J e, poiché J è iniziale, c’è un unico morfismo g : J → I. La
composizione gf è un morfismo da I in I come anche idI . Poiché I è universale,
esiste un solo morfismo da I in I e quindi gf = idI . Allo stesso modo, poiché anche
J è iniziale, f g = idJ . Dunque f : I → J è una equivalenza fra I e J ed è l’unica.
Rovesciando le frecce, si ha l’equivalenza per oggetti terminali.
¤
Esempio 2.8. In Sets un insieme formato da un solo elemento è terminale. Esiste
un oggetto iniziale?
In Grp, il gruppo banale G = {e} è sia iniziale che terminale. Lo stesso vale in
ModA e in k-Vect.
Per dimostrare l’unicità di un oggetto che gode di certe proprietà in una categoria basta quindi trovare un’altra categoria in cui questo oggetto sia iniziale o
terminale. In effetti, tutte le definizioni tramite proprietà universali possono essere
riscritte costruendo una opportuna categoria in cui l’oggetto definito risulti iniziale
o terminale.
Esempio 2.9. Sia X un insieme e C una categoria concreta. Definiamo una nuova
categoria DX come segue: un oggetto di DX è una funzione fra insiemi f : X → A,
per un oggetto A di C. Un morfismo in DX da f : X → A a g : X → B è un
morfismo h : A → B in C tale che il diagramma
~
~~
~
~
~~ ~
f
A
X@
@@ g
@@
@@
@Ã
h
/B
commuta, e cioè g = hf . Per ogni A ∈ C abbiamo l’identità 1A : A → A. Se
f : X → A è un oggetto di DX , è chiaro che 1A è l’identità dell’oggetto f .
Cosa è un oggetto iniziale in DX ? È un oggetto i : X → F (cioè una funzione
fra insiemi di codominio F ∈ C) tale che, per ogni oggetto f : X → A esiste uno
e un solo morfismo in DX da i a f e cioè esiste uno e un solo morfismo (in C)
ϕ : F → A tale che f = ϕi.
Quindi, un oggetto di C libero sull’insieme X è un oggetto iniziale di DX , ed è
quindi unico, se esiste.
Allo stesso modo, si può dimostrare l’unicità del prodotto o del coprodotto
di una famiglia di oggetti trovando una opportuna categoria in cui il prodotto
oppure il coprodotto siano oggetti iniziali oppure terminali. Lasciamo per esercizio
la determinazione di queste categorie.
Bibliografia
[AM]
M. F. Atiyah, I. G. MacDonald, Introduction to Commutative Algebra, Addison–Wesley,
1969
[An]
A. Andretta, Istituzioni di Logica Matematica. Dispense del corso disponibili all’indirizzo
www.dm.unito.it/personalpages/andretta/index.htm
[Lettres] R. Baire, E. Borel, J. Hadamard, H. Lebesgue, Bull. Soc. Math. France, 33, (1905),
pp. 261–273, ripubblicato in traduzione inglese in G. H. Moore, Zermelo’s axiom of
choice : its origins, development, and influence, Springer–Verlag, 1982, pp. 311–320
[Dev]
K. J. Devlin, Fundamentals of Contemporary Set Theory, Springer–Verlag, 1979
[FuHa]
W. Fulton, J. Harris, Representation Theory: A First Course, Springer 1991
[Hu]
T. W. Hungerford, Algebra, Springer–Verlag, 1974
[Ma]
J. I. Manin, “Assioma/Postulato”, in Enciclopedia Einaudi, volume 1, Einaudi 1977
[NaNe]
E. Nagel, J. R. Newman, La prova di Gödel, Boringhieri, 1974
[NaSt]
M.A. Naimark, A.I. Štern, Teoria delle rappresentazioni dei gruppi, Editori Riuniti
(anche in inglese, Theory of group representations, Springer GMW 246)
[Re]
M. Reid, Undergraduate Algebraic Geometry, London Mathematical Society Student
Texts 12, Cambridge University Press, 1990
[Se]
J.-P. Serre, Linear Representation of Finite Groups, Springer–Verlag, 1977
[Shaf]
I. R. Shafarevich, Basic Notion in Algebra, Springer 1997, pubblicato originariamente
come Algebra I, Encyclopaedia of Mathematical Sciences, Vol. 11
[Sharp]
R. Y. Sharp, Steps in Commutative Algebra, London Mathematical Society Student
Texts 19, Cambridge University Press, 1990
[vdW]
B. L. van der Waerden, Algebra, (settima ed., 2 volumi), Frederick Ungar Publishing
Co., 1970
73