Il monopolo di Dirac The Dirac monopole

Università degli Studi di Firenze
Scuola di Scienze Matematiche, Fisiche e Naturali
Tesi di Laurea Triennale in Fisica e Astrofisica
Il monopolo di Dirac
The Dirac monopole
Candidato: Antonio De Cristofaro
Relatore: Dott. Marco Tarlini
Correlatore: Dott. Domenico Seminara
Anno Accademico 2012/2013
Indice
1 Introduzione
3
2 Trattazione fisica del monopolo
2.1 Una prima trattazione . . . . . . . . . .
2.1.1 Il monopolo di Wu-Yang . . . . .
2.1.2 Quantizzazione della carica . . .
2.2 Articolo originale di Dirac . . . . . . . .
2.2.1 Fasi non-integrabili delle funzioni
2.2.2 Singolarità nodali . . . . . . . . .
.
.
.
.
.
.
5
. 5
. 8
. 8
. 9
. 9
. 11
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
13
13
13
13
14
14
14
14
15
15
15
16
17
17
18
19
21
4 Trattazione geometrica del monopolo
4.1 Teorie di gauge U(1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Monopolo magnetico di Dirac . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3 Rotazioni e stringa di Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
23
24
25
5 Conclusioni
27
3 Nozioni di Geometria Differenziale
3.1 Varietà differenziabili . . . . . . . . . .
3.2 Vettori e vettori duali . . . . . . . . .
3.2.1 Vettori . . . . . . . . . . . . . .
3.2.2 Vettori duali . . . . . . . . . .
3.3 Mappa differenziale e pullback . . . .
3.3.1 Mappa differenziale . . . . . .
3.3.2 Pullback . . . . . . . . . . . . .
3.4 Fibrati . . . . . . . . . . . . . . . . . .
3.4.1 Fibrato tangente . . . . . . . .
3.4.2 Definizione generale di fibrato .
3.4.3 Fibrati principali . . . . . . . .
3.4.4 Applicazione . . . . . . . . . .
3.5 Connessioni sui fibrati . . . . . . . . .
3.5.1 La uno-forma di connessione .
3.5.2 Derivata covariante e curvatura
3.5.3 Applicazione . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . .
. . . . .
. . . . .
. . . . .
d’onda .
. . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
A Forme differenziali e algebra esterna
28
A.1 Tensori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
A.2 Forme differenziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
A.3 Derivata esterna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
B Gruppi di Lie e algebre di Lie
B.1 Gruppi di Lie . . . . . . . . . . . . . .
B.2 Algebre di Lie . . . . . . . . . . . . . .
B.3 L’azione dei gruppi di Lie sulle varietà
B.4 Derivata di Lie . . . . . . . . . . . . .
Riferimenti bibliografici
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
30
30
31
32
33
35
2
1
Introduzione
Sin dai primi esperimenti condotti per indagare la natura dei fenomeni elettrici i fisici
si accorsero di un profondo legame che univa quest’ultimi ai fenomeni magnetici, questo
legame ha condotto inizialmente a ripetuti errori o a confondere i due. Il fisico scozzese
James Clerk Maxwell nel 1865 riuscı̀ a dare un’adeguata formulazione unitaria scrivendo
le equazioni dell’elettromagnetismo.
Nonostante il profondo legame esistente tra il campo elettrico e il campo magnetico risulta
evidente persino ai meno esperti di fisica che si palesa un’evidente asimmetria nel mondo
fisico e di conseguenza nelle equazioni di Maxwell; infatti, se le cariche elettriche sono state
osservate e studiate, le cariche magnetiche non sono mai state osservate singolarmente ma
solo in configurazione di dipolo. Ciò comporta che il flusso del campo magnetico attraverso
una superficie chiusa, che contenga o meno un dipolo magnetico, è nullo; questa relazione
è descritta efficacemente dalla seconda equazione di Maxwell.
Nonostante lo stesso Maxwell fosse guidato dall’analogia come metodo per l’indagine teorica, il primo fisico che cercò di comprendere la natura di questa asimmetria fu Paul Adrien
Maurice Dirac che può essere considerato a tutti gli effetti uno dei padri della moderna
fisica teorica.
Dirac, nel suo articolo del 1931 (vedi [1]), spiega che il metodo più efficace per l’indagine
fisica non sta sul basarsi su nuove idee sorte spontaneamente, in quanto la fisica moderna
poggia le basi su una matematica molto avanzata, ma impiegare gli sforzi per perfezionare
e generalizzare il formalismo matematico su cui si basa la teoria. Una volta raggiunti dei
successi in questo ambito è necessario interpretare in senso fisico i nuovi oggetti matematici trovati. Del resto ci si aspetta che la matematica progredisca e diventi sempre più
complicata, ma resti poggiata su un certo gruppo di assiomi, mentre lo sviluppo della fisica
moderna richiede una matematica che cambi continuamente le sue basi e diventi sempre
più astratta.
Dirac, spinto da una ricerca di simmetria e dualità nella descrizione del mondo che ci
circonda, nel 1930 pubblicò un’articolo che prevedeva l’esistenza dell’antiparticella (positrone), ovvero una particella dotata della stessa massa dell’elettrone ma carica opposta.
La conferma dell’esistenza dell’antiparticella positrone nel 1932 da parte di Carl Anderson
valse a Dirac il premio Nobel per la fisica nel 1933.
Nel 1931 Paul Dirac continuò la sua opera di unificazione e simmetrizzazione del mondo
fisico trattando per la prima volta il monopolo magnetico; cercando non solo di dare un’adeguata formulazione matematica del fenomeno ma anche di dare una spigazione fisica al
perchè questa particella non fosse stata osservata finora. Il risultato stupefacente a cui
arrivò Dirac nel suo articolo fu che, non solo la trattazione usata per descrivere il monpolo magnetico era compatibile con i principi generali della meccanica quantistica non
restingendo in alcuna maniera la loro interpretazione fisica, ma la quantizzazione della
carica elettrica conduceva automaticamente alla condizione di quantizzazione della carica
magnetica e viceversa. Infatti la quantizzazione della carica elettrica è da sempre ritenuta
un’evidenza sperimentale ma grazie la teoria dei monopoli che Dirac sviluppa in seguito
nell’articolo del 1948 (vedi [2]) sembra aver trovato anche un fondamento teorico.
Al di là dell’esistenza o meno del monopolo magnetico, la grande scoperta di Dirac non è
nel campo fisico ma nel campo epistemologico. Infatti la convinzione di Dirac di ricercare
una simmetria o dualità nel mondo naturale e l’interesse a far progredire di pari passo
matematica e fisica ha portato i fisici delle generazioni successive a ragionare in maniera
completamente differente. Questa nuova forma mentis è stata una costante nella rapida
evoluzione e formulazione della moderna teoria dei campi e teoria delle stringhe.
3
Questo lavoro di tesi sarà diviso in tre sezioni diverse, ovvero:
ˆ Trattazione fisica del monopolo. Presenteremo una descrizione del monopolo
basandoci esclusivamente sulle conoscenze fisiche apprese nei corsi di elettromagnetismo. Nella seconda parte di questa sezione seguiremo e presenteremo il problema
come fece Dirac nel suo articolo del 1931.
ˆ Nozioni di Geometria Differenziale. Questa sezione è una presentazione di
elementi di geometria differenziale necessari per poter affrontare la descrizione del
monopolo magnetico in maniera geometrica.
ˆ Trattazione geometrica del monopolo. Alla luce di quanto presentato nella sezione precedente andiamo ad affrontare il problema del monopolo magnetico usando
le nozioni di geometria differenziale sia come mezzo per descrivere il fenomeno sia
come mezzo d’indagine fisica per casi più complessi.
Riportiamo un passo tratto integralmente dall’articolo di Dirac del 1931 in cui l’autore
presenta la propria idea sul ruolo della matematica nella moderna fisica teorica:
“Il continuo progresso della fisica richiede per la sua formulazione teorica una matematica
che diventi continuamente sempre più avanzata. [...] La matematica diventerà sempre più
complicata, ma resterà permanentemente poggiata su una base di assiomi e definizioni,
mentre attualmente lo sviluppo della moderna fisica teorica richiede una matematica che
cambi continuamente le sue basi e diventi più astratta. [...] Questo processo di continua
astrazione proseguirà nel futuro e ciò in fisica è associato ad una continua modificazione
e generalizzazione degli assiomi alla base della matematica piuttosto che ad uno sviluppo
logico di un qualsiasi schema matematico su delle basi fissate. [...] Il più potente metodo
d’indagine che può essere consigliato attualmente è di impiegare tutte le risorse che abbiamo di matematica nel tentativo di perfezionare e generalizzare il formalismo su cui si
basa la fisica, e dopo ogni successo in questa direzione, di provare a interpretare i nuovi
oggetti matematici in termini di entità fisiche.”
4
2
2.1
Trattazione fisica del monopolo
Una prima trattazione
Per studiare il monopolo magnetico iniziamo cercando un’analogia con il monopolo elettrico; partiamo per prima cosa dalle equazioni di Maxwell nel caso non stazionario in
presenza di cariche elettriche, quindi:
∇·E=ρ
∇·B=0
∂B
∇×E=−
∂t
∂E
∇×B=J+
∂t
dove E e B sono rispettivamente il campo elettrico e il campo magnetico, mentre ρ è la
densità di carica e J è la densità di corrente.
Sfruttando la seconda e la terza equazione di Maxwell possiamo scrivere i campi esplicitando la dipendenza dal potenziale vettore A e dal potenziale scalare φ, abbiamo quindi:
B=∇×A
∂A
E=−
− ∇φ
∂t
(1)
(2)
queste due equazioni sono invarianti per trasformazioni di gauge, ovvero:
A → A + ∇Λ
dΛ
φ→φ−
dt
(3)
(4)
dove Λ è una qualsiasi funzione scalare. Possiamo, inoltre, unire il potenziale vettore
e il potenziale scalare in un singolo quadrivettore di Lorentz chiamato quadripotenziale
elettromagnetico definito come:
Aµ = (φ, A)
e riscriverci la trasformazione di gauge come:
Aµ → Aµ + ∂µ Λ.
(5)
A questa trasformazione daremo un particolare significato geometrico quando andremo a
descrivere la trattazione matematica.
Sappiamo dall’elettromagnetismo che la soluzione per le equazioni di Maxwell corrispondenti ad una carica elettrica puntiforme posizionata nell’origine sarà:
E(r) =
qr
.
r3
In analogia, se modificassimo la seconda equazione di Maxwell in modo da poter permettere
l’esistenza di monopoli magnetici, ci aspetteremmo che il campo magnetico generato da
una carica puntiforme magnetica posizionata nell’origine avesse la stessa forma funzionale
del campo elettrico, quindi:
gr
(6)
Bm (r) = 3 .
r
Adesso ci chiediamo quale sia il potenziale vettore associato ad un monopolo magnetico;
per fare ciò supponiamo di considerare un solenoide infinitesimo con momento magnetico
5
dm = µg0 dl0 , con dl0 che individua una lunghezza infinitesima in punto generico x0 del
solenoide, quindi avremo che:
dA = −µ0 dm × ∇
1
|x − x0 |
integriamo, in modo da avere uno degli estremi del solenoide nell’origine e l’altro estremo all’infinito lungo l’asse z, cosı̀ da poter considerare l’estremo nell’origine come un
monopolo:
Z 0
Z 0
1
1
0
A = −g
dl × ∇
(7)
= −g
dz 0 k̂ × ∇
0
|x − x |
|x − z 0 k̂|
−∞
−∞
risolvendo l’integrale e scrivendo il potenziale vettore in componenti avremo:
Ax =
−gy
r(r + z)
Ay =
−gx
r(r + z)
Az = 0
passando in coordinate sferiche (r, θ, φ) sarà:1
A(r) =
g(1 − cos θ)
êφ
r sin θ
(8)
Se facciamo il rotore del potenziale vettore A troviamo, grazie all’equazione (1), il campo
B, partendo dalla (7), si ha che:
Z 0
1
∇ × A = g∇ × ∇ × k̂
dz 0
|x − z 0 k̂|
−∞
"
#
Z 0
Z 0
k̂
k̂
0
2
0
=g ∇·∇·
dz − ∇
dz
−∞ |x − z 0 k̂|
−∞ |x − z 0 k̂|
Z 0
Z 0
∂
1
0
dz + 4πgk̂
δ 3 (x − z 0 k̂) dz 0
= −g∇
−∞
−∞ ∂z |x − z 0 k̂|
Z 0
1
= −g∇
+ 4πgk̂δ(x)δ(y)
dz 0 δ(z − z 0 )
|x|
−∞
r
= g 3 + 4πgk̂δ(x)δ(y)θ(−z).
r
Notiamo subito che il rotore del potenziale vettore non è ovunque uguale al campo Bm
ma ha una singolarità sull’asse z, per z negativi; notiamo anche che questa singolarità
è diretta, ricordando la nostra scelta, lungo l’asse del solenoide. Questa singolarità è
chiamata stringa di Dirac, ed è proprio grazie a questa singolarità che abbiamo un flusso
nullo attraverso una superficie chiusa che ingloba il monopolo, infatti calcolando il flusso
del campo B = ∇ × A abbiamo che:
Z
Z
Z
Φ=
B · dS =
∇ × A · dS =
∇ · (∇ × A) dV = 0.
S
S
V
Andiamo ora a calcolare il valore del flusso di Bm e vediamo come sia determinante ai
fini del risultato finale la presenza della singolarità, il flusso del campo Bm attraverso una
superficie chiusa sarà:
Z
Z
Z
r
r
∇ · 3 dV
Bm · dS =
g 3 · dS = g
r
V
S
S r
1
êφ = − sin φêx + cos φêy .
6
ma sapendo che:
r
1
= 4πδ 3 (r)
∇
= −∇ · ∇
3
r
r
2
possiamo risolvere immediatamente l’integrale:
Z
Z
4πgδ 3 (r)dV = 4πg.
∇ · Bm =
Φ=
(9)
V
V
Rifacciamo adesso l’integrale della pagina precedente sfruttando la relazione (1), questa
volta però non integriamo su tutta la superficie ma su una calotta S del polo nord (θ = 0)
con bordo C, avremo che il flusso uscente sarà:
Z
Z
I
Φ=
B · dS = (∇ × A) · dS = A · dl
S
S
C
sostituendo la relazione (8) nell’integrale otteniamo:
Z
I
2π
g(1 − cos θ)dφ = 2πg(1 − cos θ)
A · dl =
Φ=
C
(10)
0
ovviamente abbiamo una dipendenza del flusso dall’angolo θ in quanto integrando sulla
curva C abbiamo integrato in φ. Notiamo inoltre che se θ → π ritroviamo il valore del
flusso calcolato in (9).
Supponiamo adesso di non ricoprire interamente il monopolo con la calotta S ma di lasciare
una superficie infinitesima al polo sud (θ = π), il valore del flusso attraverso la calotta
nord tende al valore trovato in (9). Notiamo che il flusso attraverso la calotta sud ha
valore assoluto uguale al flusso attraverso la calotta nord ma segno opposto in quanto il
cammino sul bordo C questa volta sarà percorso in senso contrario, quindi, se attraverso
la calotta nord abbiamo un flusso uscente, attraverso la superficie infinitesima abbiamo
un flusso entrante di pari valore. Affinchè il flusso attraverso la superficie chiusa sia nullo,
dobbiamo avere un flusso uscente pari al flusso entrante e questo flusso entrante è dato
proprio da quella che abbiamo chiamato stringa di Dirac.
Quindi abbiamo capito che la singolarità lungo l’asse z è determinante affinchè si abbia un
monopolo magnetico, dall’altro canto capiamo che A non basta a descrivere globalmente
il monopolo, in quanto la relazione (1) è una relazione locale mentre quando calcoliamo
il flusso andiamo a considerare tutta la superficie sferica che ingloba il monopolo; in
altre parole, il passaggio dal locale al globale ci porta ad una singolarità. Per evitare
questo problema dobbiamo usare un’altro potenziale vettore per la calotta sud; A = AN
corrisponde al potenziale vettore per la calotta nord mentre AS è il corrispondente per la
calotta sud, quest’ultimo sarà speculare al primo infatti lo scriviamo come:
ASx =
gy
r(r − z)
ASy =
in coordinate sferiche:
AS (r) = −
−gx
r(r − z)
g(1 + cos θ)
êφ .
r sin θ
ASz = 0
(11)
Vediamo ora come l’introduzione di AS ci permetta di calcolare il flusso senza incappare
nella singolarità.
7
2.1.1
Il monopolo di Wu-Yang
Nel 1975 Wu e Yang (vedi [3]) furono i primi a notare che una strada possibile per evitare
la singolarità era di introdurre più di un potenziale vettore per descrivere il monpolo; in
genere si usa AN per l’emisfero nord e AS per l’emisfero sud della sfera S contenente un
monpolo che dà origine a un campo magnetico B = g rr3 senza singolarità. Notiamo che
all’equatore, dove i due emisferi si toccano, AN e AS sono legati da una trasformazione
di gauge (3):
AN − AS = ∇Λ
infatti sostituendo le relazioni (8) e (11) troviamo:
AN − AS =
2g
êφ = ∇(2gφ).
r sin θ
Nell’ultimo passaggio abbiamo usato il gradiente in coordinate sferiche:
∇f =
∂f
1 ∂f
1 ∂f
êr +
êθ +
êφ .
∂r
r ∂θ
r sin θ ∂φ
Quindi abbiamo che:
Λ = 2gφ.
(12)
Notiamo che, come prima, abbiamo delle singolarità per θ = 0 e θ = π ma effettuando
la traformazione di gauge per θ = π2 , passando da AN a AS , integrando su tutta la sfera
non incontriamo singolarità. Quindi se ci andiamo a calcolare il flusso totale in questa
configurazione, abbiamo:
Z
Z
Z
Φ=
∇ × A · dS =
∇ × AN · dS +
∇ × AS · dS
S
UN
US
dove UN e US sono rispettivamente l’emisfero nord e l’emisfero sud, usando il teorema di
Stokes otteniamo:
I
I
I
N
S
Φ=
A · ds −
A · ds =
(AN − AS ) · ds
equatore
equatore
equatore
I
=
∇(2gφ) · ds = 4gπ.
equatore
Il risultato trovato è uguale a quello trovato precedentemente tramite la (9).
2.1.2
Quantizzazione della carica
Consideriamo adesso una particella puntiforme di carica e e massa m che si muove in
un campo generato da un monopolo magnetico di carica g. Se il monopolo è abbastanza
pesante, l’equazione di Schrödinger della particella sarà:
1 e 2
p − A ψ(r) = Eψ(r)
2m
c
sappiamo che per trasformazioni di gauge A → A+∇Λ le funzioni d’onda devono cambiare
nel modo seguente:
ieΛ
ψ → exp
ψ = ψ0.
(13)
~c
Nel nostro caso:
ψ S (r) = exp
−ieΛ
ψ N (r).
~c
8
(14)
Nel nostro caso vogliamo vedere cosa succede sull’equatore, ovvero per θ = π2 , quindi
vediamo il comportamento delle funzioni d’onda quando percorriamo l’equatore da φ = 0
a φ = 2π. Siccome la funzione d’onda deve essere a un sol valore, dalla (14) e ricordando
che Λ = 2gφ, abbiamo che:
2eg
=n , n∈Z
(15)
~c
questa è la celebre condizione di quantizzazione di Dirac per le cariche magnetiche, infatti
se il monopolo magnetico esistesse, data la quantizzazione della carica elettrica, la carica
magnetica sarebbe quantizzata secondo la relazione:
g=
2.2
~cn
2e
,
n ∈ Z.
(16)
Articolo originale di Dirac
Dirac, nel suo articolo del 1931 “Quantised Singularities in the Electromagnetic Field ”,
è stato il primo a interrogarsi sull’asimmetria esistente in natura riguardo l’assenza di
cariche magnetiche isolate, per quanto osservato finora, rispetto la presenza di cariche
elettriche. Quanto faremo ora sarà ripercorrere l’articolo del 1931 per capire come Dirac
arrivò ad una formulazione del monopolo ed alla condizione di quantizzazione per le cariche
magnetiche.
2.2.1
Fasi non-integrabili delle funzioni d’onda
Nella seconda sezione dell’articolo Dirac introduce la teoria di gauge elettromagnetica
partendo da considerazioni sulle fasi delle funzioni d’onda. Dirac considera una partcella
il cui moto è rappresentato da una funzione d’onda ψ che è in genere funzione di x, y, z e
t, e sempre in maniera generale, la esprime nella forma:
ψ = Aeiγ
(17)
dove A e γ sono rispettivamente l’ampiezza e la fase. Come sappiamo dai principi della
meccanica quantistica, la funzione d’onda ψ sarà univocamente determinata a meno di
una costante numerica reale arbitraria che si somma alla fase γ; inoltre la fase non ha
un valore definito in un certo punto, è solo possibile definire la differenza di fase tra due
punti. Nell’articolo Dirac fa un passo in più e assume che questa differenza sia definita
solo per due punti vicini. Per punti lontani la differenza di fase risulterà definita solo in
relazione alla curva che unisce i punti, curve differenti daranno quindi differenze di fasi
diverse. In generale quindi il cambiamento totale della fase lungo una curva chiusa può
non essere nullo.
Esaminiamo adesso il caso della non-integrabilità della fase, ovvero quando il cambiamento della fase lungo una curva chiusa non è nullo. Quanto detto finora da Dirac vale per
una singola funzione d’onda; se adesso si considerano due funzioni d’onda il loro prodotto scalare ha un preciso significato fisico. Affinché l’integrale abbia un modulo definito
l’integranda, pur non avendo una fase definita ad ogni punto, deve avere una differenza di fase tra due punti qualsiasi definita. Questo comporta che il cambiamento in fase
dell’integranda lungo una curva chiusa sia nullo. Ciò implica che il cambiamento di fase
di una qualsiasi funzione d’onda lungo una qualsiasi curva chiusa deve essere opposto al
cambiamento di fase della complessa coniugata di qualsiasi altra funzione d’onda lungo la
stessa curva. Quindi in generale il cambiamento di fase di una funzione d’onda lungo una
curva chiusa deve essere lo stesso per tutte le altre funzioni d’onda.
9
Questo risultato porta a pensare che il cambiamento di fase sia determinato dal sistema
dinamico stesso e sia indipendente dallo stato considerato; siccome il sistema dinamico è
una semplice perticella, risulta che la non-integrabilità delle fasi sia connessa con il campo
di forze in cui si muove la stessa particella.
Possiamo scrivere la nostra funzione d’onda come:
ψ = ψ1 eiβ
(18)
dove ψ1 è una funzione d’onda ordinaria con una fase definita in ogni punto il cui modulo
è ovunque uguale al modulo di ψ. L’incertezza sulla fase è stata raccolta tutta nel fattore
eiβ ; per quanto detto prima β non ha un valore definito per ogni punto, ma le sue derivate
hanno un valore definito ovunque2 :
κx =
∂β
∂x
κy =
∂β
∂y
κz =
∂β
∂z
κ0 =
∂β
∂t
in genere può non rispettare il teorema di Schwarz, o meglio le condizioni di integrabilità,
∂κy
x
ovvero ∂κ
∂y = ∂x e le altre. Il cambiamento di fase lungo una curva chiusa sarà, per il
teorema di Stokes:3
Z
Z
(κ, ds) = (rot κ, dS)
(19)
dove ds (4-vettore) è un’elemento infinitesimo della curva chiusa e dS (6-vettore) è un’elemento infinitesimo delle superficie bidimensionale il cui bordo è la curva chiusa. Ovviamente ψ1 non entra nel cambiamento di fase.
Notiamo che la non-integrabilità della fase è consistente con il principio di sovrapposizione, infatti se prendessimo due funzioni d’onda entrambe con lo stesso cambio di fase su
una qualsiasi curva chiusa, allora ogni combinazione lineare di queste due dovrebbe avere
lo stesso cambio di fase per ogni curva chiusa. Dalla (18) otteniamo, ad esempio per la
componente x:
∂
∂
iβ
−i~
+ ~κx ψ1
(20)
−i~ ψ = e
∂x
∂x
notiamo quindi che se ψ soddisfa l’equazione delle onde, coinvolgendo l’operatore momento
p e l’operatore energia W , allora ψ1 soddisfa la corrispondente equazione delle onde in
cui al posto di p e W abbiamo p + ~κ e W − ~κ0 , che non è altro che l’accoppiamento
minimale. 4
Assumiamo che ψ soddisfi la tipica equazione delle onde per una particella libera in assenza
di campo, allora ψ1 soddisferà quindi l’equazione delle onde per una particella di carica
−e che si muove in un campo magnetico in cui i potenziali sono5 :
A=
~c
κ
e
,
~
A0 = − κ0 .
e
Dato che ψ1 è un’ordinaria funzione d’onda con fase definita ritroviamo il caso conosciuto
di un’elettrone che si muove in un campo elettromagnetico. Ciò ci dà un’interpretazione
fisica della non-integrabilità della fase infatti, abbiamo visto che ψ deve soddisfare sempre
la stessa equazione che ci sia un campo o meno e l’effetto del campo, quando è presente,
è di rendere la fase non-integrabile.
2
Si pensi alla derivata come un limite della differenza di una funzione in due punti.
κ può differire per un gradiente di uno scalare.
4
Qui κ indica il trivettore le cui componenti sono state definite precedentemente.
5
Anche qui A indica un trivettore.
3
10
Le componenti del 6-vettore rot κ che compare in (19) sono, a meno di coefficienti numerici,
uguali alle componenti del campo elettrico e magnetico E e H, che scritte nella notazione
tridimensionale sono:
e
∂κ
e
∇×κ= H
∇κ0 −
= E
(21)
~c
∂t
~
Quanto fatto finora ci mostra che la non-integrabilità delle fasi è perfettamente compatibile
con i principi generali della meccanica quantistica e non restringe in alcun modo la loro
interpretazione fisica.
2.2.2
Singolarità nodali
Finora abbiamo ripercorso il ragionamento descritto dall’articolo di Dirac per cui la nonintegrabilità della fase di una funzione d’onda ha una naturale interpretazione in termini
dei potenziali del campo elettromagnetico, portandoci ad una formulazione della teoria che
è completamente equivalente a quella usuale di un’elettrone in un campo elettromagnetico. Dirac nell’articolo prende in considerazione il fatto aggiuntivo che una fase è sempre
determinata a meno di un multiplo intero di 2π.
Avevamo posto, per non avere ambiguità nell’interpretazione fisica, che il cambio totale
di fase lungo una curva chiusa fosse lo stesso per ogni funzione d’onda e l’avevamo interpretato, nelle equazioni (19) e (21), come il flusso totale attraverso la curva chiusa del
6-vettore rot κ che descrive il campo elettromagnetico. Rilassiamo adesso questa relazione
ammettendo che il cambiamento di fase lungo una curva chiusa possa differire di 2π per
differenti funzioni d’onda.
Si consideri inizialmente una curva chiusa molto piccola; l’equazione d’onda richiede che la
funzione d’onda sia continua quindi il cambio di fase lungo una curva chiusa piccola sarà
piccolo. Quindi questo cambio non può che differire per multipli interi di 2π per differenti
funzioni d’onda e può essere interpretato senza ambiguità in termini del flusso attraverso
la piccola curva chiusa, inoltre anche questo flusso deve essere piccolo.
C’è un caso particolare di cui tener conto, ovvero quando la funzione d’onda si annulla e la
sua fase non ha significato. Considerando la funzione d’onda complessa in tre dimensioni,
in generale i punti in cui si annulla giaceranno lungo una linea, chiameremo questa linea,
linea nodale. Consideriamo adesso una funzione d’onda avente una linea nodale passante
dentro la nostra piccola curva chiusa, quanto detto in precedenza riguardo la continuità
non sarà più valido, infatti non possiamo più dire che il cambio di fase lungo la curva
chiusa piccola deve essere piccolo. Tutto ciò che possiamo dire è che il cambio di fase sarà
vicino a 2πn con n intero, positivo o negativo, peculiare della linea nodale. Il segno sarà
associato alla direzione con cui si percorre la curva chiusa attorno la linea nodale.
La differenza tra il cambio di fase lungo la piccola curva chiusa e il più vicino 2πn deve
essere uguale al cambio di fase di una funzione d’onda lungo una curva chiusa senza linea
nodale dentro, è quindi questa differenza che deve essere interpretata in termini del flusso
del 6-vettore (E, H) attraverso la curva chiusa. Per una curva chiusa in tre dimensioni
entra in gioco solo il campo magnetico, quindi il cambio di fase lungo una curva chiusa
piccola sarà:
Z
e
2πn +
· (H, dS) .
~c
Si può trattare le curve chiuse grandi dividendole in tante piccole curve chiuse giacenti
sulla superficie il cui bordo è la curva grande, il cambiamento di fase lungo la curva chiusa
grande sarà uguale alla somma di tutti i cambi lungo le curve piccole, quindi:
Z
X
e
· (H, dS)
(22)
2π
n+
~c
11
dove l’integrale è su tutta la superficie e la sommatoria è su tutte le linee nodali che ci
passano attraverso. Il secondo termine è uguale per tutte le funzioni d’onda mentre il
primo,come già detto, può essere differente per differenti funzioni d’onda.
L’espressione (22) applicata a qualsiasi superficie è uguale al cambio di fase lungo il bordo
di quest’ultima; quindi l’espressione
(22) applicata ad una superficie chiusa deve annullarP
si. Perciò abbiamo che
n, somma su tutte le linee nodali che attraversano la superficie
e
chiusa, deve essere uguale per tutte le funzioni d’onda e pari a − 2π~c
per il flusso magneticoP
totale che attraversa la superficie.
Se
n non si annulla implica che qualche linea nodale deve avere il punto di fine, o
estremale, all’interno della superficie; infatti una linea nodale senza punto di fine attraversa la superficie almeno due volte, o comunque un numero pari di volte, quindi darebbe
contributo
uguale ed opposto alla sommatoria nei due punti di intersezione. Il valore di
P
n per una superficie chiusa sarà uguale alla somma dei valori di n delle linee nodali
con punti di fine all’interno della superficie. Questa somma deve essere uguale per tutte
le funzioni d’onda. Segue che i punti di fine delle linee nodali devono essere gli stessi per
tutte le funzioni d’onda, quindi questi punti di fine sono punti di singolarità del campo
elettromagnetico.
Notiamo quindi che queste linee nodali non sono altro che le stringhe di Dirac che abbiamo
incontrato precedentemente. Quindi il flusso totale del campo magnetico attraverso una
piccola superficie chiusa che circonda uno di questi punti di singolarità sarà:6
Φ = 4πµ = 2πn
~c
e
dove n è caratteristico per la linea nodale che finisce all’interno della superficie, oppure è
la somma di tutti gli n per ogni linea nodale che finisce all’interno quando ce n’è più di
una. In termini fisici, nel punto di fine ci sarà un monopolo magnetico di carica:
µ=
n~c
2e
che è la quantizzazione della carica come trovata nella relazione (16) con µ = g. Dirac
nota che la carica magnetica deve essere quantizzata in relazione alla carica elettrica e in
base alla relazione:
~c
= 2.
eµ0
Dirac fa notare come viene naturale confrontare questa relazione con quella che definisce
sperimentalmente la costante di struttura fine:
~c
= 137 .
e2
6
Abbiamo assunto la carica magnetica con segno.
12
(23)
3
Nozioni di Geometria Differenziale
Prima di passare alla trattazione matematica del monopolo è necessario introdurre gli
stumenti necessari per una descrizione rigorosa del fenomeno. In particolare Wu, Yang e
Mills notarono che le proprietà geometriche e topologiche del monopolo erano efficacemente
descritte dalla geometria differenziale, in particolare dai fibrati. Ma per arrivare ad avere
una visione completa sui fibrati bisogna prima definire molti altri oggetti matematici. Per
le nozioni di matematica ci riferiamo ai libri [4] e [5].
3.1
Varietà differenziabili
Definizione 1. M è una varietà differenziabile m-dimensionale se
ˆ M è uno spazio topologico
ˆ M ha una famiglia di carte (Ui , ϕi )
ˆ Ui è una famiglia di aperti che ricopre M tale che ∪i Ui = M . ϕi è un omeomorfismo
da Ui ad un sottospazio aperto Ui0 di Rm
ˆ dati Ui , Uj aperti tali che Ui ∩ Uj 6= ∅, la mappa ψij = ϕi ◦ ϕ−1
da ϕj (Ui ∩ Uj ) a
j
ϕi (Ui ∩ Uj ) è infinitamente differenziabile
Questa definizione ci serve per dire che localmente, cioè negll’aperto coordinato Ui ,
la nostra varietà M la possiamo vedere come un sottoinsieme di Rm grazie alla ϕi , detta
anche funzione coordinata o coordinata, che per definizione è un omeomorfismo tra Ui
ed un sottospazio aperto Ui0 di Rm ; ciò però non implica che M sia un’aperto di Rm
globalmente. Ad esempio non è possibile accorgerci che ci troviamo su una sfera solamente
guardando una cartina topografica di una città.
3.2
3.2.1
Vettori e vettori duali
Vettori
Sulla varietà M un vettore è definito essere un vettore tangente ad una curva di M , quindi
prendiamo una curva c : (a, b) → M e una funzione f : M → R, con (a, b) un’intervallo
aperto di R che contiene t = 0. Definiamo il vettore tangente in c(0) come la derivata
direzionale della funzione f (c(t)) lungo la curva c(t) per t = 0, quindi sarà:
df (c(t))
|t=0
dt
in coordinate diventa:
∂f dxµ (c(t))
|t=0
∂xµ
dt
(da notare l’abuso di notazione, in quanto la prima derivata
∂(f ◦ϕ−1 (x))
).
∂xµ
∂f
∂xµ
in realtà rappresen-
ta
Abbiamo ottenuto la derivata di f rispetto a t applicando l’operatore
differenziale X a f :
dxµ (c(t))
µ ∂
µ
X=X
,
X =
|t=0
∂xµ
dt
quindi possiamo scrivere:
df (c(t))
∂f
|t=0 = X µ µ = X[f ]
dt
∂x
13
Adesso abbiamo una definizione di vettore tangente, infatti l’ultima uguaglianza definisce
X. Chiameremo X = X µ ∂x∂ µ il vettore tangente a M in p = c(0) lungo la curva c(t). Questo vettore appartiene allo spazio tangente denotato come Tp M con dim Tp M = dim M ; il
nostro vettore ha componenti X µ e Tp M è generato dai vettori di base ∂x∂ µ .
3.2.2
Vettori duali
Siccome abbiamo visto che Tp M è uno spazio vettoriale, esisterà uno spazio vettoriale duale
a Tp M , di dimensione uguale, i cui elementi sono funzioni lineari che vanno da Tp M a R.
Lo spazio duale lo chiameremo spazio cotangente denotato da Tp∗ M , un’elemento dello
spazio denotato con ω : Tp M → R si chiama vettore duale, vettore cotangente oppure
uno-forma. Il più semplice esempio di uno-forma è il differenziale df con f definita come
in precedenza. Definiamo l’azione di df ∈ Tp∗ M su X ∈ Tp M come:
∂f
|p ∈ R
∂xµ
∂f
se esprimessimo il differenziale nelle sue coordinate df = ∂x
dxµ noteremmo che è
µ
naturale considerare dxµ come base di Tp∗ M , con:
hdf, Xi|p ≡ X[f ]|p = X µ
∂
∂xν
i
=
= δµν
∂xµ
∂xµ
quindi uno uno-forma arbitraria ω si scriverà:
hdxµ ,
ω = ωµ dxµ
dove ωµ sono le componenti di ω.
3.3
3.3.1
Mappa differenziale e pullback
Mappa differenziale
Una mappa smooth, o differenziabile, f : M → N induce naturalmente una mappa f∗
chiamata mappa differenziale o tangente:
f∗ : Tp M → Tf (p) N.
Volendo vedere come agisce la mappa, se prendiamo g : N → R, ovvero g ∈ F(N ), quindi
g ◦ f ∈ F(M ) e un vettore V ∈ Tp M possiamo definire f∗ V ∈ Tf (p) N come:
(f∗ V )[g] ≡ V [g ◦ f ]
in termini di carte (U, ϕ) su M e (V, ψ) su N :
(f∗ V )[g ◦ ψ −1 (y)] ≡ V [g ◦ f ◦ ϕ−1 (x)]
dove x = ϕ(p) e y = ψ(f (p)).
3.3.2
Pullback
Un’altra mappa indotta naturalmente dalla mappa f : M → N è:
f ∗ : Tf∗(p) N → Tp∗ M
notiamo che f∗ va nella stessa direzione di f , mentre f ∗ va nella direzione contraria da
qui il nome pullback. Se prendiamo V ∈ Tp M e ω ∈ Tf∗(p)N il pullback di ω tramite f ∗ è
definito come:
hf ∗ ω, V i = hω, f∗ V i.
Questa mappa ci sarà molto utile nel proseguo.
14
3.4
Fibrati
Abbiamo visto che una varietà è uno spazio topologico che localmente può essere visto
come Rm ma non necessariamente globalmente. Adesso andiamo a vedere cosa possiamo
costruire sopra la nostra varietà, partiamo da un esempio semplice per arrivare al caso
generale.
3.4.1
Fibrato tangente
Il fibrato tangente T M su una varietà m-dimensionale è un unione di tutti gli spazi tangenti
di M :
[
TM ≡
Tp M.
p∈M
Sia Ui un ricoprimento aperto di M , se xµ = ϕi (p) è la coordinata su Ui , un’elemento di:
[
T Ui ≡
Tp M
p∈Ui
è determinato da un punto p ∈ M e un vettore V = V µ (p) ∂x∂ µ |p ∈ Tp M . Quindi un punto
appartenente al fibrato tangente in componenti sarà (p, V ). Notiamo che di conseguenza
T Ui sarà identificato con il prodotto diretto Rm × Rm in quanto Ui è omeomorfo ad un
aperto di ϕ(Ui ) di Rm e ogni Tp M è omeomorfo a Rm . In sostanza T Ui è una varietà
differenziabile 2m-dimensionale che può essere decomposta in Ui × R.7
Preso un punto u ∈ T Ui possiamo sempre separare le informazioni che u contiene riguardo
a p ∈ M e V ∈ Tp M . Possiamo definire naturalmente la proiezione come:
π : T Ui → Ui
ogni punto u ∈ T Ui viene portato tramite π(u) in p ∈ M . Abbiamo che π −1 (p) = Tp M ,
chiamaremo Tp M la fibra in p.
In generale una varità è l’unione di più aperti perciò vogliamo vedere come si comporta
un vettore V definito in p ∈ Ui ∩ Uj , questo infatti avrà due rappresentazioni in due set
di coordinate diverse. Siccome il vettore è lo stesso, esisterà una traformazione che ci
permetterà di passare da una base all’altra (o da un set di coordinate all’altro); questa
trasformazione sarà una matrice che apparterrà a GL(m, R), questo gruppo (Vedi Appendice B ) si chiamerà gruppo di struttura di T M .
Definiamo ora una mappa M → T M , che ci permette di assegnare un vettore X|p ∈ Tp M
ad ogni punto p ∈ M . Questa mappa inversa si chiama sezione o campo di vettori ed è
definita come una mappa smooth, o differenziabile, s : M → T M tale che π ◦ s = idM . Se
una sezione è definita solo su una carta Ui si chiama sezione locale si : Ui → T Ui .
3.4.2
Definizione generale di fibrato
Diamo adesso una definizione generale dei fibrati.
Definizione 2. Un fibrato (E, π, M, F, G) è composto dai seguenti elementi:
1. Una varietà differenziabile E chiamata spazio totale
7
Un’esempio tratto dall’esperienza quotidiana che ci ricorda il concetto di fibrato è la spazzola; infatti
la base la possiamo vedere come una varietà e le setole come dei vettori normali (fibre) la cui unione
rappresenta il fibrato.
15
2. Una varietà differenziabile M chiamata spazio di base
3. Una varietà differenziabile F chiamata fibra
4. Una mappa π : E → M chiamata proiezione, l’immagine dell’inversa π −1 = Fp ∼
=F
è chiamata la fibra in p
5. Un gruppo di Lie G chiamato gruppo di stuttura che agisce su F a sinistra
6. Un ricoprimento aperto Ui di M e un diffeomorfismo φi : Ui × F → π −1 (Ui ) tale che
π ◦ φi (p, f ) = p. La mappa φi è chiamata trivializzazione locale
7. Se scriviamo φi (p, f ) = φi,p (f ) la mappa φi,p : F → Fp è un diffeomorfismo. Se
prendiamo Ui ∩ Uj 6= ∅ richiediamo che tij (p) ≡ φ−1
i,p ◦ φj,p : F → F sia un’elemento
di G. Quindi abbiamo la relazione:
φj (p, f ) = φi (p, tij (p)f )
data dalla mappa smooth tij : Ui ∩ Uj → G chiamata funzione di transizione.
Andiamo a caratterizzare le nostre funzioni di transizione, infatti vogliamo che queste
rispettino le seguenti condizioni di consistenza:
tii (p) = mappa identità
tij (p) = t−1
ji (p)
tij (p) · tjk (p) = tik (p)
(p ∈ Ui )
(p ∈ Ui ∩ Uj )
(p ∈ Ui ∩ Uj ∩ Uk )
queste proprietà sono necessarie affinché i pezzi del fibrato possano essere incollati coerentemente. Se tutte le funzioni di transizione possono essere la mappa identica allora il
fibrato si chiama fibrato triviale o banale.
Riesaminando, alla luce della definizione, quanto detto precedentemente sulle sezioni nel
caso del fibrato tangente abbiamo che l’insieme delle sezioni su M è identificato con
l’insieme dei vettori definiti su M .
3.4.3
Fibrati principali
I fibrati principali sono quei fibrati che hanno per fibra F il gruppo di struttura G. Il
fibrato principale P →π M si indica anche con P (M, G) e si chiama fibrato G su M .
Come già detto nella definizione le funzioni di transizione agiscono a sinistra, ma possiamo
definire anche l’azione su F a destra. Sia φi : Ui × G → π −1 (Ui ) una trivializzazione locale
quindi la azione a destra di G su π −1 (Ui ) è definita come:
a ∈ G , π(u) = p
ua = φi (p, gi a)
si dimostra che questa definizione è indipendente dalla trivializzazione scelta, infatti:
ua = φi (p, gi a) = φj (p, gj a).
Questa azione a destra è transitiva cioè per ogni u1 , u2 ∈ π −1 (p) esiste a ∈ G tale che
u1 = u2 a, quindi la fibra è costruita come π −1 (p) = {ua | a ∈ G}, dato un’elemento u tale
che π(u) = p. Data una sezione si (p) definita su Ui , definiamo una trivializzazione locale
preferenziale φi : Ui × G → π −1 (Ui ) chiamata trivializzazione locale canonica come:
si (p) = φi (p, e)
16
con e che è l’elemento neutro o identità di G 8 , si ha che:
φi (p, g) = φi (p, e)g = si (p)g.
Se p ∈ Ui ∩ Uj le due sezioni si (p), sj (p) sono legate dalla funzione di transizione tij (p)
come segue:
si (p) = φi (p, e) = φj (p, tji (p)e) = φj (p, tji (p)) =
= φj (p, e)tji (p) = sj (p)tji (p).
3.4.4
Applicazione
Sia P un fibrato principale con fibra U (1) = S1 e spazio base S2 . Questo fibrato principale
rappresenta la struttura topologica del monopolo di Dirac. Siano [UN , US ] due ricoprimenti
aperti di S2 dove i pedici indicano se si tratta dell’emisfero nord o sud. Se parametrizziamo
S2 con le classiche coordinate sferiche abbiamo:
h
i
π
UN = (θ, φ) | 0 ≤ θ ≤ + , 0 ≤ φ < 2π
2
h
i
π
US = (θ, φ) | − ≤ θ ≤ π, 0 ≤ φ < 2π
2
l’intersezione UN ∩ US è essenzialmente l’equatore. Siano φN , φS le trivializzazioni locali
tali che:
iαS
iαN
)
)
φ−1
φ−1
S (u) = (p, e
N (u) = (p, e
dove p = π(u). La funzione di transizione tN S (p) sarà nella forma einφ dove n deve essere
un numero intero cosicché tN S (p) sia ad un sol valore sull’equatore. Per la definizione di
funzioni di transizione le fibre sull’equatore saranno legate dalla relazione:
eiαN = einφ eiαS
Se n = 0 la funzione di transizione è l’elemento identità di U (1) e abbiamo un fibrato
triviale P0 = S2 × S1 . Se n 6= 0 il fibrato U (1) Pn è non banale (attorcigliato). Notiamo
che la struttura topologica del nostro fibrato è data da un numero intero 9 , quest’intero ci
dice come sono incollate le due sezioni all’equatore.
Dal momento che U (1) è un gruppo abeliano, la azione a destra e la azione a sinistra sono
equivalenti; applicando una azione a destra g = eiΛ otteniamo:
i(αN +Λ)
φ−1
)
N (ug) = (p, e
i(αS +Λ)
φ−1
).
S (ug) = (p, e
L’azione a destra corrisponde ad una trasformazione di gauge U (1).
3.5
Connessioni sui fibrati
Le connessioni sulle varietà riemanniane sono oggetti geometrici che ci permettono di confrontare vettori di spazi tangenti differenti, in questa sezione invece daremo una definizione
più astratta ma più adatta ad applicazioni fisiche in cui compaiono le trasformazioni di
gauge.
Sia u un’elemento del fibrato principale P (M, G) e sia Gp la fibra a p = π(u), definiamo
8
9
Vedi Appendice B.2-B.3.
Questo intero assume un preciso significato geometrico nella teoria delle classi di omotopia.
17
il sottospazio verticale Vu P come quel sottospazio di Tu P che è tangente a Gp in u.10
Vediamo adesso come possiamo costruire Vu P . Preso un’elemento A ∈ g, dove g = Lie(G),
l’azione a destra (vedi Appendice B ) definisce una curva in P :
Rexp(tA) u = u exp (tA)
siccome π(u) = π(u exp (tA)) = p, questa curva giace sulla fibra Gp . Definiamo un vettore
A] ∈ Tu P come:
d
A] f (u) = f (u exp (tA))|t=0
dt
dove f : P → R è una qualsiasi funzione differenziabile. Il vettore A] è tangente a P in u,
inoltre essendo tangente ad una curva che giace su Gp , appartiene al sottospazio verticale,
quindi A] ∈ Vu P . In questo modo abbiamo definito un campo di vettori A] chiamato
campo vettoriale fondamentale generato da A. Inoltre l’applicazione ] : g → Vu P data da
A 7→ A] è un’isomorfismo tra spazi vettoriali.
Una connessione su P determina univocamente il sottospazio orizzontale Hu P complementare di Vu P in Tu P .
Definizione 3. Sia P (M, G) un fibrato principale. Una connessione in P è un’unica separazione dello spazio tangente Tu P in sottospazio verticale Vu P e sottospazio orizzontale
Hu P tale che:
1. Tu P = Vu P ⊕ Hu P
2. Un campo vettoriale X su P è separato in due campi vettoriali X H ∈ Hu P e X V ∈
Vu P tali che X = X V + X H .
3. Hug P = Rg∗ Hu P per qualsiasi u ∈ P e g ∈ G
La condizione 3. afferma che i sottospazi orizzontali Hu P e Hug P sulla stessa fibra
sono collegati dalla mappa lineare Rg∗ indotta dalla azione a destra, di conseguenza un
sottospazio Hu P in u genera tutti i sottospazi orizzontali sulla stessa fibra.
3.5.1
La uno-forma di connessione
Un modo per separare lo spazio tangente Tu P in sottospazio verticale e sottospazio orizzontale è introdurre la uno-forma a valori su un’algebra di Lie ω ∈ g ⊗ T ∗ P chiamata
uno-forma di connessione.
Definizione 4. La uno-forma di connessione ω ∈ g ⊗ T ∗ P è una proiezione di Tu P nella
componente verticale Vu P ' g. Le proprietà della proiezione sono riassunte nelle seguenti
relazioni:
1. ω(A] ) = A
A∈g
2. Rg∗ ω = Adg−1 ω
cioè per X ∈ Tu P :
10
Rg∗ ωug (X) = ωug (Rg∗ X) = g−1 ωu (X)g.
Tu P è lo spazio tangente al fibrato P e non va confuso con lo spazio tangente Tp M alla varietà M .
18
Definiamo il sottospazio orizzontale Hu P come il kernel di ω:
Hu P ≡ {X ∈ Tu P | ω(X) = 0}
si può per far vedere che la definizione ora data di connessione è consistente con quella
data precedentemente, in particolare che il sottospazio orizzontale definito come sopra
soddisfa:
Hug P = Rg∗ Hu P.
La uno-forma di connessione ω è anche chiamata connessione di Ehresmann.
Sia Ui un ricoprimento aperto di M e sia σi una sezione locale definita per ogni Ui .
Conviene introdurre la uno-forma Ai a valore su un’algebra di Lie su Ui come:
Ai ≡ σi∗ ω ∈ g ⊗ Ω1 (Ui )
un teorema ci assicura che al contrario, data un’uno-forma Ai a valore su un’algebra di
Lie su Ui , possiamo ricostruire una uno-forma di connessione ω il cui pullback dato da σi∗
sia Ai .
Teorema 1. Data un’uno-forma a valore sull’algebra di Lie g Ai su Ui e una sezione
locale σi : Ui → π −1 (Ui ), allora esiste una connessione uno-forma tale che Ai = σi∗ ω.
Affinché ω sia definita in maniera univoca su P , la separazione Tu P = Vu P ⊕Hu P deve
essere unica, quindi dobbiamo avere ωi = ωj su Ui ∩ Uj . Per soddisfare questa condizione
Ai deve avere particolari proprietà di trasformazione.
Lemma. Sia P (M, G) un fibrato principale e siano σi , σj sezioni locali su Ui , Uj tali che
Ui ∩ Uj 6= ∅. Per X ∈ Tp M (p ∈ Ui ∩ Uj ), σi∗ X e σj∗ X soddisfano:
]
σj∗ X = Rt∗ij (σi∗ X) + (t−1
ij dtij (X))
dove tij : Ui ∩ Uj → G è la funzione di transizione.
Se applichiamo la uno-forma di connessione alla tesi del lemma sopra esposto, otteniamo:
σj∗ ω(X) = Rt∗ij ω(σi∗ X) + t−1
ij dtij (X)
−1
= t−1
ij ω(σi∗ X)tij + tij dtij (X)
l’equazione si riduce a:
−1
Aj = t−1
ij Ai tij + tij dtij
e questa è la condizione di compatibilità che stavamo cercando. Ai viene interpretato come
il potenziale di gauge e questa è la trasformazione di gauge.
3.5.2
Derivata covariante e curvatura
Partendo da come è stata definita la derivata esterna in Appendice A.3, questa si può
generalizzare a forme a valore su uno spazio vettoriale φ ∈ Ωr (P ) ⊗ V . Questo ci porta
alla definizione di derivata covariante.
Definizione 5. Sia φ ∈ Ωr (P ) ⊗ V e X1 , . . . , Xr+1 ∈ Tu P . Data una uno-forma di
connessione ω su un fibrato principale P , la derivata covariante di φ è definita:
H
Dφ(X1 , . . . , Xr+1 ) ≡ dp φ(X1H , . . . , Xr+1
)
dove dp φ ≡ dp φα ⊗ eα , con {eα } una base di V e XiH è la componente orizzontale della
decomposizione data da ω.
19
Grazie alla derivata covariante possiamo dare una definizione di curvatura che verifica
importanti proprietà.
Definizione 6. La due-forma di curvatura Ω è la derivata covariante della uno-forma di
connessione ω:
Ω ≡ Dω ∈ Ω2 (P ) ⊗ g.
La due-forma Ω soddisfa le due seguenti proprietà:
Proprietà 1. La due-forma di curvatura soddisfa:
Ra∗ Ω = a−1 Ωa
a ∈ Ω.
Proprietà 2. Siano X, Y ∈ Tu P . Allora Ω e ω soddisfano l’equazione di struttura di
Cartan:
Ω(X, Y ) = dp ω(X, Y ) + [ω(X), ω(Y )]
che si può anche scrivere come:
Ω = dp ω + ω ∧ ω.
La forma locale F della curvatura Ω è definita come:
F ≡ σ∗Ω
dove σ è una sezione locale. Se esprimiamo F in termini del potenziale di gauge A = σ ∗ ω
abbiamo:
F = dA + A ∧ A
infatti partendo dall’equazione di struttura di Cartan, otteniamo:
F = σ ∗ (dp ω + ω ∧ ω) = dσ ∗ ω + σ ∗ ω ∧ σ ∗ ω = dA + A ∧ A.
Sia A = Aµ dµ il potenziale di gauge, se scriviamo F = 21 Fµν dxµ ∧ dxν in componenti
abbiamo:
Fµν = ∂µ Aν − ∂ν Aµ + [Aµ , Aν ] .
La due-forma di curvatura F si identifica con il campo di Yang-Mills (vedi [6]).
Siccome Aµ e Fµν sono funzioni a valori in g, possono essere espanse in termini della base
{Tα } di g:
Aµ = Aµ α Tα
Fµν = Fµν α Tα
i vettori della base soddisfano la relazione di commutazione [Tα , Tβ ] = fαβ γ Tγ di conseguenza otteniamo l’ espressione:
Fµν α = ∂µ Aν α − ∂ν Aµ α + fβγ α Aµ β Aν γ .
Se Ui , Uj carte di M tale che Ui ∩ Uj 6= ∅ e Fi , Fj i rispettivi campi su Ui ∩ Uj questi
rispettano la condizione di compatibilità:
Fj = Adt−1 Fi = t−1
ij Fi tij
ij
dove tij è la funzione di transizione su Ui ∩ Uj , come si può dimostrare da Aj = t−1
ij Ai tij +
t−1
dt
.
ij
ij
Il potenziale di gauge A è chiamato puro gauge se A si può scrivere localmente come:
A = g−1 dg.
20
In questo caso il campo F è identicamente nullo.
Come già visto prima, possiamo espandere ω e Ω in termini della base Tα di g ottenendo:
ω = ω α Tα
Ω = Ωα Tα .
Riscrivendoci l’equazione di struttura di Cartan su questa base si ha:
α β
Ωα = dp ω α + fβγ
ω ∧ ωγ
e la derivata esterna ci porta a:
dp Ωα = fβγ α dp ω β ∧ ω γ − fβγ α ω β ∧ dp ω γ
(24)
ricordando che ω(X H ) = 0 per un vettore orizzontale X H , otteniamo:
DΩ(X, Y, Z) = dp Ω(X H , Y H , Z H ) = 0
con X, Y, Z ∈ Tu P . Cosı̀ facendo abbiamo provato l’identità di Bianchi :
DΩ = 0.
Volendoci trovare la forma locale dell’identità di Bianchi basta far operare σ ∗ su dp Ω
quindi otteniamo per la parte di destra della (24):
σ ∗ (dp ω ∧ ω − ω ∧ dp ω) = dσ ∗ ω ∧ σ ∗ ω − σ ∗ ω ∧ dσ ∗ ω
= dA ∧ A − A ∧ dA = F ∧ A − A ∧ F
mentre per la parte di sinistra di (24):
σ ∗ dp Ω = dσ ∗ Ω = dF
in totale otteniamo:11
DF = dF + [A, F] = dF + A ∧ F − F ∧ A = 0.
3.5.3
Applicazione
Prendiamo inizialmente un caso generale, ovvero, sia P (M, G) un fibrato principale su M
e sia U un’aperto di M . Se le sezioni locali σ1 , σ2 su U sono legate da σ2 (p) = σ1 (p)g(p)
allora le corrispondenti forme locali A1 , A2 sono legate dalla relazione:
A2 = g−1 A1 g + g−1 dg
che in componenti diventa:
A2µ = g−1 (p)A1µ g(p) + g−1 (p)∂µ g(p)
che è la trasformazione di gauge per un qualsiasi fibrato.
Se adesso prendiamo in considerazione il fibrato che descrive il monopolo magnetico, ossia,
prendiamo P come il fibrato U (1) su M e dati due aperti Ui , Uj tali che Ui ∩ Uj 6= ∅
definiamo le rispettive forme locali di connessione Ai , Aj . La funzione di transizione tij :
Ui ∩ Uj → U (1) è:
tij (p) = exp [iΛ(p)]
Λ(p) ∈ R
11
Notiamo che DF = dF per G = U (1).
21
e Ai , Aj sono legate dalla relazione:
−1
Aj (p) = t−1
ij Ai (p)tij + tij dtij
= Ai (p) + idΛ(p).
In componenti torniamo ad avere una relazione uguale alle relazione (5):12
Ajµ = Aiµ + i∂µ Λ.
12
Abbiamo una i a moltiplicare il secondo termine del membro di destra in quanto la nostra connssione
Aµ differisce dal potenziale vettore standard Aµ per un fattore dato dalla scelta degli operatori dell’algebra
di Lie anti-hermitiani:
Aµ = iAµ .
22
4
Trattazione geometrica del monopolo
Adesso che abbiamo le basi matematiche adatte possiamo trattare le teorie di gauge dal
punto di vista geometrico; come abbiamo più volte visto il potenziale di gauge dal punto
di vista geometrico può essere trattato come un’espressione locale di una connessione su
un fibrato principale.
4.1
Teorie di gauge U(1)
La teoria di Maxwell dell’elettromagnetismo è descritta dal gruppo di gauge U (1), essendo
U (1) un gruppo unidimensionale e abeliano possiamo omettere gli indici e poniamo le
costanti di struttura fαβ γ = 0. Supponiamo che il nostro spazio di base, o varietà, sia
lo spazio-tempo di Minkowski quadridimensionale; avremo allora, dato che lo spazio di
Minkowski si può contrarre a un punto, che il fibrato principale P con fibra U (1) è triviale
(banale) ed è necessaria una singola trivializzazione locale su M .
Il potenziale di gauge è:
A = Aµ dxµ
di conseguenza il campo è:
F = dA
in componenti abbiamo:
Fµν = ∂µ Aν − ∂ν Aµ
inoltre F soddisfa l’identità di Bianchi:
dF = F ∧ A − A ∧ F = 0.
(25)
Questo risultato non stupisce in quanto F è una forma esatta, F = dA. Scrivendo l’identità
di Bianchi in compenenti:
∂λ Fµν + ∂ν Fλµ + ∂µ Fνλ = 0
se identifichiamo le componenti Fµν = iFµν , dove per Fµν intendiamo le componenti del
tensore elettromagnetico definito come:13


0 −Ex −Ey −Ez
Ex
0
Bz −By 
.
Fµν = ∂µ Aν − ∂ν Aµ = 
(26)
Ey −Bz
0
Bz 
Ez By −Bx
0
La relazione (25) si riduce a due delle equazioni di Maxwell:
∇×E+
∂B
= 0,
∂t
∇·B=0
è importante notare che queste due equazioni sono state ottenute in maniera completamente geometrica, infatti abbiamo semplicemente applicato l’identità di Bianchi ad una
curvatura.
Per trovare le altre due equazioni, che corrispondono alla parte dinamicha delle equazioni
di Maxwell, dobbiamo specificare l’azione. Usiamo l’azione di Maxwell SM [A] che è un
funzionale di A ed è dato da:
Z
Z
1
1
µν 4
SM [A] ≡
Fµν F d x = −
Fµν F µν d4 x.
(27)
4 R4
4 R4
13
L’invarianza del tensore elettromagnetico per traformazioni di gauge è immediata.
23
Attraverso una variazione di SM [A] rispetto Aµ , otteniamo l’equazione di moto:
∂µ Fµν = 0
(28)
riscrivendo quest’ultima equazione in termini del campo elettrico E e del campo magnetico
B otteniamo le altre due equazioni di Maxwell nel vuoto:
∂E
∇·E=0
∇×B−
= 0.
∂t
4.2
Monopolo magnetico di Dirac
Abbiamo studiato la teoria dell’elettromagnetismo di Maxwell definita su R4 come fibrato
banale con fibra U (1), adesso proviamo ad estendere il nostro studio a fibrati U (1) non
triviali. Per semplicità supponiamo il tutto indipendente dal tempo.
Il monopolo di Dirac è definito in R3 senza l’origine O e abbiamo visto che il fibrato
principale che descrive al meglio le sue proprietà topologiche è un fibrato U (1) P (S2 , U (1)).
Le due carte per descrivere la sfera S2 sono:
h
i
h
i
π
π
UN ≡ (θ, φ) | 0 ≤ θ ≤ + US ≡ (θ, φ) | − ≤ θ ≤ π
0 ≤ φ ≤ 2π.
2
2
Prendiamo una connessione di Ehresmann ω su P e le sezioni locali σN , σS tali che sui
nostri aperti i potenziali di gauge locali :
∗
AN = σN
ω
,
AS = σS∗ ω
risultino l’analogo dei potenziali vettori AN , AS delle relazioni (8) e (11), otteniamo:14
AN = ig(1 − cos θ)dφ
AS = −ig(1 + cos θ)dφ
,
(29)
dove g è l’intensità del monopolo. Sia tN S la funzione di transizione definita sull’equatore
UN ∩ US , sappiamo che questa è una mappa definita da S1 al gruppo di struttura U (1).
Scriviamo quindi:
tN S (φ) = exp [iϕ(φ)]
ϕ : S1 → R
sappiamo anche che i due potenziali di gauge su UN ∩ US devono rispettare la relazione:
−1
AN = t−1
N S AS tN S + tN S dtN S = AS + idϕ.
Sostituendo i potenziali scritti nella (29) otteniamo:
dϕ = −i(AN − AS ) = 2gdφ
dal momento che φ varia tra [0, 2π] sull’equatore, ϕ(φ) cambia di:
Z
Z 2π
∆ϕ ≡ dϕ =
2gdφ = 4πg
0
affinché tN S sia definita in maniera univoca, ∆ϕ deve essere un multiplo di 2π:
∆ϕ
= 2g = n ∈ Z
2π
che è la stessa condizione di quantizzazione della carica per il monopolo magnetico che
abbiamo trovato nelle relazioni (15) e (16).
Per il flusso del campo magnetico riotteniamo il risultato (9):
Z
Z
Z
Φ=
B · dS =
dAN +
dAS =
S2
UN
Z
AN −
=
S1
14
Z
Z
AS = 2g
S1
US
2π
dφ = 4πg.
0
Ricordandoci di moltiplicarli per il fattore dell’algebra di Lie i.
24
4.3
Rotazioni e stringa di Dirac
Il campo elettrico dovuto ad una carica puntiforme è a simmetria sferica e lo stesso vale
per il campo magnetico generato da un monopolo magnetico, come si nota dalla relazione
(6). Mentre i potenziali vettori non hanno simmetria sferica, basta guardare la loro scrittura data dalla relazione (29). Per come abbiamo descritto la stringa di Dirac è chiaro
che effettuando una rotazione al potenziale vettore, ruoterà anche la direzione lungo cui è
disposta la stringa di Dirac; vogliamo mostrare che nonstante ciò, tramite una trasformazione di gauge possiamo compensare questa rotazione.
Se prendiamo i vettori che generano il gruppo delle rotazioni SO(3) su una sfera in tre
dimensioni:
∂
∂
− cos φ cot θ
∂θ
∂φ
∂
∂
ξY = cos φ
− sin φ cot θ
∂θ
∂φ
∂
ξZ =
∂φ
ξX = − sin φ
questi vettori soddisfano l’algebra:
[ξA , ξB ] = −ABC ξC .
Ci chiediamo come si trasforma il potenziale vettore, ovvero la uno-forma di connessione,
per una rotazione infinitesima generata da uno dei vettori sopra definiti. Il potenziale
vettore si trasformerà come la derivata di Lie lungo il vettore che definisce la rotazione
infinitesima, essendo il potenziale vettore un’uno-forma, avremo che:
ν
ν
ν
ν
∂ ν A µ + A ν ∂ µ ξB
= ξB
(Fνµ + ∂µ Aν ) + Aν ∂µ ξB
=
LξB Aµ = ξB
ν
ν
= ξB
Fνµ + ∂µ (ξB
Aν ) .
Per i potenziali vettori della relazione (29) questa derivata di Lie è non nulla quindi
sembra che si abbia una rottura della classica simmetria per rotazioni, ma come detto
precedentemente possiamo annullare quest’effetto accoppiando la derivata di Lie con la
trasformazione di gauge descritta dalla relazione (5).
Affiché si abbia che la variazione del potenziale vettore sia nullo dobbiamo imporre che:
δξB Aµ = LξB Aµ + i∂µ ΛB = 0.
(30)
Dalla relazione (30) troviamo che una trasformazione di gauge ha per generatori i seguenti
vettori:
cos φ
sin θ
sin φ
ν
ΛY = −g sin φ sin θ + iξY Aν = g cot θ sin φ − g
sin θ
ν
ΛZ = −g cos θ + iξZ Aν = −g
ν
ΛX = −g cos φ sin θ + iξX
Aν = g cot θ cos φ − g
si nota che la componente lungo z è una costante, ciò è fondamentale affinché la nuova
trasformazione che andremo a definire soddisfi l’algebra di SO(3).
Combinando la trasformazione di gauge ΛB con la rotazione semplice definita da ξB ,
25
∂
creiamo un nuovo operatore di rotazione ξˆB = ξB + ΛB ∂λ
dove λ è la coordinata del
fibrato U (1), quindi possiamo scrivere:
∂
∂
cos φ ∂
ˆ
ξX = − sin φ
− cos φ cot θ
+ g cot θ cos φ − g
∂θ
∂φ
sin θ ∂λ
∂
∂
sin φ ∂
ˆ
ξY = cos φ
− sin φ cot θ
+ g cot θ sin φ − g
∂θ
∂φ
sin θ ∂λ
∂
∂
ξˆZ =
−g .
∂φ
∂λ
L’operatore scritto in queste componenti soddisfa l’algebra di SO(3) cosı̀ come ξX , ξY , ξZ .
Quindi, quando andiamo a considerare una rotazione rigida in presenza di monopoli magnetici automaticamente ci troviamo anche a considerare le trasformazioni di gauge.
In [8] si affronta il caso di una deformazione infinitesima non rigida della stringa di Dirac;
si può mostrare che la trasformazione di gauge dipende dall’angolo solido spazzato dalla
deformazione della stringa. Quindi è chiaro che ciò che ha significato fisico è la presenza
della stringa e il suo punto di fine.
26
5
Conclusioni
La trattazione del monopolo magnetico ci ha condotto alla relazione (16) che lega la quantizzazione della carica magnetica alla quantizzazione della carica elettrica.
Notiamo che questa relazione è simile alla definizione della costante di struttura fine (23)
ma allo stesso tempo ci permette di capire e quantificare la differenza che passa tra la
carica magnetica isolata e la carica elettrica. Infatti se i potenziali, i campi e la forza elettrica e magnetica sono totalmente interscambiabili nella teoria del monopolo non si può
dire lo stesso per quanto riguarda la più piccola carica magnetica o elettrica che sarebbe
presente in natura. Dal confronto tra le due relazioni abbiamo che µ0 = 137
2 e, e questo
ci può dare un’idea di come mai non abbiamo osservato finora cariche magnetiche isolate.
Dal rapporto della più piccola carica magnetica e la più piccola carica
2 elettrica implica
volte più intensa
che la forza attrattiva tra due poli magnetici di segno opposto è 137
2
di quella tra elettrone e protone. Questa forza cosı̀ intensa può essere il motivo per cui
ancora non siamo riusciti a separare poli magnetici di segno opposto.
La domanda sul perchè studiamo geometrie che descrivono un oggetto che sembra non
esitere in natura a questo punto può sorgere spontanea, ma, come argomenta Dirac in [1],
“anche le geometrie non-euclidee e le algebre non-commutative una volta erano considerate solo dei passatempi per i matematici senza alcuna applicazione fisica”. Inoltre nel 1948
Dirac (vedi [2]) ribadisce che nella fisica sperimentale esistono molte particelle di cui, sia
al tempo che tutt’oggi, non sappiamo dare un’adeguata spiegazione fisica.
L’importanza del monopolo magnetico risiede nel fatto che è una naturale generalizzazione della teoria dell’elettrodinamica e che sembra essere l’unica argomentazione teorica
che spieghi la quantizzazione della carica elettrica. Un grande numero di studi teorici e
molte ricerche sperimentali sono stati intrapresi riguardo ai monopoli magnetici, un elenco
bibliografico viene fornito in [7].
Ad oggi sperimentalmente esiste un limite minimo della massa che può avere un monopolo
magnetico; negli acceleratori di particelle facendo urtare particelle cariche elettricamente
è stato stimato che la massa minima del monopolo è di 500 GeV /c2 . Negli ultimi anni i
ricercatori si sono concentrati nella ricerca di monopoli in stati di materia condensata e
sembra che il monopolo non sia una nuova particella elementare bensı̀ una quasi-particella.
Nel gennaio del 2014 (vedi [9]) alcuni scienziati sono riusciti ad osservare dei monopoli
magnetici in un condensato di Bose-Einstein.
27
A
Forme differenziali e algebra esterna
A.1
Tensori
Un tensore di tipo (q, r) è un’applicazione multilineare che mappa q elementi di Tp∗ M e r
q
elementi di Tp M in un numero reale; si indica con Tr,p
(M ) l’insieme dei tensori (q, r) in
q
p ∈ M . Un elemento di Tr,p (M ) scritto nella basa del tangente e del cotangente, sarà:
T = T µ1 ...µq ν1 ...νr
∂
∂
. . . µq dxν1 . . . dxνr
µ
1
∂x
∂x
ovviamente possiamo vedere il tensore come funzione i cui spazi d’arrivo e di partenza
sono:
⊗q Tp∗ M ⊗r Tp M → R.
Prima di definire le forme differenziali esaminiamo le proprietà di simmetria dei tensori.
0 (M ) è definito come:
L’operazione simmetria agente su ω ∈ Tr,p
P ω(V1 , . . . , Vr ) ≡ ω(VP (1) , . . . , VP (r) )
dove Vi ∈ Tp M e P è un’elemento di Sr , gruppo simmetrico di ordine r.
Per un tensore generale del tipo (q, p) le operazioni di simmetria sono definite separata0 (M ), il simmetrizzatore S è definito:
mente per gli indici q e p. Per ω ∈ Tr,p
Sω =
1 X
Pω
r!
P ∈Sr
mentre l’anti-simmetrizzatore A è:
Aω =
1 X
sgn(P )P ω
r!
P ∈Sr
dove sgn(P ) = +1 per permutazioni pari e −1 per permutazioni dispari.
Sω è totalmente simmetrico ( P Sω = Sω per ogni P ∈ Sr ) e Aω è totalmente antisimmetrico ( P Aω = sgn(P )Aω).
A.2
Forme differenziali
Definizione 7. Una forma differenziale di ordine r o una r-forma è un tensore totalmente
anti-simmetrico del tipo (0, r).
Definiamo anche il prodotto wedge ∧ di r uno-forme attraverso il prodotto tensore che
è totalmente anti-simmetrico:
X
dxµ1 ∧ dxµ2 ∧ · · · ∧ dxµr =
sgn(P )dxµP (1) ⊗ dxµP (2) ⊗ · · · ⊗ dxµP (r)
P ∈Sr
facendo un’esempio:
dxµ ∧ dxν = dxµ ⊗ dxν − dxν ⊗ dxµ .
Si nota immediatmente che il prodotto wedge soddisfa le seguenti proprietà:
1. dxµ1 ∧ · · · ∧ dxµr = 0 se alcuni indici µ compaiono almeno due volte
2. dxµ1 ∧ · · · ∧ dxµr = sgn(P )dxµP (1) ∧ · · · ∧ dxµP (r)
28
3. dxµ1 ∧ · · · ∧ dxµr è lineare in ogni dxµ .
Da ora in poi per indicare lo spazio vettoriale generato dalle r-forme in p ∈ M useremo il
simbolo Ωrp (M ); da cui abbiamo chiaramente Ω1p (M ) = Tp∗ M e per convenienza imponiamo
che Ω0p (M ) = R.
L’ insieme di r-forme presenti nella definizione di prodotto wedge formano una base per
Ωrp (M ) e un’elemento ω ∈ Ωrp (M ) può essere espanso sulla base come:
ω=
1
ωµ ,µ ,...,µr dxµ1 ∧ dxµ2 ∧ · · · ∧ dxµr
r! 1 2
dove ωµ1 ,µ2 ,...,µr è preso totalmente anti-simmetrico, riflettendo l’anti-simmetria della base.
Si può ricavare che la dimensione di Ωrp (M ) è:
m
m!
=
k
(m − r)!r!
si nota
che se r > m la forma è identicamente nulla. Inoltre valendo l’uguaglianza m
k =
m
r
m−r (M ) e Ωr (M ), essendo uno spazio vettoriale, è
p
m−r abbimo che dimΩp (M )=dimΩp
m−r
isomorfo a Ωp (M ).
Definiamo adesso il prodotto esterno di una q-forma e una r-forma:
∧ : Ωqp (M ) × Ωrp (M ) → Ωq+r
p (M )
se prendiamo ω ∈ Ωqp (M ) e ξ ∈ Ωrp (M ), l’azione della (q + r)-forma ω ∧ ξ su q + r vettori
è definita come:
1 X
(ω ∧ ξ)(V1 , . . . , Vq+r ) =
sgn(P )ω(VP (1) , . . . , VP (q) )ξ(VP (q+1) , . . . , VP (q+r) )
q!r!
P ∈Sq+r
dove Vi ∈ Tp M ; anche ora se q + r > m, ω ∧ ξ è identicamente nulla.
Possiamo definire anche un’algebra grazie questo prodotto, infatti:
Ω∗p (M ) = Ω0p (M ) ⊕ Ω1p (M ) ⊕ · · · ⊕ Ωm
p (M )
Ω∗p (M ) è lo spazio di tutte le forme differenziali definite in p ed è chiuso rispetto al prodotto
esterno.
A.3
Derivata esterna
Definizione 8. La derivata esterna dr è una mappa Ωr (M ) → Ωr+1 (M ) la cui azione su
una r-forma
1
ω = ωµ1 ,...,µr dxµ1 ∧ · · · ∧ dxµr
r!
è definita come:
1
∂
dr ω =
ωµ ,...,µr dxν ∧ dxµ1 ∧ · · · ∧ dxµr .
r! ∂xν 1
In genere si indica con la sola d la derivata esterna; inoltre il prodotto wedge rende
automaticamente anti-simmetrico il coefficiente.
Esempio. Le r-forme nello spazio a 3 dimensioni sono:
1. ω0 = f (x, y, z)
29
2. ω1 = ωx (x, y, z)dx + ωy (x, y, z)dy + ωz (x, y, z)dz
3. ω2 = ωxy (x, y, z)dx ∧ dy + ωyz (x, y, z)dy ∧ dz + ωzx (x, y, z)dz ∧ dx
4. ω3 = ωxyz (x, y, z)dx ∧ dy ∧ dz
l’azione di d su queste forme differenziali è:
ˆ dω0 =
∂f
∂x dx
ˆ dω1 =
∂ωy
∂x
ˆ dω2 =
∂ωyz
∂x
+
∂f
∂y dy
−
∂ωx
∂y
∂ωzx
∂y
+
+
∂f
∂z dz
dx ∧ dy +
+
∂ωxy
∂z
∂ωz
∂y
−
∂ωy
∂z
dy ∧ dz +
∂ωx
∂z
−
∂ωz
∂x
dz ∧ dx
dx ∧ dy ∧ dz
ˆ dω3 = 0
possiamo notare che l’azione di d su ω0 è il gradiente, su ω1 il rotore e su ω2 è la divergenza
nel calcolo vettoriale classico.
Una proprietà molto importante della derivata esterna è:
d2 = 0
(dr+1 dr = 0)
infatti presa:
ω=
1
ωµ ,...,µr dxµ1 ∧ · · · ∧ dxµr
r! 1
l’azione di d2 su ω è:
d2 ω =
1 ∂ 2 ωµ1 ,...,µr λ
dx ∧ dxν ∧ dxµ1 ∧ · · · ∧ dxµr
r! ∂xλ ∂xν
questa è identicamente nulla in quanto il coefficiente
e ν mentre dxλ ∧ dxν è anti-simmetrico.
B
∂ 2 ωµ1 ,...,µr
∂xλ ∂xν
è simmetrico rispetto a λ
Gruppi di Lie e algebre di Lie
Un gruppo di Lie è una varietà su cui le operazioni del gruppo, prodotto e inversa, sono
definite. I gruppi di Lie hanno un ruolo fondamentale nella teoria dei fibrati e nelle
applicazioni fisiche connesse alle teorie di gauge.
B.1
Gruppi di Lie
Definizione 9. Un gruppo di Lie G è una varietà differenziabile dotata di una struttura
di gruppo in cui le operazioni:
1. · : G × G → G,
2.
−1
: G → G,
(g1 , g2 ) 7→ g1 · g2
g 7→ g−1
sono differenziabili.
30
Per le applicazioni fisiche sono particolarmente interessanti i gruppi di matrici che sono
sottogruppi dei gruppi lineari generali GL(n, R) e GL(n, C). Il prodotto tra gli elementi
del gruppo è la classica moltiplicazione tra matrici e l’inverso è la matrice inversa. Risulta
che GL(n, R) e GL(n, C) sono gruppi di Lie.
I sottogruppi di GL(n, R) a cui siamo interessati sono il gruppo ortogonale O(n), il gruppo
speciale lineare SL(n, R) e il gruppo speciale ortogonale SO(n):
O(n) = {M ∈ GL(n, R)|M M t = M t M = In }
SL(n, R) = {M ∈ GL(n, R)| det M = 1}
SO(n) = O(n) ∩ SL(n, R)
dove t indica la trasposizione della matrice.
I sottogruppi d’interesse del gruppo GL(n, C) sono il gruppo unitatio U (n), il gruppo
speciale lineare SL(n, C) e il gruppo speciale unitario SU (n):
U (n) = {M ∈ GL(n, C)|M M † = M † M = In }
SL(n, C) = {M ∈ GL(n, C)| det M = 1}
SU (n) = U (n) ∩ SL(n, C)
dove † indica il coniugato hermitiano.
Abbiamo detto che GL(n, R) e GL(n, C) sono gruppi di Lie ma non sappiamo,in linea di
principio, se anche i sottogruppi di un gruppo di Lie sono gruppi di Lie. Per questo esiste
un importante teorema che ci viene in soccorso.
Teorema 2. Ogni sottogruppo chiuso H di un gruppo di Lie G è un sottogruppo di Lie.
Grazie a questo teorema sappiamo che i gruppi sopra elencati sono dei sottogruppi di
Lie.
B.2
Algebre di Lie
Definizione 10. Siano a e g due elementi del gruppo di Lie G. La traslazione destra
Ra : G → G e la traslazione sinistra La : G → G di g su a sono definite come:
Ra g = ga
La g = ag
Per definizione Ra e La sono diffeomorfismi da G in G; inoltre inducono delle mappe
differenziali La∗ : Tg G → Tag G e Ra∗ : Tg G → Tga G.
Dato un gruppo di Lie G esiste una speciale classe di vettori caratterizzata dall’invarianza
rispetto l’azione del gruppo.
Definizione 11. Sia X campo di vettori su un gruppo di Lie G. X si dice essere invariante
a sinistra se La∗ X|g = X|ag .
Se chiamiamo l’elemento identità del gruppo di Lie e, abbiamo che un vettore V ∈ Te G
definisce un’unico campo di vettori invariante a sinistra XV tramite la traslazione di G:
XV |g = Lg∗ V
g ∈ G.
Vale anche il viceversa, ovvero, un campo di vettori invariante a sinistra X definisce
un’unico vettore V = X|e ∈ Te G. Denotiamo l’insieme dei vettori invarianti a sinistra
su G con g. La mappa Te G → g definita da V 7→ XV è un’isomorfismo, quindi l’insieme
dei vettori invarianti a sinistra è isomorfo al campo vettoriale Te G; in particolare hanno
dimg=dimG.
31
Definizione 12. Siano X e Y due campi vettoriali definiti su M . Si definiscono le parentesi
di Lie [X, Y ] come:
[X, Y ] f = X [Y [f ]] − Y [X[f ]]
dove f ∈ F(M ).
Si può vedere facilmente che se X, Y ∈ g allora [X, Y ] ∈ g, quindi g è chiuso rispetto
le parentesi di Lie.
Definizione 13. L’insieme dei campi invarianti a sinistra g con le parentesi di Lie [ , ] :
g × g → g è chiamata l’algebra di Lie di un gruppo di Lie G.
Denoteremo l’algebra di Lie di un gruppo di Lie con le lettere gotiche. Ad esempio
so(n) è l’algebra di Lie di SO(n).
Sia l’insieme di n vettori {V1 , · · · , Vn } una base per Te G, questa base definisce un’insieme
di n vettori invarianti a sinistra linearmente indipendenti {X1 , · · · , Xn } ad ogni punto
g ∈ G tramite la definizione di vettori invarianti a sinistra. Notiamo che quest’ultimo
insieme di vettori forma una base e, inoltre, sapendo che lo spazio dei vettori invarianti a
sinistra è chiuso rispetto le parentesi di Lie possiamo scrivere:
[Xa , Xb ] = cab c Xc
dove cab c sono chiamate le costanti di struttura del gruppo di Lie G. Si puo’ dimostrare
che le costanti di struttura sono indipendenti da quale elemento g ∈ G usiamo per la
definizione Lg∗ Va = Xa |g inoltre una volta determinate le costanti di struttura si determina
completamente il gruppo di Lie (teorema di Lie).
Se introduciamo una base duale a Xa e la denotiamo con θa , questa sarà una base per le
uno-forme invarianti a sinistra e soddisferà l’equazione di struttura di Maurer-Cartan:
1
dθa = − cbc a θb ∧ θc .
2
Definiamo una uno-forma a valori su un’algebra di Lie θ : Tg G → Te G come:
θ : X 7→ (Lg−1 )∗ X = (Lg )−1
∗ X
X ∈ Tg G
θ è chiamata la uno-forma canonica o forma di Maurer-Cartan su G.
B.3
L’azione dei gruppi di Lie sulle varietà
In fisica, spesso un gruppo di Lie è visto come un’insieme di trasformazioni che agiscono
su una varietà, ad esempio SO(3) è il gruppo delle rotazioni in R3 , andiamo quindi a
descrivere questo concetto per un generico gruppo di Lie G su una varietà M .
Definizione 14. Sia G un gruppo di Lie e M una varietà. L’azione di G su M è una
mappa differenziabile σ : G × M → M che soddisfa le seguenti condizioni:
1. σ(e, p) = p
∀p ∈ M
2. σ(g1 , σ(g2 , p)) = σ(g1 g2 , p)
Definizione 15. Sia G un gruppo di Lie che agisce sulla varietà M tramite σ : G × M →
M . L’azione σ si dice:
ˆ Transitiva se ∀p1 , p2 ∈ M ∃ g ∈ G | σ(g, p1 ) = p2
32
ˆ Libera se esiste un’elemento p ∈ M tale che σ(g, p) = p, allora g deve essere l’identità
e
ˆ Effettiva se σ(g, p) = p per ogni p ∈ M , allora g deve essere l’identità e, ovvero
l’identità e ∈ G è unica.
Sia G un gruppo di Lie che agisce su M in modo (g, x) 7→ gx con g ∈ G. Un campo di
vettori invarianti a sinistra XV generato da V ∈ Te G induce naturalmente un campo di
vettori su M . Definiamo un flusso 15 , come:
σ(t, x) = exp(tV )x
e definiamo un campo di vettori chiamati campo di vettori indotto identificato da V ] :
V ] |x =
d
exp(tV )x|t=0
dt
quindi abbiamo una mappa ] : Te G → X(M ), dove con X(M ) indichiamo lo spazio dei
vettori tangenti alla varietà M , definita da V 7→ V ] .
Un gruppo di Lie G agisce su se stesso in maniera particolare.
Definizione 16. Preso un qualsiasi a ∈ G e definito un’omomorfismo ada : G → G tale
che:
ada : g 7→ aga−1
questo omomorfismo è chiamato rappresentazione aggiunta di G.
Notiamo che ada e = e; quindi la mappa indotta ada∗ : Tg G → Tada g G a g = e diventa:
Ada : Te G → Te G
dove Ada ≡ ada∗ |Te G . Se identifichiamo Te G con l’algebra di Lie g, otteniamo una mappa:
Ad : G × g 7→ g
chiamata mappa aggiunta di G.
B.4
Derivata di Lie
Siano σ (t, x) e τ (t, x) due flussi generati dai vettori X,Y quindi:
dσ µ (s, x)
= X µ (σ(s, x))
ds
dτ µ (s, x)
= Y µ (τ (s, x))
ds
andiamo adesso a vedere come cambia il vettore Y lungo σ (t, x). Per fare ciò dobbiamo andare a confrontare il vettore Y definito nel punto x con il vettore nel punto
x0 = σ (x) = σ(, x), però non possiamo semplicemente considerare le differenze delle
componenti dei due vettori in quanto appartengono a spazi tangenti differenti. Per evitare
questo problema inizialmente mappiamo Y |σ (x) in Tx M con (σ− )∗ : Tσ (x) → Tx M e
prendiamo la differenza tra i due vettori (σ− )∗ Y |σ (x) e Y |x che sono entrambi vettori
15
Il flusso è una mappa definita come σ : R × M → M che soddisfa σ(t, σ µ (s, x0 )) = σ(t + s, x0 ) per ogni
t, s ∈ R.
33
appartenenti a Tx M .
La derivata di Lie del vettore Y lungo il flusso σ di X è definita come:
1
(σ− )∗ Y |σ (x) − Y |x
→0 LX Y = lim
scritta in coordinate diventa:
LX Y = (X µ ∂µ Y ν − Y µ ∂µ X ν ) ∂ν .
Riconosciamo questa formula come una parentesi di Lie, infatti:
LX Y = [X, Y ] .
Possiamo anche definire la derivata di Lie di una uno-forma ω ∈ Ω1 (M ) lungo X ∈ X(M )
come:
1
(σ )∗ ω|σ (x) − ω|x
LX ω = lim
→0 dove ω|x ∈ Tx∗ M . Se passiamo alle componenti, ponendo ω = ωµ dxµ , otteniamo:
LX ω = (X ν ∂ν ωµ + ∂µ X ν ων ) dxµ .
Ovviamente LX ω ∈ Tx∗ (M ) in quanto è una differenza di due uno-forme nello stesso punto
x. Le derivate di Lie di un tensore generico sono ottenute dalle seguenti proprietà:
LX (T1 + T2 ) = LX T1 + LX T2
LX (T1 ⊗ T2 ) = (LX T1 ) ⊗ T2 + T1 ⊗ (LX T2 )
con T1 , T2 tensori arbitrari.
34
Riferimenti bibliografici
[1] P. A. M. Dirac, “Quantised Singularities In Electromagnetic Field”, Proc. Roy. Soc.
Lond. A 133 60 (1931).
[2] P. A. M. Dirac, “The Theory Of Magnetic Poles”, Phys. Rev. 74, 817 (1948).
[3] T. T. Wu e C. N. Yang, “Concept of non-integrable phase factors and global
formulation of gauge fields”, Phys. Rev. D 12 3845 (1975).
[4] M. Nakahara, “Geometry, Topology and Physics” seconda edizione (Institute of Physics
Publishing, Bristol and Philadelphia) (2003).
[5] G. Gentili, F. Podestà e E. Vesentini, “Lezioni di Geometria Differenziale” (Bollati
Boringhieri, Torino) (1995).
[6] C. N. Yang e R. L. Mills, “Conservation of Isotopic Spin and Isotopic Gauge
Invariance”, Phys. Rev. 96 191 (1954).
[7] G. Giacomelli, M. Giorgini, T. Lari, M. Ouchrif, L. Patrizii, V. Popa, P. Spada e
V. Togo, “Magnetic Monopole Bibliography”, DFUB 2000-9 arXiv:hep-ex/0005041
(2000).
[8] J. D. Jackson, “Classical electrodynamics” seconda edizione (Wiley) (1975).
[9] M. W. Ray, E. Ruokokoski, S. Kandel, M. Möttönen e D. S. Hall, “Observation of
Dirac monopoles in a synthetic magnetic field”, Nature 505 (7485): 657 (2014).
35