Appunti di Relatività ristretta - INFN

Appunti di Relatività ristretta
Francesco Ravanini
Corso di Laurea in Astrosica e Cosmologia
Università di Bologna
28 dicembre 2007
2
Introduzione
Nel 1905 Einstein pubblicò 3 articoli:
1. elettrodinamica dei corpi in movimento, cioè le basi della
relatività ristretta
2. uno studio sul moto browniano, grazie al quale si dava un forte argomento a favore
della
natura particellare della materia
3. eetto fotoelettrico, cioè l'interpretazione di uno dei fenomeni più importanti che
condussero alla formulazione della
meccanica quantistica
Qui ci occuperemo della prima di queste 3 linee di ricerca iniziate dal genio di Ulm, i cui
frutti nella Fisica del XX secolo sono noti a tutti.
In realtà la relatività nasce da una
problematica già individuata in lavori precedenti di altri autori, in particolare di Lorentz
(1904) e di Poincaré (1901). Al termine del 1905 Einstein uscì con un altro lavoro in cui
2
compare per la prima volta la celebre relazione E = mc e negli anni successivi Minkowski
perfezionò la teoria dello spazio-tempo.
Nel 1911 Einstein cominciò a lavorare alla relatività generale portata a termine nel
1916. Da allora non è più sorta alcuna nuova teoria della relatività.
Il concetto di
relatività dei movimenti
risale in eetti a Galileo. Trovandosi su un
treno che si muove di moto rettilineo uniforme senza scossoni, se non si guarda fuori dal
nestrino non ci si può accorgere dello stato di moto o di quiete. Non si può quindi parlare
di moto assoluto, ma solo di moto relativo tra due sistemi di riferimento inerziali.
Tutto ciò concorda con la legge di gravitazione di Newton che non determina uno
stato di moto assoluto. Cioè la legge di gravitazione ha la stessa forma in due sistemi in
moto relativo uniforme. In altre parole, facendo misure sulla gravitazione non è possibile
distinguere se un sistema sia in moto oppure no.
La scoperta dell'
elettromagentismo,
culminata attorno al 1850 nei lavori di Max-
well e nelle sue 4 celebri equazioni, pose per la prima volta problemi a questa visione
galileiana della relatività dei movimenti. La teoria di Maxwell predice l'esistenza di vibrazioni del campo elettromagnetico e predice pure la velocità di propagazione di tali onde
elettromagnetiche. Tale velocità vale
c = 299.792.458 m/sec ≈ 3 · 108 m/sec
e coincide con la
velocità della luce nel vuoto, da cui Maxwell dedusse che la luce doveva
essere un fenomeno elettromagnetico.
3
4
Già l'astronomo danese Rømer aveva misurato la velocità della luce in base ai ritardi
delle eclissi dei satelliti di Giove.
Misure più precise arrivarono con il ranarsi delle
tecnologie nel XIX secolo.
Dire che la luce viaggia alla velocità della luce non è una banalità.
quale sistema di riferimento ciò avvenga.
Ci si chiede in
Alla ne dell'800 il ragionamento tipico era il
seguente: esiste un etere luminifero che vibra producendo le onde elettromagnetiche, così
come l'aria vibrando produce le onde sonore. La luce ha velocità
c
se riferita a un sistema
di riferimento a riposo rispetto all'etere.
Se però ci muoviamo rispetto all'etere con velocità
garsi con velocità
~c,
ma con velocità
~c + ~v ,
~v ,
la luce non dovrebbe più propa-
cioè la velocità della luce non è più la stessa in
tutte le direzioni. Ciò implica che le leggi di Maxwell sono valide solo per un sistema di
riferimento a riposo rispetto all'etere, che viene detto
sistema di riferimento assoluto.
L'elettromagnetismo ci permetterebbe pertanto di vericare lo stato di quiete o di moto
assoluto di un sistema.
Alla ne del XIX secolo Michelson riuscì a misurare la velocità della luce con una
precisione tale da dover decidere se il suo sistema (la Terra) era in quiete o in moto rispetto
all'etere.
Nel giro di 6 mesi la Terra, che gira attorno al Sole a 30 Km/sec, cambia la sua velocità
di 60 Km/sec e quindi se a un certo istante la Terra fosse in quiete rispetto all'etere, dopo
6 mesi essa si muoverebbe rispetto all'etere di 60 Km/sec. Quindi esiste almeno un giorno
dell'anno in cui la Terra è in moto rispetto all'etere.
La discrepanza tra
Morley detto
~c
e
~c + ~v
interferometro.
è valutabile con uno strumento costruito da Michelson e
Ciò che l'interferometro misura è la dierenza di velocità
della luce secondo la direzione. Ciò che si osservò fu l'assoluta costanza di
c in ogni direzione
e ad ogni epoca dell'anno. Non si poteva cioè misurare alcun vento di etere.
Per dare risposta all'interrogativo aperto dall'esperimento di Michelson e Morley, Lorentz sviluppò una teoria basata sul fatto che se si considera un solido, esso è formato da
atomi, costituiti da cariche elettriche positive e negative. La forza di attrazione tra cariche
positive e negative, cioè la forza di Coulomb, rimane elettrostatica nchè le cariche sono
ferme rispetto all'etere.
Quando queste si muovono compaiono fenomeni magnetici che
si espletano macroscopicamente come un accorciamento della lunghezza del solido nella
direzione del moto.
Tale accorciamento era tale, secondo Lorentz, da compensare le di-
screpanze non osservate da Michelson e Morley e non era possibile rendersene conto perchè
anche i metri con cui si misurava tale lunghezza si accorciavano.
Einstein assunse invece la
non isolabilità del moto assoluto
come postulato e di-
mostrò che la non riuscita dell'esperimento di Michelson e Morley era dovuta a proprietà
intrinseche dello spazio.
Riassumendo, nella teoria galileiana c'è un principio di relatività del moto che viene
violato dalle leggi di propagazione della luce. Infatti, usando il teorema di addizione delle
velocità, la velocità della luce non dovrebbe essere uguale per tutti i sistemi di riferimento
e manterrebbe la sua costanza in tutte le direzioni solo per osservatori in quiete rispetto
all'etere. Se si accetta quindi il teorema di addizione delle velocità, la velocità della luce
deve essere diversa a seconda degli osservatori.
5
Se invece si vuole salvare il principio di relatività, occorre abbandonare il teorema di
addizione delle velocità nella forma galileiana. Ciò porta a una nuova legge di composizione
delle velocità per la quale la velocità della luce è
c per tutti gli osservatori.
Non è possibile
inseguire la luce o andarle incontro perché comunque sia la velocità della luce è sempre
c.
Einstein salvò così il principio di relatività a costo di sacricare il teorema di addizione
delle velocità.
Sebbene nel 1906 una misura di velocità di elettroni sembrò porre dubbi sulla nuova
teoria di Einstein, tutte le misure successive diedero ragione a quest'ultimo e oggi gli eetti
della teoria della relatività einsteiniana sono testati giornalmente nei grandi acceleratori di
particelle.
Si noti che il cambiare il teorema della composizione delle velocità cambia tutta la
meccanica, nonché i concetti stessi di spazio e tempo. Si ha infatti che eventi simultanei
per un osservatore non lo sono più per un altro. Si consideri ad esempio un aereo che vola
da Bologna a Roma e che giunto a metà del suo percorso riceve un segnale radio dalle
due città. Per il personale di terra l'invio dei due segnali costituisce due eventi simultanei.
Per il pilota Roma si sta avvicinando e Bologna si sta allontanando dal segnale, perciò il
segnale arriva prima da Roma che da Bologna, perché si propaga sempre a velocità
eventi simultanei per il personale di terra non lo sono per il pilota. La
c.
Due
simultaneità non
è un concetto assoluto.
Per
evento si intende un qualcosa che capita in un certo punto dello spazio a un certo
istante. L'arrivo del segnale è un evento, un libro su un tavolo non è un evento, bensì una
successione di eventi succedentesi con continuità.
L'insieme di tutti gli eventi costituisce lo
di coordinate
(t, x, y, z).
che sarà chiamata
spazio-tempo cioè uno spazio a 4 dimensioni
Un punto dello spazio ordinario è una curva nello spazio-tempo
linea di mondo del punto materiale.
Anche le unità di misura cambiano da un sistema di riferimento ad un altro in moto
rispetto al primo. Le sbarre si contraggono nella direzione del moto, gli orologi battono
il secondo più lentamente.
Conseguentemente anche le leggi della dinamica subiscono
delle modiche, che hanno come conseguenza una nuova visione della meccanica. I campi
elettromagnetici possono essere inseriti in tale quadro in maniera molto elegante.
6
Capitolo 1
Meccanica newtoniana e relatività
galileiana
1.1
Equazioni del moto
Il mondo newtoniano è da intendersi costituito da punti materiali, ciascuno individuato da
i
3 coordinate x , i = 1, 2, 3 che possiamo riunire in un vettore ~
x ∈ R3 e da un parametro m
detto massa.
Si denisce velocità la derivata
~v =
d~x
dt
~a =
d2~x
dt2
e accelerazione la derivata seconda
La legge newtoniana del moto
F~ = m~a
è da interpretarsi come sistema di equazioni dierenziali per le traiettorie
materiali
~xn (t)
dei punti
n = 1, ..., N soggetti al campo vettoriale di forze F~ (~x, ~v , t)
d~x1
d~xN
d2~xn
~
mn 2 = F ~x1 , ..., ~xN ,
, ...,
,t
dt
dt
dt
Abbiamo così un sistema di equazioni dierenziali ordinarie del secondo ordine che dà il
moto dei punti materiali.
1.2
Sistemi di riferimento e osservatori
Le coordinate
~x ≡ (x1 , x2 , x3 )
di un punto materiale sono date rispetto a un sistema di
riferimento (per es. assi cartesiani). Cosa succede alle leggi del moto se si cambia sistema
di riferimento?
7
8
CAPITOLO 1.
MECCANICA NEWTONIANA E RELATIVITÀ GALILEIANA
Qual è il sistema di riferimento (o i sistemi di riferimento) rispetto al quale le leggi del
moto sono valide?
Deniamo il concetto di
osservatore:
si dice osservatore
O
un sistema di riferimento
con un pressato origine di assi coordinati (normalmente cartesiani, ma potremmo anche
pensare ad altre coordinate: polari, ecc...) dotato di regoli per la misura di distanze (quindi
1
2
3
in grado di assegnare coordinate x , x , x ai punti materiali) e di un orologio (quindi in
grado di misurare il tempo
t).
Deniamo anche il concetto di
evento:
si tratta di una entità denita da 4 coordinate:
le 3 usuali coordinate spaziali identicanti un punto materiale e una coordinata temporale
che ne ssa l'istante. Un evento è cioè un punto ~
x dello spazio R3 considerato a un certo
tempo
t.
Osservatori diversi
O, O0 , ...
attribuiscono ad un evento delle coordinate
(t, ~x), (t0 , ~x0 )
ecc... diverse l'uno dall'altro. Vogliamo correlare queste descrizioni dierenti per ottenere
un'unica teoria invariante, cioè valida per tutti gli osservatori.
1.3
Trasformazioni di Galileo
Un primo cambiamento possibile è il seguente
t0 = t + τ
~x0 = ~x + ξ~
Questo cambiamento di coordiante è detto
traslazione spaziale, mentre il parametro
τ
traslazione.
Il vettore
ξ
implementa una
descrive una dierenza nell'inizio del computo
dei tempi per i due osservatori, lasciando per altro l'asse dei tempi del tutto identico sotto
ogni altro aspetto per i due osservatori. Le traslazioni perciò dipendono da quattro costanti
(3 nel vettore
ξ~,
una in
τ)
non dipendenti dal punto.
Un altra trasformazione è la seguente
t0 = t
~x0 = O~x
in cui
O
è una matrice
3×3
ortogonale, cioè
OOT = 1.
Tali trasformazioni, come
ben noto, lasciano invariata la lunghezza di un vettore e sono chiamate
rotazioni.
Ogni
matrice ortogonale a 3 dimensioni ha 3 parametri indipendenti, che possono essere pensati
per esempio come i 3 angoli di Eulero, e che descrivono completamente la rotazione.
Il tipo di cambiamento di coordiante caratterizzante da un punto di vista sico è però
t0 = t
~x0 = ~x + ~v t
cioè la trasformazione tra due osservatori in moto relativo uniforme con velocità
Si noti che abbiamo inserito in queste trasformazioni ben 10 parametri:
~v .
1.4.
9
TEOREMA DI ADDIZIONE DELLE VELOCITÀ
1. 1 relativo alla traslazione dell'origine dei tempi
2. 3 relativi alle traslazioni spaziali
3. 3 relativi alle rotazioni
4. 3 della velocità
~v
di moto relativo dei sistemi di riferimento
La più generica trasformazione di Galileo si ha operando contemporaneamente tutte e tre
queste trasformazioni.
chiama
L'insieme di tutte le trasformazioni di Galileo forma gruppo e si
gruppo di Galileo.
La meccanica newtoniana è invariante sotto il gruppo di
Galileo.
1.4
Teorema di addizione delle velocità
Supponiamo di fare due successive trasformazioni di Galileo
A : O → O0
e
B : O0 → O00
~x0 = ~x + ~vA t
~x00 = ~x0 + ~vB t
eliminando la
~x0
otteniamo
~x00 = ~x + (~vA + ~vB )t
che deve essere identica alla trasformazione diretta
C : O → O00
~x00 = ~x + ~vC t
e quindi abbiamo il
teorema di addizione delle velocità
~vC = ~vA + ~vB
che è in un certo senso la legge di composizione del Gruppo di Galileo. Nelle trasformazioni
di Galileo le velocità si sommano, come è accettabile anche dall'esperienza intuitiva.
Sappiamo che la luce ha velocità
c nei sistemi di riferimento in cui valgono le equazioni di
Maxwell. Se vale il teorema di addizione delle velocità galileiano, allora le leggi di Maxwell
non sono più invarianti per trasformazioni di Galileo. Se viceversa le equazioni di Maxwell
sono valide in tutti i sistemi di riferimento inerziali, non vale più il teorema di addizione
delle velocità, cioè le trasformazioni tra sistemi inerziali non possono più essere quelle di
Galileo. Einstein scelse questa seconda ipotesi, cioè impose che
c
è un invariante e che le
equazioni di Maxwell devono valere in tutti i sistemi di riferimento inerziali, restaurando
il prinicipio di relatività ma rinunciando alle trasformazioni galileiane.
10
CAPITOLO 1.
1.5
Invarianza delle leggi della natura
MECCANICA NEWTONIANA E RELATIVITÀ GALILEIANA
Nella Fisica di Newton e Galileo, un qualunque corpo in moto con velocità ~
u rispetto
0
0
all'osservatore O avrà velocità ~
u = ~u + ~v rispetto all'osservatore O in moto rettilineo
uniforme con velocità
~v
rispetto al primo. Ciò si ottiene dalla denizione di velocità come
derivata della coordinata. Poichè
~v
è costante, la derivata seconda, cioè l'accelerazione, è
invariante
~a0 = ~a
e, assumendo che la massa
m
di un corpo sia una proprietà invariante per sistemi di
riferimento, si ha che il primo membro delle leggi del moto è invariante di Galileo.
Se il secondo membro sia invariante o meno dipende dalla forma delle forze.
Gravitazione newtoniana
tra due corpi 1 e 2
Gm1 m2 ~
F~12 = −
k12
|~r12 |2
~k12 =
~
r12
e ~
r12 = ~x1 − ~x2 dipende solo dalla distanza dei due corpi che è un
|~
r12 |
invariante per traslazioni e rotazioni, e anche per boosts a velocità costante. Perciò
ove
la gravità newtoniana è invariante di Galileo.
Forze elettrostatiche
la legge di Coulomb è pure invariante sotto trasformazioni di Ga-
lileo se si ipotizza che la carica elettrica è una proprietà dei corpi invariante di
Galileo.
In generale ogni forza dipendente solo dalle distanze è invariante per trasformazioni di
Galileo e quindi rende invarianti le equazioni newtoniane del moto. Tuttavia in natura sono
note forze che dipendono non solo dalle posizioni ma anche dalle velocità, come capita nelle
leggi di Maxwell per l'elettromagnetismo. Come abbiamo visto, è proprio sull'invarianza
delle leggi di Maxwell che la relatività galileiana entra in crisi.
Capitolo 2
Cinematica relativistica
2.1
Principi fondamentali
La meccanica relativistica si basa su due principi fondamentali:
Principio di inerzia
Esiste almeno un sistema di riferimento inerziale in cui un corpo
in quiete o in moto rettilineo uniforme perdura nel suo stato di quiete o di moto
rettilineo uniforme se non è soggetto a forze esterne
Si noti che se esiste un sistema di riferimento inerziale, ne esistono automaticamente inniti:
tutti quelli in moto rettilineo uniforme rispetto al primo.
Principio di Relatività ristretta
Le leggi della sica sono le stesse (cioè hanno la stessa
forma) in tutti i sistemi di riferimento inerziali.
Dalle leggi di Maxwell si deduce che la velocità di propagazione delle onde elettromagnetiche
è
c.
Poichè le leggi di Maxwell sono leggi universali della natura, ne si conclude che la
velocità della luce
c
deve essere la stessa in tutti i sistemi di riferimento inerziali.
Non
esiste un etere o un sistema di riferimento assoluto.
2.2
Unità di misura naturali
Poiché la velocità della luce deve essere uguale in tutti i sistemi di riferimento, viene
naturale in relatività porla uguale a 1 e misurare tutte le altre velocità come frazioni della
velocità della luce.
Ciò corrisponde a introdurre nuove unità di misura, più convenienti
per il tipo di problemi che andiamo a trattare, in cui i tempi e le lunghezze hanno la stessa
unità di misura. Per esempio possiamo adottare il metro come unità di misura sia dello
spazio che del tempo. Un metro di tempo corrisponde al tempo che impiega la luce a
1
percorrere un metro, cioè a
secondi, ovvero circa 1/3 di nanosecondo. Conseguentemente,
c
tutte le velocità sono misurate da numeri puri. Quando diremo che un corpo ha velocità
2/3, intenderemo che si muove a una velocità pari a 2/3 della velocità della luce.
11
12
CAPITOLO 2.
CINEMATICA RELATIVISTICA
−1
Le accelerazioni saranno misurate in m , le masse continuano ad essere misurate in Kg,
ma gli impulsi e le energie saranno pure misurati in Kg e le forze in Kg/m. Le formule si
esprimono senza la ridondanza di fattori
c,
il che le rende più immediatamente signicanti
dal punto di vista sico, ma per calcolare le grandezze nel tradizionale sistema metrico
internazionale m, Kg, sec occorrerà tener conto dei fattori di conversione tra le unità di
misura dei due sistemi.
Alternativamente, si può scegliere il secondo come unità fondamentale. Allora le distanze saranno misurate in secondi-luce, cioè l'unità di misura delle lunghezze sarà la distanza
percorsa dalla luce in un secondo, ovvero 300.000 Km circa. Una versione di questo sistema di misura più adatta alle distanze astronomiche è quella degli anni per i tempi e gli
anni-luce per le distanze.
2.3
Trasformazioni di Lorentz
0
Consideriamo due sistemi di riferimento inerziali O e O , rispettivamente con coordinate
x = (t, x, y, z) e x0 = (t0 , x0 , y 0 , z 0 ).1 La critica alla simultaneità implica che t 6= t0 , cioè che
anche i tempi partecipano alle leggi di trasformazione tra sistemi di riferimento inerziali.
0
Cerchiamo delle trasformazioni x (x) che lascino invariante la velocità della luce.
Le traslazioni e le rotazioni saranno uguali a quelle delle trasformazioni di Galileo,
poichè mantengono invariante la lunghezza dei vettori (e perciò
c
in particolare).
Una ovvia richiesta è che un corpo in moto rettilineo uniforme in O deve vedersi con
O0 , altrimenti sarebbe violato il principio di inerzia,
moto rettilineo uniforme anche in
ovvero
d~x
= cost. in O
dt
x:
Per esempio sull'asse
vx0
~v 0 =
⇔
~v =
dx0
dx0 dt
=
= 0 =
dt
dt dt0
0
∂x0 dx
+ ∂x
∂x dt
∂y
0
∂t0 dx
+ ∂t
∂x dt
∂y
dy
dt
dy
dt
d~x0
= cost. in O0
dt0
+
+
∂x0 dz
∂z dt
∂t0 dz
∂z dt
+
+
∂x0
∂t
∂t0
∂t
dx
= vx ecc... sono costanti per ipotesi. Perciò l'unico modo di garantire
Ora, le derivate
dt
∂x0
0
che vx sia costante è di richiedere che le derivate parziali
ecc... siano anch'esse costanti.
∂x
0
Ma ciò implica che le funzioni x (x) siano funzioni lineari, cioè
x0 = Ax
dove
A
è una matrice
4×4
a elementi reali.
Determiniamo gli elementi
Aij
ponendoci
in una situazione sica che a prima vista può apparire semplicata, ma che in realtà non
1 Nel seguito indicheremo sempre i vettori tridimensionali in
cui componenti saranno indicate con indici latini
i
x
con
R3
i = 1, 2, 3.
~x = (x1 , x2 , x3 ), le
invece la notazione x a
con la notazione
Riserveremo
vettori 4-dimensionali nello spazio-tempo. Dovendo enumerare le componenti di tali 4-vettori converremo
di indicarle con indici greci
xµ
che corrono su 0,1,2,3 in cui 1,2,3 sono le coordinate spaziali e 0 quella
temporale del 4-vettore. Useremo perciò le notazioni:
x = (x0 , x1 , x2 , x3 ) = (x0 , ~x)
2.3.
13
TRASFORMAZIONI DI LORENTZ
perde di generalità. Usando traslazioni e rotazioni, possiamo infatti sempre metterci nella
situazione in cui il moto rettilineo uniforme relativo tra i due sistemi inerziali sia diretto
0
lungo l'asse x e stabilire l'origine dei tempi in modo tale che al tempo t = t = 0 le origini
0
e tutti gli assi dei due sistemi cartesiani coincidano. In istanti successivi, il sistema O ,
visto da
O scorre
y, z .
lungo l'asse
x
a velocità costante
v,
mantenendo inalterata la direzione
degli assi
x deve coincidere, al tempo t = t0 = 0 con l'asse x0 , ciò signica che ogni
0
punto con coordinata y = 0 e z = 0 al tempo t = t = 0 deve avere forzatamente anche
0
0
nell'altro sistema y = 0 e z = 0. Ciò implica
Se tutto l'asse
A21 = A31 = 0
Lo stesso ragionamento applicato agli assi
y
e
z
comporta anche
A12 = A32 = A13 = A23 = 0
Perciò le trasformazioni si riducono a
t0
x0
y0
z0
L'origine
O
di
O
appare ad
=
=
=
=
O0
A00 t + A01 x + A02 y + A03 z
A10 t + A11 x
A20 t + A22 y
A30 t + A33 z
muoversi di moto rettilineo uniforme lungo l'asse
x0 ,
cioè
ha le equazioni del moto
x0 = A10 t
y 0 = A20 t = 0
z 0 = A30 t = 0
e quindi
A20 = A30 = 0
Invertendo le trasformazioni si ha
t =
x =
y =
z =
in cui
∆ = A00 A11 − A10 A01 .
A11 0 A02 0 A03 0
A01 0
t −
y −
z −
x
∆
A22
A33
∆
A00 0 A01 0 A02 0 A03 0
x −
t −
y −
z
∆
∆
A22
A33
(A22 )−1 y 0
(A33 )−1 z 0
Questa sono le trasformazioni inverse da
O0
a
O.
Tuttavia
queste devono ovviamente essere identiche in forma a quelle dirette scritte sopra con il
0
0
solo cambio v → −v . Perciò, nota l'assenza di y e z nelle trasformazioni di x e t dirette,
0
0
dovremo richiedere simmetricamente una assenza di y e z dalle trasformazioni di x e t
inverse. Ciò conduce a
A02 = A03 = 0
14
CAPITOLO 2.
CINEMATICA RELATIVISTICA
Pertanto le trasformazioni si semplicano nelle seguenti
t0
x0
y0
z0
=
=
=
=
A00 t + A01 x
A10 t + A11 x
A22 y
A33 z
Finora abbiamo solo messo in opera considerazioni geometriche. Ma ora imponiamo che
un fotone di luce che viaggia a velocità c = 1 in O , sia visto viaggiare alla stessa velocità
c anche in O0 . Il fotone viaggerà in linea retta e perciò le sue equazioni del moto saranno
x = n1 t
in cui
2
ni
c = 1.
y = n2 t
z = n3 t
sono le componenti di un versore indicante la direzione del moto:
Al tempo
t + dt
n21 + n22 + n23 =
il fotone avrà incrementato la sua posizione di
dx = n1 dt
dy = n2 dt
dz = n3 dt
Ne consegue che la quantità
dt2 − dx2 − dy 2 − dz 2 = 0 .
Ragionando allo stesso modo nel sistema
O0
(2.1)
si avrà
dt02 − dx02 − dy 02 − dz 02 = 0
(2.2)
La versione innitesima delle trasformazioni ci permette di sostituire nella (2.2) i dieren0
0
ziali dx , dy , ... con gli analoghi dx, dy, ... ottenendo
(A00 dt + A01 dx)2 − (A10 dt + A11 dx)2 − A222 dy 2 − A233 dz 2 = 0
Questa espressione deve essere proporzionale alla (2.1) poichè entrambe devono annullarsi.
dt dx che sono assenti dalla (2.1) devono annullarsi,
2
uguagliati a meno di una quantità per ora arbitraria Q
In particoalre i coecienti dei termini in
mentre gli altri devono essere
A00 A01 − A10 A11 = 0
(2.3)
A211 − A201 = A222 = A233 = A210 − A200 = Q2
(2.4)
La quantità arbitraria è indicata con
Q2
in quanto, essendo tutti i coecienti
Aij
reali, è
sicuramente positiva. La scelta della soluzione
A22 = A33 = Q
piuttosto che
e
z
−Q,
garantisce che nella trasformazione non ci sia un'inversione degli assi
y
(vedremo più avanti come sono trattate queste trasformazioni particolari). L'origine
2.3.
15
TRASFORMAZIONI DI LORENTZ
degli assi
O
di
O
ha
x = 0,
perciò a un generico tempo
t
la trasformazione per questo
particolare punto è
x0 = A10 t
(2.5)
0
0
procedere lungo l'asse x con velocità −v , quindi O gli
0
0
0
attribuisce l'equazione del moto x = −vt . Sostituendo t con t nella (2.5), ottenendo
A10 0
0
x = A00 t si legano i parametri Aij alla velocità relativa dei due sistemi, che deve essere
Questo punto
O
è visto da
O0
l'unico parametro sico delle trasformazioni
A10 = −vA00
e dalla (2.3) segue
−vA11 = A01
Usando la (2.4) si ottiene
A211 1 − v 2 = A200 1 − v 2 = Q2
da cui
A11 = A00 = √
Come già commentato per
A22
e
A33
Q
1 − v2
Q.
< 0 crescendo t
anche qui scegliamo la soluzione positiva per
Questa scelta è qui ancora più giusticata dal fatto che se fosse A00
t0 , cioè i due sistemi di riferimento avrebbero assi dei tempi rivolti in direzione
diminuirebbe
opposta, con nefaste conseguenze sulla causalità, ecc...
Le trasformazioni di Lorentz diventano perciò con questa scelta
√
t − vx
t0 = Q √
L = −m 1 − v 2
1 − v2
x − vt
x0 = Q √
1 − v2
y 0 = Qy
z 0 = Qz
(2.6)
A questo punto possiamo scrivere le traformazioni inverse, ricavandole dalla (2.6)
t0 + vx0
t = Q−1 √
1 − v2
0
x + vt0
x = Q−1 √
1 − v2
y = Q−1 y 0
z = Q−1 z 0
(2.7)
16
CAPITOLO 2.
oppure come trasformazioni con
CINEMATICA RELATIVISTICA
v → −v
t0 + vx0
t = Q√
1 − v2
x0 + vt0
x = Q√
1 − v2
y = Qy 0
z = Qz 0
(2.8)
Dal confronto della (2.7) e della (2.8) risulta evidente che la costante Q > 0 deve soddisfare
Q = Q−1 , da cui Q = 1. Perciò in conclusione le trasformazioni di Lorentz sono
t − vx
t0 = √
1 − v2
x − vt
x0 = √
1 − v2
0
y = y
z0 = z
(2.9)
Spesso si introduce la notazione
γ=√
1
1 − v2
che semplica la forma delle trasformazioni di Lorentz
t0
x0
y0
z0
La funzione
γ(v),
spesso detta fattore
=
=
=
=
γ
γ(t − vx)
γ(x − vt)
y
z
(2.10)
relativistico di una trasformazione di Lorentz è
tale che
γ(v = 0) = 1
γ(v → 1) → ∞
e per velocità piccole (non relativistiche) ha lo sviluppo di Taylor
1
γ(v) ≈ 1 + v 2 + ...
2
2.4.
17
TRASFORMAZIONI DELLE VELOCITÀ
2.4
Trasformazioni delle velocità
Supponiamo di avere un oggetto che viaggia con velocità ~
u = (ux , uy , uz ) nel sistema di
0
riferimento O . A quale velocità sarà visto viaggiare in O in moto rispetto a O a velocità
v
lungo l'asse
x?
Ovviamente, come abbiamo visto, non può valere un teorema di pure
addizioni delle velocità, come avveniva con le trasformazioni di Galileo, in quanto sarebbe
in contraddizione con l'invarianza della velocità della luce. Per dedurre la trasformazione
delle velocità scriviamo le trasformazioni di Lorentz in forma innitesima
dt0
dx0
dy 0
dz 0
=
=
=
=
γ(dt − v dx)
γ(dx − v dt)
dy
dz
da cui
dx0
γ(dx − v dt)
ux − v
=
=
0
dt
γ(dt − v dx)
1 − ux v
0
dy
dy
uy
=
=
=
0
dt
γ(dt − v dx)
γ(1 − ux v)
0
dz
dz
uz
=
=
=
0
dt
γ(dt − v dx)
γ(1 − ux v)
u0x =
u0y
u0z
Questa è la formula relativistica di addizione delle velocità.
Si noti come la modica
rispetto alla pura addizione di Galileo si produca a causa del fatto che anche i tempi
dt
sono diversi nei due sistemi di riferimento. Ciò comporta leggi di trasformazione non banali
uy , uz sebbene le coordinate y, z non subiscano variazioni. Inoltre, limitandoci
x, se O vede un raggio di luce muoversi a velocità c = 1, O0 misurerà una velocità
1+v
c0 =
=1
1+v
anche per le
all'asse
18
CAPITOLO 2.
CINEMATICA RELATIVISTICA
cioè queste formule confermano l'invarianza della velocità della luce. Se un corpo si muove
1
1
0
a velocità ux =
rispetto a O , e O si muove rispetto ad O a velocità v = , esso non sarà
2
2
0
visto da O muoversi a velocità 1, come erroneamente si potrebbe concludere applicando
trasformazioni di Galileo, bensì a velocità
u0x =
1
2
+ 12
4
1 1 =
5
1+ 2 · 2
cioè a una velocità comunque inferiore a quella della luce.
Per velocità relative tra i sitemi di riferimento piccole rispetto a quella della luce (v
1)
le formule si riducono a quelle galileiane, come si può vedere facilmente espandendo le
formule di trasformazione delle velocità per
v → 0.
Ciò spiega perché nell'esperienza
comune l'addizione galileiana di velocità è assolutamente accettabile.
Per esempio se due automobili si incrociano sull'autostrada a velocità ciascuna di 30
m/sec (circa 100 Km/h), ognuno dei due autisti dovrebbe giudicare, galileianamente, che
l'altra auto gli viene incontro a 60 m/sec. Se invece applichiamo le formule relativistiche,
−7
tenendo conto che in unità c = 1 la velocità di 30 m/sec è pari a circa 10 , avremo
u0x =
2 · 10−7
= 2 · 10−7 (1 − 4 · 10−14 )
−14
1 + 4 · 10
ovvero la correzione è di 14 ordini di grandezza inferiore alla velocità stessa, assolutamente
trascurabile.
Se invece si incontrassero due astronavi vaiggianti ciascuna a velocità 0.99, cioè vicinissime alla velocità della luce, avremmo
u0x =
0.99 + 0.99
1.98
=
= 0.9995 < 1
2
1 + 0.99
1.981
comunque inferiore alla velocità della luce.
2.5
Diagrammi spazio-temporali
Un modo utile per visualizzare la geometria dello spazio-tempo come emerge dalle trasformazioni di Lorentz è quello di ricorrere ai cosiddetti diagrammi spazio-temporali. Iniziamo
con il semplicare il nostro problema pensando allo spazio come a una retta unidimensionale. Allora lo spazio-tempo sarà rappresentato da un piano bidimensionale con coordinate
(x, t).
2.5.
19
DIAGRAMMI SPAZIO-TEMPORALI
Le bisettrici
x = ±t
di questo graco rappresentano le linee lungo cui si propagano
raggi di luce passanti per il qui e ora cioè l'origine degli assi
x = vt
lanciata dall'origine in moto rettilineo uniforme
tan ϕ = 1/v ,
inclinazione
x = t = 0.
Una particella
sarà rappresentata da una retta di
come la linea verde in gura. Questa rappresentazione della sua
traiettoria nello spazio-tempo viene detta
linea di mondo.
Una particella in moto non
uniforme potrà percorrere linee di mondo curve più complicate, come per esempio la linea
blu, la cui tangente punto per punto avrà inclinazione pari a
1/v
in quell'istante. Tuttavia
se la particella si mantiene sempre a velocità minore di quella della luce
inclinazione dovrà essere sempre maggiore di
minori di
◦
45
◦
45
v < 1,
la sua
su questo graco. Linee con inclinazioni
corrispondono a ipotetici corpi viaggianti a velocità maggiori di
c
(tachioni).
Vedremo tra breve che tali oggetti non possono esistere, pena la violazione dell'ordinamento
causale degli eventi.
O,
x e t sono visibilmente ortogonali. Le linee di eventi giudicati simultanei dall'osservatore O sono ovviamente
rette parallele all'asse x, cioè aventi equazione t = cost. Analogamente corpi fermi rispetto
ad O saranno rappresentati da linee di mondo parallele all'asse t, cioè da rette di equazione
x = cost.
Nel sistema di riferimento qui disegnato, che chiameremo
gli assi
Ci possiamo ora chiedere come possano essere rappresentati su questo diagramma gli
O0 in moto rispetto ad O a velocità v . Le
assi di un nuovo sistema di riferimento inerziale
trasformazioni di Lorentz ci dicono che
x0 = γ(x − vt)
t0 = γ(t − vx)
x0 , ovvero la retta di equazione t0 = 0, sarà dato sul nostro piano (x, t)
0
0
dalla retta t = vx e l'asse dei tempi t , ovvero la retta di equazione x = 0, sarà dato
1
0
dalla retta t = x. L'osservatore O giudica eventi simultanei quelli che giacciono su rette
v
t0 = cost., cioè t = vx + cost.
. Prendiamo per esempio il luogo geometrico degli eventi che O
γ
Perciò l'asse delle
giudica simultanei e vericantesi dopo 1 metro (ricordiamo che stiamo misurando il tempo
0
in metri!) dal qui ed ora. Questi saranno sulla retta t = 1. Ma per O gli eventi simultanei
1
0
dopo 1 metro saranno t = 1, cioè t = vx + . Non solo la retta degli eventi simultanei
γ
20
per
CAPITOLO 2.
O0
è inclinata rispetto a quella di
modicata di una quantità
1/γ ,
O,
CINEMATICA RELATIVISTICA
ma anche l'unità di misura del tempo ne risulta
come vedremo meglio più avanti.
La cosa più sorprendente è che apparentemente il sistema di riferimento
più ortogonale. L'angolo tra gli assi non è uguale a
◦
90
O0
non sembra
!. Tuttavia questa non ortogonalità
è solo apparente. Infatti ciò che determina l'ortogonalità non è l'angolo tra gli assi, ma
l'annullarsi del prodotto scalare tra i vettori della base. Ora, il teorema che aerma che
~x · ~y = |~x||~y | cos ϑxy
ove
ϑxy
è l'angolo compreso tra i due vettori, è vero solo in geometria euclidea. Cominciamo
a capire che la geometria dello spazio-tempo non è di tipo strettamente euclideo.
In geometria euclidea la distanza ta due punti, per esempio tra l'origine e un punto P
2
2
2
di coordinate (x, y) è data da s = x + y , come ben nota conseguenza del Teorema di
Pitagora. La cosa importante è che, mentre un cambiamento di base nello spazio euclideo
può far variare le coordinate del punto
P,
la sua distanza dall'origine rimane invariata.
Passando infatti da una base ortogonale a un'altra, la trasformazione che opero è, nel caso
2
euclideo, una rotazione. Ora, qualunque rotazione lascia invariata la quantità s . Si dice
infatti in geometria che le rotazioni sono
isometrie,
ovvero trasformazioni di coordinate
che lasciano invariata la distanza tra punti. Le traslazioni e le rotazioni nello spazio euclideo
sono isometrie.
Vediamo se anche nel nostro spazio-tempo vale una simile relazione, cioè se la distanza
2
2
2
spazio-temporale tra due eventi si può scrivere come σ = x + t . Se così fosse, dovrei
trovare che questa quantità è invariante per le trasformazioni che richiedo essere isometrie
del mio spazio-tempo. Ciò che deve restare invariante per cambiamenti di coordinate nello
spazio-tempo è la velocità della luce, che abbiamo visto condurre alle trasformazioni di
Lorentz.
Perciò le nostre isometrie sono le trasformazioni di Lorentz. Se applico tali
2
trasformazioni alla quantità σ sopra denita, mi accorgo subito che essa non è invariante:
02
2
σ 6= σ . Invece lo è la quantità τ 2 = t2 − x2 . Infatti
τ 02 = t02 − x02 = γ 2 [(t − vx)2 − (x − vt)2 ] = γ 2 (1 − v 2 )(t2 − x2 ) = τ 2
2.6.
PRODOTTO SCALARE IN
MN
21
Dunque la geometria è drasticamente diversa nello spazio-tempo rispetto allo spazio
3
normale. Mentre il nostro spazio può essere assimilato allo spazio euclideo R , lo spazio4
4
tempo non è banalmente un R , o più precisamente, è isomorfo a R come spazio vettoriale,
4
ma non come spazio metrico. Chiameremo questo spazio M , la lettera M essendo scelta
in onore del matematico Minkowski che, negli anni immediatamente seguenti al 1905,
formalizzò questo tipo di spazi proprio pensando all'applicazione in relatività stimolata
da Einstein.
Dunque nello spazio-tempo di Minkowski non vale il teorema di Pitagora
tradizionale, ma piuttosto un teorema di Pitagora alla rovescia con il segno meno e dove
l'ipotenusa è sempre minore di uno dei due cateti!
2.6
Prodotto scalare in
MN
È chiaro che in una simile situazione geometrica anche il prodotto scalare va rivisto. Infatti
la distanza di un punto dall'origine può essere pensata come la norma del vettore che
2
identica quel punto. Tornando al nostro esempio bidimensionale, in R tale norma è data
2
2
2
da |~
x| = x + y = ~x · ~x e risulta, per quanto detto, essere un invariante per trasformazioni
2
isometriche. Invece in M , ove un punto, o meglio un evento, è identicato dal vettore
x = (t, x) la norma invariante sarà |x|2 = x · x = t2 − x2 . Vediamo subito che il prodotto
2
scalare è denito in modo diverso. In R esso era denito come
~a · ~b = a1 b1 + a2 b2
ma ciò porterebbe alla denizione di distanza
s2
che non va bene in Minkowski.
Qui
dobbiamo assumere un prodotto scalare denito come
a · b = a0 b0 − a1 b1
ove abbiamo indicato con l'indice 0 la coordinata temporale e con 1 quella spaziale dei
nostri vettori. In questo modo la norma di un vettore e il prodotto scalare stesso risulta
essere invariante di Lorentz.
Tornando al caso 4-dimensionale sico, il prodotto scalare in
M4
sarà dato da
a · b = a0 b 0 − a1 b 1 − a2 b 2 − a3 b 3
Pensando al prodotto scalare come moltiplicazione riga per colonna di vettori, mentre nel
3
caso euclideo R si ha immediatamente


3
b1
X
(a1 , a2 , a3 )  b2  =
ai bi
i=1
b3
nel caso minkowskiano occorre inserire una opportuna matrice


1 0
0
0
b0
 0 −1 0
  b1
0

(a0 , a1 , a2 , a3 ) 
 0 0 −1 0   b2
0 0
0 −1
b3

3
X

=
aµ ηµν bν

µ,ν=0
22
CAPITOLO 2.
CINEMATICA RELATIVISTICA
Useremo in generale indici latini quando ci riferiremo a spazi euclidei e indici greci per
spazi di tipo Minkowski. Gli spazi minkowskiani talvolta vengono anche detti spazi pseudoeuclidei.
La matrice
η
di elementi
ηµν
metrica
viene detta
N
sarebbe invece banalmente la matrice identità a
dello spazio
dimesioni
1N .
M4 .
La metrica di
RN
Talvolta la notazione
dei 4-vettori ora introdotta viene abbreviata indicando solo due simboli nel vettore riga o
colonna: la componente temporale
a0
e il 3-vettore delle componenti spaziali
~a.
In questo
modo la formula per il prodotto scalare diventa
(a0 , ~a)
In
M2
1 ~0
~0 −13
b0
~b
= a0 b0 − ~a · ~b
la metrica è semplicemente
η=
1 0
0 −1
Verichiamo che con tale metrica anche il sistema
apparenze. In
O
O0
risulta ortogonale, nonostante le
i vettori della base sono
e0 =
1
0
,
e1 =
0
1
ed evidentemente il loro prodotto scalare da proprio gli elementi di
η:
eµ · eν = ηµν
come facile vericare. Perciò i vettori della base sono ortogonali. Trasformiamo questi vet0
tori secondo Lorentz in una nuova base per O che si muove a velocità v . La trasformazione
di Lorentz si può scrivere in forma matriciale come
t0
x0
1−v
0
=γ
1 −v
−v 1
t
x
perciò
e00
=γ
,
e01
=γ
0
1−v
ed è quindi immediato vericare che anche i loro prodotti scalari vericano
e0µ · e0ν = ηµν
Dunque, anche se a prima vista gracamente diremmo che i due assi di
O0
non sono
ortogonali, in realtà essi vericano le condizioni di ortogonalità come quelli di
O.
È il
concetto di ortogonalità che si modica nello spazio di Minkowski poiché la metrica, che
appunto determina i prodotti scalari, non è più
1
ma
η.
Si noti come i vettori della base ortonormale, che in uno spazio euclideo prenderemmo
±1. Infatti |e0 |2 = 1, ma |e1 |2 = −1.
Equivalentemente, det η = −1 < 0. La metrica non è denita positiva e ciò ha come
normalizzati a 1, qui sono in realtà normalizzati a
conseguenza che possono esistere vettori a norma nulla che non sono nulli, mentre in uno
spazio euclideo questo era garantito.
2.7.
2.7
23
CONO-LUCE, PASSATO, PRESENTE, FUTURO
Cono-luce, passato, presente, futuro
I vettori in
MN ,
cioè in qualunque spazio con metrica non denita positiva, si possono
dividere come segue
1. vettori di
tipo tempo, aventi |x|2 > 0
2. vettori di
tipo spazio, aventi |x|2 < 0
3. vettori di
tipo luce, aventi |x|2 = 0.
Questi ultimi deniscono un ipercono nello spazio
cono-luce.
M4
di equazione
t2 − ~x2 = 0,
detto
I vettori di tipo tempo si trovano all'interno di questo cono e quelli di tipo
spazio all'esterno. L'origine del cono coincide con il qui e ora
composto da due falde: una di coordinate
detta cono del
passato.
t>0
detta cono del
O.
Il cono è ovviamente
futuro,
In gura ne diamo una rappresentazione in
M
3
l'altra con
t<0
.
L'asse dei tempi in gura è orientato verticalmente dal basso verso l'alto. Il vertice dei
due coni è l'evento qui e ora
O.
La supercie del cono superiore è il luogo geometrico
delle traiettorie di raggi di luce emessi in
O.
L'interno del cono superiore rappresenta gli
O e viaggiando
v > 1).
eventi che potrò raggiungere in futuro partendo da
breve che è impossibile viaggiare o comunicare a
a
v < 1.
(vedremo tra
Analogamente la supercie del cono inferiore è il luogo geometrico di eventi passati che
possono aver emanato un raggio di luce che mi raggiunge qui e ora in
O.
Lo spazio, stelle,
galassie, ecc... che vedo (cioè sto osseervando) ora tramite segnali luminosi (o radio, IR,
4
UV, X...) è dato proprio da questa supercie conica (che in M sarebbe di dimensione 3,
3
quindi uno spazio R ). L'interno del cono inferiore è l'insieme degli eventi di partenza di
un mezzo di trasporto o un segnale viaggiante a
v<1
che raggiunge
O
qui e ora.
24
CAPITOLO 2.
Risulta perciò evidente che l'evento
O
può essere inuenzato causalmente solo dagli
eventi appartenenti al cono inferiore, mentre
eventi appartenenti al cono superiore.
CINEMATICA RELATIVISTICA
O
stesso può inuenzare causalmente solo
Ciò giustica la nomenclatura di passato data al
cono inferiore e quella di futuro data al cono superiore.
La regione esterna ai due coni non presenta alcuna possibile connessione causale con
presente
O
e ad essa viene dato, forse con un certo abuso di termini, il nome di
. Il piano (in
4
3
M sarebbe un iperpiano R ) perpendicolare all'asse dei tempi e passante per O costituisce
l'insieme di tutti gli eventi simultanei a
prende il nome di
adesso.
O
nel sistema di riferimento in cui
O
è a riposo e
I concetti di presente e adesso, che abitualmente consideriamo
come equivalenti, sono distinti in relatività e tornano a coincidere solo nel limite in cui la
velocità della luce diventa innita. In tale limite i coni si allargherebbero no a coincidere
3
con il piano dell'adesso. Si noti, equivalentemente, che abbiamo identicato due spazi R in
quanto detto sopra, non coincidenti. Uno è lo spazio degli adesso, coiè denito dagli eventi
simultanei. L'altro è lo spazio visibile che comprende eventi che vedo adesso, ma capitati
nel passato. Se vedo oggi esplodere una supernova nella Grande Nube di Magellano, sto
ossevando ora un evento capitato circa 160.000 anni fa. Ciò che si trova al posto di quella
supernova ora, nel senso di simultaneamente a me adesso, mi è sconosciuto.
Fa parte
degli eventi del presente, di cui non posso avere informazione. Se decido ora di mandare
una sonda per esplorare quella supernova, a velocità vicinissima a quella della luce, essa
raggiungerà la supernova tra 160.000 anni, quando la sua linea di mondo incontrerà il mio
cono del futuro.
2.8
Rapidità
Continuiamo a restringerci per semplicità allo spazio-tempo bidimensinale
M2 .
Un altro
modo di scrivere le trasformazioni di Lorentz fa uso delle funzioni iperboliche
cosh θ =
eθ + e−θ
2
,
sinh θ =
eθ − e−θ
2
per le quali vale l'identità
cosh2 θ − sinh2 θ = 1
analoga a quella per funzioni trogonometriche ordinarie, ma con il segno meno, proprio ciò
che distingue l'invariante di Lorentz da un comune invariante per rotazioni. Ricordiamo
che
cosh θ = cos iθ
,
sinh θ = i sin iθ
e che, per denizione
sinh θ
cosh θ
θ
−θ
Poiché e > 0 e e
> 0, allora cosh θ > 0, per tutti i θ. Invece sinh θ può essere sia positivo
che negativo (è una funzione dispari di θ , mentre cosh θ è pari). Tuttavia è sempre
tanh θ =
| sinh θ| < | cosh θ|
2.8.
25
RAPIDITÀ
fe quindi
| tanh θ| < 1,
per tutti i
θ.
Valgono le espansioni in serie attorno a
θ=0
1
sinh θ ≈ θ + θ3 + O(θ5 )
6
1
cosh θ ≈ 1 + θ2 + O(θ4 )
2
1
tanh θ ≈ θ − θ3 + O(θ5 )
3
Poniamo
il nome di
v = tanh θ
rapidità.
√
nelle trasformazioni di Lorentz. Il parametro
s
1 − v2 =
1−
sinh2 θ
1
=
2
cosh θ
cosh θ
=⇒
γ = cosh θ
e quindi
t0 = t cosh θ − x sinh θ
x0 = x cosh θ − t sinh θ
ovvero
θ
così denito prende
Avremo
t0
x0
=
cosh θ − sinh θ
− sinh θ cosh θ
t
x
,
γv = sinh θ
26
CAPITOLO 2.
CINEMATICA RELATIVISTICA
Così scritte, le trasformate di Lorentz hanno una fortissima analogia con una rotazione di
angolo
θ
degli assi in un piano euclideo, dove però qui
θ → iθ.
Possiamo allora pensare
alle trasformazioni di Lorentz come a una sorta di speciali rotazioni (iperboliche) nello
spazio-tempo.
La legge di composizione delle velocità, in termini delle rapidità prende una forma
particolarmente interessante. Essa infatti può essere scritta come
tanh θB =
per la trasformazione da un sistema
a
OA .
tanh θA − tanh θAB
1 − tanh θA tanh θAB
OA e uno OB
viaggiante a velocità relativa
vAB
rispetto
Questa risulta essere proprio la formula di addizione delle tangenti iperpoliche, da
cui si deduce
θB = θA − θAB
ovvero, mentre in relatività le velocità non rispettano più una legge di somma, le rapidità
seguono un principio di addizione. Per piccole velocità
v = tanh θ ≈ θ + ...
e quindi il teorema di addizione delle rapidità equivale in questo limite al teorema di
addizione delle velocità galileiano.
2.9
Invarianza dell'ipervolume
Ritorniamo ora al diagramma dello spazio
M2
di coordinate
(t, x).
Un corpo che si muova alla velocità della luce viaggia lungo la prima o la seconda
bisettrice. Posso pensare di riscrivere le trasformazioni di Lorentz usando le coordinate
t ± x = ξ±
dette
coordinate di cono-luce.
Avrò
ξ 0± = e±θ ξ ±
2
2
2
2
+ −
L'invariante di Lorentz τ = t − x è ora dato semplicemente dal prodotto τ = ξ ξ . Le
±
linee ξ = cost. sono le parallele alle bisettrici e segnano la propagazione di raggi di luce.
2.10.
27
IPERBOLI INVARIANTI, STABILITÀ DEL CONO-LUCE
Se costruisco un quadrato e poi lo trasformo secondo Lorentz può succedere per esempio
+
−
che la sua ξ
sia dimezzata, ma allora la sua ξ
sarà contemporaneamente raddoppiata,
4
sicchè l'area rimane costante. Applicando questo ragionamento a tutto lo spazio M e
non solo al diagramma semplicato bidimensionale, possiamo aermare che l'ipervolume
Ω
di una gura geometrica 4-dimensionale è un invariante di Lorentz.
d4 x = dt dx1 dx2 dx3 è un invariante.
In particolare il
volumetto innitesimo
2.10
Iperboli invarianti, stabilità del cono-luce
Le rotazioni del piano euclideo mantengono invariate le circonferenze e ciò perché l'equazione della circonferenza si scrive
x2 + y 2 = cost.
Ciò che funge da analogo della circonferenza nello spazio-tempo di Minkowski sono le
iperboli
t2 − x2 = cost.
Esse sono iperboli equilatere aventi come asintoti le bisettrici
η = cost.
e
ξ = cost.
La
trasformazione di Lorentz non fa altro che far scorrere i punti del piano su queste iperboli
(come ad esempio per i vertici del quadrato di cui sopra) che vengono perciò dette
invarianti.
iperboli
28
CAPITOLO 2.
CINEMATICA RELATIVISTICA
Se allora un punto è vincolato a scorrere su queste iperboli, esso si potrà trovare o su
±
una iperbole del I-III quadrante rispetto a ξ , oppure su una del II-IV, oppure sugli assi
ξ ± . Poichè le bisettrici sono mandate in se stesse dalle trasformazioni di Lorentz, non è
possibile per un punto fuori di esse attraversarle. Esse dividono nettamente lo spazio-tempo
in 3 regioni che vengono trasformate in se stesse.
Si vede così che una trasformazione di Lorentz manda eventi del cono del futuro sempre in eventi dello stesso cono del futuro. Analogamente capita con passato e presente. Si
dice che le tre regioni passato, presente e futuro sono sottoinsiemi
stabili,
cioè mappati
in se stessi dalle trasformazioni di Lorentz. Le trasformazioni di Lorentz hanno quindi la
piacevole caratterisitica di non cambiare la posizione di un evento: se esso, per esempio,
O, apparterrà anche al futuro di qualunque sistema
O e in moto relativo inerziale rispetto a quello in cui O è a riposo.
appartiene al futuro di
di riferimento
centrato in
Le trasforma-
zioni di Lorentz, perciò, tendono a conservare la succesione causale degli eventi e questa è
una proprietà cruciale per una struttura geometrica che voglia pretendere di rappresentare
il mondo sico.
2.11
Ordinamento causale e velocità maggiori di
c.
in relatività ristretta non può esistere alcun agente sico
che si propaghi a velocità maggiore di quella della luce. Le trasformazioni di
Dimostriamo ora che
Lorentz sono valide per
diventa immaginario.
v < 1,
poiché per
v =1
il denominatore si annulla e per
v >1
Si potrebbe però obbiettare che ciò non dimostra aatto che non
possano esistere velocità superiori a quella della luce. Infatti per
v≥1
le trasformazioni
potrebbero essere diverse. Tuttavia ora mostreremo che ciò porta ad un assurdo, usando
solo trasformazioni di Lorentz per
v < 1.
∆x nello spazio e ∆t nel tempo; siano
(t1 , x1 ) le coordinate dell'evento 1 e (t2 , x2 )le coordinate dell'evento 2. ∆x = x1 − x2
∆t = t1 − t2 > 0, cioè l'osservatore O vede l'evento 2 avvenire prima dell'evento 1. Dalle
Supponiamo di avere due eventi che siano distanti
cioè
e
2.12.
29
CONTRAZIONE DELLE LUNGHEZZE
trasformazioni di Lorentz abbiamo subito che per un altro osservatore
ad
O
a velocità
v
O0
in moto rispetto
questi intervalli saranno
∆x0 = γ(∆x − v∆t)
∆t0 = γ(∆t − v∆x)
0
E' possibile che O veda l'evento 1 avvenire prima di 2?
∆t0 < 0, ovvero ∆t < v∆x da cui
Perchè ciò accada deve essere
∆t
<v<1
∆x
Tali
O con velocità v sodisfacente a queste
v esistono se ∆t < ∆x, cioè se l'intervallo
O
è minore del tempo che impiega la luce per
Quindi tutti i sistemi che traslano rispetto al sistema
diseguaglianze vedono prima 1 e poi 2.
temporale tra i due eventi per l'osservatore
andare da 2 a 1.
Supponiamo che l'evento 1 sia provocato dall'evento 2, cioè che esista una relazione di
causa-eetto tra i due eventi nella sequenza
2 → 1.
E' chiaro che se trovo un osservatore
per il quale la sequenza di eventi è invertita ho violato la causalità. Se esiste tale causalità,
allora essa sarà dovuta a un agente sico propagantesi da 2 a 1. Questo agente sico si
propaga a una velocità
u=
∆x
∆t
Se u < 1 non ci sono velocità v tali da invertire la sequenza degli eventi 2 → 1, perché
∆t/∆x = 1/u > 1. Se invece supponiamo per assurdo che tale agente sico si propaghi
con una velocità u > 1, potremo sempre trovare una velocità v < 1 alla quale si mouve un
0
osservatore O per il quale la sequenza di eventi appare invertita (1 → 2) e ciò è chiaramente
impossibile in quanto violerebbe la causalità.
Se ne conclude che nessun segnale, sia esso composto da corpi dotati di massa o meno,
può propagarsi a velocità maggiore di quella della luce senza violare la causalità. La velocità
della luce rappresenta quindi un limite massimo di propagazione di qualunque informazione
nello spazio-tempo.
2.12
Contrazione delle lunghezze
Immaginiamo di avere una sbarra
nell'origine
O
e l'altra in un punto
OA di lunghezza L ferma in O
A lungo l'asse x, cioè tale che
∀t,
e avente un'estremità
x o = 0 xA = L
Per le trasformazioni di Lorentz, lo stesso punto avrà in un sistema inerziale
rispetto a
O
a velocità
v
lungo l'asse
x
le seguenti coordinate
x0o = −γvto
t0o = γto
O0
in moto
30
CAPITOLO 2.
e quindi
O
x0o = −vt0o ,
come è logico che sia, poiché
allontanarsi a velocità
−v .
O0
CINEMATICA RELATIVISTICA
vede questo punto sso nell'origine di
Analogamente per il punto
x0A = γ(L − vtA )
A
t0A = γ(tA − vL)
La misura di lunghezza della sbarra viene eettuata da entrambi gli osservatori misurando
simultaneamente le coordinate dei punti estremi
per
per
La condizione
t0o = t0A
O:
L = xA − xo
O0 :
L0 = x0A − x0o
D'altronde la dierenza
x0A − x0o
x0A
lunghezza
L
A
e calcolandone la dierenza, cioè
a tempi uguali
a tempi uguali
O0
−
x0o
v
L)
c2
⇒
to = tA
t0o = t0A
tA − to =
v
L
c2
si trasforma come
v2
= γ[L − v(tA − to )] = γL 1 − 2
c
giudica che la lunghezza di una sbarra misurata da
O
essere di
sia di lunghezza
L0 =
Poiché
e
si traduce in
γto = γ(tA −
da cui discende che
O
γ > 1,
è sempre
L
γ
L0 < L e si ha il fenomeno noto come contrazione
relativistica delle
lunghezze.
Una sbarra a 30 m/sec (velocità tipica di un auto sull'autostrada) sarebbe contratta
10−14 volte la sua lunghezza a riposo. Ma a velocità vicine
di una quantità dell'ordine di
a quelle della luce la contrazione può arrivare a essere quasi totale.
Si noti che questo
modo di misurare la posizione degli estremi simultaneamente non tiene conto dei ritardi
di segnale dovuti alla velocità nita della luce, e non è ad essi dovuto, ma alla particolare
natura della geometria pseudoeuclidea dell spazio-tempo.
2.13
Dilatazione dei tempi
Associata alla contrazione delle lunghezze si ha sempre anche una dilatazione dei tempi.
Supponiamo di avere un orologio fermo nell'origine degli assi di
O
che possiamo schematiz-
zare come una serie di eventi equidistanti (il battito dei secondi, per esempio) lungo l'asse
t. Sia la distanza tra i primi due di questi eventi T . Cioè il primo evento O si trova in
to = xo = 0 e il secondo A (l'altro estremo dell'intervallo temporale OA di lunghezza T )
in tA = T e xA = 0.
O0 vede i due eventi a tempi
t0o = 0
t0A = γtA
2.14.
31
PARADOSSO DEI GEMELLI
e quindi giudica che l'intervallo temporale trascorso sia
T 0 = t0A − t0o = γtA
dunque con una dilatazione dei tempi
T 0 = γT
2.14
Paradosso dei gemelli
Supponiamo che si voglia fare un viaggio dalla Terra ad α-Centauri (distanza misurata
4
dalla Terra L = 4 anni-luce) a v = c = 240.000 Km/sec. La luce impiega 4 anni per
5
arrivare ad α-Centauri. I terrestri (sistema O ) vedono l'astronave impiegare 5 anni per
raggingere la stella.
Per questo problema conviene adottare come unità di misura aventi
c=1
l'anno peer
i tempi e l'anno-luce per le misure spaziali.
Sull'astronave c'è un orologio che scandisce il tempo.
Visto dagli astronauti, questo
orologio è del tutto regolare, mentre da Terra lo si vede andare più lentamente e gli stessi
astronauti invecchiano più lentamente dei loro gemelli terrestri.
Per quanto visto, un
intervallo di tempo dell'astronave sarà visto da Terra dilatato di un fattore
γ=√
5
1
=
3
1 − v2
Quindi mentre sulla Terra sono passati 5 anni, sull'astronave ne sono passati 3 e quindi
gli astronauti dicono di impiegare 3 anni per fare il viaggio. Ma gli astronauti viaggiano
4
sempre alla velocità v =
e dicono che il viaggio è più corto perché è più breve il percorso.
5
3
0
Infatti per la contrazione delle lunghezze per loro sarà L = L, cioè per gli astronauti
5
12
la distanza Terra α-Centauri è di
= 2, 4 anni-luce. Dunque l'evento A di arrivo su
5
α-Centauri avrà coordinate
x=4 t=5
x0 = 0 t0 = 3
nel sistema
nel sistema
O
O0
della Terra
dell'astronave
Tuttavia questo calcolo fa sorgere un apparente paradosso. La perfetta relatività dei
movimenti fa sì che gli astronauti possano assumere di essere fermi e che invece sia la Terra
4
a muoversi a v =
e percio` essi vedono gli eventi terrestri svolgersi più lentamente di
5
5
un fattore di dilatazione . Allora dati due gemelli, uno dei quali rimane sulla Terra e
3
l'altro invece fa parte dell'equipaggio, il gemello terrestre vedrebbe il gemello astronauta
invecchiare meno rapidamente di lui, mentre il gemello astronauta vedrebbe quello terrestre
invecchiare meno di lui. Chi invecchia meno in realtà?
32
CAPITOLO 2.
CINEMATICA RELATIVISTICA
Il paradosso si risolve rendendosi conto che due sistemi di riferimento inerziali viaggiano
necessariamente con moto rettilineo uniforme uno rispetto all'altro e che perciò nchè si
rimane in questa situazione non vi sarà modo per i due gemelli di reincontrarsi e paragonare
eettivamente le loro età. Per fare ciò, l'astronave deve invertire il suo moto e tornare verso
la Terra. Ma questo equivale a dire che deve necessariamente rallentare e passare quindi
per stati di moto accelerato per i quali non valgono più le trasformazioni di Lorentz.
Tralasciando il problema della decelerazione e poi nuova accelerazione in senso opposto
dell'astronave, immaginiamo che il gemello astronauta, una volta arrivato ad α-Centauri,
0
00
salti dal sistema di riferimento inerziale O di andata verso la stella a quello O di ritorno.
0
Eventi simultanei per il sistema di andata sono individuati da rette parallele all asse x del
00
sistema di andata, e queste rette sono ben diverse da quelle parallele all'asse x del sitema
di ritorno.
Il gemello astronauta, nell'evento A in cui arriva su α-Centuari ed è ancora solidale al
O0 , descrive gli eventi che lui giudica simultanei al suo arrivo, come
0
il luogo geometrico dato dalla retta parallela all'asse x e passante per l'evento A cioè nel
sistema di riferimento
2.14.
33
PARADOSSO DEI GEMELLI
sistema di coordinate di
O0
dalla retta
t0 = 3
Questa viene trasformata nel sistema
O
della Terra nella retta di equazione
5
3=
3
ovvero
4
x+ t
5
9
4
t= x+
5
5
9
= 1, 8 anni. Questo è
5
il tempo che il gemello astronauta giudica sia passato sulla Terra durante il suo viaggio di
che intercetta l'asse
x=0
su cui rimane la Terra a un tempo
t=
andata.
Ora l'astronauta inverte bruscamente la rotta, cioè salta istantaneamente su un altro
00
sistema di riferimento O in cui la retta degli eventi simultanei con A è data dalla equazione
4
41
t=− x+
5
5
che è la retta di inclinazione data dall'inverso della velocità (negativa) di ritorno che passa
0
00
per l'evento A. L'astronauta, durante il salto da O a O vede trascorrere istantaneamente
9
tutti gli eventi terrestri dal tempo
= 1, 8 anni al tempo 41
= 8, 2 anni. Cioè un intervallo
5
5
di 6,4 passa istantaneamente sulla Terra per giudizio dell'astronauta.
Ovviamente questo salto istantaneo non è sicamente possibile.
La decelerazione e
successiva accelerazione deve durare un certo tempo e i tempi terrestri vengono visti scorrere più velocemente ma non istantanemaente per eetti di trasformazioni tra sistemi di
riferimento accelerati che tratteremo in relatività generale.
Per ora basti sapere che al
suo ritorno sulla Terra il gemello astronauta sarà invecchiato in totale di 6 anni, mentre il
suo gemello terrestre sara` invecchiato di 10 anni. Questa asimmetria è dovuta proprio al
fatto che l'astronauta ha dovuto cambiare sistema di riferimento inerziale mentre il gemello
terrestre no.
Si noti che anche in questa analisi del paradosso dei gemelli non si tiene conto della
velocità di propagazione del segnale. Gli eetti di dilatazione dei tempi e contrazione delle
lunghezze sono dati esclusivamente da considerazioni sul concetto di simultaneità come
giudicato dai diversi sistemi di riferimento inerziali in gioco.
Se invece volessimo tener conto della propagazione dei segnali alla velocità
c,
la descri-
zione dei fenomeni sarebbe diversa. L'astronauta vedrebbe gli eventi terrestri dei primi 1,8
anni raggiungerlo molto lentamente, mentre i successivi lo raggingerebbero rapidamente
durante il viaggio di ritorno, cosicchè al momento del rientro sulla Terra l'astronauta è
aggiornato su tutti gli eventi accaduti sul pianeta nel decennio trascorso. Tuttavia egli è
conscio che ciò che vede a un certo istante sulla Terra è in realtà avvenuto tempo prima
ed è a lui arrivato tramite un segnale luminoso che ci ha messo un certo tempo, così come
quando vediamo esplodere una supernova non diciamo ora è esplosa la supernova ma,
34
CAPITOLO 2.
CINEMATICA RELATIVISTICA
se questa si trova per esempio a 1000 anni-luce da noi, diciamo 1000 anni fa è esplosa
una supernova nella costellazione tal dei tali, ecc.... Attribuiamo cioè all'evento esplosione
della supernova una proprietà di simultaneità con gli eventi terrestri di 1000 anni fa, non
con quelli di oggi. È questa simultaneità che viene distorta dalle trasformazioni di Lorentz.
L'eetto non è dovuto solo al trasmettersi a velocità nita dei segnali.
2.15
Tempo proprio
Si denisce
tempo proprio τ
di un sistema di riferimento il tempo misurato dagli orologi
posti a riposo nel sistema di riferimento dato.
Si ponga attenzione nel distinguere il tempo proprio dal tempo coordinata. Il tempo
coordinata vuol dire semplicemente la dierenza tra la coordinata tempo di due eventi.
L'evento partenza e l'evento arrivo su
α-Cen
dell'astronave, nell'esempio del paragrafo
precedente, sono distanziati di 5 anni per l'osservatore terrestre
O.
Tempo proprio è quello sperimentato dall'astronave per chi è sopra l'astronave. Essa,
nel sistema dell'astronave
O0
è ferma. Ora, abbiamo visto che
dt02 − d~x02 = dt2 − d~x2
è un invariante per trasformazioni di Lorentz. Nel sistema dell'astronave
d~x0 = 0
e
dt0
è
il tempo segnato dagli orologi dell'astronave, cioè è contemporaneamente tempo proprio e
tempo coordinata dell'astronave.
dτ 2 = dt2 − d~x2
Ma
d~
x
dt
= ~v
e quindi, indicando con
v = |~v |
√
dτ = dt 1 − v 2
cioè si riottiene il tempo dilatato, cioè il tempo proprio dell'astronave è il tempo che la
Terra ha visto passare sui suoi orologi moltiplicato per per il fattore di rallentamento
√
1 − v 2 = γ −1 .
D'ora in poi useremo il tempo proprio come invariante spazio-temporale fondamentale
dτ 2 = dt2 − dx21 − dx22 − dx23
Capitolo 3
Calcolo tensoriale piatto
Vediamo ora di formalizzare in una veste matematica corretta le idee esposte nel capitolo
precedente. Allo scopo iniziamo con alcuni richiami sugli spazi vettoriali e gli spazi metrici,
per poi introdurre il calcolo tensoriale piatto.
Le leggi della Fisica devono essere uguali in qualsiasi sistema di riferimento inerziale,
cioè invarianti per trasformazioni di Lorentz. Per poter asserire ciò bisogna porre le leggi
siche in una forma in cui l'invarianza appaia chiaramente e ciò viene fatto tramite il
calcolo tensoriale.
3.1
Spazi vettoriali lineari reali
Uno spazio vettoriale lineare
detti vettori
•
1
V
una operazione di somma
su un corpo commutativo
+:V×V→V
~v
commutativa
∀~v , ~u ∈ V
associativa
(~v + ~u) + w
~ = ~v + (~u + w)
~
è un insieme di elementi
che goda delle proprietà
~v + ~u = ~u + ~v
K
nel quale siano denite
∀~v , ~u, w
~ ∈V
esistenza del vettore nullo
∃~0 ∈ V :
~v + ~0 = ~v
∀~v ∈ V
1 In questa sezione useremo la convenzione di indicare vettori in uno spazio vettoriale generico di dimensione
N
con il simbolo
~x.
Useremo invece la notazione con lettere grassette
x
quando penseremo a
un vettore come a una matrice colonna. La corrispondente matrice riga sarà indicata dall'operazione di
xT . Le matrici
A, B, ecc...
trasposizione come
sempre, maiuscole
quadrate saranno indicate con lettere grassette, usualmente, ma non
I risultati di questo capitolo si potranno applicare sia allo spazio-tempo 4-dimensionale di Minkowski,
i cui vettori sono indicati con
x
che allo spazio ordinario
capitoli.
35
R3
i cui vettori sono indicati con
~x
negli altri
36
CAPITOLO 3.
esistenza dell'opposto
~v + (−~v ) ≡ ~v − ~v = ~0
∀~v ∈ V ∃(−~v ) :
•
un prodotto per scalari
K×V→V
che goda delle proprietà
distributiva I
λ(~v + ~u) = λ~v + λ~u
∀λ ∈ K, ∀~v , ~u ∈ V
(λ + µ)~v = λ~v + µ~v
∀λ, µ ∈ K, ∀~v ∈ V
distributiva II
associativa
∀λ, µ ∈ K, ∀~v ∈ V
(λµ)~v = λ(µ~v )
CALCOLO TENSORIALE PIATTO
invarianza per l'unità di
K
1~v = ~v
1 ∈ K, ∀~v ∈ V
Nel seguito ci occuperemo principalmente dei casi in cui
K=R
nel quale
V
è detto spazio
vettoriale reale.
Ricordiamo qui, senza ripeterne le dimostrazioni, alcune proprietà utili degli spazi
vettoriali:
•
l'unicità del vettore nullo e dell'opposto di un elemento dato
•
le leggi di annullamento del prodotto per scalari
0~v = ~0
∀~v ∈ V
λ~0 = ~0
∀λ ∈ R
•
la validità delle usuali regole algebriche di calcolo
•
l'esistenza una base
che ogni
{~eµ ; µ = 1, ..., N } di vettori
vettore ~
a ∈ V si possa esprimere come2
~a = aµ~eµ
Il numero intero
N
si dice dimensione di
componenti del vettore
~a
2 Qui e nel seguito aderiamo alla
nella base
linearmente indipendenti di
V
tale
aµ ∈ R
V
e si scrive
dim V = N .
Le
aµ
sono dette
{~eµ }.
convenzione di Einstein sugli indici: indici ripetuti una volta in alto e
una in basso si sottintendono sommati, cioè, per esempio, la notazione precedente sottintende una
P
µ a
secondo membro. Quindi o un indice si contrae, cioè si somma con un altro indice con lo stesso nome ma
che si trova in posizione (alto o basso) opposta, oppure è libero e allora deve comparire libero e nella stessa
posizione anche nell'altro membro dell'equazione.
possono essere ribattezzati a piacere.
Si noti che gli indici ripetuti sono muti e che quindi
3.1.
37
SPAZI VETTORIALI LINEARI REALI
Deniamo un operatore come un ente astratto
produce come risultato un altro vettore
d~ ∈ V,
A
cioè
che, applicato a un generico
~a ∈ V
A : V → V.
A~a = d~
Consideriamo operatori lineari, cioè tali che
A(λ~a + µ~b) = λA~a + µA~b
Il vettore
d~ sarà
esprimibile come
d~ = dµ~eµ ,
ma anche come
d~ = A~a = A(aµ~eµ ) = aµ A~eµ = aµ Aν µ~eν
cioè
dµ = aν Aµν
in cui
Aµν
indica la
µ-sima
componente del vettore
A~eν .
I numeri
Aµν
possono essere
organizzati in una matrice


A=
A1 1 . . .
.
.
.
AN1
..
.
...
A1 N
.
.
.
N
AN
Si noti che la posizione degli indici non è indierente.



Il primo indice, che sia in alto o
in basso, rappresenta comunque le righe, mentre il secondo rappresenta le colonne. Ecco
µ
µ
µ
perchè le notazioni A ν e Aν non sono equivalenti e la notazione Aν in realtà avrebbe senso
solo per matrici simmetriche. Si può così dire che la matrice A costituisce una rappresentazione matriciale dell'operatore lineare
A.
Come conseguenza dell'algebra operatoriale si
può immediatamente costruire l'algebra delle matrici
1. Somma: la matrice
S=A+B
2. Prodotto: la matrice
Un vettore
~a = aµ~eµ
P = AB
ha componenti
ha componenti
S µν = Aµν + B µν
P µν = Aµρ B ρν
sarà rappresentato dalla matrice colonna

a1


a=
.
.
.
N


a
e ciò concorda con la denizione del prodotto righe per colonne
dµ = Aµν aν
cioè
d = Aa
38
CAPITOLO 3.
3.2
CALCOLO TENSORIALE PIATTO
Prodotto scalare, metrica
Nello spazio
con valori
V deniamo un prodotto scalare, inteso come
in R, cioè · : V × V → R avente le proprietà
forma bilineare non degenere
~a · ~b = ~b · ~a
(λ~a + µ~b) · ~c = λ~a · ~c + µ~b · ~c
Il prodotto scalare permette di denire, per ogni vettore, una
|~v | =
norma
√
~v · ~v
Uno spazio vettoriale dotato di prodotto scalare viene perciò detto
spazio normato.
Esprimendo i vettori tramite le componenti nella base
~a · ~b = aµ bν ~eµ · ~eν = gµν aµ bν
ove si è denita la
metrica
gµν = ~eµ · ~eν
La commutatività del prodotto scalare implica la simmetria della metrica
Introduciamo anche la
metrica inversa, denita dalla relazione
gµν = gνµ .
g µν gνρ = δρµ
δρµ = 1 se µ = ρ e δρµ = 0 se µ 6= ρ è il cosiddetto simbolo di Krönecker, che descrive le
componenti della matrice identità 1. Pensando a gµν come alle componenti di una matrice
g, allora la relazione denitoria di g µν si rilegge come g−1 g = 1, e ciò giustica il nome
µν
di metrica inversa per g . Il fatto che il prodotto scalare sia non degenere assicura che
det g 6= 0 e che quindi esiste l'inverso g−1 . Si noti invece che non richiederemo in generale
dove
che il prodotto scalare sia denito positivo, il che implicherebbe che tutti gli autovalori di
g
siano positivi. Qui invece possiamo permettere sia autovalori positivi che negativi, come
appunto capita nel caso della metrica dello spazio-tempo minkowskiano.
Il prodotto scalare in termini matriciali si può rappresentare come
~a · ~b = aT gb
Uno spazio normato dotato di metrica invertibile e simmetrica si dice
spazio metrico.
Nella presente trattazione assumiamo che gli elementi della matrice metrica siano costanti indipendenti dalle coordinate. Vedremo che in Relatività generale occorrerà generalizzare questo punto a metriche dipendenti dalle coordinate, che introdurranno i cosiddetti
spazi curvi. Nella trattazione della relaitività ristretta, tuttavia, si fa uso solo di metriche
costanti e gli spazi metrici dotati di metriche costanti si dicono
Possiamo poi denire i vettori della
base duale di V
~eµ = g µν ~eν
spazi piatti.
3.2.
39
PRODOTTO SCALARE, METRICA
che sono pure linearmente indipendenti. Pertanto un vettore si può decomporre anche nella
base duale
~a = aµ~eµ
Confrontando questa decomposizione con quella nella base originaria si legano i due diversi
tipi di componenti
aµ g µν = aν
e analogamente
aµ gµν = aν
Inoltre il prodotto scalare di due vettori si esprime come
~a · ~b = gµν aµ bν = aν bν
Da tutto ciò si comprende l'importante ruolo della metrica
gµν
e della sua inversa
g µν
nell'alzare e abbassare gli indici. In qualunque situazione, da una quantità con un indice
in alto si potrà ottenere la sua analoga con indice in basso moltiplicando per la metrica
gµν . Viceversa un indice sarà abbassato dalla metrica inversa g µν .
Due vettori si dicono
ortogonali se il loro prodotto scalare è nullo.
Una base in cui tutti
i vettori siano ortogonali l'uno all'altro si dice base ortogonale. Ovviamente la metrica
g
di una base ortogonale è una matrice diagonale. Poichè ogni matrice con determinante non
nullo si può diagonalizzare, e avrà come elementi diagonali i suoi autovalori, ne concludiamo
che possiamo sempre trovare una base ortogonale per uno spazio piatto.
La norma può essere riscritta in componenti, mostrando la sue relazione con la metrica
|~v |2 = gµν v µ v ν
In particolare per i vettori della base
|~eµ |2 = gµµ
(qui non vale la convenzione di Einstein)
e perciò possiamo sempre ridenire nuovi vettori della base aventi norma quadrata 1:
−1/2
~eˆµ = gµµ ~eµ . In questa nuova
la metrica risulta necessariamente
base ortonormale
diagonale e avente lungo la diagonale elementi
gµµ = ±1.
Gli spazi vettoriali reali normati
piatti si possono perciò classicare dandone le dimensioni e la quantità di
compaiono nella metrica di una loro base ortonormale.
elementi diagonali di
g
+1
e
−1
che
Poiché il numero totale degli
è la dimensione, in realtà basterà indicare quanti autovalori +1
(o coordinate temporali ) e quanti
−1
(o coordinate spaziali ) compaiono nella metrica.
N
Come spazi vettoriali, tutti questi spazi sono isomor a R . Tuttavia solo se tutti
gli autovalori hanno lo stesso segno, che in questo caso conviene prendere positivo, cioè
indica la matrice identità a N dimensioni)
N
In questo caso potremo usare la notazione R
p,q
In tutti gli altri casi useremo la notazione R
dove p è il numero di
se in una base ortonormale
essi sono isomor a uno
per identicarli.
g = 1N
(dove
spazio euclideo.
1N
40
CAPITOLO 3.
CALCOLO TENSORIALE PIATTO
q quello di coordinate temporali3 . Gli spazi di Minkowski saranno
= RN −1,1 cioè spazi con N − 1 coordinate spaziali e 1 coordinata
p,q
p,q
spazi R
con entrambi p, q 6= 0 e dim R
= p + q sono detti spazi
coordinate spaziali e
N
classicati come M
temporale.
Gli
pseudoeuclidei.
In questa notazione lo spazio-tempo sico della Relatività ristretta, che
4
3,1
nora abbaimo chiamato M , è R .
2
Il segno di |~
v | dipende essenzialmente dagli autovalori della metrica. In RN questi sono
tutti positivi, e perciò anche il determinante della metrica è positivo. La norma quadrata
sarà sempre positiva e potrà annullarsi solo per il vettore nullo.
Nel caso, invece, degli
spazi pseudoeuclidei è possibile trovare un luogo geometrico di tutti i vettori che hanno
norma nulla. A questo luogo viene dato il nome di
cono-luce.
I vettori saranno classicati
a seconda che abbiano norma positiva, nulla o negativa in vettori di tipo tempo, di tipo
luce o di tipo spazio, come già visto.
3.3
Cambiamenti di base
aµ quando si fa un
cambiamento di base. Supponiamo di trasformare i vettori della base {~
eµ } in un nuovo
0
insieme di vettori {~
eµ } attraverso l'applicazione di una trasformazione lineare L
Un altro importante aspetto della questione è vedere cosa succede alle
~e0µ = L~eµ = Λν µ~eν
L si può rappresentare come una matrice N × N Λ. Si può
dimostrare facilmente che i vettori {~
e0µ } sono ancora linearmente indipendenti se e solo se
det Λ 6= 0. In questo caso {~e0µ } è una nuova base di V ed esiste certamente la trasformazione
−1
inversa Λ
che manda le {~
e0µ } nelle {~eµ }.
Sia dato un vettore ~
a e abbia componenti aµ nella vecchia base {~eµ } e a0µ nella nuova
base {~
e0µ }. Sarà
~a = aµ~eµ = aµ (Λ−1 )ν µ~e0ν = a0ν ~e0ν
Dunque la trasformazione
cioè
a0ν = (Λ−1 )ν µ aµ
Si vede come le componenti con indice in alto di
dette componenti controvarianti del vettore
3 Il scegliere +1 per le coordiante temporali e
~a
si trasformano con
Λ−1 .
Perciò sono
~a.
−1
per quelle spaziali è puramente una convenzione. Si
potrebbe benissimo scegliere, come in eetti vienefatto in molti libri di relatività, anche di attribuire il nome
di spaziali alle coordinate con metrica +1, (convenzione East-Coast) il che tra l'altro sarebbe compatibile
con la scelta nel caso euclideo. Tuttavia per altri motivi realtivi a una scrittura più elegante della teoria die
campi, molti scelgono la convenzione, cui aderiremo anche noi, di attribuire +1 alle coordinate temporali
e
−1
a quelle spaziali (convenzione West-Coast). I nomi delle convenzioni derivano dal fatto che mentre
la scuola di Einstein (Princeton, ecc...) che si trova sulla costa atlantica degli USA (East-Coast) adottava
la metrica con coordinate spaziali +1, nei grandi Istituti di ricerca californiani, seguendo soprattutto
Feynman, si preferì la metrica con +1 per le coordinate temporali.
Leggendo un libro di Relatività si
invita sempre a fare molta attenzione a come si sono adottate le convenzioni, poiché diverse formule
possono cambiare segno a causa di questa scelta.
3.4.
41
ISOMETRIE
Ricordando che
aµ = aν gµν = aν ~eµ · ~eν ,
avremo
a0µ = a0ν ~e0µ · ~e0ν = (Λ−1 )ν ρ aρ Λσµ Λτ ν ~eσ · ~eτ
Però
(Λ−1 )ν ρ Λτ ν = δρτ
e quindi
a0µ = Λσµ gσρ aρ = Λσµ aσ
Queste componenti si trasformano perciò con
rianti di
3.4
Λ
e vengono quindi dette componenti cova-
~a.
Isometrie
Tutte le possibili trasformazioni lineari invertibili e suriettive sui vettori di uno spazio metrico possono essere viste come cambiamenti di base. Tra esse, hanno particolare interesse
isometrie.
Dunque, se opero una trasformazione su un vettore ~
v , esso si trasformerà in un v' a causa
quelle che lasciano invariato il prodotto scalare.
di una isometria
A queste si da il nome di
L
~v 0 = L~v
(3.1)
Pensando ai vettori come matrici colonna, il prodotto scalare si realizza riga per colonna
cioè occorre, tramite la metrica, denire il corrispondente vettore riga. Si noti, per quanto
detto sopra, che il vettora riga
ṽ
di componenti covarianti
vµ
è dato da
ṽ = vT g
Il prodotto scalare sarà allora
~u · ~v = ũv = uT gv
Il cambiamento di base (3.1) in termini matriciali si scrive
v0 = Λv
Se la trasformazione
L
u0T = uT ΛT
deve lasciare invariato il prodotto scalare, si deve vericare che
u0T gv0 = uT ΛT gΛv = uT gv
da cui la condizione fondamentale che denisce l'insieme di matrici che possono rappresentare una isometria
ΛT gΛ = g
Nel caso di spazi euclidei in cui
di matrici.
g = 1
(3.2)
questa si riduce alla condizione di ortogonalità
Le isometrie degli spazi euclidei sono le rotazioni
realizzate appunto da matrici ortogonali
ΛT = Λ−1
N -dimensionali
che sono
42
CAPITOLO 3.
CALCOLO TENSORIALE PIATTO
Queste matrici costituiscono un gruppo sotto l'operazione di prodotto di matrici, che si
chiama gruppo ortogonale
O(N ).
Poichè per qualunque matrice con
det AT = det A
det A 6= 0
det(A−1 ) = (det A)−1
e
per le matrici ortogonali si ha
(det Λ)2 = 1
⇒
det Λ = ±1
E' chiaro che due matrici ortogonali con determinante +1 hanno prodotto ancora con
determinante +1. Le matrici con determinante +1 formano perciò un sottogruppo di
detto sottogruppo delle rotazioni proprie
SO(N ).
Le matrici con determinante
−1
O(N )
invece
non formano gruppo. Tuttavia esse possono essere tutte ottenute moltiplicando le matrici
di
SO(N )
per un singolo elemento con determinante
−1,
per esempio la matrice
−1
se
N
diag(1, −1, ..., −1) se N è pari. Esse quindi costituiscono un laterale
SO(N ) e, detto Z2 il gruppo ciclico {1, −1} si ha O(N ) = SO(N ) × Z2 .
p,q
Passiamo ora ad esaminare il caso degli spazi pseudoeuclidei R . La relazione denitoria del gruppo di matrici è ora la (3.2) con g = diag(1, ..p volte..., 1, −1, ...q volte..., −1).
Questo denisce un gruppo che è la generalizzazione del gruppo delle rotazioni O(N ) a spazi
con metrica più generale. Indicheremo questi gruppi con O(p, q). Il gruppo delle trasformazioni di Lorentz è pertanto il gruppo O(3, 1). A questo gruppo vanno aggiunte le traslazioni
p+q
spaziali e temporali, che formano un gruppo abeliano isomorfo a R
(inteso come gruppo
p,q
rispetto al prodotto), per avere tutte le isometrie psssibili di R . Il gruppo di tutte le
p+q
isometrie, sia Lorentz che traslazioni, si dice gruppo di Poincaré P(p, q) = O(p, q) × R
.
è dispari, o la matrice
del sottogruppo
Il determinante, con ragionamento del tutto analogo a quanto fatto per le matrici orto-
±1. Anche qui possiamo quindi identicare un sottogruppo di trasformazioni proprie SO(p, q). Tuttavia la struttura può presentare un ulteriore complessità, che
analizzeremo in dettaglio nel coaso di nostro intertesse, cioè il gruppo O(3, 1).
gonali, è sempre
3.5
Gruppo di Lorentz
0
Il gruppo di Poincaré P(3, 1) è il gruppo delle trasformazioni di coordinate x = Λx + a in
R3,1 che lasciano invariato il prodotto scalare e perciò permettono di denire l'invariante
2
2
2
metrico dτ = |dx| = dt − |d~
x|2 . Le trasformazioni di Poincaré sono costituite dalle
4
traslazioni a ∈ R e dalle trasformazioni di Lorentz Λ ∈ O(3, 1). Queste ultime si possono
dividere in
proprie, cioè con determinate +1, e improprie con determinate −1.
formano il sottogruppo
SO(3, 1),
può essere realizzato moltiplicando ogni elemento di
diag(1, −1, −1, −1).
Le prime
come già visto. Le seconde invece sono un laterale che
SO(3, 1)
per la matrice
g = η =
Quest'ultima lascia invariata la coordinata temporale e manda le
coordinate spaziali da
~x
in
−~x.
Si tratta quindi di una trasformazione di parità.
Ogni
trasformazione impropria è il prodotto di una trasformazione propria e una di parità.
+
0
Inoltre si può denire l'insieme O (3, 1) delle matrici Λ aventi l'elemento Λ 0 >
0.
Queste trasformazioni hanno la proprietà di lasciare invariato l'ordine temporale degli
3.5.
43
GRUPPO DI LORENTZ
ortocrone. Quelle invece con Λ00 < 0 invertono la direzione
vengono dette anticrone. Il loro insieme viene spesso indicato con
eventi, perciò sono dette
dell'asse dei tempi e
O− (3, 1). Chiameremo inoltre
SO± (3, 1) = O± (3, 1) ∩ SO(3, 1).
O+ (3, 1)
l'elemento 1
Dimostriamo che
è un sottogruppo di O(3, 1). Sapendo che il prodotto è associativo, che
+
appartiene a O (3, 1), ci basta mostrare che il prodotto di due matrici ortocrone è ancora
una matrice ortocrona e che l'inversa di una trasformazione ortocrona è ortocrona.
Per
fare ciò cominciamo col notare che, dalla relazione (3.2) discende
Λ−1 = η −1 ΛT η
Ne segue
(Λ−1 )00 = Λ00
Perciò se
Λ
è ortocrona con
Λ00 > 0,
(Λ−1 )k0 = Λ0k
Λ−1
pure
(3.3)
lo è. Inoltre
(Λ−1 )kl = Λlk
,
k, l = 1, 2, 3
(3.4)
Inoltre, sempre dalla relazione denitoria (3.2), calcolandone esplicitamente il primo termine, si ha
(Λ00 )2 −
X
(Λi0 )2 = 1
i
Riscrivendo quest'ultima per
Λ
−1
e tenendo conto delle (3.3,3.4) abbamo anche
(Λ00 )2 −
X
(Λ0i )2 = 1
i
Da queste ultime due equazioni discende che
(Λ00 )2 ≥ 1
e cioè
Λ00 ≤ −1
Λ00 ≥ 1.
che Λ, Σ ∈
oppure
Chiaramente le metrici ortocrone si hanno nel secondo caso. Supponiamo
O+ (3, 1). Vogliamo mostrare che P = ΛΣ ∈ O+ (3, 1). Calcoliamo pertanto il primo
elemento di matrice di
P
P 00 = Λ00 Σ00 +
X
~ ·Σ
~
Λ0i Σi0 = Λ00 Σ00 + Λ
i
dove con
~ Σ
~ indichiamo i vettori di componenti Λ0i e Σi0 rispettivamente.
Λ,
Il loro prodotto
scalare gode della seguente proprietà
~ ·Σ
~ = |Λ||
~ Σ|
~ cos θ
Λ
dove
θ
è l'angolo tra
~
Λ
e
~
Σ
e ovviamente
| cos θ| ≤ 1.
Perciò
~ · Σ|
~ ≤ |Λ||
~ Σ|
~
|Λ
Ora
~ 2 > |Λ|
~ 2
(Λ00 )2 = 1 + |Λ|
e
~ 2 > |Σ|
~ 2,
(Σ00 )2 = 1 + |Σ|
per cui
~ Σ|
~
Λ00 Σ00 > |Λ||
e
~ ·Σ
~ ≥ Λ00 Σ00 − |Λ||
~ Σ|
~ >0
P 00 = Λ00 Σ00 + Λ
da cui risulta che
P ∈ O+ (3, 1).
Dunque le matrici ortocrone formano un sottogruppo di
O(3, 1).
La situazione dei sottogruppi del gruppo di Lorentz si può riassumere nella segnete
tabella
44
CAPITOLO 3.
0
Λ0≥1
Λ00 ≤ −1
CALCOLO TENSORIALE PIATTO
det Λ = +1
det Λ = −1
proprie ortocrone
improprie ortocrone
proprie anticrone
improprie anticrone
La prima casella in alto a destra, cioà le proprie ortocrone forma il sottogruppo
SO+ (3, 1)
delle trasformazioni di Lorentz ottenibili dall'identità con deformazioni continue dei parametri. Normalmente si richiede che una legge sica sia invariante rispetto a queste trasformazioni. Le trasformazioni della seconda casella, le improprie ortocorone, si ottengono dalle
proprie ortocrone moltiplicandole per una inversione di parità
coincide con la metrica
η ).
P = diag(1, −1, −1, −1) (che
Tutte le leggi siche per le quali si desidera anche invarianza
di parità devono essere invarianti almeno per tutte le ortocrone, siano esse proprie o im+
proprie, cioè per il sottogruppo O (3, 1) costituito da entrambe le caselle della prima riga
della tabella.
La prima casella della seconda riga, le trasformazioni proprie anticrone si ottengono dal-
T = diag(−1, −1, 1, 1).
le proprie ortocrone moltiplicandole per una inversione temporale
Tutte le leggi siche che siano indierenti alla freccia del tempo devono essere invarianti
per tutte le matrici proprie, siano esse ortocrone o anticrone, cioè per le matrici di tutto
il sottogruppo
SO(3, 1)
costituito dalle due caselle della prima colonna della tabella. Le
matrici della seconda colonna della seconda riga, cioè le improprie anticrone si ottengono
dalle proprie ortocrone moltiplicandole per
PT = diag(−1, 1, −1, −1).
Esse vanno consi-
derate se si vuole invarianza rispetto a tutto il gruppo di Lorentz, cioè anche per parità e
inversione temporale.
3.6
Tensori
Considerando ora un operatore rappresentato da una matrice
A,
i suoi elementi
Aµν
si
trasformano come segue
(A0 )µν = (Λ−1 )µρ Λσν Aρ σ
Quindi, consistentemente, l'indice in alto si trasforma in maniera controvariante e quello in
basso in maniera covariante. Più in generale, un oggetto che si trasforma come il prodotto
di
p
componenti controvarianti e
q
covarianti di un vettore si dice
tensore di rango (p, q).
In altre parole, un tensore è un insieme di numeri
Aµ1 ···µp ν···νq
che, per una trasformazione di base, si trasforma come
(A0 )µ1 ···µp ν1 ···νq = (Λ−1 )µ1 ρ1 · · · (Λ−1 )µp ρ1 Λσ1 ν1 · · · Λσq νq Aρ1 ···ρp σ1 ···σq
In un tensore, qualunque indice può essere innalzato o abbassato usando la metrica o la
metrica inversa.
3.7.
45
INVARIANTI
3.7
Invarianti
Si dicono invarianti le quantità che non variano per un cambiamento di base. Il prodotto
scalare di due vettori è un invariante
a0µ b0µ = aσ Λσµ (Λ−1 )µρ bρ = aσ δρσ bρ = aσ bσ
Gli invarianti sono molto importanti in relatività. Ad esempio, le trasformazioni di Lorentz
devono lasciare invariata la quantità
dτ 2 = dt2 − |d~x|2 = gµν dxµ dxν = dxµ dxµ
2
Poichè non abbiamo richiesto la positività della metrica, si può avere dτ < 0 e non è vero
2
µ
che dτ = 0 implichi che dx = 0. Infatti tutti i vettori del cono-luce sono caratterizzati
2
proprio da dτ = 0.
µ
Un altro invariante importante è la traccia TrA = A µ di una matrice
(A0 )µµ = (Λ−1 )µρ Λσµ Aρ σ = Aρ ρ
Anche il determinante di una matrice è un invariante. Basta ricordare che il determinante di un prodotto è uguale al prodotto dei determinanti e che il determinante di una
matrice inversa è uguale all'inverso del determinante della matrice originaria:
det A0 = det(Λ−1 AΛ) = (det Λ)−1 det A det Λ = det A
3.8
Campi tensoriali
Ci interessa ora studiare la trasformazione di un tensore dipendente dal punto, ovvero di
quello che si denisce come un
campo tensoriale.
(T 0 )µν ρ (x0 ) = (Λ−1 )µα (Λ−1 )ν β Λγ ρ T αβγ (x)
in cui
xµ = Λµν x0ν
Supponinamo di avere una grandezza W (P ), ove P è un punto di V di coordinate
~x. Se trasformandola secondo una isometria di V succede che W 0 (P ) = W (P ), ovvero
W 0 (~x0 ) = W (~x), si dice che W è una funzione scalare. Se W 0 = W anche come forma
funzionale, ovvero W (~
x0 ) = W (~x), si parla di invariante scalare.
3
Un esempio di invariante scalare in R è il potenziale coulombiano
a
a
V (r) = = √
r
∆xi ∆xi
Trasformandolo con l'isometria di
V 0 (r0 ) = q
R3 ,
cioè le rotazioni
a
(R−1 )ji ∆x0j Rki ∆x0k
O(3),
si ha infatti
a
=q
∆x0j ∆x0j
= V (r0 )
46
CAPITOLO 3.
Quindi
CALCOLO TENSORIALE PIATTO
V (r)
non solo ha lo stesso valore, ma mantiene anche la stessa forma nel nuovo
sistema di coordinate ~
x0 che aveva nel vecchio ~x.
Introduciamo ora il concetto di
derivata di un tensore.
Cominicamo col denire le
derivate di una funzione scalare
∂W 0
∂W ∂xν
∂W
=
= Λν µ ν
0µ
ν
0µ
∂x
∂x ∂x
∂x
La derivata di uno scalare rispetto alle componenti controvarianti di un 4-vettore si comporta quindi come un 4-vettore covariante. Analogamente la derivata rispetto alle componenti
covarianti si comporta in modo controvariante
∂W
∂W ∂xν
∂W 0
=
= (Λ−1 )µν
0
0
∂xµ
∂xν ∂xµ
∂xν
In maniera poco ortodossa, si può dire che indici in alto nel denominatore di una derivata
si comportano come indici in basso e viceversa indici in basso si comportano come indici in
alto. Ciò giustica l'introduzione del simbolo
µ
alla coordinata x
∂µ ≡
∂µ
∂µ
per indicare la derivata tensoriale rispetto
∂
∂ ~
= ( , ∇)
µ
∂x
∂t
si comporta quindi come un 4-vettore covariante
∂µ0 = Λν µ ∂µ
Si noti che l'analogo controvariante è dato da
µ
∂ =
Derivando un tensore di rango
r
∂
∂t
~
−∇
si ottiene un tensore di rango
r + 1.
Per esempio
∂µ0 T 0αβ (~x0 ) = Λν µ (Λ−1 )αγ (Λ−1 )βδ ∂ν T γδ
Ad esempio in
R3
il potenziale elettrostatico, come abbiamo visto, è un invariante scalare.
xi del vettore posizione ~x si ottiene un 3-vettore (il
Derivandolo rispetto alle componenti
campo elettrico)
Ei = −∂i V
il che può essere scritto in notazione vettoriale
~ = ∇V
~
E
come
ben noto.
La derivata di un vettore da un tensore di rango 2
∂µ V ν = Tµ ν
Facendone la contrazione si ottiene la divergenza del vettore
la usuale divergenza
~ · V~
∂i V i = ∇
V~ .
A 3 dimensioni questa è
3.8.
47
CAMPI TENSORIALI
che è infatti uno scalare. Nel caso 4-dimensionale di Minkowski si parla di 4-divergenza
∂µ V µ
di un 4-vettore. Questa è uno scalare di Lorentz.
Inne, il rotore è una operazione dierenziale che, applicata a un vettore, genera un
altro vettore. In generale, per scrivere questa operazione in componenti conviene introdurre
il
N
simbolo totalmente antisimmetrico di Levi-Civita.
dimensioni questa è denita come un tensore di rango
α1 ...αN

 +1
−1
=

0
per α1 ...αN
per α1 ...αN
= tutte
= tutte
In uno spazio vettoriale
V
a
N
le permutazioni pari di 1, ..., N
le permutazioni dispari di 1, ..., N
per almeno 2 indici uguali
3
Illustreremo questo a 3 dimensioni in R e a 4 dimensioni nello spazio-tempo di Minkowski
4
3
M . In R talvolta il simbolo di Levi-Civita viene anche chiamato simbolo di Ricci. Le
componeti del rotore di un vettore saranno espresse da
~ × V~ )i = ijk ∂j Vk
(∇
Infatti, per esempio
~ × V~ )1 = 123 ∂2 V3 + 132 ∂3 V2 = ∂2 V3 − ∂3 V2
(∇
come deve essere secondo la denizione tradizionale. Il lettore potrà agevolmente vericare
le altre componenti.
Il simbolo di Levi-Civita a 4 dimensioni ha 4 indici:
un tensore antisimmetrico di rango
tensore di rango
4−r
r≤4
αβγδ = −αβγδ .
La contrazione di
con il simbolo di Levi-Civita produce un altro
totalmente antisimmetrico nei suoi indici che viene detto
duale del
precedente
αβγδ Vδ = Ṽ αβγ
αβγδ Fγδ = F̃ αβ
αβγδ Rβγδ = R̃α
La contrazione, invece, con un tensore simmetrico produce 0, perché moltiplicare un oggetto
simmetrico per uno antisimmetrico produce sempre zero. Poiché ogni tensore di rango 2
può essere pensato come la somma di una parte simmetrica e di una antisimmetrica negli
indici, risulta che solo la parte antisimmetrica può avere un duale. Si noti che la proprietà
che il duale di un tensore di rango 2 è pure di rango 2 è valida solo in 4 dimensioni.
Il simbolo di Levi-Civita si trasforma come
0α1 ...αN = det Λ · α1 ...αN
ed è quindi una densità tensoriale di rango
N.
Si dice densità scalare ogni oggetto che si
trasformi come
q 0 (x0 ) = det Λ · q(x)
48
CAPITOLO 3.
CALCOLO TENSORIALE PIATTO
e densità tensoriale ogni oggetto che, oltre alla trasformazione tipica dei tensori abbia anche
un termine di tipo determinante nella trasformazione. Per esempio una densità tensoriale
di rango 2 si trasforma come
T 0µν (x0 ) = det Λ · (Λ−1 )µρ (Λ−1 )ν σ T ρσ
Nel caso del simbolo di Levi-Civita, tutti i termini
Λβiαi
nella contrazione si elidono dando
δ di Kroenecker e lasciando quindi sopravvivere solo il termine col determinate. Per le
trasformazioni proprie det Λ = 1 perciò non c'è distinzione da un tensore usuale, e il simbolo
delle
di Levi-Civita è lo stesso in tutti i sistemi di riferimento. Ma se considero trasformazioni
improprie, allora
det Λ = −1 e i tensori sono quindi caratterizzati dalle loro trasformazioni
di parità. I vettori che si trasformano con un segno meno sotto trasformazioni di parità
vengono detti pseudovettori.
Si possono avere anche pseudoscalari (le densità scalari) e
pseudotensori.
Una proprietà importante di
ijk = ijk
a 3 dimensioni è la seguente
ijk ilm = δ jl δ km − δ jm δ kl
molto utile per dimostare certe identità tra gradienti, divergenze e rotori di 3-vettori.
Vedremo alcuni esempi di ciò nella trattazione del campo elettromagnetico.
Capitolo 4
Dinamica relativistica
4.1
Particella libera relativistica
Per sviluppare una dinamica relativistica procederemo qui da un punto di vista formale,
e cioè da un prinicipio di minima azione. Come in meccanica newtoniana una particella
libera percorre un cammino lungo il quale la traiettoria sia minima (linea retta in uno spazio
euclideo) e questo può essere formalizzato chiedendo che la lunghezza della traiettoria
Γ
Z
ds
Γ
sia minimo, cioè che
Z
δ
ds = 0
Γ
così anche in relatività richiederemo che la lunghezza della linea di mondo
γ di una particella
nello spazio-tempo sia la minima possibile se la particella è libera. Perciò richiederemo il
principio di minima azione
δS = 0
con
Z
dτ
S=α
γ
ove
α
è una costante per ora arbitraria, che sseremo in seguito. L'azione
scritta come l'integrale, tra l'istante iniziale
tA
delle coordinate e delle velocità nota come Lagrangiana
Z
tB
L(~x, ~v )
e quello nale
S
può essere
del moto, di una funzione
tB
S=
dt L(~x, ~v )
tA
Poichè il tempo proprio
dτ
è legato al tempo coordinata da
dτ =
√
assumere come lagrangiana di una singola particella libera la quantità
√
L = α 1 − v2
49
1 − v 2 dt,
possiamo
50
CAPITOLO 4.
Determiniamo ora la costante
α
richiedendo che per
DINAMICA RELATIVISTICA
v→0
sia riprodotta la lagrangiana
non relativistica di una particella libera, che notoriamente è pari alla sua energia cientica
L = 12 mv 2 + cost. (a meno di una costante additiva arbitraria). Perciò espandiamo questa
esperessione per v piccoli
1
L = α − αv 2 + ...
2
da cui è immediato identicare α = −m. Perciò la lagrangiana relativistica della particella
libera di massa m è
√
L = −m 1 − v 2
La massa
m si intende misurata nel sistema di riferimento a riposo.
Da questa lagrangiana
è immediato ricavare, col metodo di Euler-Lagrange, le equazioni del moto
d ∂L ∂L
−
=0
dt ∂~v
∂~x
(4.1)
cioè il moto rettilineo uniforme
~v = cost.
Per ricavare una espressione per l'impulso
p~
di questa particella, ricordiamo che in
formalismo lagrangiano esso è visto come variabile canonicamente coniugata alla coordinata
~x
p~ =
∂L
m~v
= mγ~v
=√
∂~v
1 − v2
p~ = m~v . Il fattore γ fa
m quando questa viaggi a
Si noti come questa espressione dierisca da quella newtoniana
crescere vertiginosamente l'impulso di una particella di massa
velocità relativistiche.
Per accelerare una particella alla velocità della luce occorrerebbe
fornirle un impulso innito, cosa chiaramente impossibile e per questo motivo nessun corpo
materiale dotato di massa potrà mai raggiungere la velocità della luce.
L'energia totale del sistema è data dall'hamiltoniana
2
√
E = H = p~ · ~v − L = mγv + m 1 −
Si noti che quando la particella è a riposo, cioè
v2
mv 2 + m − mv 2
√
=
= mγ
1 − v2
γ = 1,
l'energia del sistema non è nulla,
bensì
E0 = m
cioè ogni corpo materiale è dotato di una energia a riposo pari alla sua massa. Questa è forse
la relazione più famosa di tutta la relatività, ma quello che interessa qui è capirne il profondo
signicato: ogni massa è una forma di energia e l'energia può essere sempre pensata come
massa (questo sarà particolarmente importante per determinare i campi gravitazionali).
La massa pu essere trasformata in energia e viceversa, come avviene notoriamente nelle
reazioni nucleari. Per esempio nella fusione dell'idrogeno in elio, la massa totale dei corpi
iniziali è più grande del 7 per mille di quella del nucleo di elio nale. La dierenza si è
trasformata in energia termica e cinetica i cui eetti devastanti sono noti a tutti.
4.2.
51
4-VELOCITÀ
L'energia di una particella libera può perciò essere pensata come somma di energia
cinetica e energia a riposo
E = mγ = m + (γ − 1)m
perciò una espressione per l'emergia cinetica di una particella materiale in relatività è
T = (γ − 1)m.
È immediato vericare che, espandendo per piccole
1
2
usuale dell'energia cientica non-relativistica T = mv .
2
4.2
v
si riottiene la formula
4-velocità
Una volta compreso come scrivere l'energia e il momento relativistici, ci chiediamo come
essi si trasformino sotto Lorentz.
Allo scopo dobbiamo prima introdurre il concetto di
4-velocità. Essa è denita come
uµ =
dxµ
dτ
µ
Essendo la derivata eettuata rispetto al tempo proprio, che è un invariante, u eredita
µ
le proprietà tensoriali di dx e quindi è un 4-vettore. Le componenti della 4-velocità si
2
2
possono ottenere osservando che dτ = dt − |d~
x|2 = dt2 (1 − v 2 ) da cui dt = γdτ e perciò
dxµ
=γ
u =γ
dt
µ
1
~v
La 4-velocità ha sempre norma 1
µ
2
uµ u = γ (1, −~v )
1
~v
= γ 2 (1 − v 2 ) = 1
E' utile denire in maniera simile anche la 4-accelerazione
aµ =
duµ
dτ
che risulta sempre ortogonale alla 4-velocità. Infatti derivando la
uµ uµ = 1
rispetto a
τ
si
ottiene
aµ uµ = 0
4.3
4-impulso e equazione di mass-shell
Una volta introdotta la 4-velocità la trattazione covariante dell'impulso e dell'energia
può essere agevolmente trattata dimostrando che la quantità
controvarianti
µ
p =
E
p~
p = (E, p~)
di componenti
52
CAPITOLO 4.
detta
4-impulso
è un 4-vettore.
DINAMICA RELATIVISTICA
Infatti essa può essere scritta come
pµ = muµ
con
uµ
4-velocità, come è immediato vericare
µ
p =
Il 4-vettore
p
mγ
mγ~v
= mγ
1
~v
= mγuµ
perciò ha componenti che si trasformano come un tensore controvariante di
rango 1
p0µ = (Λ−1 )µν pν
da cui si possono ricavare le trasformazioni di energia e impulso. In particolare, sistemi
di riferimento diversi attribuiranno energia diversa a un corpo; le componenti energia e
impulso si mescolano in una trasformazione di Lorentz, proprio come si mescolano spazio
e tempo.
La quantità
|p|2 = pµ pµ
è pertanto un invariante di Lorentz. Essa può essere espressa
da un lato tramite la sua espressione generale
|p|2 = E 2 − p2
(in cui si è usata la notazione
p = |~p|)
e dall'altro può essere calcolata in un sistema di
riferimento particolare, poiché il suo valore non cambia passando da un sistema a un altro.
Calcolandola quindi nel sistema di riferimento a riposo, in cui
µ
p =
si ottiene l'equazione di
mass-shell
m
~0
o equazione di dispersione per una particella libera
relativistica
E 2 = p2 + m2
p2
. Si noti che
2m
se si vuole calcolare l'energia da questa formula occorre estarre una radice quadrata
che è l'analogo della formula newtoniana che lega impulso ed energia
E=
p
E = ± p2 + m2
Le soluzioni con il segno meno vengono escluse dal fatto che si assume che una particella
a riposo abbia energia pari alla sua massa positiva
m,
non
−m.
Tuttavia queste energie
negative diventano importanti quando si cerca di introdurre una equazione quantisitica
relativistica analoga all'equazione di Schrödinger, la cosiddeta equazione di Dirac, che
prevede appunto accanto alle soluzioni di energia positiva anche quelle di energia negativa,
portando di fatto al concetto di antiparticella.
Non ci occupiamo qui per ora di questo
problema, segnalando però che anche le soluzioni di energia negativa della relazione di
mass-shell possono assumere signicato in certi capitoli della Fisica Teorica.
Si noti inoltre che la relazione di mass-shell ci da anche la relazione energia-impulso nel
caso di particelle prive di massa (per esempio il fotone)
E=p
4.4.
53
PARTICELLA IN UN POTENZIALE ESTERNO
Pensando a tali particelle prive di massa come caso limite di quelle massive per
rendiamo conto che la relazione
E=√
m → 0,
ci
m
1 − v2
si annullerebbe a meno che il denominatore pure si annulli, ovvero che
v = 1,
cioè che la
particella viaggi alla velocità della luce. Viceversa, una particella che viaggia alla velocità
della luce avrebbe energia divergente, a meno che il numeratore si annulli, cioè la particella
sia di massa nulla. Le particelle esistenti in natura perciò si possono dividere in due grandi
classi:
•
quelle con massa
•
quelle di massa nulla, che sono forzate a viaggiare costantemente alla velocità della
m>0
che viaggiano sempre a velocità inferiore a quella della luce
luce senza mai fermarsi o rallentare.
Non possono invece esistere particelle che viaggino a velocità superiori a quelle della luce
(tachioni). Esse potrebbero essere infatti veicolo di segnali superluminali che violerebbero
la causalità. Per essere più precisi esse potrebbero esistere ma non avere alcuna interazione
col mondo da noi conosciuto e perciò si possono totalmente ignorare in una teoria scientica
perché non misurabili.
4.4
Particella in un potenziale esterno
Supponiamo ora che la nostra particella sia immersa in un campo esterno statico descrivibile
da un potenziale
V (~x).
La lagrangiana sarà ora
√
L = −m 1 − v 2 − V (~x)
e le equazioni di Euler-Lagrange (4.1) che minimizzano l'azione in questo caso sono
d~p
∂V
~
=−
= −∇V
dt
∂~x
Introdotto il concetto di
forza
~
F~ = −∇V
la legge fondamentale del moto può essere scritta come
d~p
F~ =
dt
che ha una forma analoga a quella newtoniana, ma in realtà è molto diversa. Infatti ora il
momento non ha più la forma newtoniana
p~ = m~v
da cui sarebbe subito possibile inferire
54
CAPITOLO 4.
la seconda legge di Newton
F~ = m~a.
DINAMICA RELATIVISTICA
Essendo ora la forma dell'impulso
p~ = mγ~v
la sua
derivata sarà più complicata
d
dγ
F~ = m (γ~v ) = mγ~a + m ~v
dt
dt
dγ d~v
= mγ~a + m · ~v = mγ~a − mγ 3 (~v · ~a)~v
d~v dt
Questa legge mostra che la forza è parallela alla accelerazione solo nel caso in cui quest'ultima sia perpendicolare alla velocità o parallela ad essa. In tutti gli altri casi, ci sono
componenti della forza non dirette come l'accelerazione. Inoltre la validità di questa forma
della legge del moto è limitata ai casi in cui la massa rimane costante. Ora abbiamo visto
che processi nucleari possono trasmutare massa in energia e perciò può esserci anche un
termine
dm/dt
che complica ulteriormente le cose. In conclusione, sebbene la
F~ = d~p/dt
sia una corretta legge dinamica in relatività, essa ha un contenuto in generale molto più
ricco che in meccanica newtoniana, prevedendo sia forze non parallele all'accelerazione, sia
la possibilità che, con la transmutazione di massa in energia siano previsti nuovi metodi di
inuire sulle traiettorie dei corpi materiali.
4.5
4-forza
Un metodo più succinto di esprimere la legge della dinamica è quello di introdurre il
concetto di 4-forza
Fµ =
Essendo
dτ
dpµ
dτ
pµ
implica che la 4-forza è un 4-vettore.
dE
dt
un invariante, la natura tensoriale di
Le sue componenti sono
dt dpµ
F =
=γ
dτ dt
µ
F~
Come abbiamo visto, in relatività può capitare che la massa di un corpo si trasmuti in
parte in energia, cambiando quindi le caratteristiche del moto, come avviene per esempio
nelle reazioni nucleari. Se però ci restringiamo a moti in cui la massa a riposo del corpo
rimane costante, dalla denizione di 4-forza segue
Fµ = m
duµ
= maµ
dτ
cioè una specie di analogo 4-dimesionale della legge di Newton. Ricordando che la 4µ
accelerazione è ortogonale alla 4-velocità, ne segue Fµ u
= 0, da cui, esplicitando le
componenti
dE
γ ( , −F~ )
dt
2
ovvero
1
~v
dE
= F~ · ~v
dt
=0
4.6.
55
AZIONE A CONTATTO E A DISTANZA. CAMPI.
e perciò possiamo riscrivere la 4-forza come
µ
F =γ
Osservando inne che
p~ = E~v
F~ · ~v
F~
si ha
dE
d~p
F~ =
= E~a +
~v
dt
dt
e perciò la generalizzazione relativistica della legge di Newton
F~ = mγ~a + (F~ · ~v )~v
che torna a coincidere con quella classica per
v 1.
Questa equazione ci dice che la
forza, in generale, non è più parallela all'accelerazione, cosa che invece succedeva sempre in
meccanica newtoniana. Il parallelismo tra
incipiente, oppure se
F~ · ~v = 0,
F~
e
~a
sussiste solo se
~v = 0,
ciè in caso di moto
cioè per forze perpendicolari alla velocità (come nel moto
circolare uniforme) o, inne, per il caso in cui il moto sia rettilineo (non necessariamente
uniforme), cioè con
4.6
~a
parallela a
~v .
Azione a contatto e a distanza. Campi.
Se si vuole ora considerare la dinamica di un sistema chiuso (cioè non sottoposto a forze
esterne, ma solo alle forze esercitate da uno sull'altro corpo appartenente al sistema), si
incontra un punto fondamentale di dierenza con la meccanica newtoniana.
Un sistema di particelle infatti può prevedere due tipi fondamentali di interazioni:
•
l'
interazione a contatto in cui i corpi si comportano come liberi nchè non giungono
a contatto l'uno dell'altro e allora avviene un urto durante il quale può esserci scambio
di impulso e energia. Questa è la situazione tipica delle classiche palle da biliardo
•
l'
interazione a distanza in cui i corpi si sentono
l'un l'altro attraverso un poten-
ziale, come avviene per esempio nella gravità newtoniana.
Nessun segnale può propagarsi a velocità superiore a quella della luce. La visione newtoniana della forza di gravitazione universale presuppone una forza che dipenda solo dalle
posizioni dei corpi che la generano e la subiscono. Poiché tali corpi si muovono, il dire che
la forza dipende solo dalla posizione e non dalla velocità ha una conseguenza crucuale: si
deve richiedere che la forza si propaghi a velocità innita.
Se un corpo si muove la sua
inuenza gravitazionale secondo Newton deve riaggiornarsi immediatamente in qualunque
punto dello spazio. Ciò rende la graviatazione di Newton incompatibile con la relatività ristretta. Sarà da questo punto che prenderà le mosse l'altra grande rivoluzione Einsteiniana,
la relatività generale.
56
CAPITOLO 4.
DINAMICA RELATIVISTICA
Qui ci basti commentare per ora che una interazione tra corpi distanti in relatività non
può che avvenire a velocità minore o uguale a quella della luce. Il concetto di campo, che
in meccanica newtoniana era nulla più che un espediente matematico, diventa ora invece
centrale. Invece del concetto di azione a distanza tra due corpi, la visione relativistica preferisce parlare di corpo materiale che produce un campo (gravitazionale, elettromagnetico,
ecc...) che si propaga nello spazio come un'onda a velocità minore o uguale a quella della
luce e quando raggiunge l'altro corpo materiale è da questo percepito e ne inuenza il moto.
Ciò che viene salvato della visione newtoniana è solo il prinicipio di azione e reazione. La
forza prodotta dal campo sul corpo di arrivo è uguale e contraria a quella sul corpo di
partenza. Tuttavia queste due forze non vengono in essere nello stesso istante, ma sono
separate dal tempo di propagazione del segnale di campo da un corpo all'altro.
Tuttavia il principio di azione e reazione garantisce, come in meccanica newtoniana,
che l'impulso totale di un sistema chiuso si conserva. Nel caso di forze a contatto questo è
F~AB agente dalla particella A sulla particella B
F~BA agente dalla particella B sulla particella A,
chiaramente intuitivo. Se la forza
durante
un urto è uguale e contraria alla
allora
d
F~AB + F~BA = (~pA + p~B ) = 0
dt
Perciò l'impulso totale
P~ = p~in
~in
~out
~out
B
A +p
B = p
A +p
si conserva nel processo di urto. Dall'eE = EAin + EBin = EAout + EBout .
µ
Perciò possiamo aermare che in ogni processo di urto il 4-impulso totale P del sistema
quazione di mass-shell discende che anche l'energia totale
si conserva.
Nel caso di interazione a distanza ovviamente per avere ancora la conservazione del
4-impulso totale dobbiamo ammettere che parte di esso è data dal 4-impulso del campo
che deve essere sommato a quello delle particelle.
Dunque in relatività l'unico tipo di
lagrangiama che possiamo immaginare di scrivere per particelle interagenti a distanza è per
forza accoppiata alla lagrangiana di un campo
φ(~x, t)
(la cui natura tensoriale dipenderà
dal tipo di interazione) che media le forze tra queste particelle
L=
X
−mA
q
1−
vA2
− V (~xA , ~vA , φ(~xA , t), ∂µ φ(~xA , t)) + Lcampo (φ, ∂µ φ)
A
Vedremo in dettaglio un esempio di ciò trattando il campo elettromagnetico.
In ultima analisi anche le interazioni a contatto sono in realtà delle interazioni a distanza
(su distanze molto piccole). Due palle da biliardo che urtano sono composte da atomi che,
avvicinandosi gli uni agli altri, si repellono per via di forze elettromagnetiche. Gli urti tra
particelle elementari sono in realtà regolati dalle forze nucleari (deboli e forti), anch'esse
descritte da un campo.
Da ciò si vede come il concetto di campo prenda sempre più
importanza man mano che si procede nell'analisi delle forze della natura e la relatività si
dimostra perfettamente compatibile con questo tipo di visione.
4.7.
57
CRITICA AL CONCETTO DI CORPO RIGIDO
4.7
Critica al concetto di corpo rigido
In meccanica classica è molto in uso il concetto di corpo rigido. Un corpo perfettamente
rigido ha un moto del tutto solidale col suo centro di massa.
Se imprimo una forza su
un lato del corpo, tutti i punti del corpo devono risentire immediatamente di questa forza
e spostarsi di conseguenza. In relatività, tuttavia, ciò è impossibile perché implicherebbe
la trasmissione di una informazione a velocità innita.
Detto in altro modo, la velocità
del suono all'interno di un corpo rigido dovrebbe essere innita e perciò maggiore della
velocità della luce. Il corpo perfettamente rigido è un concetto non valido in meccanica
relativistica.
La visione relativistica si sposa bene invece con una visione atomistica in cui un corpo
materiale è costituito da moltissimi corpuscoli tenuti insieme da campi di interazione.
Il problema si ripresenta però a livello dei corpuscoli:
se questi hanno una qualunque
estensione, non potendo essere rigidi, devono essere composti di qualcosa di ancora più
piccolo.
Dunque gli oggetti elementari in relatività devono essere puntiformi.
In realtà
questa visione viene modicata se si introducono considerazioni quantisitiche.
Tuttavia
qui non ci occuperemo di questo interessantissimo aspetto, che esula dalla trattazione
strettamente classica della relatività ristretta e assumeremo come puntiformi gli oggetti
elementari.
4.8
Densità e correnti
Spesso, avendo a che fare con corpi macroscopici, conviene considerare la distribuzione
di materia come approssimativamente continua e perciò introdurre i concetti di densità e
3
corrente di materia. Preso un cubetto innitesimo di lato dx e volume dV = d x di materiale, misuratane la massa-energia
dE
si denisce
densità di materia-energia relativisitica
la quantità
µ(~x, t) =
dE
dV
Questa può variare nel tempo perché ci può essere un usso di materia che esce o entra
dalle pareti immaginarie del cubetto.
Dunque una informazione completa non consta
solo della densità ma anche dei movimenti di materia, cioè del movimento che la materia
del cubetto compie in ogni istante, ovvero della
corrente di materia
~π (~x, t) = µ(~x, t)~v (~x, t)
Alternativamente possiamo pensare a un sistema di
che costituiscono il nostro corpo materiale.
N
particelle puntiformi
A = 1, ..., N
In questo caso la denizione di densità e
corrente può agevolmente essere data in termini di distribuzioni delta di Dirac centrate nei
58
CAPITOLO 4.
punti in cui si trovano le particelle (si ricordi che
µ(~x, t) =
X
~π (~x, t) =
X
DINAMICA RELATIVISTICA
p~A = EA~vA )
EA δ (3) (~x − ~xA )
(4.2)
p~A δ (3) (~x − ~xA )
(4.3)
A
A
in cui
~xA (t)
δ (3) (~x) = δ(x1 )δ(x2 )δ(x3 )
è la distribuzione delta di Dirac tridimensionale e
è la traiettoria della particella
Naturalmente
µ(x)
~xA =
A.
non è un invariante di Lorentz. Per rendersene conto facilmente,
pensiamo a un gas di densità uniforme in una scatola cubica di lato
L.
Se
M
è la massa
totale del gas, la sua densità nel sistema di riferimento in cui il cubo è a riposo, sarà
µ=
M
L3
Tuttavia se osservo il cubo da un sistema di riferimento inerziale che si muova rispetto a
quello a riposo con velocità v lungo uno dei lati del cubo, questo lato subirà una contrazione
0
di Lorentz e misurerà L = L/γ . Pertanto questo nuovo osservatore non vede più un cubo
ma un parallelepipedo schiacciato di un fattore
L3 /γ . Perciò egli attribuirà al gas una densità
µ0 =
γ
nella direzione del moto e avente volume
γM
= γµ
L3
Ci aspettiamo quindi che la densità si trasformi con un fattore
γ
e che non sia uno scalare
invariante di Lorentz, ma si trasformi come una struttura più complicata.
Allo stesso modo si possono introdurre altre densità.
qualche proprietà che chiameremo genericamente carica
qA
Per particelle dotate di una
potrò introdurre una densità
di carica e una densità di corrente
(~x, t) =
X
~ x, t) =
J(~
X
qA δ (3) (~x − ~xA )
A
qA~vA δ (3) (~x − ~xA )
A
e lo stesso per qualunque altro tipo di carica una particella possa possedere. Nel seguito di
questa sezione pensiamo a
particella: la sua massa
qA
mA ,
come a una qualsiasi caratteristica Lorentz-invariante di una
la sua carica elettrica
eA
oppure un'altro tipo di carica (per
esempio di colore per i quarks, ecc...). L'invarianza di queste cariche elementari implica
che possiamo scrivere le densità e le correnti in maniera covariante collezionandole in un
4.8.
59
DENSITÀ E CORRENTI
4-oggetto
J
µ
dxµA (3)
δ (~x − ~xA )
dt
A
A
Z
Z
X dxµ dτ
X
dxµA (3)
=
dt
qA δ(t − tA )
δ (~x − ~xA ) = dt
qA A δ (4) (x − xA )
dt
dτ dt
A
A
Z
X
=
dτ
qA uµA δ (4) (x − xA (τ ))
=
ε
J~
X
=
qA
1
~vA
δ (3) (~x − ~xA ) =
X
qA
A
µ
µ
In questa ultima forma è chiaro che J è un 4-vettore. Infatti dτ e qA sono invarianti, uA
(4)
sono 4-vettori e la δ
, dovendo soddifare in qualunque sistema di riferimento la relazione
denitoria
Z
d4 xδ (4) (x) = 1
deve pure essere un invariante. Per essere più precisi essa si trasforma inversamente a
d4 x. Quest'ultimo si trasforma come det Λ−1 , perciò la delta di Dirac 4-dimensionale si
µ
trasforma come det Λ, cioè come una densità scalare. Perciò J si trasforma come uno
pseudo-4-vettore.
Calcoliamo ora, tornando alla notazione con la delta 3-dimensionale, la divergenza della
densità di corrente
~ · J~ =
∇
X
qA
A
= −
X
A
Se le
qA
X d~xA ∂
d~xA ∂ (3)
qA
δ (~x − ~xA ) = −
δ (3) (~x − ~xA )
dt ∂~x
dt
∂~
x
A
A
qA
∂ (3)
∂ε
δ (~x − ~xA ) = −
∂t
∂t
equazione di
sono proprietà delle particelle indipenedenti dal tempo allora vale l'
continuità
∂ε ~ ~
+∇·J =0
∂t
ovvero ancora più elegantemente in formalismo 4-dimensionale
∂µ J µ = 0
Questa equazione ha un profondo signicato sico, in quanto è alla base delle leggi di
conservazione. Infatti in un sistema chiuso, la carica totale
cariche
volume
Q
sarà la somma di tutte le
qA delle singole particelle, ovvero l'integrale della densità ad essa
V sucientemente grande da includere tutto il sistema
Z
XZ
X
3
Q(t) =
d xε(x) =
d3 x qA δ (3) (~x − ~xA ) =
qA
V
A
A
associata su un
60
CAPITOLO 4.
DINAMICA RELATIVISTICA
Questa quantità globale potrebbe in linea di principio dipendere dal tempo
t.
Tuttavia
l'equazione di continuità ci permette di calcolarne la derivata temporale
dQ
=
dt
Z
V
∂ε
=−
dx
∂t
3
Z
~ · J~
d3 x∇
V
Ora per il teorema di Stokes l'integrale su un volume della divergenza di un campo vettoriale
∂V di tale volume del campo
Z
Z
3 ~
~
d x∇ · J =
d~σ · J~
è pari all'integrale sulla frontiera
V
dove con
d~σ
vettoriale stesso
∂V
si indica il vettore innitesimo normale a
∂V
in un punto
~σ ∈ ∂V .
Se questa
supercie è presa molto lontana (matematicamente, innitamente lontana) dal sistema,
tutte le densità e correnti saranno nulle su tale supercie. Perciò l'integrale di Stokes si
annulla e
dQ
=0
dt
⇒
Q = costante
Perciò a ogni equazione di continuità è associata una legge di conservazione della quantità
Z
d3 xJ 0 (x)
Q=
R3
Notando che
d3 x
si trasforma con un
γ −1
e
ε
con un
γ,
si vede che
Q
è uno scalare se
Jµ
era un 4-vettore.
4.9
Tensore energia-impulso
Ritorniamo alla denizione di densità di massa-energia e alla corrispondente corrente, date
nelle eq.(4.2,4.3). La corrente corrisponde anche alla densità di impulso, perciò allo stesso
modo della densità di materia possiamo pensare alla densità di impulso come un 3-vettore
di componenti
π i (x) =
X
piA δ (3) (~x − ~xA )
A
i
dove pA sono le componenti del 3-vettore impulso della particella A. La densità di corrente
corrispondente a ogni componente della densità di impulso è data da un oggetto con 2 indici
σ ij . Il primo denota a quale componente della densità di impulso ci stiamo riferendo, il
secondo è l'indice della componente della velocità nella denizione di corrente
σ ij (x) =
X
piA vAj δ (3) (~x − ~xA )
A
Tutte queste nozioni possono essere riassunte in un unico oggetto 4-dimensionale con due
indici
µν
T (x) =
X
A
µ
µ dxA (3)
pA
δ (~x
dt
− ~xA ) =
X pµ pν
A A (3)
A
EA
δ (~x − ~xA )
4.9.
61
TENSORE ENERGIA-IMPULSO
da cui si evince che
T µν = T νµ
è un oggetto simmetrico. Inoltre esso può essere riscritto
come
T
µν
XZ
=
dτ pµA uνA δ (4) (x − xA (τ ))
A
in analogia con quanto fatto nel caso di una corrente generica nella sezione precedente.
Con ciò si vede che si tratta di un tensore di rango 2, cui viene dato il nome di
energia-impulso.
tensore
Le sue componenti in forma matriciale sono

µ π1 π2 π3
 π 1 σ 11 σ 12 σ 13 
µ
~
π

=
 π 2 σ 21 σ 22 σ 23  = ~π σ
π 3 σ 31 σ 32 σ 33

T µν
3×3 σ è detta tensore degli sforzi (nome mutuato dalla teoria dell'elasticità
dei solidi) e il suo elemento i, j -simo rappresenta il usso della componente i della densità
di impulso lungo la direzione j .
dove la matrice
Questa denizione è stata data per particelle non interagenti o interganeti a contatto.
Nel caso di particelle interagenti a distanza si dovrà considerare anche la densità di energia e di impulso distribuita nel campo di interazione, come vedremo nel caso del campo
elettromagnetico.
Il tensore energia impulso è una quantità fondamentale in tutta la relatività, ristretta
o generale. Esso infatti codica nella maniera più completa la conservazione di 4 cariche
che sono alla base di tutta la meccanica.
∂i T µi =
X
pµA
A
= −
X
= −
X
dxiA ∂ (3)
δ (~x − ~xA )
dt ∂xi
pµA
dxiA ∂ (3)
δ (~x − ~xA )
dt ∂xiA
pµA
∂ (3)
δ (~x − ~xA )
∂t
A
A
X dpµ
∂ X µ (3)
A (3)
= −
δ (~x − ~xA )
pA δ (~x − ~xA ) +
∂t A
dt
A
µ
µ0
X
∂T
dpA (3)
+
δ (~x − ~xA )
= −
∂t
dt
A
ovvero
∂ν T
µν
=
X dpµ
A (3)
A
dt
δ (~x − ~xA ) =
X
FAµ γ −1 (vA )δ (3) (~x − ~xA ) = g µ
A
A dierenza del caso generico della sezione precedente, qui il 4-impulso delle singole particelle non è necessariamente una quantità ssa nel tempo. Lo è ovviamente nchè una
62
CAPITOLO 4.
DINAMICA RELATIVISTICA
particella è libera. Nel momento in cui comincia a interagire essa subisce una forza, che
µ
crea appunto il termine g di cui sopra e a cui si da talvolta il nome di densità di forza. Se
µν
le particelle non interagiscono, ovviamente ∂ν T
= 0. Lo stesso si verica se le particelle
interagiscono solo a contatto. Infatti supponiamo che tutte le particelle si stiano muovendo liberamente tranne due
B
e
l'energia si conservano, dunque
di forza sono
gµ =
C che si urtano. Per tutte
dpµA /dt = 0. Allora gli unici
le particelle libere l'impulso e
termini non nulli nella densità
dpµB (3)
dpµ
δ (~x − ~xB ) + C δ (3) (~x − ~xC )
dt
dt
L'interazione avviene a contatto, cioè quando
~xB = ~xC
e durante l'urto il 4-impulso si
conserva
d µ
(pB + pµC ) = 0
dt
In caso di azione a distanza la
gµ
⇒
gµ = 0
non può essere annullata. Tuttavia, come vedremo
esplicitamente nel caso del campo elettromagnetico, è possibile aggiungere un termine di
µν
campo al tensore energia-impulso in modo tale che la somma del T
della materia più
quello del campo sia ancora conservato.
La legge di conservazione corrispondente all'equazione di continuità del tensore energiaimpulso ci dice che la quantità
ν
Z
P =
d3 xT 0ν
R3
si conserva. Chiaramente questa quantità corrisponde al 4-impulso totale del sistema, cioè
alla somma dei 4-impulsi di tutte le particelle in esso contenute. Come abbiamo detto ciò
è strettamente vero solo per particelle con interazioni a contatto (per esempio in un gas
perfetto relativistico). Per interazioni a distanza, come l'elettromagnetismo, la gravità o le
altre forze fondamentali della natura, per mantenere l'equazione di continuità (e quindi la
conservazione dell'energia-impulso) occorre aggiungere un termine di campo che ci mostra
come una certa quantità dell'energia e dell'impulso totali del sistema chiuso sono distribuite
nel campo di interazione. Il campo in relatività non è più solo un articio matematico, ma
diventa una vera e propria entità sica dotata di energia e impulso come le particelle.
4.10
Momento angolare
Si denisca la quantità
M γαβ = xα T γβ − xβ T αγ = −M γβα
che è chiaramente un 4-tensore di rango 3, essendo somma di prodotti di tensori di rango
1 e 2 rispettivamente. Si noti l'antisimmetria negli indici
a una legge di continuità rispetto all'indice
γ
α, β .
Questa quantità obbedisce
se il sistema è isolato. Infatti
∂γ M γαβ = δγα T γβ + xα ∂γ T γβ − δγβ T αγ + xβ ∂γ T αγ
4.11.
63
CENTRO DI MASSA-ENERGIA
La legge di continuità del tensore energia-impulso garantisce l'annullarsi del secondo e
quarto termine, perciò
∂γ M γαβ = T αβ − T βα = 0
per simmetria del tensore energia-impulso.
Corrispondentemente a questa equazione di
continutà esiste una collezione di cariche conservate etichettate da due indici
J
αβ
Z
d3 xM 0αβ = −J βα
=
Si tratta quindi di di un tensore antisimmetrico di rango 2, perciò dotato di 6 componenti
indipendenti, normalmente esprimibili in termini di 2 vettori tridimensionali. Vediamo di
capire a cosa corrispondono sicamente queste componenti
J
Z
0i
J ij
0
0i
i
00
i
Z
d x(x T − x T ) = tP − d3 xxi T 00 = K i
Z
Z
3
i j0
j i0
=
d x(x T − x T ) = d3 x(xi π j − xj π i ) = ijk Lk
=
3
Queste espressioni diventano ancora più chiare se torniamo alle espressioni per un sistema
L avremo
X
XZ
3
~xA × p~A
d3 x ~xA × p~A δ (3) (~x − ~xA ) =
d x~x × ~π =
di particelle. Per le componenti di
~ =
L
Z
A
A
e perciò stiamo parlando delle componenti del momento angolare totale del sistema, che
perciò è una quantità conservata anche in relatività.
4.11
Centro di massa-energia
~
K
X
EA~xA
d3 xρ~x = tP~ −
Più involuta è l'interpretazione delle componenti di
~ = tP~ −
K
Z
A
Dividendo ambo i membri per l'energia totale, che è pure una quantità conservata, si vede
che il punto (centro di massa-energia)
P
xA
A EA ~
~
X= P
A EA
soddisfa l'equazione del moto
~ = V~ t + K
~
X
ove sia
~
V~ = P~ /E e K
sono costanti. Perciò tale punto si muove di moto rettilineo uniforme.
Perciò il centro di massa-energia (CME) ha un moto non inuenzato dalle forze interne
del sistema e ci si può porre in un sistema di riferimento inerziale in cui esso risulti fermo.
Questo è il concetto che sostituisce il centro di massa della sica newtoniana.
Nel sistema CME il vettore
velocità
V~ .
~
X
è ovviamente nullo, per denizione, come pure la sua
~ = 0 e J αβ ha solo 3 componenti date dal momento
K
Perciò in questo sistema
angolare intrinseco del sistema.
64
CAPITOLO 4.
4.12
DINAMICA RELATIVISTICA
Spin
Il 4-tensore
J αβ
ha una trasformazione alquanto peculiare per traslazioni.
0µ
µ
µ
µ
coordinate come x = x + a con a = costante, esso subirà una variazione
Se cambio
J 0αβ = J αβ + aα pβ − aβ pα
Ciò non deve sorprendere più di tanto, poiché sappiamo che il momento angolare subisce
una analoga variazione quando lo si denisca da origini degli assi diversi. Per isolare la
parte intrinseca del momento angolare risulta conveninete denire un 4-vettore detto
come segue
dove
U δ = P δ/
1
Sα = αβγδ J βγ U δ
2
P
n
mn
è la 4-velocità del CME. Nel sistema CME le sue componenti sono
δ
U =
(poiché
spin
γ(0) = 1).
1
~0
Perciò in tale sistema le componenti di
Sα si possono facilemnte calcolare
Sα = (0, J 23 , J 31 , J 12 )
cioè
α
S =
0
~
L
Le componenti dello spin sono proprio date dal momento angolare intrinseco, cioè calcolato
nel sistema CME. Che
Sα
abbia sempre 3 componenti indipendenti, in qualunque sistema
di riferimento si può vedere dalla relazione
U α Sα = 0
facilmente deducibile dalla denizione di Sα in quanto si moltiplica un termine simmetrico
α δ
αβγδ
in α, δ (U U ) per uno antisimmetrico . Questa relazione lega tra loro le 4 componenti
di
Sα
in qualunque sistema di riferimento, lasciandone solo 3 linearmente indipendenti.
Capitolo 5
Il campo elettromagnetico
5.1
Equazioni di Maxwell
I fenomeni elettromagnetici, nella sintesi operata da Maxwell (1850) sono descritti da un
campo elettrico
~
E
e un campo magnetico
descritte da una densità di carica
ρ
~
B
generati da distribuzioni di carica elettrica
e una densità di corrente
~j = ρ~v ,
essendo
~v
un campo
di velocità che descrive i moti delle cariche elettriche nello spazio tridimensionale.
Le equazioni di Maxwell, che regolano tutti i fenomeni elettromagnetici, si scrivono
~ ·E
~ =ρ
∇
~
~ =0
∇·B
~ ×E
~ = − ∂ B~
∇
∂t
~
∂E
~
~
∇×B =
+ ~j
I
II
III
IV
∂t
La II e la III legano tra loro i campi
due legano i campi
densità
ρ
~ B
~
E,
Eq. di Gauss per l'elettricità
Eq. di Gauss per il magetismo
Legge di Faraday dell'induzione
Legge di Ampère
~
E
e
~
B
e si dicono equazioni omogenee, le altre
alle loro cause, cioè alla distribuzione di cariche descritta dalla
e dalla densità di corrente
~j .
Non esistono, per quanto sappiamo, in natura cariche e correnti magnetiche (monopoli
~ ↔ −B
~
E
che le equazioni godono quando scritte in assenza di cariche elettriche (cioè per ρ = ~
j = 0).
magnetici) anche se da un punto di vista teorico restaurerebbero la simmetria
5.2
Equazione di continuità
La densità di carica
ρ
e la corrente
~j
sono legate dall'equazione di continuità
∂ρ ~ ~
+∇·j =0
∂t
Quest'ultima è deducibile dalle equazioni di Maxwell stesse. Si prenda la IV equazione e
se ne faccia la divergenza (cioè vi si applichi l'operatore
~
∇·
~ ·∇
~ ×B
~ = ∂∇
~ ·E
~ +∇
~ · ~j
∇
∂t
65
ad ambo i membri)
66
CAPITOLO 5.
e inne si ricordi che per qualunque vettore
~
~ ·E
∇
V~
IL CAMPO ELETTROMAGNETICO
vale l'identità
~ ·∇
~ × V~ = 0.
∇
Riesprimendo
tramite la equazione III, si ottiene l'equazione di continuità.
Il signicato sico dell'equazione di continuità è quello di conservazione della carica
elettrica totale del sistema, come può essere dimostrato seguendo le linee della sezione 4.8.
Quest'ultima è denita come la somma su tutti i punti dello spazio della densità di carica
distribuita in ciascun punto
Z
Q≡
ρ(~x, t)d3 x
R3
Nel caso di un sistema di particelle cariche la densità e la densità di corrente saranno
denite come
ρ(~x, t) =
X
~j(~x, t) =
X
eA δ (3) (~x − ~xA )
A
eA~vA δ (3) (~x − ~xA )
A
in cui
eA
sono le cariche elettriche delle singole particelle del sistema.
discende che
5.3
Q=
Ovviamente ne
P
A eA .
Campi potenziali
Dalla II equazione di Maxwell vediamo che
~
B
è un campo vettoriale a divergenza nul-
la. Tutti i vettori a divergenza nulla si possono scrivere come rotore di un altro vettore
opportuno. Perciò introduciamo il potenziale vettore
~
A
tale che
~ =∇
~ ×A
~
B
Sostituendo nella III
cioè
(5.1)
~
~ ×E
~ = −∇
~ × ∂A
∇
∂t
!
~
∂
A
~+
~ × E
∇
=0
∂t
Ora, ogni vettore avente rotore nullo può essere scritto come il gradiente di un opportuno
potenziale scalare. Esisterà dunque una funzione
φ
tale che
~
~ + ∂ A = −∇φ
~
E
∂t
φ
è detto potenziale scalare. Quindi
~
~ = −∇φ
~ − ∂A
E
∂t
(5.2)
5.4.
67
INVARIANZA DI GAUGE E GAUGE DI LORENTZ
5.4
Invarianza di gauge e gauge di Lorentz
I potenziali
~
A
e
φ
non sono in realtà deniti univocamente dalle relazioni (5.1,5.2). Quelli
che contano da un punto di vista sico sono i campi
~ B
~
E,
e qualunque variazione dei po-
~ φ che li lasci invariati è del tutto ininuente per la sica dell'elettromagnetismo.
tenziali A,
Mostriamo ora che una ridenizione dei potenziali come segue
~ → A
~0 = A
~ + ∇Λ
~
A
∂Λ
0
φ → φ = φ − ∂t
con
~ B
~.
Λ funzione arbitraria genera gli stessi campi E,
(5.3)
Infatti, tenendo conto della identità
vettoriale
~ × ∇f
~ =0 ,
∇
∀f
si ha
~0 = ∇
~ ×A
~0 = ∇
~ ×A
~+∇
~ × ∇Λ
~ =∇
~ ×A
~=B
~
B
~0
~
∂A
~ 0 = −∇φ
~ 0 − ∂ A = −∇φ
~ + ∇∂Λ
~
~ ∂Λ = E
~
E
−
−∇
∂t
∂t
∂t
Le ridenizioni (5.3) dei potenziali, che lasciano invariata la sica, sono dette trasformazioni
di gauge. Le equazioni di Maxwell sono invarianti per trasformazioni di gauge.
Λ per semplicare certe formule relative
~
ai potenziali A, φ sapendo che queste non inceranno i risultati sici che riguardano i campi
~ B
~.
E,
Possiamo quindi scegliere opportunamente le
Una scelta conveniente è il cosiddetto gauge di Lorentz in cui
~ ·A
~ + ∂φ = 0
∇
∂t
Qualunque funzione
Λ(x)
(5.4)
che soddis la condizione
Λ = 0
realizza la condizione (5.4) del gauge di Lorentz. Infatti operando sul primo membro della
(5.4) una trasformazione di gauge si ottiene
0
2
~ ·A
~ 0 + ∂φ = ∇
~ + ∂φ + ∇2 Λ − ∂ Λ = ∇
~ ·A
~ ·A
~ + ∂φ − Λ
∇
2
∂t
∂t
∂t
∂t
e perciò essa è realizzata da qualunque trasformazione di gauge che soddis
5.5
Equazioni soddisfatte da
~
A
e
φ;
4-potenziale
Sostituendo le (5.1,5.2) nella IV equazione di Maxwell, si ha
~= ∂
~ ×∇
~ ×A
∇
∂t
~
~ − ∂A
−∇φ
∂t
Λ = 0.
!
+ ~j
Aµ
68
CAPITOLO 5.
IL CAMPO ELETTROMAGNETICO
e grazie alla nota identità tra vettori
~ ×∇
~ × V~ = ∇(
~ ∇
~ · V~ ) − ∇2 V~
∇
si perviene alla
~
∂φ
∂2A
~
~
~
~
+ ~j
−∇ A + 2 = −∇ ∇ · A +
∂t
∂t
2
equazione che deve essere soddisfatta dai potenziali scalare e vettore anchè i campi
~ B
~
E,
da loro generati soddisno le equazioni di Maxwell.
Nel gauge di Lorentz questa equazione si semplica notevolmente
~ = ~j
A
Analogamente, sostituendo le (5.1,5.2) nella I equazione di Maxwell otteniamo
~ ·
−∇
Nel gauge di Lorentz, in cui
~
~ + ∂A
∇φ
∂t
~ A
~ = − ∂φ
∇·
∂t
!
= −∇2 φ −
∂ ~ ~
∇·A=ρ
∂t
anche questa equazione si semplica notevolmente
φ = ρ
Risulta quindi conveniente riunire i tre potenziali
4-dimensionale
µ
A =
φ
~
A
~
A
e il potenziale
φ
in un oggetto
per il quale, nel gauge di Lorentz, le equazioni di campo si scrivono semplicemente
Aµ = j µ
≡ ∂µ ∂ µ si Lorentz-trasforma come uno scalare e j µ come un 4-vettore controµ
variante, anche A risulta essere un 4-vettore controvariante. Il corrispondente 4-vettore
ν
~ . A questo oggetto Aµ o Aµ si
covariante sarà ovviamente denito da Aµ = gµν A = (φ, −A)
Poichè
da il nome di 4-potenziale elettromagnetico.
5.6
Tensore elettromagnetico
Per scrivere le equazioni di Maxwell in forma covariante dobbiamo innanzitutto trovare
un oggetto tensoriale che codichi opportunamente le informazioni contenute nei campi
~ B
~.
E,
Questi due vettori corrispondono in totale a 6 componenti.
Perciò l'oggetto che
cerchiamo non può essere un 4-vettore, che ha solo 4 componenti. Un generico tensore di
rango 2 avrebbe 16 componenti, ma se consideriamo un tensore antisimmetrico, esso ha le
componenti diagonali nulle e quelle sotto la diagonale opposte a quelle sopra la diagonale, e
5.6.
69
TENSORE ELETTROMAGNETICO
perciò non indipendenti. Tale tensore antisimmetrico ha perciò esattamente 6 componenti
indipendenti, e viene quindi spontaneo pensare a un tale oggetto come il naturale candidato
a descrivere il campo elettromagnetico.
Deniamo il tensore elettromagnetico
Fµν = ∂µ Aν − ∂ν Aµ
Si verica subito che tale oggetto è antisimmetrico nello scambio degli indici
µ
e
ν.
Le sue
componenti possono essere determinate con un calcolo diretto, per esempio:
F0i = ∂0 Ai − ∂i A0 = −
∂Ai
− ∂i φ = E i
∂t
F12 = ∂1 A2 − ∂2 A1 = ∂2 A1 − ∂1 A2 = −B 3
Riassumendo
F0i = E i
Fij = −ijk B k
ovvero in forma matriciale

Fµν

0
E1
E2
E3
 −E 1
0
−B 3 B 2 

=
2
3
 −E
B
0
−B 1 
−E 3 −B 2 B 1
0
Analogamente si può denire un tensore controvariante

F µν = g µρ g νσ Fρσ
La prima considerazione è che
potenziale
Aµ ,

0 −E 1 −E 2 −E 3
 E1
0
−B 3 B 2 

=
2
3
 E
B
0
−B 1 
E 3 −B 2 B 1
0
Fµν ,
anche se inizialmente denito attarverso il 4-
dipende solo dai campi elettrico e magnetico, perciò come questi è un
oggetto sico gauge invariante.
Consideriamo ora le due equazioni di Maxwell disomogenee (I e IV) nella forma
~ ·E
~ =ρ
∇
~ ×B
~ − ∂ E~ = ~j
∇
∂t
A secondo membro compare in modo evidente la 4-corrente
j µ , perciò ci aspetteremmo che
questa sia eguagliata da un 4-vettore. Abbiamo però a disposizione un tensore antisimmetrico
Fµν
di rango 2. Osserviamo che le componenti di questo tensore sono date dalle
componenti di
~
E
o
~.
B
Ora, nelle equazioni compaiono le derivate di tali vettori, perciò
dovrebbe esserci anche una ∂µ nel primo membro dell'equazione. Viene spontaneo pensaµν
re che la contrazione ∂µ F
, che ha appunto un solo indice libero, possa essere il miglior
candidato. Infatti le equazioni disomogenee si scrivono
∂µ F µν = j ν
(5.5)
70
CAPITOLO 5.
IL CAMPO ELETTROMAGNETICO
Possiamo vericare questo fatto componente per componente
~ ·E
~ = j0 = ρ
∂µ F µ0 = ∂i E i = ∇
∂µ F µi = ∂0 F 0i + ∂k F ki = ∂0 E i + ∂k = −
∂E i
~ × B)
~ 1
+ (∇
∂t
e analogamente per le altre componenti.
Si noti che derivando il primo membro rispetto a
∂µ si ottiene 0, poichè si sta contraendo
un oggetto totalmente simmetrico (∂µ ∂ν ) con uno totalmente antisimmetrico (F
µν
). Perciò
il secondo membro di tale uguaglianza dovrà pure essere 0. Abbiamo così ridedotto in un
modo molto semplice, che illustra la potenza del caclolo covariante, l'equazione di continuità
∂µ j µ = 0.
Esaminiamo ora le equazioni omogenee
~ ·B
~ =0
∇
~ ×E
~ + ∂ B~ = 0
∇
∂t
Di nuovo queste sono 4 equazioni in tutto, ma la dierenza ora è che non possono più essere
uguagliate a un 4-vettore: a secondo membro infatti c'è semplicemente 0. Dovendo usare
Fµν
e non potendo contrarlo in modo tale da ottenere comunque 4 equazioni, si può solo
pensare a una combinazione di antisimmetrizzazione degli indici che possa eventualmente
dare 4 equazioni indipendenti. Avendo a disposizione 2 indici ciò non è possibile: poichè
ogni indice prende 4 valori le possibilità sarebbero le possibili liste di 4 oggetti presi a due
a due, cioe`
In eetti stiamo contando le
4!
=6
2!2!
compomenti di Fµν
che sono appunto 6. Tuttavia notiamo
che anche in queste equazioni come nelle precedenti entrano le derivate, perciò dovremo
∂µ da qualche parte. Vediamo allora cosa si riesce a fare con oggetti con 3
∂µ Fνρ . Se antisimmetrizziamo completamente questo oggetto otteniamo tutti i
mettere una
indici, tipo
modi di disporre 4 oggetti presi a 3 a 3 cioè
4!
=4
3!1!
abbiamo il giusto numero di equazioni. Per le equazioni omogenee di Maxwell si propone
quindi la forma
∂µ Fνρ + ∂ρ Fµν + ∂ν Fρµ = 0
Una verica componente per componente conferma che la scelta è giusta e che questa
equazione veramente è equivalente alle equazioni di Maxwell omogenee.
Usando il simbolo di Levi-Civita è utile a questo punto introdurre il tensore elettromagnetico duale
F̃µν = µνρσ F ρσ
5.7.
71
FORZA DI LORENTZ
in modo da scrivere le equazioni omogenne di Maxwell nella semplice forma
∂µ F̃ µν = 0
(5.6)
Le equazioni di Maxwell possono quindi essere scritte in maniera covariante tramite le (5.5)
e le (5.6).
Per studiare le trasformazioni di Lorentz dei potenziali scalare e vettore basta osservare
che essi formano un 4-vettore e perciò si trasformano come
A0µ = Λµν Aν
Nel caso di due sistemi di riferimento in moto relativo a velocità
φ0
A01
A02
A03
=
=
=
=
v
lungo l'asse
x1
si avrà
γ(φ − vA1 )
γ(A1 − vφ)
A2
A3
Analogamente per i campi elettrico e magnetico basta scrivere le trasformazioni del tensore
elettromagnetico
(F 0 )µν = Λρ µ Λσν Fρσ
ed esplicitare le componenti. Un semplice prodotto di matrici fornisce, :
E10
E20
E30
B10
B20
B30
= E1
= γ(E2 − vB3 )
= γ(E3 − vB2 )
= B1
= γ(B2 + vE3 )
= γ(B3 + vE2 )
Si noti come un campo puramente elettrico in un sistema di riferimento inerziale può
mostrare sia componenti elettriche che magnetiche in un altro. I concetti di campo elettrico
e di campo magnetico sono del tutto relativi.
5.7
Forza di Lorentz
Le equazioni di Maxwell dicono come, data una distribuzione di cariche (descrtta da
ρ)
e
dato il loro movimento (descritto da ~
j ) siano determinati il campo elettrico e il campo magnetico. Tuttavia non dicono nulla su come i campi
~ B
~
E,
inuenzino il moto delle particelle
cariche. Questo è descritto dalla cosiddetta forza di Lorentz, cioè da una espressione per
la forza generata da un campo elettromagnetico che inserita nelle equazioni del moto (di
Newton o relativistiche) determina le traiettorie dei punti materiali carichi elettricamente.
72
CAPITOLO 5.
IL CAMPO ELETTROMAGNETICO
La forza di Lorentz è, nel caso più generale
~ + 1B
~ × ~v
F~ = e E
c
In formalismo 4-dimensionale essa si può tradurre in una espressione che lega la derivata
del 4-impulso rispetto al tempo proprio con il tensore elettromagnetico e la 4-velocità
1
dpµ
= F µν uν
dτ
c
5.8
Formalismo lagrangiano
Come già commentato nel capitolo sulla meccanica relativisitca l'interazione a distanza
in relatività si deve pensare sempre come mediata da un campo avente una sua densità
di energia-impulso e quindi assimilabile a un ente sico che partecipa alla dinamica del
sistema assieme alle particelle che ne sono sorgenti. Una trattazione completa di un sistema
comprendente le sue forze deve perciò passare attraverso la formulazione di un principio
di minima azione, o equivalentemente di un formalismo lagrangiano, che comprenda sia
le particelle materiali che i campi che ne trasmettono le interazioni.
In questa sezione
esporremo la formulazione lagrangiana di un sistema di particelle accoppiato al campo
elettromagnetico.
Scriviamo l'azione di particelle nel campo elettromagnetico come composta di tre parti
S = Smat + Sint + Scampo
in cui
Smat
è l'azione delle
N
particelle libere vista a suo tempo
Smat = −
N
X
Z
q
1 − vA2 dt
t0
A=1
Scampo
t1
mA
è il termine di puro campo in assenza di materia e dovrebbe riprodurre le equazioni
di Maxwell in assenza di cariche elettriche e correnti.
Esso deve essere sia invariante di
Lorentz che invariante di gauge. Inoltre, poichè le equazioni di Maxwell in forma covariante
involvono derivate prime di
Fµν , ci aspettiamo che la corrispondente densità di Lagrangiana,
da cui esse sono ottenute attraverso le equazioni di Eulero-Lagrange con una operazione di
derivazione, sia un Lorentz-invariante quadratico nelle
Fµν
e senza derivate. Ci sono due
invarianti di Lorentz e di gauge indipendenti con questi requisiti
Fµν F µν
e
1
Fµν F̃ µν
Abbiamo però visto che di questi due invarianti il primo è anche invariante di parità,
mentre il secondo non lo è. Poichè i fenomeni elettromagnetici, per quanto ne sappiamo
1 Ovviamente
F̃µν F̃ µν = Fµν F µν ,
come è facile vericare
5.8.
73
FORMALISMO LAGRANGIANO
sperimentalmente, non presentano violazioni della simmetria di parità, ne a livello classico
e nemmeno a quello quantistico, escluderemo la possibilità che il secondo termine possa
comparire nella densità di lagrangiana
L.
Z
Scampo =
ove
d4 x = dx0 dx1 dx2 dx3 .
Pertanto assumiamo che l'azione sia data da
Z
4
d xL = λ
La costante
λ
d4 xFµν F µν
davanti all'integrale sarà determinata dalla ri-
chiesta che eettivamente le equazioni del moto forniscano le equazioni di Maxwell, con le
giuste costanti. Ricordando la denizione di
Fµν
in termini del 4-potenziale
Aµ
possiamo
usare le equazioni di Eulero-Lagrange
∂ρ
∂L
∂L
−
=0
∂∂ρ Aµ ∂Aµ
per ricavare le equazioni del moto. Queste risultano avere la forma
∂ρ F ρµ = 0
complementate dall'identità di Bianchi
∂ρ F̃ ρµ = 0
Sappiamo che l'identità di Bianchi da origine alle equazioni omogenee di Maxwell, mentre
l'altra equazione da origine a quelle disomogenee che sono accoppiate alla materia.
Il
fatto che qui esse a secondo membro siano nulle rispecchia l'assunto iniziale che stiamo
µ
trattando un campo in assenza di materia. Il termine proporzionale a j che abbiamo
visto a secondo membro dare le equazioni di Maxwell disomogenee complete verrà dunque
dal termine di interazione materia-campo Sint . Questo dovrà essere un Lorentz-invariante
µ
contenente appunto j accoppiata in qualche modo al campo Aµ . La maniera più semplice
di accoppiare questi due campi in grado di fornire, attraverso Eulero-Lagrange, le equazioni
di Maxwell disomogenee è quella di assumere
Z
Sint = ω
Anche qui la costante
ω
d4 x j µ Aµ
davanti all'integrale sarà determinata richiedendo che vengano
riprodotte le corrette costanti nelle equazioni di Maxwell. Applicando Eulero-Lagrange a
Sint + Scampo , a dierenza di prima, ove comparivano solo derivate della L
∂ρ Aµ , ora compare anche una derivata della densità di lagrangiana rispetto ad
tutto il sistema
rispetto a
Aµ ,
portando alle equazioni
∂ρ F ρµ = j µ
a patto che si scelga
λ = −ω/4.
La scelta di porre
ω = 1 porta, come vedremo tra breve, al
corretto accoppiamento materia-campo, cioè alla giusta espressione per la forza di Lorentz.
L'azione totale del sistema materia-campo elettromagnetico sarà perciò
S=−
N
X
A=1
Z
mA
Z
Z
q
1
4
µ
2
d4 xFµν F µν
dt 1 − vA + d xj Aµ −
4
74
CAPITOLO 5.
IL CAMPO ELETTROMAGNETICO
Ricordando le espressioni della densità di carica e di corrente per un sistema di particelle
ognuna avente carica
eA
ρ(~x, t) =
~j(~x, t) =
N
X
A=1
N
X
eA δ (3) (~x − ~xA (t))
eA~vA (t)δ (3) (~x − ~xA (t))
A=1
perveniamo alla lagrangiana di un sistema di particelle materiali immerso in un campo
elettromagnetico
L=−
X
mA
q
1 − vA2 +
X
eA φ(xA ) −
A
A
X
~ A ) + Lcampo
eA~vA · A(x
A
Prima di calcolare le equazioni del moto, ricaviamo il momento coniugato
nate
P~A
delle coordi-
~xA
∂L
~ A)
= p~A + eA A(x
P~A ≡
∂~vA
ove
p~A = mA γ(vA )~vA
è il consueto impulso della particella materiale. Per applicare Eulero-
Lagrange per le variabili
~x, ~v
∂L
d ∂L
=
dt ∂~vA
∂~xA
calcoliamo innanzitutto il termine
∂L/∂~xA
∂L ~ = eA ∇(
~ A
~ · ~vA ) − eA ∇φ
~
= ∇L
∂~xA ~vA =cost.
Dimostriamo che vale l'identità
~ A
~ · ~v ) = (~v · ∇)
~ A
~ + ~v × (∇
~ × A)
~
∇(
(5.7)
Ciò può essere fatto in compnenti, tenendo conto della relazione
δjl δkm = δjm δkl + ijk ilm
(5.8)
La componente j-sima del primo membro della (5.7) si può scrivere
~ · ~v ) = ∂j Ak v k = δjl δkm ∂l Am v k
∂j (A
che equivale a moltiplicare il primo membro della (5.8) per
∂l Am v k .
La (5.8) ci fornisce
allora
~ × A)
~ i
δjl δkm ∂l Am v k = (δjm δkl + ijk ilm )∂l Am v k = v k ∂k Aj + jki v k (∇
5.9.
TENSORE ENERGIA-IMPULSO DEL CAMPO ELETTROMAGNETICO
75
e cioè la (5.7). Pertanto
∂L
~ A ) + eA~vA × B(x
~ A ) − eA ∇φ(x
~
~ A(x
= eA (~vA · ∇)
A)
∂~xA
Da ciò, usando le equazioni di Eulero-Lagrange per le coordinate
~xA
e le velocità
~vA
delle particelle si ottiene l'espressione per la forza di Lorentz vista prima
dpµ
= F µν uν
dτ
Questa che abbiamo esposto è la lagrangiana generale dell'elettrodinamica classica di un
sistema di particelle e sta alla base della generalizzazione quantistica nota come QED
(quantoelettrodinamica), uno dei massimi successi della Teoria Quantistica dei Campi.
Si noti che il calcolo del momento coniugato alle coordinate
di accoppiamento con il campo elettromagnetico dato dalla
~xA
Sint
delle particelle, nel caso
proposta sopra, porta a
∂L
~ A)
P~A =
= p~A + eA A(x
∂~xA
con
p~A
impulso della particella libera, cioè la cosiddetta regola minimale di accoppiamento
tra materia carica e un campo elettromagnetico esterno.
Inne calcoliamo l'hamiltoniana che ci darà l'energia totale del sistema. Cominciamo
da
Smat + Sint
(indichiamo per brevità
H =
X
~ A = A(x
~ A)
A
e
φA = φ(xA )
~vA · P~A − L
A
=
X
mA γA vA2
~ A · ~vA + mA
+ eA A
q
1−
vA2
~ A · ~vA + eA φA
− eA A
A
=
X
(mA γA + eA φA )
A
Si noti che il contributo all'energia dovuto alla presenza di campo elettromagnetico proviene
tutto dal solo potenziale scalare.
5.9
Tensore energia-impulso del campo elettromagnetico
Nel caso del campo elettromagnetico, descritto dalla densità di lagrangiana
1
L = − Fµν F µν
4
calcoliamo il tensore energia impulso
T µν =
∂L
∂µ Aσ − δνµ L
∂∂µ Aσ
76
CAPITOLO 5.
IL CAMPO ELETTROMAGNETICO
Essendo
∂L
1
∂Fαβ
1
∂(∂α Aβ − ∂β Aα )
= − F αβ
= − F αβ
∂∂µ Aσ
2
∂∂µ Aσ
2
∂∂µ Aσ
∂∂α Aβ
= −F αβ δαµ δβσ = −F µσ
= −F αβ
∂∂µ Aσ
si ha
Alzando l'indice
1
T µν = −F µσ ∂ν Aσ + δνµ Fρτ F ρτ
4
ν
1
T µν = −F µσ ∂ ν Aσ + g µν Fρτ F ρτ
4
Questo tensore non è simmetrico. Costruiamoci allora un tensore
T 0µν = T µν + ∂σ ψ µνσ
che sia simmetrico. Allo scopo prendiamo
ψ µνσ = Aµ F νσ
cosicchè
∂σ ψ µνσ = (∂σ Aµ )F νσ + Aµ ∂σ F νσ
In assenza di cariche il secondo termine scompare e quindi
∂σ ψ µνσ = F νσ ∂σ Aµ
Perciò il nuovo tensore energia impulso sarà ora simmetrico e varrà
µν
Tcampo
=− F
µσ
F σν
1
− g µν Fρτ F ρτ
4
Si vede subito che la traccia
T µµ = 0
è nulla (il campo elettromagnetico classico è conformemente invariante) ed esplicitando le
componenti
T 00 = H =
E2 + B2
2
T 0i = S i
1 2
(E + E32 − E12 + B22 + B32 − B12 )
T 11 =
2 2
1 2
T 22 =
(E + E12 − E22 + B32 + B22 − B12 )
2 3
1 2
T 33 =
(E + E22 − E32 + B12 + B22 − B32 )
2 1
T ij = −E i E j + B i B j
i 6= j
ij
Le componenti T
= σ ij si dicono tensore degli sforzi di Maxwell, mentre le componenti
0i
T che devono fornire la densità di impulso del sistema, sono date dalle componenti del
vettore di Poynting
~=E
~ ×B
~,
S
del quale si può così comprendere il signicato sico.
5.10.
TENSORE ENERGIA-IMPULSO DI MATERIA ACCOPPIATA AL CAMPO ELETTROMAGNET
5.10
Tensore energia-impulso di materia accoppiata al
campo elettromagnetico
Ricordando le denizioni di densità e corrente di materia
µ(x) =
X
~π (x) =
X
00
mn γ(vn )δ (3) (~x − ~xn (t)) = Tmat
n
i0
p~n δ (3) (~x − ~xn (t)) = Tmat
n
ovvero, usando il 4-vettore
pµ
µ0
Tmat
(x) =
X
pµn δ (3) (~x − ~xn (t))
n
possiamo vedere le componenti
µ0
Tmat
del tensore energia-impulso di un sistema di particelle
libere come le densità di 4-impulso. Queste, assieme alle densità di correnti di 4-impulso
formano come visto a suo tempo 4 equazioni di continuità
µν
∂ν Tmat
=0
Se le particelle non sono più libere, ma intergaenti elettromagneticamente, questa equazione di continuità non vale più e deve essere sostiutita da una più generale che comprende
anche il contributo del tensore energia-impulso del campo elettromagnetico.
Denendo
infatti
µν
µν
T µν = Tmat
+ Tcampo
si ha l'equazione di continuità
∂µ T µν = 0
valida per tutto il sistema chiuso costituito da materia più campo elettromagnetico.