dispense - Dipartimento di Fisica

IL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ
RISTRETTA
ISIDORO FERRANTE
1. I NTRODUZIONE
In questo ciclo di lezioni ci proponiamo di seguire un percorso molto formale nella
formulazione della teoria, partendo dai postulati di Einstein, e riscrivendo le leggi della
fisica utilizzando quello che tecnicamente si chiama formalismo covariante, ovvero
quel sistema di notazione che permette di riconoscere immediatamente la struttura
matematica delle varie quantità fisiche che entrano in gioco.
A partire dal formalismo covariante, si discende ai risultati particolari in termi di
quantità note e misurabili, e si cerca di spiegare gli effetti in termini di semplici
osservazioni.
Ovviamente un simile approccio non è pensabile nell’insegnamento della scuola secondaria: ma del resto lo scopo di queste lezioni non è quello di fornire gli strumenti
per l’insegnamento, bensì quello di mettere gli insegnanti in condizione tale da poter
in caso affrontare la lettura di un testo specialistico sull’argomento, per cercare le risposte alle domande che spesso ingenuamente ci si pone davanti ad una teoria che in
alcuni casi fornisce dei risultati lontani dal senso comune.
Si daranno per conosciuti gli aspetti fondamentali della teoria, dal significato di sitema
di riferimento inerziale, alle trasformazioni di Lorentz, alle contrazioni delle lunghezze
e dilatazione dei tempi.
2. A LCUNI
PROBLEMI DELLA MECCANICA NEWTONIANA E
DELL’ ELETTROMAGNETISMO CLASSICO .
La situazione della fisica precedente all’articolo sulla relatività generale del 1905 presentava alcuni piccoli problemi di tipo logico o sperimentale che gli scienziati del tempo cercavano di risolvere tramite situazioni ad hoc, senza pensare che un ripensamento
delle leggi della meccanica fosse necessario per una loro completa comprensione. La
meccanica newtoniana, anche se riscritta parzialmente nel ’700 e ’800, era rimasta sostanzialmente invariata, nella sostanza, dall’epoca dei principia di Newton. Qualche
problemino c’era, è vero, di natura sia logica che sperimentale. Il principale problema
di natura logica era ovviamente quello dell’azione a distanza: non era per niente chiaro
il meccanismo per cui due corpi avrebbero potuto influenzarsi a vicenda attraverso lo
spazio, e il concetto stesso aveva avuto qualche difficoltà ad affermarsi. C’era anche
il problema di definire cosa fosse esattamente un sistema inerziale, e di capire come
1
2
italianISIDORO FERRANTE
mai una certa classe di sistemi di riferimento risultasse privilegiata rispetto ad altri,
ma sembrava un problema minore. Dal punto di vista sperimentale, le cose andavano
decisamente meglio: l’unica osservazione non spiegabile tramite la meccanica newtoniana era la famosa precessione di 43” per secolo nel perielo di Mercurio, peraltro un
residuo di una precessione osservata di ben 574” per secolo, di cui la teoria newtoniana
riusciva a spiegare solamente 531” per secolo
Le cose peggiorarono quando si cercò di rendere coerenti le leggi della meccanica con
l’elettrodinamica di Maxwell. Un primo problema si ha ad esempio nella formulazione
~ Nella meccanica newtoniana si assumeva valesse
della forza di Lorentz1, F~ = q ~vc × B.
la relatività di Galileo: ovvero, dato un sistema chiuso (chiamiamolo laboratorio) non è
possibile determinare se questo si muove o sta fermo senza compiere esperimenti che
coinvolgano in qualche maniera gli oggetti che si trovano all’esterno del laboratorio
stesso. In modo del tutto formale si dice che le equazioni del moto devono risultare
invarianti per trasformazioni del tipo x~0 = ~x − ~v t.
Osserviamo innanzitutto che una trasformazione del genere non ha effetti sulla accelerazione, e pertanto nemmeno sulla forza: questo vuol dire che la forza tra due corpi
non può dipendere dalla posizione e velocità assoluta di uno di essi, bensì solamente
dalla posizione e velocità relativa: F~1→2 = F~ (~x1 − ~x2 , ~v1 − ~v2 ). La forza di Lorentz invece non ha questa caratteristica, a meno di non interpretare la velocità ~v come
misurata in un qualche particolare sistema di riferimento.
La situazione in realtà è decisamente peggiore: infatti le equazioni delle onde elettro2~
~ 2E
~ = 0 NON risulta invariante per trasformazioni di Galileo, e
magnetiche, c12 ∂∂tE2 − ∇
alla stessa maniera non risulta invariante il complesso delle equazioni di Maxwell. Altri problemi derivavano dall’analisi di problemi apparentemente semplici: ad esempio,
si considerino due particelle in moto con la stessa velocità ~v in una direzione che forma un angolo con la congiungente (figura 2.1). Esiste un sitema di riferimento in cui
queste cariche sono in quiete, e si attraggono con una forza diretta lungo la congiungente data dalla formula di Coulomb. Nel sistema di riferimento in cui le cariche sono
in moto, ognuna di queste produce un campo magnetico le cui linee di forza sono circonferenze coassiali con la linea di moto; in conseguenza di ciò, su ciascuna delle due
cariche nasce una forza Fm di origine magnetica che non è diretta lungo la congiungente. Sommata alla forza elettrica, si ottengono due risultati interessanti: innanzitutto,
tra le due cariche si osserva una coppia che tende a farle ruotare; in secondo luogo,
nel sistema in cui le due cariche sono a riposo la forza è diretta lungo la congiungente:
le trasformazioni di Galileo prevedono invece che questa NON cambi direzione. Che
fine fa il principio di azione e reazione? E la conservazione del momento angolare? E
come mai le trasformazioni di Galileo falliscono?
Un problema molto simile vien fuori da un esempio altrettanto semplice: si consideri
la situazione esemplificata in figura 2.2: stavolta le due velocità non devono essere
1
Adopereremo il sistema di unità di misura detto gaussiano, in quanto utile per semplificare molte
delle formule adoperate: vedi la sezione dedicata all’elettromagnetismo.
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA
3
F IGURA 2.1. Due cariche viste da un sistema di riferimento che si
muove con velocità v rispetto ad ess: sorgono delle forze di natura
magnetica che fanno sì che la forza che agisce su ciascuna delle due
cariche non risulti diretta lungo la congiungente.
q
Fe
v
Fm
F
v
q
F IGURA 2.2. Sulla carica 1 agisce solamente la forza dovuta al campo
elettrico generato dalla carica 2; su questa invece agiscono sia la forza
dovuta al campo elettrico che quella dovuta al campo magnetico.
v1
F 21
v2
Fm
F12
necessariamente uguali. Sulla carica superiore agisce solamente la forza dovuta al
campo elettrico della carica inferiore: infatti, lungo la direzione del moto il campo
magnetico è nullo.
Sulla carica inferiore invece agiscono sia le forze dovute al campo elettrico che quelle
dovute al campo magnetico prodotti dalla carica superiore.
Stavolta, la forza di origine magnetica non si annulla, anzi è diretta verso sinistra. Di
nuovo,che fine fa il principio di azione e reazione?
In realtà i fisici della fine del diciannovesimo secolo non erano troppo turbati da queste
osservazioni: infatti, la natura ondulatoria della luce, così come era ormai stata definitivamente accertata sperimentalmente, richiede nel loro modo di vedere l’esistenza di
un mezzo in grado di trasportare le vibrazioni dovute ai campi elettromagnetici.
Si pensava insomma che, analogamente a quanto accade con le onde sonore, esistesse un qualche substrato, detto etere, in grado di propagare le onde elettromagnetiche.
4
italianISIDORO FERRANTE
A questo punto, la mancata validità delle relatività galileiana per le equazioni elettromagnetiche non veniva a costituire più un problema, perché si veniva a creare un
sistema di riferimento privilegiato, quello in cui l’etere si trovava a riposo, appunto,
nel quale valevano le equazioni di Maxwell: in tutti gli altri sistemi di riferimento sarebbero comparsi dei fattori correttivi generalmente troppo piccoli per essere rivelati
sperimentalmente.
Purtroppo tutti gli esperimenti destinati a determinare le caratteristiche fisiche dell’etere portavano a risultati contraddittori: un classico esempio è il risultato di Fizeau
sulla velocità della luce all’interno di dielettrici in moto. Fizeau misurò la velocità
della luce all’interno di un tubo percorso da un flusso di acqua in moto con velocità v, trovando dei
risultati compatibili con l’ipotesi che la velocità aumentasse di un
1
termine 1 − n2 v: si tratta di un risultato difficilmente comprensibile in meccanica
classica, in quanto porterebbe ad ipotizzare che l’etere venisse trascinato solamente
parzialmente dal moto del fluido.
Inoltre, i tentativi di misurare direttamente il moto della Terra attraverso l’etere, soprattutto ad opera di Michaelson e Morley, portarono, come è noto, a risultati negativi.
2.1. I postulati di Einstein. La strategia adoperata da Einstein è quella di rifiutare l’idea dell’esistenza di un sistema di riferimento inerziale privilegiato: assieme a questo
principio, Einstein assume anche la congettura che la velocità della luce sia la stessa
in qualunque sistema di riferimento inerziale.
A partire da questi due postulati, Einstein ricava rapidamente le conseguenze più rivoluzionare della sua teoria: la revisione del concetto di simultaneità, le trasformazioni
di Lorentz come equazioni che collegano le misure di tempo e distanza tra due sistemi
inerziali diversi, la contrazione delle lunghezze e la dilatazione dei tempi, l’aberrazione
della luce, fino ad arrivare alle equazioni del moto dell’elettrone.
In questa trattazione noi seguiremo un approccio simile, ma partendo non dall’invarianza della velocità della luce, bensì dalla richiesta di invarianza delle equazioni della
dinamica e dell’elettrodinamica rispetto alle trasformazioni di Lorentz. Si tratta di un
approccio più moderno, in gran parte dovuto ad un ex professore di Einstein, Minkowsky, il quale si occupò di formalizzare la struttura dello spazio tempo così come
concepito da Einstein, il quale dapprima rimase perplesso di fronte al lavoro del collega, salvo poi accettarlo in toto quando si rese conto di quanto venisse facilitata la
formulazione della teoria della relatività generale.
2.2. Il concetto di invarianza. Si dice che una determinata legge fisica espressa nella
forma A = B è invariante sotto una certa trasformazione se questa trasformazione
cambia nello stesso modo sia la quantità A che la quantità B trasformando l’equazione
in un’altra del tipo A0 = B 0 .
Le leggi della fisica classiche, newtoniane, ad esempio sono invarianti per rotazioni
del sistema di riferimento: ad esempio, in F~ = m~a sia la forza che la accelerazione si trasformano alla stessa maniera se si adopera un sistema di riferimento ruotato
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA
5
rispetto ad un qualunque asse. Certamente, le componenti dei vettori F~ e ~a cambieranno nel passaggio al nuovo sistema di riferimento, ma in modo tale che l’uguaglianza
venga sempre rispettata. Altre due invarianze importanti nella meccanica newtoniana sono quelle per traslazioni spaziali (che trasforma la coordinata ~x nella coordinata
~x0 = ~x + x~0 ) o temporali (t → t0 = t + t0 ): ovvero, cambiando l’origine delle coordinate o l’origine dei tempi, le equazioni devono rimanere valide. Questo ci porta a
concludere, ad esempio, che la forza tra due corpi a e b può dipendere solamente dalla
loro posizione relativa e non da quella assoluta: ovvero F~ab = F~ (~xa − ~xb ).
Altre due importanti invarianze sono quelle per inversioni spaziali, o parità, o per
inversioni temporali.
La prima ci dice che non ha importanza se prendo una terna di assi cartesiani destrorsi
ˆ ŷ, ẑ) → (x̂0 , ŷ 0 , ẑ 0 ) =
o sinistrorsi, ottenuta invertendo il verso di tutti e tre gli assi(x,
(−x̂, −ŷ, −ẑ): infatti le componenti dell’accelerazione cambieranno segno così come
~ In
quelle della forza2. Un caso particolare è dato dalla forza di Lorentz: F~ = qv
~ × B.
questa espressione, infatti, cambiando di segno alle componenti degli assi, si giungerebbe ad un assurdo, in quanto il prodotto vettoriale rimarrebbe alla fine dello stesso
segno.... Il problema viene risolto in quanto dallo studio delle equazioni di Maxwell si
scopre che le componenti di del campo magnetico non cambiano di segno se si cambia
~ è uno pseudovettore,
il segno agli assi del sistema di riferimento! Si dice allora che B
in quanto si comporta come un vettore per rotazioni, ma in modo diverso per trasformazioni di parità. Una quantità con proprietà simili è il momento della quantità di
moto.
L’invarianza per inversione temporale è una questione invece assai delicata: vuol dire
infatti che ogni processo fisico visto alla rovescia, ossia dalla fine al principio, rimane
sempre un processo fisicamente probabile. Sappiamo che questo è vero microscopicamente: le leggi fondamentali che regolano le interazioni tra le particelle elementari
ubbidiscono a questa regola3; tuttavia sappiamo anche che le leggi macroscopiche, che
coinvolgono le interazioni tra molti corpi, non risultano reversibili temporalmente. Un
esempio banale: in un corpo soggetto ad attrito viscoso, F~ = −κ~v = m~a, per inversione temporale cambia segno il termine della forza, ma non quello dell’accelerazione
(l’accelerazione, in quanto derivata seconda rispetto al tempo, non cambia segno per
inversione temporale, mentre la velocità sì). In questo caso, infatti, la forza sorge dalla
somma degli urti che il corpo subisce contro le molecole del fluido in cui è immerso: i
singoli urti sono reversibili temporalmente, ma il loro effetto complessivo no.
L’ultima invarianza, quella che ci interessa di più, è invece l’invarianza per trasformazioni di Galileo:
2Sappiamo però che
~x0 = ~x − ~v t
questo non è vero se si considerano le interazioni deboli.
In realtà le interazioni deboli sembrano violarla: non esiste una prova sperimentale diretta, ma alcuni
principi teorici uniti a dati sperimentali puntano in questa direzione.
3
6
italianISIDORO FERRANTE
Ovvero, se ci trasferiamo da un sistema di riferimento ad un altro che si muove rispetto
a questo con velocità costante ~v le equazioni non cambiano.
L’accelerazione è ovviamente invariante: infatti, derivando due volte si ottiene ~a 0 = ~a.
Ne segue che perché l’equazione di newton sia invariante deve risultare che la forza
deve dipendere dalla posizione relativa degli oggetti, come già visto, ed eventualmente
dalla velocità relativa: F~ab = F~ (x~a − x~b , ~va − ~vb ).
Nel caso del moto nel fluido viscoso, l’invarianza non è ovviamente rispettata: infatti
in quel caso abbiamo un sistema di riferimento privilegiato, ovvero quello in cui il
fluido è in quiete, e la velocità va misurata relativamente a quel sistema di riferimento.
Passiamo adesso ad esaminare le leggi dell’elettromagnetismo: le equazioni di maxwell sono invarianti rispetto alle trasformazioni viste prima, tranne in un caso: ovvero
quello delle trasformazioni di galileo.
Per trasformazioni di Galileo compaiono nelle equazioni termini aggiuntivi, che non
vi è modo di eliminare. 4
Ora, si potrebbe pensare che cambiando sistema di riferimento questi termini in qualche modo si compensino ad esempio nel calcolo delle forze: bene, non è così. L’elettromagnetismo non è invariante per trasformazioni di Galileo.
Sappiamo però che le trasformazioni di Lorentz, quelle ottenute supponendo l’invarianza della velocità della luce in un cambiamento di sistema di riferimento inerziale,
lasciano invariate le equazioni di Maxwell (e lo dimostreremo nel seguito).
Possiamo quindi cambiare leggermente i postulati di Einstein nei due seguenti:
(1) Le relazioni tra le misure di spazio e di tempo in due sistemi di coordinate che
si muovono con velocità relativa costante sono dati dalle equazioni di Lorentz
(2) Tutte le equazioni fondamentali della fisica sono invarianti sotto trasformazioni
di Lorentz.
Partiremo da questo punto, quindi, e al termine ricaveremo l’invarianza della velocità
della luce.
2.3. Le trasformazioni di Lorentz. Richiamiamo le trasformazioni di Lorentz: in
quasi tutti gli esempi in questi appunti ci riferiremo alla situazione seguente: consideriamo un sistema di riferimento S ed un altro sistema di riferimento S 0 che si muove
rispetto a questo con velocità ~v senza ruotare.
4Ad esempio, consideriamo l’equazione ∇
~ ×E
~
= − 1c ∂∂tB . Per trasformazione di Galileo dal sistema
0
S a quello S che si muove con velocità v lungo l’asse y, i campi si trasformano nel modo seguente:
~ 0 (~x0 ) = E(~
~ x − ~v t), B
~ 0 (~x0 ) = B(~
~ x − ~v t). Le derivate rispetto alla coordinate non cambiano: ∇
~ 0 = ∇,
~
E
~
~0
∂B
∂B
ma la dipendenza rispetto al tempo contiene una dipendenza aggiuntiva! Si ha quindi ∂t = ∂t − (~v ·
~ B.
~
∇)
Si ha quindi un termine aggiuntivo che non va via. Si può pensare che l’errore stia nell’assunto
~ 0, B
~ 0 , ed in effetti è così : nel
secondo cui basti sostituire le nuove coordinate per ottenere i campi E
nuovo sistema di riferimento i campi cambiano. Tenendo conto di questa possibilità, il termine extra si
trasforma in un termine del secondo ordine in v/c, ma non scompare del tutto.
~
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA
7
F IGURA 2.3. Due sistemi di riferimento S ed S 0 si muovono con velocità relativa uniforme diretta lungo x. All’istante t = 0 le origini delle
coordinate coincidono, ed inoltre t0 = 0.
S
S’
v
O
O’
Supponiamo inoltre per semplicità che all’istante t = 0 le origini O ed O 0 coincidano,
ed inoltre che in quell’istante anche nel sistema S 0 valga t0 = 0 Supponiamo infine che
la velocità ~v sia orientata lungo l’asse x (vedi figura ).
Allora dato un evento, ovvero un punto di coordinate spaziali x, y, z e coordinate
temporali t, nel sistema S 0 le coordinate saranno:
x0 = q
t0 = q
y0 = y
z0 = z
1
1−
v2
c2
(x − vt)
v t
−
x
2
c2
1 − vc2
1
Solitamente si introducono i simboli: β = vc , γ = √ 1
1−β 2
; inoltre si moltiplica il tempo
t per la velocità della luce in modo da avere grandezze omogenenee.
Con questo simbolismo, le T.L. acquistano una forma simmetrica:
(2.1)
x0
ct0
y0
z0
=
=
=
=
γ (x − βct)
γ (ct − βx)
y
z
Le trasfomazioni inverse si ottengono rapidamente spostando gli apici e cambiando v
con −v:
x
ct
y
z
=
=
=
=
γ (x0 + βct0 )
γ (ct0 + βx0 )
y0
z0
8
italianISIDORO FERRANTE
3. D EFINIZIONE
DELLO SPAZIO QUADRIDIMENSIONALE CON METRICA DI
M INKOWSKY.
Cominciamo col definire delle quantità che chiameremo vettori controvarianti, o anche
quadrivettori (o tetravettori, con una parola in disuso).
Un quadrivettore viene individuato da quattro componenti, che si indicano con gli
indici da 0 a 3. Lo indichiamo col simbolo xµ (fate attenzione all’indice in alto: è
la chiave del formalismo). La componente con indice uguale a 0 è detta componente
temporale del quadrivettore, mentre le componenti da 1 a 3 sono dette componenti
spaziali. Una forma alternativa di indicare un vettore di questo tipo è x µ = (x0 , ~x).
Definiamo un prodotto scalare tra vettori nella forma5 hx, yi = x0 y 0 − x1 y 1 − x2 y 2 −
x3 y 3 = x0 y 0 − ~x · ~y. Osservate questa formula: risulta un po’ complicata da applicare,
soprattutto perché a volta i termini vanno sommati, a volte sottratti. Nel formalismo
einsteniano, questo prodotto scalare si scrive anche nella forma: hx, yi = Σ µ,ν gµν xµ y ν ,
dove gµν è una matrice diagonale i cui elementi sono g00 = 1, g11 = g22 = g33 = −1.
Notare anche stavolta la posizione degli indici. Si assume per convenzione che quando
due indici sono uguali, ed uno si trova in alto e l’altro in basso, allora si somma su di
essi. In questo modo si semplifica ulteriormente la formula:hx, yi = g µν xµ y ν . L’uso
della matrice metrica gµν serve per il momento solamente ad evitare il problema dei
segni che cambiano. Ci si può spingere ancora più in là nella semplificazione: si
definiscono i cosiddetti vettori controvarianti secondo la formula: x µ = gµν xν : un
vettore controvariante ha quindi componenti x0 = x0 , x1 = −x1 , x2 = −x2 , x3 =
−x3 , ovvero xµ = (x0 , −~x). In questo modo il prodotto scalare si scrive nella forma:
hx, yi = xµ y µ = xµ yµ . Da notare che qualunque tra i due vettori x o y può essere
trasformato nell’equivalente controvariante.
Cosa sono questi vettori controvarianti? I fisici di solito si trovano spaesati di fronte a
questo nuovo concetto: in fondo un vettore controvariante sembra uguale ad un vettore
covariante, a parte i segni cambiati. Per i matematici invece la differenza è più chiara,
in quanto riconoscono nei vettori controvarianti gli elementi di uno spazio duale. Il
fatto che la forma di g sia così semplice è dovuta essenzialmente al fatto che stiamo
adoperando coordinate cartesiane. Se avessimo adoperato ad esempio coordinate polari nello spazio, allora la matrice g avrebbe avuto una forma completamente differente e
i vettori controvarianti sarebbero risultati completamente diversi dai vettori covarianti,
al punto di non avere neanche le stesse dimensioni.
5
Nei testi più vecchi, si utilizzano gli indici da 1 a 4: le componenti spaziali del quadrivettore sono le
prome tre, mentre la quarta componente è puramente immaginaria. In questo modo il prodotto scalare
assume la forma consueta, ma assume segno opposto a quello da noi definito: hx, yi = x 1 y 1 + x2 y 2 +
x3 y 3 + (ix4 · iy 4 ) = ~x · ~y − x4 y 4 . Questa notazione apparentemente più semplice risulta perè alla lunga
macchinosa e non è estendibile alla relatività generale.
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA
9
Il vantaggio di adoperare questa notazione risulterà evidente quando si passerà a sistemi di coordinate qualsiasi (nella relatività generale).6
Allo stesso modo in cui abbiamo definito la matrice gµν possiamo definire una matrice
g µν che ritrasforma il vettore controvariante in un vettore covariante. Nel linguaggio
gergale, moltiplicare per una matrice gµν abbassa un indice, mentre moltiplicare per
g µν lo alza. In questa semplice rappresentazione, gli elementi di g µν sono uguali a
quelli di gµν . Si noti inoltre che gν µ = gνµ = δνµ dove δ indica il simbolo di kronecker.
3.1. Il gruppo di Lorentz. Fino a questo punto abbiamo costruito uno spazio quadridimensionale, e l’abbiamo dotato di una sua metrica.
Adesso definiamo le trasformazioni di Lorentz come quelle trasformazioni lineari che
lasciano invariato il prodotto scalare tra due quadrivettori, ovvero quelle che, dati due
quadrivettori di componenti xµ , xν , le trasformano in x0µ , y 0µ , in modo tale che x0µ yµ0 =
xµ y µ .
Entrando nel dettaglio, data una qualsiasi trasformazione lineare definita dalla matrice Λµ ν tale che x0µ = Λµ ν xν (si noti che l’ordine degli indici è importante, la
matrice in generale non è simmetrica), e definita la matrice covariante Λ µ ν ottenuta abbassando un indice ed alzandone un altro tramite la matrice metrica g µν , allora
deve aversi:x0µ yµ0 = Λµ k xk Λµ λ yλ , ovvero Λµ k Λν k = δνµ . Questa è una relazione di
ortogonalità tra matrici. Si può dimostrare facilmente come il determinante della matrice Λ debba essere uguale a ±1. A noi interessano solamente quelle trasformazioni
che possono essere ricondotte con continuità alla matrice identità, ovvero quelle con
determinante 1.
Inoltre, vogliamo considerare solamente quelle trasformazioni che non cambiano segno alla coordinata temporale (trasformazioni ortocrone) : si verifica che queste corrispondono al caso Λ00 > 0. Queste due condizioni definiscono le cosiddette trasformazioni di Lorentz proprie. Si dimostra che costituiscono un gruppo, il gruppo di
Lorentz.
Le rotazioni costituiscono un sottogruppo del gruppo di Lorentz: infatti, mantengono
invariato il modulo della parte spaziale e non toccano la parte temporale.
Si può dimostrare anche intuitivamente che una qualunque trasformazione del gruppo
è scrivibile come l’applicazione successiva di un massimo di 6 trasformazioni successive: una rotazione intorno a ciascuno dei dei tre assi, ed una spinta (la spinta è una
Trasformazione di Lorentz che non prevede rotazioni del sistema di riferimento) lungo
ciascuno dei tre assi.
Le matrici che effettuano le trasformazioni sono7:
6Nell’eseguire materialmente i conti, conviene pensare ai vettori controvarianti come vettori colonna,
mentre i vettori covarianti sono vettori riga. Nel passare da un vettore controvariante al corrispondente
covariante, si traspone e si cambia il segno agli indici 1, 2 e 3.
7Consideriamo il primo indice come il numero di riga ed il secondo come numero di colonna.
10
italianISIDORO FERRANTE


x 



y 



z 

1
0
0
0
1
0
0
0
1
0
0
0
rotazioni
0
0
0
1
0
0
0 cos θx sin θx
0 − sin θx cos θx
0
0
0
cos θy 0 sin θy
0
1
0
− sin θy 0 cos θy
0
0
0
cos θz sin θz 0
− sin θz cos θz 0
0
0
1
spinte
γ
−βγ 0 0
  −βγ
γ
0 0
 
  0
0
1 0
0
0 1
  0
γ
0 −βγ 0
  0
1
0
0
 
  −βγ 0
γ
0
0
0
0
1
 
γ
0 0 −βγ
  0
1 0
0
 
  0
0 1
0
−βγ 0 0
γ
 












dove, seguendo la notazione usuale, abbiamo posto per brevità β = vc , γ = √ 1
1−β 2
.
3.2. Scalari, quadrivettori, tensori. Fin qui abbiamo incontrato due tipi di grandezze: quelle che per trasformazioni di Lorentz rimangono invarianti, e li chiameremo
scalari, e i quadrivettori, che invece si trasformano tramite la matrice Λ.
Possiamo generalizzare la nozione di quadrivettore considerando una grandezza munita di N indici, ciascuno dei quali si può alzare od abbassare tramite la matrice g µν ,
che da un sistema all’altro si trasforma tramite moltiplicazione di ciascuno degli indici
per una matrice Λ: si parla allora di tensori di rango N. Gli scalari sono quindi tensori
di rango 0 e i quadrivettori tensori di rango 1. Adoperemo nel seguito quasi esclusivamente tensori di rango 2, che quindi i trasformano sotto T.L. secondo la formula:
T 0µν = Λµ k Λµ λ T κλ .
A partire da due vettori si possono costruire due tensori indipendenti, uno simmetrico
e uno asimmetrico:
S µν = xµ y ν + xν y µ
Aµν = xµ y ν − xν y µ
I tensori antisimmetrici posseggono una strana proprietà molto utile: sotto rotazioni,
gli elementi A0i , con i = 1, 2, 3, si comportano esattamente come un vettore tridimensionale. Non solo, ma gli elementi (A23 , −A13 , A21 ) si comportano analogamente
come un normale vettore tridimensiale sotto rotazioni. La verifica si può effettuare
moltiplicando esplicitamente la generica matrice antisimmetrica per una delle matrici che effettuano rotazioni lungo uno qualunque degli assi. Se però si effettua una
operazione di parità, ovvero si cambia la direzione di tutti e tre gli assi spaziali (trasformazione a determinante -1, e quindi non appartenenente al gruppo di Lorentz), gli
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA
11
elementi A0i cambiano di segno, mentre gli elementi (A23 , −A13 , A21 ) rimangono invariati. Insomma, un tensore antisimmetrico corrisponde, nello spazio tridimensionale,
ad un vettore ed uno pseudovettore, e si può scrivere nella forma:
Aµν


0
Vx
Vy
Vz
 −Vx
0
Pz −Py 

=
 −Vy −Pz
0
Px 
−Vz Py −Px
0
Si può moltipicare un vettore per un tensore contraendo due indici, ovvero facendo
in modo che uno di questi sia covariante ed uno controvariante, ponendoli uguali, e
sommando su di essi:
B µ = T µν Vν = Tν µ V ν
Si possono moltiplicare anche due tensori tra di loro:
K µν = T µλ Sλ ν
Il risultato del prodotto di più tensori eseguito secondo queste regole è un altro tensore,
di rango pari al numero di indici liberi.
La traccia di un tensore di rango 2, ottenuta contraendo i due indici tra di loro, è un
invariante:
T r(T ) = T µµ = T 00 + T 11 + T 22 + T 33 = T 00 − T 11 − T 22 − T 33
Insomma, le regole d’oro per lavorare con i tensori sono: quando si contraggono due
indici, uno deve essere in alto ed uno in basso. Dalla contrazione di due indici, si ottiene un tensore di rango inferiore di due unità. A destra e a sinistra di una uguaglianza,
si devono trovare lo stesso numero di indici, con lo stesso nome e nella stessa posizione. Queste regolette ci permettaranno di procedere alla formalizzazione della teoria ella relatività procedendo pressocché alla velocità della luce (senza mai superarla,
ovviamente).
Possiamo osservare, en passant, come le matrici gµν e Λµ ν siano dei tensori (cosa di
per sé non banale). La dimostrazione è lasciata come esercizio.
3.3. Invarianza sotto trasformazioni di Lorentz. A questo punto possiamo capire
cosa vuol dire che le equazioni della meccanica e dell’elettromagnetismo devono essere invarianti sotto trasformazioni di Lorentz: vuol dire che possiamo scriverle in
forma cosiddetta covariante a vista ovvero del tipo: Aµ = B µ , dove Aµ e B µ sono due
quantità fisiche che si trasformano entrambe come quadrivettori. Ovviamente anche le
forme T µν = S µν od anche Aµ = T µν B ν sono forme covarianti, e quindi possibili leggi
fisiche. La cosa importante è che a destra e a sinistra delle equazioni si abbiano oggetti
che si trasformano allo stesso modo da un sistema di riferimento inerziale all’altro.
Adesso possiamo tornare alla fisica, e classificare le quantità che conosciamo in base
alle proprietà di trasformazione.
12
italianISIDORO FERRANTE
3.4. Coordinate, separazione. Il primo quadrivettore con cui avremo a che fare sarà
il vettore posizione, che individua univocamente un evento dello spazio tempo, dato
un particolare riferimento inerziale. Sarà xµ = (ct, ~x). Dati due eventi vicini a e b, e
indicate con xµa e xµb le coordinate dei due eventi, definiamo come separazione tra gli
eventi la differenza tra le due coordinate ∆xµ = xµb − xµa . Sia inoltre tb > ta in quel
particolare riferimento, ovvero a precede b.
Il modulo quadro (con la metrica relativistica) di questo quadrivettore è l’intervallo tra
i due eventi: ∆s2 = ∆xµ ∆xµ = c2 (tb − ta )2 − (~xb −~xa )2 . Questo intervallo può essere
positivo, negativo o nullo.
Se l’intervallo è positivo, allora si dice di tipo tempo. In questo caso esiste un sistema
di riferimento in cui gli eventi a e b avvengono nello stesso
luogo, ma con un certo
q
intervallo di tempo. In questo caso, la quantità ∆τ = ∆s
rappresenta l’intervallo
c2
temporale tra i due eventi. Si può verificare facilmente che in ogni altro sistema di
riferimento la distanza temporale tra i due eventi risulterà maggiore: la quantità ∆τ
costituisce l’intervallo di tempo proprio tra i due eventi a e b. I due eventi possono (ma non debbono necessariamente) essere collegati da un nesso di tipo causale, e
precisamente a è la causa e b l’effetto.
Se l’intervallo è negativo, è detto di tipo spazio. Esiste un sistema di riferimento in cui
i due eventi avvengono nello stesso istante, ma in luoghi diversi. √
In quel sistema di
riferimento, la componente temporale si annulla. La quantità ∆l = −∆s2 costituisce
la distanza propria tra i due eventi. Stavolta i due eventi NON sono collegati da un
nesso causale.
Infine particolare importanza riveste il caso ∆s2 = 0: in questo caso, esiste un raggio
di luce che partendo dall’evento a raggiunge l’evento b : i due eventi sono separati
da un intervallo di tipo luce. Può esistere anche in questo caso un nesso causale tra
l’evento a e l’evento b.
2
4. C INEMATICA .
Si consideri un punto materiale (o particella) che descrive una certa traiettoria nello
spazio. Siamo abituati a descrivere la traiettoria come una curva nello spazio tridimensionale, data da tre equazioni parametriche ~x(t). La descrizione relativistica del
moto della stessa particella non cambia di molto: stavolta abbiamo un quadrivettore
~
xµ (t) = (ct, x(t)).
Rispetto al caso non relativistico, la traiettoria deve soddisfare in
più alla condizione che la velocità risulti inferiore alla velocità della luce. Ovviamente
i valori delle coordinate cambiano a seconda del sistema di riferimento che abbiamo
scelto per descrivere il moto: supponiamo di averne scelto uno in modo assolutamente
casuale ed arbitrario.
4.1. Tempo proprio. Consideriamo due punti della traiettoria, agli istanti t e t + dt.
La separazione tra questi due eventi è uguale a dxµ = (cdt, ~v dt).L’intervallo è ovviamente di tipo temporale, come del resto si osserva calcolandolo esplicitamente:ds 2 =
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA
13
F IGURA 4.1. Diagramma spazio temporale del paradosso dei gemelli
ct
ct1
1/2
cdτ =(c2 dt2 −dx2 )
<dt
x
q
2
dt (1 −
L’intervallo di tempo proprio è quindi dτ = dt 1 − vc2 = dt
. Ecco
γ
che si scopre un effetto relativistico che già conoscevamo sotto il nome di dilatazione dei tempi: l’intervallo di tempo misurato da un orologio posto a cavallo del punto
materiale che stiamo studiando risulta più breve dello stesso intervallo misurato in un
qualsiasi altro sistema di riferimento. Supponiamo che la particella passi all’istante
t = 0 dall’origine delle coordinate, e che in quel momento l’orologio solidale con essa
segni l’istante τ = 0. Allora il tempo segnato dall’orologio negli istanti successivi
si otterrà integrando l’elemento dτ lungo tutta la traiettoria. Quindi, ad esempio, se
la particella ripassa dall’origine
delle
coordinate
R t1 spaziali all’istante t1 , il suo orologio
R t1
R t1 dτ
segnerà un tempo τ = 0 dτ = 0 dt dt = 0 γdt > t1 . Questo non è altro che il
paradosso dei gemelli esposto in modo formalmente rigoroso.
2
v2
).
c2
4.2. Velocità. La velocità ordinaria di una particella risulta dal rapporto tra la parte
x
spaziale e quella temporale di un quadrivettore:~v = d~
. Quindi le proprietà di trasfordt
mazione da un sistema di riferimento all’altro non sono per niente ovvie: la velocità
non è un quadrivettore. Per questo motivo, le sue proprietà di trasformazione da un
sistema di riferimento all’altro risultano particolari: per ottenerle, basta scrivere le
trasformazioni di Lorentz in forma differenziale:
dx0
cdt0
dy 0
dz 0
=
=
=
=
γ (dx − βcdt)
γ (cdt − βcdx)
dy
dz
dove β = v0 /c è la velocità di S 0 rispetto ad S, e poi dividere membro a membro:
14
italianISIDORO FERRANTE
dx0
dx − βcdt
vx − v 0
=
=
dt0
dt − βdx/c
1 − vxc2v0
dy 0
dy
vy
=
=
=
0
dt
γ (dt − βdx/c)
γ 1 − vxc2v0
vx0 =
(4.1)
vy0
vz0 =
dz
vz
dz 0
=
=
dt0
γdt − βdx/c
γ 1 − vxc2v0
Si lascia come esercizio la dimostrazione che qualunque siano ~v e v 0 , si ha sempre
|~v 0 | < c, e che se |~v | = c allora anche |~v 0 | = c
4.3. Quadrivelocità. Dividendo invece la separazione infinitesima tra due punti della traiettoria di una particella (quadrivettore) per il corrispondente intervallo di temµ
. Il nome
po proprio (invariante) si ottiene ovviamente un quadrivettore: u µ = dx
dτ
che viene dato a questa quantità fisica è quadrivelocità. Le sue componenti sono:
uµ = (γc, γ~v ). Il concetto di quadrivelocità non scalza quello di semplice velocità di
una particella: infatti, la velocità di un punto materiale risulta facilmente accessibile
alla misurazione, in quanto coinvolge il rapporto tra grandezze misurate nello stesso
sistema di riferimento (mentre l’intervallo di tempo proprio è definito nel sistema di
quiete della particella). Si noti inoltre che la quadrivelocità non risulta definita per un
raggio di luce, in quanto l’intervallo di tempo proprio risulta identicamente uguale a
zero.
Moltiplicando la quadrivelocità per se stessa, si trova facilmente: uµ uµ = γ 2 c2 −
γ 2~v 2 = c2 .
Un esercizio interessante consiste nel ricavare la trasformazione della velocità a partire
dalla quadrivelocità : infatti, se in un sistema di riferimento una particella ha velocità
~v , ed in un altro sistema di riferimento, in moto con velocità ~v 0 rispetto a questo,
ha velocità ~v 0 , allora sarà uµ = (cγ, γ~v ) e u0µ = (cγ 0 , γ 0~v 0 ). Ma d’altro canto u ed
u0 devono essere collegati da una T.L. di velocità ~v0 . Sfruttando queste relazioni, è
possibile trovare la relazione esistente tra ~v e ~v 0
4.4. Quadriaccelerazione. La derivata della quadrivelocità rispetto al tempo proprio
µ
si chiama quadriaccelerazione: aµ = udτ . La quadriaccelerazione ha la particolarità di
essere ortogonale (con la metrica di Minkowsky) alla quadrivelocità: infatti u µ aµ =
µ
2
µ
uµ du
= 12 dudτuµ = 12 dc
= 0. La relazione tra l’accelerazione e la parte spaziale della
dτ
dτ
quadriaccelerazione è piuttosto complicata: si lascia per esercizio la dimostrazione che
i due vettori puntano in lgenerale in direzioni diverse.
5. D INAMICA
La dinamica è la parte più delicata della relatività speciale: infatti è quella parte della teoria in cui i principi della dinamica newtoniana vengono messi in discussione e
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA
15
modificati in modo da rimanere consistenti con gli altri postulati della relatività. Ovviamente, in questo come in altri casi, la parola ultima delle modifiche apportate spetta
agli esperimenti, che finora hanno verificato solidamente i risultati ottenuti.
5.1. Massa di quiete. Un primo concetto che vogliamo definire è quello di massa di
quiete di un corpo. Vogliamo che la massa costituisca una proprietà del corpo, che non
dipenda dal sistema di riferimento. Non esistono motivi di principio per cui si debba
effettuare una richiesta del genere: infatti proprietà come il volume, le dimensioni,
anche il colore (vedremo in seguito) possono cambiare da un sistema di riferimento
all’altro, e quindi dipendere dalla velocità del corpo. Del resto, alcuni testi di relatività parlano tranquillamente di massa relativistica di un corpo come dipendente dalla
velocità. Però esistono tutta una serie di ragioni pratiche e teoriche non disprezzabili
che fanno preferire una definizione invariante: ad esempio, le particelle subatomiche
sono caratterizzate da una serie di proprietà che le identificano, ed una di esse è la
massa. Tutti gli elettroni, e i protoni, ad esempio, hanno la stessa massa quando questa viene misurata nel sistema di riferimento in cui essi sono in quiete, e così tutti i
neutroni e tutti i mesoni K, π, e qualunque altro riusciate ad immaginare. Sembra un
delitto mascherare questo fatto della natura utilizzando una definizione di massa che
dipenda dalla velocità. Inoltre, e questo lo vedremo in seguito, la massa a riposo di
una particella fornisce una misura dell’energia interna di legame dei vari costituenti.
La scelta che risulterà alla fine più elegante sarà quella di definire la massa di un corpo
tramite misure effettuate nel suo riferimento di quiete. In questo modo la massa risulta
uno scalare (possiede ovviamente lo stesso valore in ogni sistema di riferimento) , e
può essere misurata tranquillamente adoperando i metodi della meccanica newtoniana,
misurando ad esempio l’accelerazione che il corpo subisce quando viene sottoposto ad
una forza nota, purché le velocità che entrano in gioco nel misuramento risultino molto
piccole.
5.2. Quadriimpulso. Possiamo creare un nuovo tensore moltiplicando la quadrivelocità per la massa a riposo di un corpo:
(5.1)
P µ = muµ = (mcγ, mγ~v )
Concentriamo momentaneamente la nostra attenzione sulla parte spaziale: osserviamo
come a bassa velocità il fattore γ tende ad 1, e quindi la parte spaziale tende alla quantità di moto della particella. Adesso il problema è: la definizione di quantità di moto
newtoniana è corretta, oppure è solamente il limite a bassa velocità della espressione
relativistica8?
Il punto focale è: dato un sistema di due particelle che interagiscono tra di loro, vogliamo che la quantità di moto risulti definita in modo tale che si conservi durante
l’urto. Questa proprietà, dovendo rimanere valida in ogni sistema di riferimento, ci fa
8
In questi appunti, considero sinonimi i termini quantità di moto, impulso e momento della particella
(anche se a stretto rigore il secondo è l’integrale della forza, mentre l’ultimo termine è una cattiva
traduzione dell’inglese momentum) in quanto ormai questo è l’uso corrente.
16
italianISIDORO FERRANTE
F IGURA 5.1. Esempio adoperato per il calcolo della forma relativistica
dell’impulso: supponiamo che le masse siano uguali, e che la componente y dell’impulso totale sia nulla. Allora la massa 1 torna indietro
con la stessa velocità, mentre la massa 2 cambia il segno della componente y. Lo stesso urto, visto nel sistema S 0 che si muove con velocità
v0 , appare praticamente uguale, tranne che per il fatto che le masse 1 e
2 si scambiano il ruolo.
−v
u1
−u1
u2
u2
u1
v
Urto visto in S’
Urto visto in S
immediatamente sospettare che la quantità di moto debba essere la parte spaziale di
un quadrivettore. Per corroborare questa ipotesi, possiamo considerare un urto in due
sistemi di riferimento, scelti in modo che i conti siano particolarmente facili. questo
esempio è adoperato dalla maggior parte dei libri, ma una trattazione più generale si
trova nel libro di Jackson.
Supponiamo allora di trovarci in un sistema di riferimento in cui si ha un urto come in
figura 5.1: le masse siano uguali, e la massa 1 torni indietro dopo l’urto con la stessa
velocità u1 . La massa 2, d’altro canto, prima dell’urto ha una velocità ~v di componenti
vx = v0 , vy = u2 : dopo l’urto, la componente x rimane invariata, mentre quella y
cambia di segno.
Supponiamo di osservare adesso lo stesso urto da un sistema di riferimento S 0 che si
muove con velocità v0 rispetto ad x: stavolta, nel nuovo sistema di riferimento, la
massa 2 avrà una componente x della velocità nulla sia prima che dopo l’urto; al
contrario, la massa 1 avrà sia prima che dopo l’urto una componente x della velocità
pari a vx = −v0 .
In pratica, le due masse si saranno scambiate il ruolo! quindi per simmetria, osservando la figura, possiamo concludere che nel sistema di riferimento S 0 la massa 1 avrà
velocità lungo y pari ad u2 , mentre la massa 1 avrà velocità lungo y uguale a u2 . Ma
le due velocità sono collegate da una trasformazione di Lorentz, ovvero: u 01 = u2 ed
anche u02 = u1 . quindi varrà, applicando le 4.1:
(5.2)
u2 = u01 =
u1
γ
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA
17
Passiamo adesso a considerare la quantità di moto: supponiamo inanzitutto che questa
abbia una forma del tipo: P~ = mg(v)~v dove g(v) è una funzione del modulo della
velocità della particella. In entrambi i sistemi, visto che le masse 1 e 2 tornano indietro con la stessa velocità, la componente y della quantità di moto totale deve essere
nulla: quindi deve risultare mg(u1 )u1 = mg(v)u2 . Applicando la relazione 5.2 si
trova:g(u1) = g(v)/γ. Prendendo il limite per piccole velocità, ed osservando che
perché risulti valido il limite newtoniano deve essere g(0) = 1, si trova: g(v) = γ.
5.3. L’energia. Adesso che abbiamo giustificato l’ipotesi che la parte spaziale del
quadriimpulso corrisponda alla quantità di moto, occupiamoci della componente temporale.
Una prima osservazione che possiamo fare è la seguente: noi vogliamo che la quantità
di moto totale si conservi in un urto indipendentemente dal sistema di riferimento dal
quale compiamo la misura. Ma una trasformazione di Lorentz da un sistema di riferimento all’altro comporta mescolamenti tra la parte spaziale e quella temporale: quindi,
se vogliamo che la conservazione sia indipendente dal sitema scelto, allora dobbiamo
concludere che anche la parte temporale rappresenta una quantità conservata.
Per capire di cosa si tratta, facciamo il limite per piccole velocità:
1
1 v2
1 2
2
0
P = mcγ w mc 1 + 2 =
mc + mv
2c
c
2
Come si vede, a parte il termine mc2 , non è altro che l’energia cinetica della particella
divisa per la velocità della luce. Ma cosa significa il termine mc2 ? La tentazione è
quella di attribuirgli il significato di energia posseduta dalla particella in assenza di
velocità. Si tratterebbe quindi di un termine che tiene conto di tutta l’energia interna
della particella. Ma è giustificata una ipotesi di questo tipo? Evidentemente si tratta
di una congettura molto forte, in quanto non esiste assolutamente niente del genere in
meccanica newtoniana!
Ci viene incontro in questa supposizione un argomento molto semplice: immaginiamo
di avere un sistema composto da due masse uguali M tenute ad una distanza L da un
sistema di asticciole rigido (vedi figura 5.2). Da una di queste masse parte una certa
quantità di energia sotto forma di onda elettromagnetica che viene assorbita dall’altra.
Sappiamo che la relazione tra l’energia e l’impulso della radiazione elettromagnetica
è E = cP : quindi, in seguito all’emissione, le due masse rinculano e si muovono in
direzione opposta alla radiazione con velocità v = P/2M . Quando la radiazione viene
assorbita dall’altra massa, dopo un tempo circa L/c, il sistema si trova nuovamente
a riposo: nel frattempo però si è spostato in direzione della massa che ha emesso
l’energia di una quantità ∆x = vL/c = EL/(2M c2 ). D’altro canto, però, per la
conservazione della quantità di moto, la posizione del centro di massa deve essere
rimasta invariata! L’unica possibilità a questo punto è che una piccola quantità di
massa ∆M si sia spostata dal’emettitore all’assorbitore, in maniera che il baricentro
non si trovi più al centro delle due masse, ma si sia spostato verso la massa più pesante
18
italianISIDORO FERRANTE
F IGURA 5.2. Schema dell’esperimento mentale in grado digiustificare l’equivalenza tra massa ed energia: due masse uguali sono connesse
rigidamente a distanza L. Il centro di massa si trova al centro. Dalla
massa di sinistra un fotone di energia E viene emesso verso destra: le
due masse rinculano con velocità v = P/2M . Quando il fotone viene assorbito, dopo un tempot = L/c, il sistema torna in quiete, ma si
è spostato di una quantità ∆x = vt = P L/(2M c). Essendo però il
sistema isolato, il centro di massa deve essere rimasto in quiete: pertanto, si deve supporre che la massa di sinistra abbia perduto una quantità
di massa ∆M e che una uguale quantità sia stata acquisita dall’altra
massa. Imponendo che lo spostamento del centro di massa sia uguale
ed opposto allo spostamento del sistema formato dalle due masse, si
ottiene:∆M = E/c2 .
M
v=P/2M
M−∆ M
M
L
E=cP
∆x
M+ ∆ M
di una quantità ∆x. Insomma, bisogna avere:∆x = ∆M L/2M = EL/(2M c 2 ) ovvero
∆M = E/c2 . Quindi si trova che appunto la variazione di massa dell’emettitore è
uguale all’energia della radiazione emessa diviso la velocità della luce al quadrato!
Ovviamente questo ragionamento è solamente approssimativo, in quanto mescola concetti provenienti dall’elettrodinamica e dalla meccanica newtoniana per giungere ad un
risultato relativistico: un conteggio più accurato porta tuttavia allo stesso risultato.
Siamo quindi autorizzati ad ipotizzare che l’energia di una particella relativistica sia
2
data dalla formula E = √ mc 2 2 . Le conferme sperimentali di questo risultato sono
1−v /c
ormai così tante che non avrebbe senso elencarle tutte: questa formula è adoperata
ormai correntemente in tutti quei calcoli che coinvolgono le particelle all’interno degli
acceleratori che si muovono a velocità molto vicine a quella della luce, e non si sono
mai osservate deviazioni significative.
~ ).
Quindi il quadriimpulso assume definitivamente la forma: P µ = (E/c, P
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA
19
Prendendone il quadrato, si ottiene: m2 c2 = E 2 /c2 − P~ 2 od anche E 2 = m2 c4 + c2 P~ 2 .
Nel caso di corpi di massa 0, allora E = c|P~ |.
Inoltre, dal semplice esame delle formule 5.1 che danno energia ed impulso in termini
della velocità, si ricava:
P~ = ~v E/c2
Nel caso m = 0 si trova |~v | = c: le particelle prive di massa possono muoversi
solamente alla velocità della luce!
5.3.1. Urti. Definiamo dapprima il concetto di urto in modo preciso: in un processo
di urto si hanno due corpi non interagenti, ciascuno in moto rettilineo uniforme. I due
corpi vengono portati ad interagire brevemente in una regione limitata di spazio e per
un intervallo di tempo finito, dopo di ché l’interazione cessa e i corpi ricominciano a
viaggiare con velocità costante.
Come abbiamo visto, nell’urto tra due particelle si conserva il quadriimpulso totale:
questo significa che nel trattamento relativistico degli urti l’energia totale si conserva
sempre. La cosa non è in contrasto con l’esperienza quotidiana: infatti, in un urto anelastico, l’energia cinetica dei due corpi coinvolti nella collisione si converte in energia
interna, di legame o di agitazione termica. Questa energia rientra nel calcolo della
massa dei corpi: pertanto, in un urto anelastico relativistico, esiste la possibilità che le
masse delle particelle dopo l’urto (dette anche prodotti di reazione) risultino differenti
da quelle che si avevano prima dell’urto! Nel caso di corpi macroscopici, solitamente
le energie cinetiche in gioco sono cosi’ piccole rispetto alla massa a riposo che una
conversione di energia in massa corrisponde ad un trascurabile aumento della massa,
che passa inosservato, a fronte di una grande perdita di energia cinetica, facilmente
osservabile.
Per una trattazione relativistica completa degli urti dobbiamo allora considerare la
possibilità che le masse cambino.
Avremo quindi 2 particelle, a e b, con masse ma ed mb , prima dell’urto, e quadrimomenti Paµ e Pbµ , prima dell’urto, ed altre due particelle c e d dopo l’urto, con quadrimomenti Pcµ e Pdµ . Se sia la particella a a trasformarsi nella c, o se sia la particella b, è
una questione inessenziale, e sostanzialmente indecidibile, soprattutto se consideriamo
particelle microscopiche. La conservazione del quadriimpulso si scrive nella forma:
Paµ + Pbµ = Pcµ + Pdµ
e contiene sia la conservazione dell’impulso che quella dell’energia.
Una quantità molto utile è il modulo quadro dell’impulso totale, moltiplicato per la
velocità della luce al quadrato:
2
s = c2 (Pa + Pb )µ (Pa + Pb )µ = (Ea + Eb )2 − c2 P~a + P~b
Il significato di questa quantità diventa chiaro calcolandola nel sistema del centro dei
momenti, impropriamente detto spesso anche sistema del centro di massa: infatti si
20
italianISIDORO FERRANTE
F IGURA 5.3. Scattering Compton: un fotone urta contro un elettrone
in quiete; a seguito dell’urto, l’elettrone rincula e il fotone cambia la
sua energia ed il suo impulso.
/home/ferrante/tex/relativita/compton.eps not f
tratta di un invariante, e possiamo calcolarlo dove i conti sono più semplici. Nel sistema del centro di massa, appunto, la somma dei momenti delle particelle è nulla.
Pertanto, la quantità s si riduce al quadrato della somma delle energie delle due particelle nel centro di massa, ovvero più semplicemente il quadrato dell’energia nel centro
di massa. Se si ricorda che l’energia di una particella è sempre maggiore alla sua massa
per c2 , si ottiene che per ottenere due particelle di un tipo dato, condizione necessaria
(ma non sufficente) è che l’energia del centro di massa debba essere maggiore della
somma delle masse dei prodotti finali, moltiplicata per c2 .
Example 5.1. Scattering Compton.
Uno degli esempi più interessanti è l’effetto Compton, che consiste nell’urto di un
fotone con un elettrone in quiete (vedere figura 5.3). Si tratta in questo caso di un
urto elastico, in quanto le masse dei prodotti finali sono uguali a quelle dei prodotti
~ mentre P µ = hν 0 /c(1, k̂),
iniziali. In questo caso, Paµ = hν/c(1, k̂); Pbµ = (me c, 0),
c
µ
Pd = (me γc, me γ~v ).
Le incognite sono sei (le tre componenti dell’impulso per ognuna delle particelle),
mentre le equazioni sono 4. Una incognita è però eliminabile facilmente osservando
che l’impulso iniziale e i due finali giacciono sullo stesso piano: quindi un angolo
di rotazione intorno alla direzione dell’impulso iniziale è arbitrario, e non cambia le
energie delle particelle finali. Dopo essersi ridotti ad un piano, rimangono 4 equazioni
e tre incognite. Una ulteriore quantità rimane indeterminata: assumiamo che sia l’angolo formato tra la direzione del fotone entrante e quella del fotone uscente, ovvero
l’angolo di scattering del fotone.
Allora scriviamo la conservazione del quadriimpulso nella forma:
Pdµ = Paµ + Pbµ − Pcµ
e calcoliamo il prodotto scalare di questa espressione per sè stessa. Ricordiamo che
in base alla definizione Pdµ Pdµ = Pbµ Pbµ = m2e c2 ed inoltre Pcµ Pcµ = Paµ Paµ = 0;
rimangono i doppi prodotti Paµ Pbµ = hνme , Pcµ Pbµ = hν 0 me ed infine Paµ Pcµ =
h2 νν 0
(1 − cos θ). Mettendo assieme tutti i pezzi, si ha:
c2
c
c
h
0
−
=
λ
−
λ
=
(1 − cos θ)
ν0 ν
me c
Example 5.2. Energia di soglia
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA
21
Un altro esempio interessante riguarda il concetto di energia di soglia. Si supponga di voler inviare un positrone (Particella avente la stessa massa dell’elettrone, ma
di carica positiva: è l’antiparticella dell’elettrone) contro un elettrone, in modo che
nella reazione finale si ottengano un protone ed un antiprotone (protone con carica negativa). L’ elettrone, inoltre, sia in quiete e il positrone venga sparato addos~i ed energia Ei . L’energia del centro di massa è allora:
so con impulsoq
indidente P
√
√
Ecm = s = (Ei + me c2 ) − P~ 2 = 2Ei me c2 . Perché si possano produrre due
i
m2
protoni, deve risultare Ecm > 2mp c , ovvero 2E i me c2 > 4m2p c4 , ed infine E i > 2 mpe c2 .
2
La massa dell’elettrone è di 9.1 × 10−31 Kg, corrispondente ad una energia a riposo di
circa 8 × 10−14 Joule. La massa del protone è circa 1.7 × 10−27 Kg, pari a circa 1.5 ×
10−10 Joule. Inserendo i numeri, si trova allora che il positrone deve avere un’energia
di 5.5 × 10−7 , ovvero 6.7 milioni di volte maggiore della sua massa a riposo 9.
Se invece elettrone e positrone vengono fatti collidere sparandoli uno contro l’altro con
la stessa velocità ed energia Ei , allora l’energia nel centro di massa è semplicemente
2Ei , e quindi basterà che sia Ei > mp c2 , ovvero l’energia incidente deve essere semplicemente maggiore dell’energia a riposo del protone, pari a circa 1800 volte l’energia a
risposo dell’elettrone, decisamente minore di quella calcolata nel caso precedente. E’
proprio su questo principio che si basa il funzionamento dei collisionatori, od anche,
usando il termine inglese, colliders, in cui le particelle vengono scagliate l’una contro
l’altra con uguale velocità.
5.4. Forze. Il concetto di forza in relatività risulta problematico.
Innanzitutto, si perde il concetto di azione a distanza: se ad esempio considero l’interazione tra due elettroni in moto, allora l’informazione sulla posizione di uno dei
due elettroni giunge all’altro con un ritardo che dipende dalla distanza. Nel frattempo,
il primo elettrone si è spostato e quindi la forza non potrà in principio essere diretta
lungo la congiungente, se non in casi speciali. Viene a mancare così il principio di
azione e reazione, fondamentale nella meccanica newtoniana. In fisica relativistica le
interazioni avvengono non tra corpi, bensì tra i corpi ed il campo (elettrico, magnetico,
gravitazionale, o di altra natura) nelle immediate vicinanze di ogni corpo.
Rimane valido però il principio della conservazione della quantità di moto, a patto di
tenere conto della quantità di moto associata al campo che trasporta l’interazione.
Quale sarà la forma assunta dall’equazione F~ = m~a ? Una ipotesi potrebbe essere
qualcosa del tipo: maµ = F µ , dove F µ è un quadrivettore la cui parte spaziale si riduce alla forza newtoniana nel limite di piccole velocità. Ma questo non ci dice molto:
infatti le forme γ F~ , F~ , F~ /γ si riducono tutte alla forma newtoniana per basse velocità,
e niente ci impedisce di pensarne mille altre. Si rende necessario dare parola all’esperimento: ad esempio, considerando la deflessione di un elettrone a velocità prossima
9
Per confronto, un insetto di massa intorno ad 1 mg, che vola ad una velocità di circa 50 cm/s ha una
energia cinetica di circa 10−4 Joule. La sua energia a riposo, per contro, è di circa 1014 Joule.
22
italianISIDORO FERRANTE
a c in conseguenza di un campo elettrico perpendicolare alla direzione del suo moto;
oppure la relazione tra il raggio e la velocità in una particella che descrive una circonferenza sotto l’azione del campo magnetico. Questi esperimenti danno come risultato
che la parte spaziale del quadrivettore F µ deve essere uguale a γ F~ : con questa scelta,
~
~
si ha tra l’altro che la parte spaziale dell’equazione diventa: ddτP = γ ddtP = γ F~ , per cui
~
si recupera la forma newtoniana ddtP = F~ , dove stavolta P~ è però la versione relativistica della quantità di moto. A dare maggior forma a questa ipotesi, scopriremo più in
là che le equazioni dell’elettrodinamica forniscono esattamente la stessa formula.
Rimane da scoprire cosa sia la componente temporale della quadriforza: per questo, osserviamo che, come abbiamo visto in precedenza, quadriaccelerazione e quadrivelocità sono ortogonali, e quindi lo sono anche quadriimpulso e quadrivelocità:
F µ uµ = 0. Da questa relazione si ottiene: F 0 γc = γ 2 F~ · ~v ovvero:
F0 =
γ dE
γ~
F · ~v =
c
c dt
Quindi la componente temporale della quadriforza è uguale a γ/c volte la derivata
dell’energia della particella, ovvero la potenza sviluppata dalla forza.
Questo risultato rafforza l’identificazione dell’energia cinetica della particella con la
componente temporale del quadriimpulso, e nel contempo l’identificazione della componente spaziale della quadriforza con γ volte la forza newtoniana.
In alcuni testi a questo punto si cerca di ricavare la legge di trasformazione della forza
da un sistema di riferimento all’altro: si tratta di equazioni complicate che non aggiungono niente al contenuto fisico delle equazioni che abbiamo visto. Nel caso in
cui saremo costretti a trasformare una forza da un sistema di riferimento all’altro, ci
basterà sapere che la quadriforza si trasforma come un quadrivettore. E’ il caso di
notare, però, che nel passaggio da un sistema di riferimento all’altro la direzione della
forza cambia, mentre le trasformazioni di Galileo lasciano invariati sia modulo che
direzione!
5.5. La massa relativistica. Alcuni autori introducono il concetto di massa relativistica, o semplicemente massa, di una particella, dicendo che la massa varia con la
velocità secondo la formula: m = √ m02 2 , dove m0 è la massa a riposo, in modo da
1−v /c
scrivere l’energia nella forma E = mc2 . Il guadagno che si ottiene con questa scelta
è quello di poter conservare l’espressione P~ = m~v per la quantità di moto, e quella
di poter considerare la massa una grandezza additiva. A parte questo, la massa relativistica è quasi sempre fonte di grandi confusioni ed è preferibile a giudizio di chi
scrive evitarne l’uso. Rimane da notare che tuttavia molti testi, anche estremamente
qualificati, continuano ad adoperarla.
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA
23
6. C AMPI
Un campo tensoriale, del tipo di quelli che interessano noi fisici, è una applicazione
che associa ad ogni evento nello spazio-tempo una quantità di tipo tensoriale.
Il più semplice di tutti è il campo scalare. Nel caso del campo scalare, ad ogni punto
dello spazio quadridimensionale va assegnata una quantità che non cambia sotto trasformazione di Lorentz. Specifichiamo meglio cosa si intende. Sia Φ(x µ ) un campo
scalare. Allora, sotto una trasformazione che porta il quadrivettore x µ nel quadrivettore x0µ , in generale la forma della funzione Φ cambia, diventando Φ 0 , ma in modo tale
che il valore assunto nel punto di coordinate x0µ sia uguale a quello assunto da Φnel
corrispondente punto xµ .
Ovvero:
Φ0 (x0µ ) = Φ(xµ )
In modo analogo è possibile definire un campo quadrivettoriale: stavolta, sotto l’effetto
di una trasformazione di Lorentz, le componenti del quadrivettore cambiano. Ovvero:
V 0µ (x0 ) = Λµ ν V ν (x)
E lo stesso può avvenire con un tensore di grado generico.
Nel seguito, terremo sottintesi gli argomenti delle varie funzioni, sottindendendo che i
campi siano calcolati in un punto dello spazio tempo, le cui coordinate vanno calcolate
nello stesso sistema di riferimento in cui si calcolano le componenti dei tensori.
6.1. Operatori differenziali.
6.1.1. Gradiente. Consideriamo un campo Φ, e calcoliamone il differenziale, ovvero
la variazione lineare per un piccolo spostamento ∆xµ . Si ha:
∆Φ =
∂Φ
∂Φ
∂Φ
∂Φ
∆x0 + 1 ∆x1 + 2 ∆x2 + 3 ∆x3
0
∂x
∂x
∂x
∂x
Ora, sappiamo che ∆Φ è invariante per T.L.; sappiamo anche che ∆x µ è un quadrivettore controvariante. Ma allora le componenti del gradiente di Φ devono costituire un
vettore controvariante!
Possiamo attribuire questa proprietà all’operatore gradiente, definito come:
−
∂
∂
∂
∂
1∂ →
∂µ =
,∇
,
,
,
=
∂x0 ∂x1 ∂x2 ∂x3
c ∂t
.
µν
µ
Moltiplicando
semplicemente per g possiamo trovare l’operatore covariante: ∂ =
→
−
1 ∂
, −∇
c ∂t
24
italianISIDORO FERRANTE
6.1.2. Dalembertiano. Moltiplicando i due operatori covariante e controvariante otteniamo un operatore scalare che ha una sua particolare importanza: si tratta del
cosiddetto Dalembertiano, che ha un suo simbolo particolare: .
1 ∂2
~2
−∇
c2 ∂t2
si riconosce immediatamente in questo operatore quello che compare nelle equazioni
d’onda......
= ∂ µ ∂µ =
6.1.3. Divergenza. La divergenza di un campo quadrivettoriale è definita come:
1 ∂V 0 ~ ~
+ ∇V
c ∂t
Ovviamente si tratta di un invariante. Se la divergenza è zero in un sistema di riferimento, allora lo è dappertutto.
(6.1)
∂µ V µ =
7. L’ ELETTRODINAMICA
E LE EQUAZIONI DI
M AXWELL
7.1. Richiami di elettrodinamica. Siamo pronti a questo punto a scrivere la teoria
relativistica dell’elettrodinamica.
Scopriremo che le equazioni sono già covarianti per trasformazioni di Lorentz, e che
quindi la teoria di Maxwell non richiede alcuna modifica, ma solamente una re-interpretazione
di alcuni risultati.
Partiamo dal ricordare le equazioni di Maxwell. Adoperemo come unità di misura
il sistema gaussiano, una variante del CGS, che permette di scrivere rapidamente le
equazioni senza le complicazioni derivanti dalle costanti 0 e µ0 .
Ricordiamo rapidamente alcune caratteristiche del cgs:
1
(1) La costante 0 vale 4π
. In conseguenza, non esiste una unità di misura propria
della carica, che risulta una grandezza derivata.
. Di conseguenza, i campi elettrici e magnetici hanno le
(2) La costante µ0 vale 4π
c
stesse dimensioni, e si misurano con le stesse unità.
In queste unità di misura, le equazioni di Maxwell diventano:
~ ·E
~
∇
~ ·B
~
∇
~ ×E
~
∇
~ ×B
~
∇
= 4πρ
= 0
~
= − 1c ddtB
= 4π
J~ +
c
~
1 dE
c dt
A cui vanno aggiunte l’equazione di continuità e l’espressione della forza agente su di
una carica:
∂ρ ~ ~
+∇·J =0
∂t
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA
~
~ + ~v × B
F~ = q E
c
25
I campi possono essere derivati da un potenziale scalare ed uno vettoriale in base alle
equazioni:
~
~ = −∇φ
~ − 1 ∂A
E
c ∂t
~ = ∇
~ ×A
~
B
I campi scalari e vettoriali non sono definiti completamente da queste relazioni: per
rimuovere l’indeterminatezza si adopera una ulteriore relazione, detta condizione di
gauge. Nella relatività si preferisce adoperare la cosiddetta gauge di Lorentz, che
corrisponde all’equazione:
1 ∂φ ~ ~
+∇·A=0
c ∂t
In questa gauge, le relazioni che legano i potenziali alle sorgenti sono del tipo:
1 ∂2φ ~ 2
− ∇ φ = 4πρ
c2 ∂t2
~
1 ∂2A
~ 2A
~ = 4π J~
−
∇
c2 ∂t2
c
Scrivere queste equazioni in forma covariante a vista sarà poco più che un gioco da
ragazzi.....
7.2. La carica. Partiamo come al solito, da un dato sperimentale: la carica è un invariante. Non esiste un vero esperimento effettuato allo scopo di verificare questa
congettura, ma sostenere il contrario porterebbe a conseguenze facilmente osservabili:
ad esempio, sappiamo che la carica è quantizzata, cosa difficilmente compatibile con
una sua dipendenza dalla velocità, e sappiamo anche che le cariche dell’elettrone e
del protone sono uguali entro una parte su 10−19 . Ma il protone è circa 2000 volte
più pesante dell’elettrone, e conseguentemente più lento: una dipendenza della carica
dalla velocità porterebbe ad uno squilibrio nell’accurata cancellazione tra le cariche
che si osserva quotidianamente. Possiamo quindi assumere tranquillamente che la carica dellélettrone rimanga la stessa quando misurata in sistemi di riferimento inerziali
diversi.
26
italianISIDORO FERRANTE
7.3. Le densità di carica e di corrente. Se la carica si conserva in un sistema di
riferimento, allora si conserva in tutti i sistemi di riferimento: ovvero, l’equazione di
continuità mantiene la sua forma in tutti i sistemi di riferimento.
Se la osserviamo bene, e la confrontiamo con la 6.1 vediamo subito che l’equazione
di continuità non è altro che la divergenza di un campo quadrivettoriale avente come
parte temporale la densità di carica moltiplicata per la veclocità della luce, e come
~
parte spaziale la densità di carica: J µ = (cρ, J)
Questa semplice osservazione ci dice già molto: ci dice, infatti, come si modifica la
densità di carica nel passare da un sistema di riferimento ad un altro: basta applicare
le trasformazioni di Lorentz!
ρ
0
Jx0
Jy0
v = γ ρ − 2 Jx
c
= γ (Jx − vρ)
= Jy
Jz0 = Jz
Facciamo qualche esempio. Supponiamo dapprima di avere, in un sistema di riferimento, una certa densità di carica in quiete ρ0 , e di non avere alcuna corrente elettrica
di nessun tipo.
Allora, in un sistema di riferimento che si muove con velocità vx rispetto a questo, la
densità di carica risulterà aumentata per un fattore γ. La cosa si comprende immediatamente se si pensa ad un parallelepipedo di volume V0 nel sistema originale: all’interno,
si troverà la carica Q = ρV0 .
Nel sistema di riferimento in cui la carica è in moto, il volume in esame si restringerà
di un fattore γ(per la contrazione delle lunghezze): V = V0 /γ. Ma per l’invarianza
della carica, conterrà la stessa carica Q! La densità di carica sarà allora ρ 0 = VQ =
γ VQ0 = γρ. La presenza della densità di corrente nel nuovo sistema di riferimento si
spiega facilmente osservando che in questo la carica si muove con velocità v lungo
l’asse x.
Più difficile risulta comprendere il caso seguente: supponiamo che esista in un sistema
di riferimento una certa densità di corrente J~0 , che per comodità possiamo considerare
diretta lungo l’asse x, e confinata ad esempio all’interno di un filo. Supponiamo che
nello stesso sistema di riferimento non si misurino cariche elettriche libere.
Cambiamo sistema di riferimento passando ad un altro in moto con velocità v parallela
~ nel nuovo sistema di riferimento la densità di corrente vale J 0 = γJ0 , ed inoltre
a J:
appare una densità di carica ρ0 = − cv2 J0 . L’apparizione di una densità di carica elettrica
cambiando sistema di riferimento è abbastanza strana e difficile da spiegare. Proviamo
a darne una spiegazione intuitiva: ipotizziamo, in modo del tutto arbitrario, che la
densità di corrente sia dovuta ad una carica positiva ρ0 che si sposta verso destra con
velocità v, ed una carica negativa che rimane ferma, di valore −ρ 0 . Si osservi che sia
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA
27
F IGURA 7.1. Schema per mostrare la trasformazione delle correnti: lo
stesso filo, visto da due sistemi di riferimento diversi. Nel primo caso,
le cariche positive si muovono e quelle negativa rimangono in quiete;
nel secondo avviene l’opposto. Tuttavia, nel primo caso le cariche si
bilanciano perfettamente, mentre nel secondo no.
/home/ferrante/tex/relativita/correnti.eps not fo
ρ0 che v sono arbitrari; l’unico vincolo è che J0 = ρ0 v. Supponiamo di osservare
questo sistema da un sistema di riferimento in moto con velocità v diretta verso destra.
In questo sistema di riferimento, la densità di carica positiva apparirà ferma, e quindi
1/γ volte più piccola di quanto appariva nel primo sistema di riferimento; in contrasto,
la densità di carica negativa adesso appare in moto verso sinistra con velocità v , e
quindi maggiore di un fattore γ.
Quindi la densità di carica totale sarà: ρ0 = ρ0 /γ − γρ0 = γρ0 1−γ
= −γv 2 ρ0 =
γ2
−γvJ0 mentre la densità di corrente sarà dovuta alla carica negativa che si sposta
verso sinistra, e quindi J 0 = γρ0 v = γJ0 .
2
Si ritrovano quindi le espressioni ottenute direttamente tramite trasformazione di Lorentz.
7.4. I potenziali. Passiamo ad osservare adesso le equazioni dei potenziali.
Stavolta è immediato osservare come queste equazioni risultano covarianti, una volta
che si è assunto che il quadrivettore formato da una componente temporale pari a φ ed
~ Aµ = (φ, A).
~
una spaziale uguale ad A:
Abbiamo fatto già un bel po’ di passi avanti: sappiamo adesso che se in un sistema
di riferimento conosciamo i potenziali, automaticamente sappiamo calcolarli in ogni
sistema di riferimento.
7.5. I campi elettrici e magnetici e il tensore elettromagnetico. Passiamo adesso
ad esaminare le equazioni che dai potenziali portano ai campi.
Esaminiamole in dettaglio, ad esempio quella che consente di trovare la componente z
del campo magnetico e la componente xdel campo elettrico:
y
x
− ∂A
Bz = ∂A
∂x
∂y
x
− 1c ∂A
Ex = − ∂φ
∂x
∂t
Possiamo notare come la parte destra delle equazioni è della forma ∂ µ Aν − ∂ ν Aµ :
come si vede, si tratta di un tensore antisimmetrico!
28
italianISIDORO FERRANTE
Si trova allora che le componenti del campo elettrico e magnetico altro non sono che
le componenti di un tensore antisimmetrico di rango 2... una conclusione per lo meno
inaspettata!
Il tensore antisimmetrico che prende il posto dei campi elettrici e magnetico assume la
forma seguente:
F µν

0 −Ex −Ey −Ez
 Ex
0
−Bz By 

= ∂ µ Aν − ∂ ν Aµ = 
 Ey Bz
0
−Bx 
Ez −By Bx
0

a questo punto, come ulteriore regalo, siamo in grado di conoscere le leggi di trasformazione dei campi elettrici! Infatti, basta moltiplicare per due matrici Λ!
F 0µν = Λλµ Λκν F λκ
Questa espressione è molto carina e molto compatta, però non soddisfa del tutto i
fisici, soprattutto quelli sperimentali, che preferiscono avere visione diretta dei campi
elettrici e magnetici. Esplicitando rispetto ai campi, si ottiene allora che in un sistema
di riferimento che viaggia lungo l’asse x con velocità ~v i campi elettrici e magnetici
assumono la forma:
(7.1)
Ey0
Ez0
Ex0 = Ex
Bx0 = Bx
0
= γ (Ey − βBz ) By = γ (By + βEz )
= γ (Ez + βBy ) Bz0 = γ (Bz − βEy )
Quindi si ha che la componente dei campi parallela alla direzione di moto non viene
alterata, mentre le componenti trasverse subiscono dei mescolamenti. In particolare, se
in un sistema di riferimento inerziale si ha esclusivamente un campo elettrico statico,
in qualunque altro sistema di riferimento si ha anche un campo magnetico.
Ricordiamo, en passant, come i campi vadano calcolati nello stesso punto dello spazio
tempo: e quindi, se nel sistema di riferimento originario, si adoperano le coordinate
xµ , allora nel nuovo sistema di riferimento sarà il caso di passare alle nuove coordinate
tramite la trasformazione x0µ = Λν µ .
Notiamo come a partire dal tensore elettromagnetico siamo in grado di calcolare ben
~2 − B
~ 2 ed
due quantità invarianti: si dimostra facilmente infatti come le quantità E
~ ·B
~ rimangono inalterate dopo avere applicato le 7.1. Si verifica anche come la priE
ma espressione corrisponda alla quantità esplicitamente invariante F µν Fµν , mentre la
seconda a αβγδ Fαβ Fγδ , dove αβγδ è un tensore che cambia di segno per ogni scambio
di indici, e la cui componente 1234 vale 1.
~ ·B
~ ci dice ad esempio che se in un sistema di riferimento i campi
L’invarianza di E
elettrici e magnetici sono ortogonali dappertutto, allora lo stesso succede in qualsiasi
altro sistema di riferimento.
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA
29
Inoltre, se in un sistema di riferimento il campo elettrico o magnetico sono nulli, allora
in ogni altro sistema di riferimento i due campi sono ortogonali tra di loro.
~2 − B
~ 2 ci dice che se in un sistema di riferimento in un determinato
L’invarianza di E
punto ed istante, il campo elettrico risulta maggiore di quello magnetico, allora esiste
un sistema di riferimento in cui si riesce ad annullare il campo magnetico.
Inoltre, se i moduli dei campi elettrici e magnetici sono uguali tra di loro, allora lo
stesso succederà in ogni sistema di riferimento.
Example 7.1. Condensatore in moto
Come esempio delle trasformazioni dei campi, consideriamo il caso di due piani parallei carichi uniformemente con densità ±σ (praticamente, un condensatore). Sappiamo che tra i due piani il campo elettrico è perpendicolare alle due superfici, e vale
E = 4πσ.
Supponiamo adesso che il condensatore si muova con velocità v ortogonale ai due
piani, e quindi parallela al campo elettrico. Come si sa, la contrazione di Lorentz non
agisce sulle distanze perpendicolari alla direzione del moto: pertanto, il condensatore
apparirà leggermente schiacciato, ma non vi saranno cambiamenti nella ditribuzione
di carica. Il campo allora apparirà invariato: è esattamente quello che ci aspettiamo
dalle leggi di trasformazioni dei campi.
Supponiamo adesso che il condensatore si muova con velocità parallela ai piani e perpendicolare al campo elettrico: stavolta, le lastre appariranno contratte in direzione
parallela al moto, e quindi la densità di carica apparirà maggiore di un fattore γ: corrispondentemente, l’intensità del campo elettrico apparirà aumentata di un fattore γ,
nuovamente in accordo con le leggi di trasformazione.
Inoltre, le due densità di carica con il loro moto produrranno una densità di corrente
superficiale J~s = γσ~v . Sappiamo che una distribuzione di corrente di questo tipo produce un campo magnetico parallelo alle due superfici, ed ortogonale a J~s , di intensità
B = 4π
J = 4π
γσv = γ vc E: nuovamente, si trova un risultato in accordo con le leggi
c s
c
di trasformazioni dei campi
Carica puntiforme in moto con velocità costante ~v
Vogliamo calcolare il campo elettrico prodotto da una carica in moto rettilineo uniforme con velocità ~v diretta lungo l’asse x. Supponiamo, per semplicità, che la carica
passi per l’origine delle coordinate all’istante t = 0, e calcoliamo il campo proprio
in quell’istante, in cui si ha anche t0 = 0. Allora, la relazione tra le coordinate ~x nel
sistema del laboratorio e le coordinate ~x0 nel sistema in cui si muove sono date da:
x0 = γx, y = y, z 0 = z.p
Nel sistema di riferimento in cui la carica è in quiete, si ha
ˆ
r0
1
0
0
~
E = 4πc q r02 , dove r = x02 + y 02 + z 02 .
30
italianISIDORO FERRANTE
~ ottenibile tramite le leggi di
Nel sistema del laboratorio, invece, si ha un campo E
trasformazione 7.1:
x0
γx
Ex = Ex0 = q
=q
3/2
02
02
02
2
2
(x + y + z )
(γ x + y 2 + z 2 )3/2
γy
y0
=q
Ey = γEy0 = γq
3/2
(x02 + y 02 + z 02 )
(γ 2 x2 + y 2 + z 2 )3/2
γz
z0
=q
Ez = γEz0 = γq
3/2
(x02 + y 02 + z 02 )
(γ 2 x2 + y 2 + z 2 )3/2
Un esame approfondito di queste espressioni mostra che il campo rimane radiale, ma
rispetto a quello della carica ferma nell’origine delle coordinate diminuisce di un fattore 1/γ 2 sull’asse delle x, mentre aumenta di un fattore γ sul piano yz: quindi, contrariamente a quanto sembra derivare dalle equazioni di trasformazione, la componente
parallela alla velocità non rimane invariata, perché le distanze vengono contratte di un
fattore γ.
Infine si calcola il campo magnetico, ottenendo:
~
~ = ~v × E
B
c
Il campo magnietico risulta quindi ortogonale sia al campo elettrico che alla velocità;
le linee di forza sono anelli concentrici all’asse x
7.6. Equazioni di Maxwell. Scrivere le equazioni di Maxwell in forma covariante è
un semplicissimo esercizio di trascrizione.
~ ·E
~ = 4πρ.
Partiamo dalle equazioni contenenti i termini di sorgenti. Ad esempio, ∇
Utilizzando i simboli definiti in precedenza, questa diventa:∂1F 01 + ∂2 F 02 + ∂3 F 03 =
4π 0
J
c
~ ×B
~ = 4π J~ + 1 ∂ E~ diventa
La componente x dell’equazione contenente la corrente ∇
c
c ∂t
1
10
invece: ∂2 F 12 + ∂3 F 13 = 4π
J
−
∂
F
.
Si
verifica
immediatamente
che
è possibile
0
c
scrivere queste due e le altre equazioni nella forma:
∂µ F µν =
4π µ
J
c
Un po’ più di lavoro richiede la trascrizione delle altre due equazioni di Lorentz: ad
~ ×E
~ = − 1 ∂ B~ diventa ∂ 2 F 03 + ∂ 3 F 20 + ∂ 0 F 32 = 0.
esempio la componente x di ∇
c ∂t
~ B
~ = 0 diventa ∂ 1 F 23 +∂ 2 F 13 +∂ 3 F 12 = 0. Ci si convince
Similmente, l’equazione ∇·
rapidamente che l’equazione
∂ µ F νλ + ∂ ν F λµ + ∂ λ F µν = 0
contiene tutte e due le equazioni di Maxwell rimanenti.
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA
31
7.7. Forza di Lorentz. Rimane un’ultima equazione da analizzare: si tratta dell’equazione che dà la forza su di una particella carica.
~ Ovvero, il
~ v , γ(E+
~ ~v ×B))
Una verifica rapida permette di appurare che: F µν uν = (γ E~
c
quadrivettore ottenuto moltiplicando il tensore elettromagnetico con la quadrivelocità
ha una parte spaziale che è γ volte la forza di Lorentz, mentre la sua parte temporale
altro non è che γ volte la potenza acquistata dalla carica. Insomma, il cerchio si chiude:
basta equagliare questa espressione con la derivata covariante della quantità di moto
per ottenere l’espressione relativisticamente invariante dell’equazione del moto di una
carica elettrica in un campo elettrico esterno:
dpµ
= eF µν uν
dτ
Possiamo studiare due casi, particolarmente semplici: il moto in un campo elettrico o
megnetico uniformi.
Example 7.2. Campo elettrico costante ed uniforme
In questo caso le equazioni del moto assumono la forma particolarmente semplice:
dP~
~
= qE
dt
e quindi:
~
P~ = P~0 + q Et
L’energia allora varia secondo la formula:
2
~
E 2 = m2 c4 γ 2 = c2 P 2 + m2 c4 = c2 P~0 + q Et
+ m 2 c4
da cui si ricava la velocità (per semplicità, supponiamo la carica ferma all’istante t=0):
2
~
qE
q Et
t
1
2
mc
γ =
=
+ 1 → v = c r
2
2
v2
m c
2
1 − c2
qE 2
1 + mc
t
Si nota che per tempi piccoli, e quindi basse velocità, si ritrova la formula newtoniana.
A tempi grandi, e quindi ad alte velocità, la velocità tende invece a c, ma senza mai
superarla.
Un caso interessante si ha quando si spara in campo elettrico orientato in direzione x
una carica con velocità iniziale diretta lungo y.
Allora si possono esplicitare le due componenti della quantità di moto, ottenendo:
Py = P0 = mγvy
Px = qEt = mγvx
32
italianISIDORO FERRANTE
La tangente dell’angolo tra la velocità e il campo elettrico varia linearmente secondo la
stessa legge del caso non relativistico: tan θx = qEt/P0 , però la componente y della
velocità, anzicché aumentare, diminuisce! Infatti l’energia vale:
v
u
2 !
u
qEt
E = mγc2 = mc2 t 1 + P02 /(mc)2 +
mc
da cui, sostituendo γ,si trova:
vx = r
vy = r
qEt
1 + P02 /(mc)2 +
P0 /m
1+
P02 /(mc)2
+
qEt 2
mc
qEt 2
mc
Il calcolo della traiettoria tramite integrazione rispetto al tempo è lasciato come esercizio.
Example 7.3. Campo magnetico costante ed uniforme
Il caso di un campo magnetico uniforme si riesce a risolvere facilmente:
~v
dP~
~
=q ×B
dt
c
Ora, osservando come F~ · ~v = 0 anche nel caso relativistico, dobbiamo dedurre che
l’energia, e quindi γ, e infine anche il modulo della velocità rimangano costanti.
L’equazione del moto diventa allora:
~v
d~v
~
=q ×B
mγ
dt
c
La soluzione di questa equazione è un vettore ~v rotante in senso orario (se q è po~ con velocità angolare ω =
sitiva, antiorario altrimenti) intorno alla direzione di B
qB
. A parte il fattore c, dovuto all’uso del sistema cgs, questa espressione differisce
mcγ
dall’espressione solita della frequenza di Larmor per un fattore γ al denominatore.
La traiettoria corrisponde all’elica del caso non relativistico, dove però stavolta la reqB
lazione tra raggio e componente trasversa della velocità è data da: v T = ωR = mcγ
R,
2πmcγ
2π
mentre il passo dell’elica è d = vk ω = vk qB . Si noti che in termini del momento
della particella, le relazioni rimangono identiche a quelle del caso classico: R = mc
P ,
qB T
2πmc
d = Pk qB .
Example 7.4. Campi elettrico e magnetico ortogonale
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA
33
Un campo elettromagnetico in cui le componenti elettriche e magnetiche risultino ortoganali in ogni punto dello spazio non è un caso strano, bensì è quello che si ottiene normalmente osservando un campo elettroco o magnetico statico da un differente
sistema di riferimento inerziale.
Pertanto, questo caso è riconducibile facilmente ad uno dei due precedenti: infatti,
~ ·B
~ = 0, è possibile trovare un sistema di riferimento in cui il campo
visto che E
magnetico o elettrico si annullino, a seconda che risulti E 2 − B 2 maggiore o minore
di zero.
Il caso E 2 = B 2 richiede invece un trattamento a parte.
7.8. Onde elettromagnetiche. L’equazione delle onde, applicata al tensore elettromagnetico, non crea nessun problema in quanto è invariante a vista:
F µν = 0
alla stessa maniera non creano problemi le espressioni delle onde piane monocromatiche, che richiamiamo per comodità:
~ = E~0 e−i(ωt−~k~x) , B
~ = k̂ × E
~
E
Ricordiamo che per soddisfare alle equazioni di Maxwell nel vuoto, ~kdeve essere
ortogonale sia a B che ad E.
Come si fa a trasformare questa equazione in una equazione invariante a vista? Semplice: si costruisce in quadrivettore k µ = ( ωc , ~k).
L’equazione diventa immediatamente:
F µν = F̃ µν e−ik
µx
µ
dove F̃ µν indica un tensore costante ed uniforme nello spazio: di nuovo, un’equazione
covariante a vista!
Le equazioni di Maxwell portano a due condizioni su k µ : la prima deriva dalla divergenza del tensore elettromagnetico, ed è: kµ F µν = 0: questa condizione porta
~ La seconda
~ nonchè alla relazione ~k × B
~ = − ω E.
all’ortogonalità di ~k ed il campi E,
c
~ = 0 e ~k × E
~ = ω B.
~
equazione, porta invece alle condizioni ~k · B
c
Lavorando con queste equazioni, si giunge alle condizioni su k µ : k µ kµ = 0, ovvero:
ω2
− ~k 2 = 0: insomma, viene fuori la solita relazione ben consociuta tra il modulo di
c2
~k e la frequenza ω,ovvero k = ω , o anche, visto che k = 2π , λ = ν/c.10
c
λ
10Una piccola incursione nella meccanica quantistica:
sappiamo che l’energia di un fotone è E = ~ω,
mentre la sua uantità di moto è P = ~~k. Utilizzando la notazione relativistica, si ha: P µ = ~k µ , che è
una espressione covariante a vista.
34
italianISIDORO FERRANTE
Inoltre si può giungere alla dimostrazione che i due invarianti già visti sono entrambi
nulli: ovvero, i campi sono ortogonali e i moduli dei campi elettrico e magnetico sono
uguali.
Insomma, troviamo che tutte le caratteristiche delle onde elettromagnetiche sono invarianti per trasformazioni di Lorentz: un’onda elettromagnetica monocromatica piana
rimane un’onda eletromagnetica piana vista in qualsiasi sistema di riferimento.
Le condizioni che l’onda sia monocromatica e piana in realtà sono superflue: l’equazione delle onde, essendo invariante per trasformazione di Lorentz, ci riporta indietro
al punto da cui siamo partiti:ci dice infatti che la velocità della luce è indipendente dal
sistema di riferimento.
Ma adesso abbiamo una ulteriore informazione preziosa: sappiamo adesso come si
trasformano i vettori ~k e la frequenza ωda un sistema di riferimento all’altro!
Infatti, applicando una T.L. diretta lungo l’asse xotteniamo:
ω 0 = γ(ω − vkx )
kx0 = γ(kx − cv2 ω)
ky0 =
ky
0
kz =
kz
Vediamo una conseguenza di questa equazione: supponiamo che in un certo sistema di
riferimento noi misuriamo una certa frequenza ωe che questa frequenza derivi da una
direzione ~k. Supponiamo che la sorgente di questa radiazione si muova con velocità ~v
lungo una direzione nota, che arbitrariamente decidiamo essere la direzione x. Allora,
dalle equazioni precedenti, siamo in grado di ricostruire la frequenza e la direzione nel
sistema di riferimento in cui la sorgente è in quiete, ovvero la frequenza e direzione di
emissione.
In particolare, si ha: ω 0 = γ(ω − vc ω cos θ), dove θ è l’angolo tra la direzione di
osservazione e la velocità della sorgente.
Di solito l’equazione si scrive nella forma:
ω=
ω0
1
v
γ 1 − c cos θ
Questa equazione assomiglia molto a quella dell’effetto Doppler, ma contiene un termine γ aggiuntivo: in particolare, si ottiene che se si osserva una sorgente ad angolo
retto (cos θ = 0), allora la freuqenza dell’onda elettromagnetica risulta minore di quella di emissione di un fattore γ! Si tratta di quello che viene comunemente definito
effetto Doppler trasverso, e che è stato misurato in esperimenti a terra effettuati su
di una piattaforma rotante. L’effetto Doppler trasverso è una conseguenza della dilatazione relativistica dei tempi: infatti sappiamo che un orologio posto sulla sorgente
scandisce il tempo più lentamente di un orologio solidale con l’osservatore. Ed infatti,
la frequenza emessa risulta diminuita esattamente di un fattore γ!
italianIL FORMALISMO COVARIANTE NELLA TEORIA DELLA RELATIVITÀ RISTRETTA
35
Un altro effetto estremamente interessante che segue dalle regole di t rasformazione
del quadrivettore k µ è che la direzione di propagazione dell’onda cambi nel passaggio
da un sistema di riferimento all’altro: si tratta del fenomeno dell’aberrazione della
luce, che non risulta spiegabile in termini della relatività galileiana.
Si ha ad esempio:
cos θ 0 − vc
γ (kx − βω)
kx0
0
=
cos θ = 0 =
ω
γ (ω − βkx )
1 − vc cos θ 0
e si verifica che per velocità piccole rispetto a quelle della luce si ottiene la formula
classica dell’aberrazione ∆θ = vc sin θ