Corso di Relatività - Università di Trento

Corso di Relatività: prima parte
Prof. L. Vanzo1
Dipartimento di Fisica, Università di Trento
9 maggio 2013
1 [email protected]
Sommario
Negli ultimi decenni dell’ottocento si pensava alle onde elettromagnetiche come a perturbazioni di un etere immobile, dotato anche di proprietà meccaniche. Questo pose per le
discipline fisiche quello che era, forse, il principale problema scientifico dell’epoca: dimostrare sperimentalmente l’esistenza dell’etere e determinarne le proprietà meccaniche ed
elettromagnetiche. Tuttavia, e in parte sorprendentemente1 , nessuno dei vari esperimenti
tentati riuscı́ mai in quell’intento. Oggi si può dire che quegli esperimenti misero in luce
essenzialmente i limiti dei concetti di spazio e tempo della fisica classica newtoniana, e la
necessità di una loro revisione2 .
Come tutti sanno, la forma definitiva di questa revisione è opera di A. Einstein e forma la base concettuale della teoria della relatività ristretta, o speciale. Questa teoria è
basata sull’osservazione che in mancanza di segnali che si propagano immediatamente,
non è possibile confrontare il tempo di eventi distanti se prima non si adotta una convenzione per sincronizzare (o regolare) gli orologi. Si vedrà che ciò ha condotto Einstein
a un nuovo concetto di tempo. Questo argomento e le sue conseguenze nei campi della
meccanica e dell’elettrodinamica formano il corpo principale del corso di relatività. La
meccanica dei fluidi, la statistica e la termodinamica relativistica saranno considerate solo
marginalmente.
L’estensione del principio di relatività ai sistemi di riferimento accelerati, considerata
da Einstein come epistemologicamente necessaria, condusse a una seconda, e più radicale, revisione dei concetti di spazio e tempo. L’osservazione (sempre di Einstein) che
una trasformazione arbitraria delle coordinate spazio-temporali è indistinguibile da un
cambiamento del campo gravitazionale è il fondamento della sua teoria relativistica della
gravitazione, la relatività generale che è alla base della recente, intensa attività di ricerche
nel campo cosmologico, e che sarà introdotta nella seconda parte di questo corso.
I seguenti appunti raccolgono una sintesi dei temi trattati a lezione, e non devono in alcun
modo essere considerati un sostituto dei testi. Per i necessari approfondimenti si rimanda
allo studio dei libri indicati nella bibliografia.
1
La necessità dell’etere era sostenuta da alcuni fra i migliori scienziati dell’epoca.
In appendice D sono citati i testi di W. Pauli, di C. Møller e di Panofski e Phillips, dove si trova una
introduzione storica dettagliata al periodo pre-relativistico.
2
Indice
1 Simmetrie non relativistiche
1.1 Considerazioni generali . . . . . . . . . . . . . . . . . . .
1.2 Sistemi di riferimento e coordinate . . . . . . . . . . . .
1.3 Il gruppo di Galilei . . . . . . . . . . . . . . . . . . . . .
1.3.1 Sistemi inerziali . . . . . . . . . . . . . . . . . . .
1.3.2 Trasformazioni di Galilei . . . . . . . . . . . . . .
1.3.3 Struttura di gruppo . . . . . . . . . . . . . . . . .
1.4 Relatività e meccanica . . . . . . . . . . . . . . . . . . .
1.4.1 L’addizione delle velocità . . . . . . . . . . . . . .
1.4.2 Equazioni del moto di Newton . . . . . . . . . . .
1.4.3 Sistemi continui: il fluido perfetto e la conduzione
1.4.4 L’equazione di Schrödinger . . . . . . . . . . . . .
1.4.5 Il principio di relatività galileiano . . . . . . . . .
1.5 Ottica non relativistica . . . . . . . . . . . . . . . . . . .
1.5.1 onde piane e velocità di fase . . . . . . . . . . . .
1.5.2 la velocità di gruppo . . . . . . . . . . . . . . . .
1.5.3 La velocità della luce nei dielettrici trasparenti . .
1.5.4 L’aberrazione e l’effetto Doppler . . . . . . . . . .
1.6 Esperienze di fine secolo XIX . . . . . . . . . . . . . . .
1.6.1 Hoek . . . . . . . . . . . . . . . . . . . . . . . . .
1.6.2 Fizeau e Fresnel . . . . . . . . . . . . . . . . . . .
1.6.3 Michelson e Morley . . . . . . . . . . . . . . . . .
1.6.4 Interpretazioni . . . . . . . . . . . . . . . . . . .
1.7 Esperienze moderne . . . . . . . . . . . . . . . . . . . . .
. .
. .
. .
. .
. .
. .
. .
. .
. .
del
. .
. .
. .
. .
. .
. .
. .
. .
. .
. .
. .
. .
. .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
calore
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2
2
3
5
5
6
7
8
8
9
10
12
14
14
15
16
17
19
20
21
22
22
23
25
2 Le basi della relatività speciale
2.1 Gli assiomi di Einstein . . . . . . . . . . . . . . . .
2.1.1 Osservazioni sui postulati . . . . . . . . . .
2.1.2 La definizione del tempo . . . . . . . . . . .
2.2 Le trasformazioni di Lorentz . . . . . . . . . . . . .
2.2.1 Condizioni sulle trasformazioni . . . . . . .
2.2.2 Trasformazioni di Lorentz speciali, o boosts
2.2.3 La più generale trasformazione di Lorentz .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
26
26
27
28
30
30
32
36
1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2.3
2.4
2.5
Lunghezze e intervalli di tempo . . . . . . . . . . . . . .
L’addizione delle velocità . . . . . . . . . . . . . . . . . .
La luce nei dielettrici trasparenti . . . . . . . . . . . . .
2.5.1 Effetto Doppler e aberrazione secondo la relatività
2.5.2 Onde di materia . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
37
39
41
42
42
3 Formalismo quadridimensionale ed equazioni invarianti
3.1 Prodotto scalare . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Gruppo di Lorentz . . . . . . . . . . . . . . . . . . . . . .
3.3 Tensori e campi di tensori . . . . . . . . . . . . . . . . . .
3.3.1 tensori algebrici . . . . . . . . . . . . . . . . . . . .
3.3.2 campi tensoriali . . . . . . . . . . . . . . . . . . . .
3.4 Equazioni invarianti . . . . . . . . . . . . . . . . . . . . . .
3.4.1 Equazione di Klein-gordon . . . . . . . . . . . . . .
3.4.2 Equazione di Proca . . . . . . . . . . . . . . . . . .
3.5 Il tempo proprio . . . . . . . . . . . . . . . . . . . . . . . .
3.6 Il cono luce e le relazioni causali . . . . . . . . . . . . . . .
3.7 Curve . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
44
44
45
46
46
48
49
49
50
51
51
52
4 Meccanica relativistica
4.1 quantità di moto, energia e forza . . . . . .
4.2 formule di trasformazione . . . . . . . . . .
4.3 sistemi di particelle . . . . . . . . . . . . . .
4.4 Equazioni del moto . . . . . . . . . . . . . .
4.5 Moto uniformemente accelerato, o iperbolico
4.6 Il razzo relativistico . . . . . . . . . . . . . .
4.7 E = mc2 . . . . . . . . . . . . . . . . . . . .
4.8 Collisioni . . . . . . . . . . . . . . . . . . . .
4.8.1 L’effetto Compton . . . . . . . . . .
4.8.2 Energia di soglia . . . . . . . . . . .
4.8.3 Decadimento . . . . . . . . . . . . .
4.9 Moto dello spin e precessione di Thomas . .
4.10 Principio variazionale . . . . . . . . . . . . .
4.11 Momento angolare . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
54
54
55
56
57
58
59
62
64
64
66
68
69
71
73
5 Elettrodinamica covariante
5.1 Forma covariante delle equazioni . . .
5.2 Corrente elettrica . . . . . . . . . . .
5.3 Trasformazione dei campi . . . . . .
5.4 Elettrodinamica fenomenologica . . .
5.5 Campo di una carica in moto rapido
5.6 L’equazione di Lorentz-Dirac . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
74
74
75
78
79
81
85
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6 Principi variazionali
6.1 Equazioni di Eulero e Lagrange . . .
6.2 Azione per il campo elettromagnetico
6.3 Azione per le particelle . . . . . . . .
6.4 Il tensore energia-impulso . . . . . .
6.4.1 Caso generale . . . . . . . . .
6.4.2 Campo scalare . . . . . . . .
6.4.3 Campo elettromagnetico . . .
6.4.4 Fluido perfetto . . . . . . . .
6.4.5 Particelle libere . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
88
89
90
92
93
93
95
96
97
100
7 Teoria della gravitazione
7.1 Il principio di equivalenza . . . . . .
7.2 Metrica e gravitazione . . . . . . . .
7.2.1 Moto di una particella . . . .
7.2.2 Distanze spaziali e intervalli di
. . . .
. . . .
. . . .
tempo
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
102
102
105
107
110
8 Appendici
A
Invarianza della fase
B
La delta di Dirac . .
C
Testi di Riferimento .
D
Argomeni da studiare
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
113
113
113
116
117
. . . . . . .
. . . . . . .
. . . . . . .
per l’esame
.
.
.
.
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Capitolo 1
Simmetrie non relativistiche
Dal punto di vista di un fisico moderno una teoria relativistica (in assenza di gravitazione)
è innanzitutto una teoria in accordo con i postulati di Einstein e, dunque, una teoria invariante di Lorentz. Ma sarebbe errato pensare che il principio di relatività non esistesse
prima di Einstein; la meccanica classica di Galileo-Huygens-Newton e le sue numerose
ramificazioni soddisfa anch’essa a un principio di relatività, eccetto che il gruppo di simmetria è il gruppo di Galilei, diverso dal gruppo di Lorentz. Quest’ultimo ha la stessa
dimensione del gruppo di Galilei e quindi il suo ruolo, propriamente, non è introdurre il
principio di relatività, quanto ripristinare il principio già esistente in una forma che sia
valida anche per l’elettrodinamica di Maxwell-Lorentz.
In questo capitolo discuteremo brevemente le simmetrie non relativistiche soprattutto
nel campo della meccanica e dell’ottica, allo scopo di identificare quelle assunzioni ingiustificate la cui rimozione ha portato infine al punto di rottura creato dalla teoria di
Einstein.
1.1
Considerazioni generali
Due osservatori aventi posizione, orientamento e velocità diverse descrivono lo stato di
un sistema fisico in modo diverso. Per esempio, se si tratta di particelle gli assegnano
coordinate e velocità diverse oppure, se si tratta di un sistema quantistico, gli assegnano
vettori diversi del suo spazio di Hilbert.
Ma come si calcolano le nuove coordinate e velocità, o i nuovi vettori? Questa è una
materia delicata che riflette in larga misura le nostre opinioni sulla natura delle simmetrie
spazio-temporali. In generale, esiste un gruppo di trasformazioni, operanti sullo spazio
delle fasi o sullo spazio di Hilbert, le quali definiscono una legge di trasformazione degli
stati e delle variabili dinamiche; la struttura di gruppo tiene conto dell’idea naturale che
tali applicazioni si possano comporre e invertire. Per esempio, se si associa ad ogni rotazione nello spazio una matrice ortogonale 3 × 3, allora alla rotazione inversa sarà associata
l’inversa della matrice e a due rotazioni eseguite in successione è associata la matrice che
risulta dal prodotto delle due. L’insieme delle rotazioni, con questa corrispondenza, forma
un gruppo continuo isomorfo al gruppo ortogonale SO(3) delle matrici ortogonali 3 × 3.
4
Si noti che le applicazioni di cui stiamo parlando non sono la stessa cosa delle operazioni
fisiche con cui si cambiano effettivamente posizione, orientamento o velocità degli osservatori, tuttavia per comodità noi non faremo questa distinzione. Parleremo quindi di una
rotazione sia per indicare una rotazione fisica dell’osservatore (o dello stato), sia come di
un elemento del gruppo matematico delle matrici ortogonali 3 × 3.
C’è un’interpretazione passiva delle trasformazioni, secondo la quale il cambiamento dello
stato è attribuito al cambiamento dell’osservatore e allora si afferma, un pò vagamente, che
il gruppo “trasforma” un osservatore nell’altro. Ma si può anche dare un’interpretazione
attiva, secondo la quale l’osservatore resta lo stesso ma si ha un cambiamento reale dello
stato.
Ora, se le formule di trasformazione non hanno effetto sulle equazioni di una teoria nel
senso che ne mantengono inalterata la forma, allora le predizioni della teoria non dipenderanno, per esempio, dalla velocità del sistema di riferimento. Si parla allora di trasformazioni di simmetria, e del gruppo corrispondente come di un gruppo di simmetria; per
la precisione, poiché le trasformazioni connettono osservatori con diverso orientamento,
posizione e velocità, si parla di simmetrie spazio-temporali. In questo caso si ha quindi
un principio di relatività, cioè si afferma che le leggi della fisica sono le stesse per gli
osservatori le cui posizioni, velocità e orientamento relativi sono connesse da elementi del
gruppo di simmetria.
Ovviamente, il tratto caratteristico di una teoria relativistica è soprattutto la relatività
del moto, piuttosto che la relatività di orientamento o di posizione. La parola chiave è
dunque velocità relativa, ed è essenziale che il gruppo di simmetria contenga elementi che
corrispondono a osservatori in moto relativo, per parlare veramente di relatività. Se il
gruppo include le traslazioni temporali, allora le leggi sono anche le stesse ad ogni tempo.
Si noti che non si considerano osservatori accelerati, un problema che richiederebbe l’introduzione della relatività generale. D’altronde l’accelerazione ha effetti meccanici che si
possono rivelare anche stando all’interno di una cassa chiusa, e dunque una simmetria
che rendesse equivalenti due osservatori relativamente accelerati sembra, a prima vista,
del tutto impossibile.
Nel seguito studieremo i due principali esempi di simmetria spazio-temporale che si trovano in fisica e i corrispondenti principi di relatività: la simmetria galileiana che caratterizza
la meccanica di Galileo e Newton, brevemente, e la simmetria di Lorentz che caratterizza
la relatività ristretta, estensivamente. L’enfasi sarà posta evidentemente sulla relatività
del moto, il concetto in cui le due simmetrie si differenziano maggiormente.
1.2
Sistemi di riferimento e coordinate
Dato che i moti relativi sono i soli che si osservano, per una descrizione razionale del
moto e degli altri fenomeni fisici è essenziale introdurre quello che in fisica si chiama un
sistema di riferimento. Esso definisce uno standard convenzionale di quiete e le procedure
5
per la misura e la registrazione permanente delle coordinate di posizione e di tempo degli
eventi1 .
Si riconosce facilmente che i metodi usati allo scopo si basano tutti su due fatti fondamentali. Il primo è l’esistenza di corpi approssimativamente rigidi le cui proprietà sono
in ottimo accordo con gli assiomi e le proposizioni della geometria euclidea. L’immagine
scolastica del sistema di riferimento formato da tre piani rigidi ortogonali, poi idealizzato
nei tre assi ortogonali orientati, ha infatti la sua origine nella geometria euclidea e nei corpi rigidi. Le coordinate cartesiane hanno infatti il semplice significato fisico di lunghezze
misurate mediante regoli rigidi.
In secondo luogo l’esistenza dei campi elettromagnetici (campi EM), con la loro enorme
velocità di propagazione, è sufficientemente semplice e universale da rendere possibile il
loro impiego per la misura delle coordinate spazio-temporali (cioè di tempo e luogo, anche
qui localmente2 in accordo con gli assiomi e le proposizioni della geometria euclidea).
Per esempio, il global positioning system[1] (GPS) è una tecnologia sofisticata per la
determinazione delle coordinate che fa uso di satelliti e segnali EM di alta frequenza.
Le coordinate sono qui determinate non mediante l’uso di regoli rigidi, ma da misure
effettuate con segnali elettromagnetici e coinvolgono inevitabilmente la propagazione della
radiazione EM. In entrambi i casi, le coordinate spaziali sono misurabili e possiedono un
diretto significato fisico.
La coordinata temporale è invece determinata dal fatto che possiamo attribuire a certi
moti (la rotazione della terra o le oscillazioni di un pendolo), un carattere idealizzato e
privilegiato. Cioè si assume che il moto degli oggetti privilegiati , che chiameremo orologi,
non influenzi nè sia influenzato dagli oggetti che si vogliono indagare 3
Il carattere idealizzato degli orologi fornisce un concetto di tempo altrettanto idealizzato,
essenzialmente equivalente al tempo assoluto di Newton, del quale egli affermava “che
in sè e per sua natura, senza relazione ad alcunché di esterno, scorre uniformemente e
con altro nome è chiamato durata.” Newton era estremamente consapevole del fatto che
potrebbero non esistere moti rigorosamente uniformi con cui misurare il tempo, e forse
proprio per questo introdusse la sua definizione di tempo assoluto.
Il carattere idealizzato degli orologi è ancora più marcato nelle teorie quantistiche ma
non può essere mantenuto, per esempio, in relatività generale perché secondo quella teoria il ritmo degli orologi è influenzato dal campo gravitazionale, e dunque dalla presenza
delle masse astronomiche. Al contrario che del tempo, nelle teorie quantistiche non relativistiche le coordinate spaziali sono invece osservabili soggette a dispersione, e come
tali si riferiscono sia all’oggetto osservato che allo strumento che le misura. Questo fa sı́
che in tali teorie lo spazio e il tempo siano trattati in maniera completamente differente.
Nello svolgimento della relatività ristretta le problematiche legate alla teoria quantistica
saranno comunque completamente ignorate.
1
Come avverte B. Schutz nel suo ottimo libro, un sistema di riferimento non è semplicemente una
persona con il binoccolo, ma un sofisticato sistema di raccolta dati.
2
Sulle distanze cosmologiche le cose cambiano.
3
Ci sarebbe il problema importante di sapere in che misura queste ipotesi siano compatibili con le
leggi della fisica, ma di questo non ci occupiamo.
6
Vi sono altre idealizzazioni, meno importanti, di cui faremo spesso uso; per esempio, in
fisica classica si può generalmente parlare delle coordinate di un evento di emissione su
di una stella lontana anche se di solito non è possible misurarle veramente. Un altra
idealizzazione che useremo sarà riferirsi ai sistemi di riferimenti come se fossero sistemi di
coordinate.
1.3
1.3.1
Il gruppo di Galilei
Sistemi inerziali
Si sa per esperienza che esistono sistemi di riferimento nei quali una particella libera (cioè
non soggetta all’azione di forze esterne) si muove con velocità costante, un’affermazione
importante vecchia di alcuni secoli e nota come legge di inerzia 4 . Questi sono i sistemi
di riferimento inerziali (abbr. SRI), rispetto ai quali le equazioni del moto assumono la
forma semplice descritta da Newton nei Principia (la legge F = ma e le sue applicazioni
ai sistemi di particelle e ai corpi rigidi, al moto dei pianeti e delle comete e, più in
generale alla meccanica celeste, e ancora, alla fisica statistica classica, al moto dei fluidi,
all’aerodinamica, eccetera).
Ovviamente l’accelerazione può essere zero solo rispetto a un tempo opportuno, cioè
rispetto a un moto uniforme opportuno, e quindi la legge di inerzia implica una scelta
del tempo. Assumeremo quindi, come parte della definizione di un sistema di riferimento
inerziale, che sia possibile costruire e usare orologi idealizzati che siano consistenti con la
legge di inerzia. Lo chiameremo il tempo universale. Con buona approssimazione, e per gli
scopi pratici della vita quotidiana come ad esempio la definizione di un orario ferroviario,
un tale orologio è la sfera celeste delle stelle fisse, che segna il tempo siderale.
E1: Sia t il tempo universale e τ = f (t) una funzione monotona crescente di t. Si calcoli
l’accelerazione di una particella considerando τ come il nuovo tempo. Si deduca che la
legge di inerzia resta valida se e solo se τ = at + b, con a e b arbitrari ma a > 0.
È appena il caso di sottolineare che siccome l’assenza di forze si può accertare solo con
l’assenza di accelerazioni, un SRI non è esattamente definibile a meno che le sorgenti
di forza non siano tutte esattamente note. Ma per quanto riguarda la legge di inerzia è
altrettanto chiaro che ogni riferimento che si muove con moto traslatorio uniforme rispetto
a un sistema inerziale è esso stesso inerziale, e dunque che esiste un’infinità di tali sistemi.
Si pone il problema di trovare la formula di trasformazione delle coordinate associate a una
coppia arbitraria di sistemi inerziali. Per le coordinate useremo la notazione vettoriale,
con x = (x, y, z) e il significato usuale di x, y e z come di lunghezze misurate lungo i
rispettivi assi orientati (le coordinate cartesiane).
4
Per una discussione approfondita si veda E. Mach, “La meccanica nel suo sviluppo storico critico”,
Universale Scientifica Boringhieri, 1977.
7
1.3.2
Trasformazioni di Galilei
′
Se i sistemi inerziali F e F sono in moto relativo uniforme con velocità costante v, in
meccanica classica si considerano evidenti le seguenti formule di trasformazione
′
x = R · x + vt + a
(3.1)
′
t =t+τ
(3.2)
dove R è una matrice ortogonale (RRT = 1) che rappresenta una rotazione e la notazione
R · x denota, come al solito, il prodotto righe per colonne di R con x. Queste sono
le trasformazioni di Galilei. Una descrizione prosaica delle formule direbbe allora che
′
′
l’osservatore O in F osserva l’origine di F muoversi con velocità v e transitare per il
punto a nell’istante t′ = τ (o equivalentemente t = 0); osserva inoltre che i versori degli
′
assi orientati di F e F sono connessi dalla rotazione R
ej =
3
∑
′
Rij ei
(3.3)
i=1
e che l’orologio di O appare in ritardo di τ secondi rispetto al proprio (se τ > 0, altrimenti
′
è O che ritarda rispetto ad O). L’operazione corrispondente descrive una traslazione
temporale.
E2: Si mostri che una rotazione e una traslazione spaziale commutano se e solo se la
traslazione è diretta lungo l’asse di rotazione.
Le formule scritte sono convenienti per studiare la struttura di gruppo delle trasformazioni
′
galileiane. Talvolta è più conveniente immaginare che F sia il sistema mobile e F il
“sistema del laboratorio” considerato in quiete. Allora le coordinate dello stesso punto
nei rispettivi SRI sono connesse dalle formule equivalenti
′
x = R−1 · (x − vt − a)
(3.4)
Se v = 0 la formula descrive l’azione combinata di rotazioni (x → R · x) e traslazioni
(x → x − a), che però non hanno niente a che vedere con il moto relativo. Per scopi
pratici possiamo eliminare il ricorso alle rotazioni e alle traslazioni richiedendo che i sistemi
′
coincidano esattamente per t = t = 0. Allora si ha la trasformazione di Galilei speciale
′
x = x − vt (boost, in inglese) o, per esteso,
′
x
′
y
′
z
′
t
=
=
=
=
x − vx t
y − vy t
z − vz t
t
(3.5)
(3.6)
(3.7)
(3.8)
È importante rendersi conto che queste trasformazioni contengono, oltre al moto relativo,
anche certe assunzioni sulla natura dello spazio e del tempo, o meglio, sul comportamento
8
′
di regoli e orologi in movimento. Per esempio, adottando l’equazione t = t , si assume che
si possano costruire orologi il cui ritmo non dipende dalla loro velocità. L’altra assunzione
riguarda le distanze: le trasformazioni galileiane implicano immediatamente l’invarianza
della distanza spaziale
′
′
|x − y | = |R · (x − y)| = |x − y|
dove |x| = (x2 + y 2 + z 2 )1/2 . In altre parole, si assume che si possano costruire regoli
standard la cui lunghezza non dipende dallo stato di moto. Entrambe queste assunzioni
sono ingiustificate. Di fatto, il tempo assoluto è l’assunzione che non si può mantenere
in una teoria dove opera una velocità massima per la propagazione dei segnali, se le leggi
sono locali. Oggi sappiamo che la massima velocità in natura è raggiunta dalla radiazione
elettromagnetica nel vuoto (o dai fotoni), approssimativamente uguale a
c = 2, 99792 · 1010 cm · sec−1 ≃ 300.000 Km/sec.
e forse da qualche altra particella, come ad esempio certi tipi di neutrini. Per il resto, le
formule di trasformazione corrispondono evidentemente all’idea di uno spazio vettoriale
euclideo, dove le operazioni fondamentali sono quelle dell’algebra lineare o più generalmente dell’algebra affine (uno spazio vettoriale è uno spazio affine con la scelta di un’origine,
v. figura).
x
x’
vt
K’
K
x’=x−vt
′
Figura 1.1: x = x − vt
1.3.3
Struttura di gruppo
Le trasformazioni descritte dalle equazioni (3.1) e (3.2) formano un gruppo continuo a
dieci dimensioni, G, denominato gruppo di Galilei. Per indicare un elemento del gruppo
G usiamo la notazione
g = (R, v, a, τ )
(3.9)
9
e per indicare l’azione dell’elemento g sulle coordinate (x, t) scriviamo
( ) (
)
x
R · x + vt + a
g·
=
t
t+τ
(3.10)
Si noti che le coordinate definiscono formalmente un vettore in uno spazio cartesiano con
quattro dimensioni e che G opera (non linearmente) in questo spazio. Analogamente sia
′
′
′
′
′
g = (R , v , a , τ )
Allora iterando la formula di trasformazione (3.10) si ottiene facilmente la seguente
formula per il prodotto in G
′
′
′
′
′
′
′
′
g g = (R · R, R · v + v , R · a + v τ + a , τ + τ )
(3.11)
L’identità è l’elemento e = (1, 0, 0, 0), e si verifica facilmente che con queste operazioni
l’insieme delle g forma un gruppo. Quanto alla dimensione, si noti che occorrono tre
angoli per specificare R, tre numeri reali per v, tre per a e uno per τ , per un totale di
dieci numeri reali indipendenti. Questo è tutto ciò che si intende dicendo che il gruppo
ha dimensione dieci (anche se G non è uno spazio vettoriale).
E3: (i) Si provi a realizzare G e la formula del prodotto (3.11) mediante un gruppo di
trasformazioni lineari di uno spazio a 5 dimensioni (G è allora un gruppo di matrici 5 × 5
con l’usuale prodotto di matrici); (ii) dato g ∈ G si trovi il suo inverso, cioè l’elemento
g −1 tale gg −1 = g −1 g = e; (iii) si mostri che si può ottenere una traslazione spaziale
combinando un boost con una traslazione temporale.
1.4
Relatività e meccanica
Occupiamoci della relazione del gruppo di Galilei con le equazioni del moto. Nella descrizione classica del moto, per ogni particella si hanno tre variabili di posizione funzioni del
tempo, che è comune a tutte. Le leggi del moto eguagliano le forze per unità di massa con
le accelerazioni e sono dunque, tecnicamente parlando, sistemi di equazioni differenziali
ordinarie del secondo ordine. L’assegnazione delle forze e dei dati iniziali è allora tutto
ciò che serve per trattare matematicamente il problema del moto (cioè il calcolo della
traiettoria, per esempio le orbite dei pianeti). La teoria delle equazioni differenziali implica anche il determinismo della fisica classica, cioè il fatto che la traiettoria è localmente
univocamente determinata dalle condizioni iniziali.
1.4.1
L’addizione delle velocità
Due semplici conseguenze delle trasformazioni di Galilei sono la formula di addizione delle
velocità
′
u =u−v
(4.1)
10
′
che si ottiene differenziando l’espressione x = x − vt, e il carattere assoluto dell’accelerazione
′
du
du
a = ′ =
=a
dt
dt
′
′
′
Siano θ l’angolo tra u e v e θ quello tra u e v e poniamo anche u = |u|. Dal teorema di
addizione si hanno le formule (verificare)
′
′
′
′
tan θ =
′
′
u cos θ = u cos θ − v
u sin θ = u sin θ,
sin θ
cos θ − v/u
′
u = −v cos θ +
√
(4.2)
(4.3)
v 2 cos2 θ′ + u2 − v 2
(4.4)
Useremo questi risultati per verificare l’invarianza galileiana di alcune equazioni importanti che si incontrano nella fisica classica newtoniana.
E4: Un forte nuotatore, capace di una velocità di 5 m/s in acqua ferma, procede in un
fiume per 50 metri contro una corrente di 3 m/s e ritorna poi al punto di partenza con la
corrente a favore. Un secondo nuotatore di pari abilità attraversa il fiume ortogonalmente,
con andata e ritorno da riva a riva, distanti anche’esse 50 m. Chi termina per primo la
gara? Si deducano formule generali nel caso che velocità e distanze del problema siano
generiche; si denoti con c la velocità dei nuotatori e con v quella del fiume, la distanza sia
L.
1.4.2
Equazioni del moto di Newton
L’esempio paradigmatico di un sistema dinamico classico considera N punti materiali
soggetti a forze centrali, per cui
mi
d2 xi
= −∇i U (x1 , . . . , xN )
dt2
(4.5)
dove ∇i indica il gradiente rispetto alla variabile xi e l’energia potenziale U descrive
un’interazione a due particelle del tipo
∑
U (x1 , . . . , xN ) =
V (|xi − xj |) = V (r12 ) + V (r13 ) + · · · + V (r32 ) + · · · (4.6)
1≤i<j≤N
Qui rij = |xi − xj |. La terza legge del moto è allora automaticamente soddisfatta e l’invarianza per traslazioni spaziali e temporali è ovvia. Non vi è alcuna difficoltà di principio
a introdurre potenziali che coinvolgono tre o più particelle alla volta. Classici esempi di
interazione a due particelle sono l’interazione gravitazionale e l’interazione elettrostatica
coulombiana tra cariche puntiformi. Incidentalmente, le equazioni godono anche delle
simmetrie discrete (in opposizione a quelle continue) di riflessione: x → −x, t → −t,
11
che non si considerano parte del gruppo di Galilei ma che sono importanti per la teoria
quantistica e forse anche per la fisica statistica.
Nella dinamica newtoniana le masse sono assolute5 e dunque tali sono anche le forze. È
allora immediato constatare che le equazioni del moto (4.5) sono covarianti per trasfor′
mazioni di Galilei, vale a dire che le variabili trasformate x = R · x + vt + a obbediscono
anch’esse alle equazioni del moto (4.5).
Ovviamente se R, v e a dipendessero dal tempo o dal punto (come per le rotazioni)
questo non sarebbe più vero. Più in generale esistono infinite trasformazioni delle variabili dinamiche che non mantengono la forma delle equazioni del moto, un fatto che ha
impressionato Newton, pare, più della covarianza galileiana appena descritta.
E5: Verificare esplicitamente questo fatto, per esempio supponendo che v dipenda dal
tempo. Come cambia la (4.1)? Si verifichi anche la proprietà di covarianza delle (4.5).
Osservazione: Si potrebbe chiedersi quale sia il gruppo massimale di covarianza delle
equazioni del moto (4.5) e se questo abbia un significato fisico, però si scopre che questo
dipende essenzialmente dal tipo di forze applicate e dalla forma dell’energia potenziale.
Per esempio, se due particelle interagiscono solamente con forze centrali la simmetria extra include formalmente il gruppo delle rotazioni in quattro dimensioni (SO(4) anziché
SO(3)). Abbiamo anche visto che in generale sono presenti simmetrie discrete di riflessione. Per una particella libera il gruppo di covarianza è un’estensione del gruppo di
Galilei a un gruppo di dimensione dodici, detto gruppo di Schrödinger. Anche questo
gruppo cessa di rappresentare simmetrie non appena si introducono le interazioni. Queste
simmetrie sembrano dunque accidentali e non le prenderemo in esame. Tuttavia non è
mai opportuno dimenticarsene completamente. Se esistono buone ragioni per imporre
simmetrie extra, oltre a quelle già richieste dal principio di relatività, queste possono diventare strumenti potenti per generalizzare le teorie della fisica. Gran parte degli sviluppi
moderni nella fisica delle particelle elementari sono infatti derivati da argomenti di questo
tipo.
1.4.3
Sistemi continui: il fluido perfetto e la conduzione del
calore
Nella meccanica dei continui, un altro esempio di teoria covariante galileiana è fornito dal
moto isoentropico di un fluido perfetto. Le equazioni sono quelle di Eulero
1 ∂p
∂ui
+ u · ∇ui = −
∂t
ρ ∂xi
(4.7)
5
Il rapporto fra due accelerazioni, che è una grandezza assoluta, determina il rapporto inverso delle
masse. Scelto dunque una volta per tutte un corpo standard che fornisca un’unità di massa, le altre masse
possono essere determinate usando il principio di azione e reazione, per esempio mediante collisioni, e
saranno conseguentemente invarianti.
12
dove u(t, x) è il campo di velocità del fluido, p è la pressione e ρ la densità di massa,
vincolati a soddisfare l’equazione di continuità
∂ρ
+ div(ρu) = 0
∂t
(4.8)
Per chiudere il sistema di equazioni deve anche essere assegnata un’equazione di stato,
esprimente p in funzione di ρ, per esempio l’equazione barotropica p = (γ − 1)ρ. Le
trasformazioni di Galilei devono ora tenere conto del fatto che le variabili sono campi,
cioè grandezze che dipendono dalla posizione oltre che dal tempo. Tuttavia, le formule di
′
′
trasformazione sono abbastanza evidenti: per l’osservatore inerziale in F poniamo (t = t
è sottinteso, a = 0 e R = 1, in altri termini studiamo il boost)
′
′
′
′
′
u (t, x ) = u(t, x + vt) − v
′
ρ (t, x ) = ρ(t, x + vt),
(4.9)
′
′
′
p (t, x ) = p(t, x + vt)
(4.10)
Queste formule ci dicono semplicemente che la densità e la pressione in ogni punto del
fluido sono le stesse per entrambi gli osservatori, mentre i campi di velocità differiscono
′
solo per un moto collettivo di traslazione uniforme. Infatti, dato che x + vt = x, i secondi
membri di queste equazioni sono realmente valutati in x.
Con queste trasformazioni è facile mostrare che le equazioni del moto del fluido sono
covarianti galileiane.
E6: Provare l’affermazione appena fatta. Si usino le formule
′
∂u
∂u
=
+ v · ∇u,
∂t
∂t
′
∂ρ
∂ρ
=
+ v · ∇ρ
∂t
∂t
Quale trasformazione rende le equazioni di Eulero invarianti per inversione temporale?
Vale ancora per l’equazione di Navier-Stokes?
In presenza di viscosità si deve aggiungere al secondo membro della (4.7) il termine
η
∆u
ρ
dove η > 0 è il coefficiente di viscosità, e si hanno cosı́ le equazioni di Navier-Stokes. Il
nuovo termine è invariante galileiano, come si vede usando la (4.9).
La novità dei fluidi rispetto alle particelle puntiformi è stata la necessità di introdurre
una legge di trasformazione di tipo nuovo. Nel prossimo esempio, il calore, vedremo come
la richiesta di covarianza può anche suggerire la forma corretta di un’equazione fisica.
L’equazione della propagazione del calore in un corpo solido immobile diventa, nel caso
semplice di corpi omogenei e isotropi, la seguente equazione per la distribuzione della
temperatura T nel corpo
∂T
= χ∇2 T
∂t
(4.11)
13
dove χ è la conducibilità termica (funzione della temperatura e della pressione). Assumeremo che T sia uno scalare, cioè che
′
′
′
T (x , t) = T (x + vt, t)
(4.12)
Allora si vede subito che la (4.11) non è invariante, in quanto
′
∂T
∂T
=
+ v · ∇T
∂t
∂t
Il termine di trasporto, v · ∇T , può essere eliminato solo se nell’equazione originale vi
è un termine di trasporto analogo. Deduciamo dunque che l’equazione del calore per un
corpo in movimento con velocità u deve essere corretta con un termine analogo:
∂T
+ u · ∇T = χ∇2 T
∂t
(4.13)
′
Poiché u = u + v, l’equazione è ora covariante. Si può quasi dire, in questo caso, che il
principio di relatività definisce la fisica.
Dal punto di vista della teoria delle rappresentazioni del gruppo di Galilei, le grandezze
(Ṫ , ∇T ) si trasformano come una delle due possibili rappresentazioni quadri-vettoriali
del gruppo: detto (η, χ) un quadri-vettore generico6 si ha (per trasformazioni di Galilei
′
speciali: x = x − vt)
′
I : η = η + v · χ,
′
χ =χ
oppure in alternativa
′
II : η = η,
′
χ = χ + ηv
Infatti
T˙ ′ = Ṫ + v · ∇T,
′
′
∇ T = ∇T
Un esempio di grandezze che seguono la seconda formula di trasformazione è la coppia
densità di massa, corrente di massa: (ρ, ρu).
Il prossimo esempio mostrerà che non sempre la formula di trasformazione è evidente.
1.4.4
L’equazione di Schrödinger
Nel caso della particella libera, l’equazione di Schrödinger che sostituisce la legge classica
E = p2 /2m, o v̇ = 0, è (con ℏ = 1)
i
6
∂Ψ
1 2
=−
∇Ψ
∂t
2m
(4.14)
Si ricordi che il gruppo agisce in uno spazio a quattro dimensioni.
14
L’invarianza per traslazioni e rotazioni è evidente se si definisce la trasformazione attiva
della funzione d’onda nel seguente modo7
′
Ψ (x, t) = Ψ(R−1 · (x − a), t − τ )
(4.15)
′
Si noti che l’applicazione Ψ → Ψ è unitaria rispetto al prodotto scalare
∫
(Ψ, Φ) =
Ψ(x)Φ(x) d3 x
R3
′
Consideriamo il boost x = x + vt. Ora la formula di trasformazione è più complicata:
con qualche calcolo si verifica facilmente che la nuova funzione d’onda
(
)
mv 2
′
Ψ (x, t) = exp −i
t + imv · x Ψ(x − vt, t)
(4.16)
2
′
soddisfa ancora l’equazione di Schrödinger e che la trasformazione Ψ(x, t) → Ψ (x, t) ≡
[T (v)Ψ](x, t) è unitaria. La mappa T (v) è una rappresentazione: T (v1 +v2 ) = T (v1 )T (v2 ).
E7: Si scriva la trasformazione passiva che corrisponde alla trasformazione attiva (4.16).
Suggerimento: una trasformazione attiva seguita da una passiva (o viceversa) producono
l’identità.
E8: Si scriva l’equazione di Schrödinger per due particelle identiche interagenti con un
potenziale del tipo (4.6) adattato a due particelle, e si verifichi la covarianza dell’equazione
generalizzando opportunamente la (4.16) per Ψ(x1 , x2 , t).
E9: Si aggiunga al secondo membro della (4.14) un termine di potenziale U (r)Ψ, r = |x|.
L’equazione è ancora covariante galileiana? Qual’è il gruppo manifesto di simmetria?
La formula di trasformazione (4.16) introduce una fase che dipende dalla velocità relativa.
È quindi interessante osservare che se fosse possibile misurare la fase relativa di due
particelle con masse diverse allora, effettuando un boost, si potrebbe misurare la velocità
relativa dei due sistemi inerziali. Per salvare la simmetria galileiana, o equivalentemente
il principio di relatività, si impone allora la regola di superselezione secondo la quale non
sarebbe possibile preparare combinazioni lineari di stati descriventi particelle con masse
diverse.
Osservazioni. La formula di trasformazione (4.16) sembra scritta ad hoc per avere la
covarianza dell’equazione di Schrödinger. Naturalmente il fatto notevole è che una tale
formula esista, e possiamo chiederci allora se non vi sia un modo sistematico per trovare
le formule di trasformazione in casi più complicati. La materia che si occupa di questi
problemi è una teoria matematica nota come teoria della rappresentazione dei gruppi. Essa
fornisce la classificazione delle formule di trasformazione possibili e determina il carattere
delle grandezze che si trasformano o, come si suol dire, lo spazio della rappresentazione.
7
′
′
′
La versione passiva è Ψ (x , t) = Ψ(x, t), dove x = R · x + a.
15
Gli esempi discussi sopra definiscono alcune rappresentazioni del gruppo di Galilei: la
prima opera sullo spazio vettoriale dei vettori di posizione delle particelle, la seconda e
la terza su campi vettoriali e scalari che dipendono dal tempo e la quarta sullo spazio di
Hilbert di una particella libera.
1.4.5
Il principio di relatività galileiano
Il fatto che le equazioni del moto siano identiche in tutti i sistemi di riferimento inerziali,
se le formule di trasformazione sono quelle di Galilei, è la versione matematicamente
precisa dell’affermazione euristica nota come principio di relatività galileiano, secondo
il quale le leggi della meccanica sono a priori indipendenti dai sistemi di riferimento
inerziali ai quali sono riferite. In particolare, non sarà possibile determinare la velocità
di un laboratorio installato in un SRI compiendovi esperimenti meccanici su sistemi isolati
(cioè disaccoppiati dal mondo esterno) e dunque non sarà nemmeno possibile, in questo
senso, determinare la velocità assoluta della terra (la velocità riferita allo spazio assoluto).
Il termine “a priori” significa “prima di ogni processo di misura”. È chiaro che la misura
di qualche effetto fisico può essere usata per discriminare sistemi di riferimento diversi.
′
E10: Si supponga che F sia uniformemente accelerato rispetto a F : si dimostri che le
′
equazioni del moto in F sono identiche alle equazioni che si userebbero in F in presenza
di un campo gravitazionale uniforme. Si può usare questa proprietà come argomento per
estendere il principio di relatività ai sistemi uniformemente accelerati?
1.5
Ottica non relativistica
Nuove opportunità e nuovi problemi sorgono in relazione ai fenomeni connessi con la propagazione della luce. Infatti le equazioni di Maxwell non hanno la proprietà di covarianza
richiesta dal principio di relatività galileiano, cioè non sono invarianti per trasformazioni
di Galilei. Per capirlo basta notare che la velocità di un impulso elettromagnetico dipende
dal sistema di riferimento, se vale la (4.1), mentre le equazioni di Maxwell predicono che
sia indipendente dal moto della sorgente e uguale alla costante universale c che compare
nelle equazioni stesse.
Lo stesso Maxwell pensava che le sue equazioni valessero in una classe limitata di sistemi
di riferimento, quelli in quiete rispetto al cosiddetto etere, una sostanza imponderabile
ed elastica presente nell’universo che si credeva propagasse la luce e rendesse possibili i
fenomeni elettromagnetici, alla stessa maniera che un gas è necessario per la propagazione
del suono.
Ma se è cosı̀ allora dovrebbe essere possibile misurare la velocità assoluta della terra,
perché il suo moto attraverso l’etere causerebbe un “drift” in grado di alterare la velocità
della luce a seconda della sua direzione di propagazione.
Ma se non sappiamo quali sono le equazioni elettromagnetiche in un riferimento mobile,
come si possono trattare i fenomeni elettromagnetici in un riferimento terrestre, in mo-
16
vimento rispetto all’etere? La maniera più semplice e diretta è determinare l’effetto del
gruppo di Galilei sulle caratteristiche di un’onda elettromagnetica piana.
1.5.1
onde piane e velocità di fase
Si consideri un’onda piana che si propaga nel piano z = 0, cioè il versore di propagazione
sia nel piano (x, y). Nel sistema di riferimento assoluto, F , dove l’etere è immobile, la
fase dell’onda è
(
)
(
x cos α + y sin α
r)
F(t, x, y) = ν t −
=ν t−
(5.1)
c
c
c è la velocità di fase, uguale in F alla velocità della luce nel vuoto, ν è la frequenza e
n = (cos α, sin α) è il versore che indica la direzione di propagazione. Espressa in funzione
′
′
delle coordinate del sistema inerziale F in moto rispetto a F , che sono x = x − vt,
′
′
y = y, t = t, la fase diventa
)
(
′
′
′
(x + vt ) cos α + y sin α
′
F(t, x, y) = ν t −
c
oppure, riordinando i termini,
(
′
′
′
′)
x cos α + y sin α
′
′
F(t, x, y) = ν t −
c′
dove
(
)
(
v
v · n)
′
ν = ν 1 − cos α = ν 1 −
c
c
(5.3)
′
c = c − v cos α = c − v · n
′
ν
ν
′
cos α = ′ cos α
c
c
(5.2)
(5.4)
′
ν
ν
′
sin α = ′ sin α
c
c
(5.5)
Un semplice argomento mostra che la fase è invariante (v. appendice A) cosicché F(t, x, y)
′
′
′
′
nella (5.2) è anche la fase in F . Questo significa semplicemente che ν , c e α sono
′
rispettivamente la frequenza, la velocità di fase e la direzione dell’onda in F . Dalle (5.5)
′
si ottiene subito α = α , mentre per la lunghezza d’onda si ha (diversamente che dal caso
relativistico)
′
′
′
1/λ = ν /c = ν/c = 1/λ
(5.6)
Introducendo il numero d’onde, k = (2π/λ)n, le (5.5) si compendiano nell’equazione
′
vettoriale k = k. Apparentemente, dunque, la teoria non predice aberrazione per la luce.
Ritorneremo sulla questione in seguito.
17
′
La (5.4) determina la velocità di fase nel sistema F , mentre la (5.3) mostra come si
′
trasforma la frequenza; entrambe dipendono dalla velocità assoluta di F , che può quin′
di essere determinata, in linea di principio, compiendo esperimenti ottici in F . Una
precisazione necessaria è che la velocità dei segnali elettromagnetici misurata in questi
esperimenti non è la velocità di fase, che è inosservabile, ma la velocità di gruppo.
E11. La luce proveniente dalla galassia di Andromenda (M31) ha uno spostamento verso il
blu (parte alta dello spettro) di una parte su 1000, cioè ∆ν/ν ≃ 0, 001. Con quale velocità
radiale si sta muovendo Andromeda rispetto a noi? E si avvicina o si allontana? Un
“gamma ray burst” recentemente osservato, il GRB090423, ha uno spostamento relativo
verso il rosso pari a 8, cioè la frequenza ricevuta è 1/9 di quella emessa. Se interpretiamo
lo spostamento come effetto Doppler con che velocità si allontana?
1.5.2
la velocità di gruppo
La velocità di gruppo compare quando si ha a che fare con pacchetti d’onde, sovrapposizioni lineari di onde elettromagnetiche piane con vettori d’onda e frequenze leggermente
diversi da un certo vettore d’onda medio. Si può determinare la velocità di gruppo con la
nota formula8
u=
∂ω
∂k
ω = 2πν
dove k = 2πλ−1 n e le derivate sono calcolate nel vettore d’onda medio. Usando la (5.3)
′
e k = k, si ottiene subito il teorema di addizione
′
u =u−v
u = |u| = c
(5.7)
che è identico al teorema di addizione delle velocità per le particelle di materia. Ponendo
′
′ ′
u = u e , si ottiene il modulo in funzione della direzione
′
′
′
u = −v · e + {(v · e )2 + c2 − v 2 }1/2
′
(5.8)
′
Dalla (5.7) si ha u ∧ v = u ∧ v e u · v = u · v − v 2 , ovvero9
′
′
u sin θ = u sin θ,
′
′
u cos θ = u cos θ − v
(5.9)
da cui la formula
′
tan θ =
sin θ
cos θ − v/u
(5.10)
Vediamo dunque che la frequenza, la velocità di fase e la velocità di gruppo della radiazione
elettromagnetica dipendono dalla velocità degli osservatori rispetto al sistema assoluto.
8
9
Un’abbreviazione per ux = ∂ω/∂kx , etc.
Ricordarsi che |a ∧ b| = ab sin θ e a · b = ab cos θ.
18
La direzione di propagazione e la lunghezza d’onda, invece, rimangono invariate. Vale
inoltre per la luce lo stesso teorema di addizione delle velocità che vale per le particelle
di materia. In particolare le formule (5.10) e (4.3) sono identiche, con le opportune
identificazioni (i.e. u al posto di c).
E12: Si usi la formula (5.10) per determinare l’angolo di incidenza della pioggia vista dal
finestrino di un treno in corsa, con un’assunzione ragionevole sul valore di θ. Cosa sono
in questo caso v e u? Conviene assumere che v/u ≪ 1?
E13: Per la luce stellare osservata dalla terra è probabile che v/c ≪ 1; dalla (5.10) si
′
ottenga una formula per θ − θ, valida al primo ordine in v/c.
1.5.3
La velocità della luce nei dielettrici trasparenti
In un dielettrico trasparente fermo nel sistema assoluto, la velocità della luce è c/n, dove
n > 1 è l’indice di rifrazione. Se però il dielettrico si muove rispetto all’etere, la velocità
di fase e la velocità di gruppo sono in generale diverse da c/n, sia rispetto al dielettrico
che rispetto al sistema assoluto.
Questo pose un problema che provocò molto dibattito tra gli scienziati ottocenteschi, in
parte perché la risposta dipende in modo essenziale dalle assunzioni che si possono fare
sul comportamento dell’etere in un mezzo in movimento.
Una semplice ipotesi era che l’interazione fra etere e materia fosse estremamente debole, se
non nulla, e che l’etere passasse dunque indisturbato attraverso la materia. Un’altra, forse
più ragionevole, era che il trascinamento fosse solo parziale (teoria di Fresnel). Conviene
allora trattare tutti i casi simultaneamente e assumere che la velocità dell’etere rispetto
al sistema assoluto F a causa del trascinamento sia
0≤f ≤1
w = f v,
essendo v la velocità assoluta del mezzo, misurata in F . Il parametro f si chiama “il
coefficiente di trascinamento” di Fresnel, il quale ne dava l’espressione
f =1−
1
n2
espressione che egli derivò dalla sua teoria elastica dell’etere. Il caso f = 1 era quello
che preferiva Stokes. Si noti però che f dipende dalla frequenza della luce, cosicché il
trascinamento dell’etere dipenderebbe anche dal suo “colore”.
Nel sistema Ff che si muove con velocità f v rispetto a F , l’etere è immobile e la velocità
di fase è c/n. Per la velocità di fase in F avremo quindi (dall’eq. (5.4))
c
c0 = + f v · n
(5.11)
n
e per la velocità di gruppo (teorema di addizione)
c
u = uf + f v
|uf | =
(5.12)
n
19
dove uf è la velocità di gruppo in Ff . Da qui si ricava
{
}1/2
c2
2 2
2
u = f v · e + (f v · e) + 2 − f v
n
(5.13)
dove e denota il versore della direzione di propagazione della luce, misurato in F . La
′
′
velocità di F rispetto a Ff è (1 − f )v, e dunque la velocità di fase in F è
′
c =
c
c
v·n
− (1 − f )v · n = − 2
n
n
n
(5.14)
La seconda eguaglianza vale se f ha il valore di Fresnel. Per la velocità di gruppo avremo,
analogamente,
′
u = uf −
v
n2
(5.15)
Le equazioni (5.12) e (5.15) riconfermano il teorema di addizione
′
u=u +v
(5.16)
′
′
Detto e il versore di propagazione in F , dalla (5.15) si ricava infine
{
}1/2
1
c2
v2
′
′
′ 2
−4
u = − 2 v · e + n (v · e ) + 2 − 4
n
n
n
(5.17)
Le formule (5.11), (5.13), (5.14), (5.16) e (5.17) risolvono il problema posto. Applicazioni
agli esperimenti saranno discusse più avanti. Al primo ordine nel parametro piccolo v/c
si ottengono le formule utili
(
)
c
1
u= + 1− 2 v·e
(5.18)
n
n
c
v·e
u = − 2
n
n
′
′
(5.19)
E14: Un raggio di luce si propaga all’interno di un tubo di acqua corrente, nel verso della
medesima. La velocità della corrente rispetto al sistema assoluto sia v: quanto vale la
′
velocità della luce nel sistema assoluto? E nel sistema F dove l’acqua è in quiete? E se
il verso di propagazione è opposto alla corrente? Se è ortogonale?
20
1.5.4
L’aberrazione e l’effetto Doppler
La formula (5.10)
′
tan θ =
sin θ
cos θ − v/c
(5.20)
′
connette la direzione di un raggio di luce misurata in un laboratorio terrestre F , con la
sua direzione assoluta (che in generale non si conosce).
′
La formula (5.3) connette invece la frequenza in F con la frequenza assoluta (che pure,
in generale, non è nota). In entrambi i casi però, le formule predicono effetti osservabili
di grande rilevanza pratica e concettuale.
Aberrazione stellare
Se la luce proviene da una stella lontana e se ciò che interessa è l’effetto di aberrazione
al primo ordine in v/c, allora si può supporre che la stella sia in quiete rispetto all’etere.
La direzione assoluta della stella è allora ϑ = π − θ e la direzione relativa (o apparente)
′
′
è ϑ = π − θ . La (5.20) diventa la formula dell’aberrazione stellare, dove, espandendo in
serie al primo ordine in v/c, si ha
′
tan ϑ =
sin ϑ
v tan ϑ
≃ tan ϑ −
cos ϑ + v/c
c cos ϑ
(5.21)
′
Ponendo δϑ = ϑ − ϑ ≪ 1 radianti10 (angolo di aberrazione) si ottiene, con buona
approssimazione,
δϑ = −
v
′
sin ϑ
c
in accordo con le prime osservazioni di Bradley (1727), e successive. Ora la velocità
′
della terra varia nel corso dell’anno, cioè ϑ dipende dal tempo, e dunque l’aberrazione è
osservabile e si manifesta come un moto annuale apparente delle stelle lungo piccole ellissi
′
di estensione angolare ∼ v sin θ /c (per una stella allo zenit si tratta di circa 41′′ ), dovuto
alla rivoluzione della terra intorno al sole. Si noti che l’aberrazione stellare non dipende
dalla distanza delle stelle (a differenza della parallasse, che pure è dovuta alla rivoluzione
terrestre) e che lo spostamento angolare della stella è nella direzione del moto della terra,
come avviene per la direzione della pioggia vista attraverso il finestrino di un treno in
corsa.
L’importanza dell’aberrazione per la relatività è dovuta al fatto che l’angolo di aberrazione non cambia se il telescopio è riempito d’acqua (Airy, 1871-73), mentre nella teoria
dell’etere secondo Lorentz questo è vero solamente al primo ordine in v/c (a causa del
10
1 rad = 57, 29o = 206.265′′ ; 1 arcsec = 0, 48 × 10−5 rad.
21
drift). In effetti il percorso della luce fra due punti dati è determinato dal principio di
Fermat, secondo il quale l’integrale curvilineo sui cammini γ(p, q) da p a q
∫
T (p, q) =
γ(p,q)
dσ
,
u′
′
v·e
c
u = − 2
n
n
′
′
assume un valore minimo sul cammino effettivamente percorso dalla luce. La velocità u
è quella ricavata dalla (5.19), e si vede che dipende esplicitamente dalla direzione e dalla
′
velocità assoluta della terra. Dal punto di vista della teoria della relatività, u = c/n
e le osservazioni di Airy sono la semplice conseguenza del fatto che un raggio incidente
normalmente sulla superficie di separazione di due dielettrici diversi non subisce rifrazione.
l’effetto Doppler
L’equazione (5.3) dell’effetto Doppler
(
v · n)
′
ν =ν 1−
c
non può essere sperimentalmente verificata se non si conosce la frequenza assoluta ν; quello
che si può fare è allora calcolare il rapporto, νo /ν1 , della frequenza di una sorgente avente
velocità assoluta vo con la frequenza rivelata da un detector avente velocità assoluta v1 ,
cosı́ da eliminare la frequenza incognita ν. Si ottiene
νo
1 − vo · n/c
(v1 − vo ) · n (v1 · n)(v1 − vo ) · n
−1=
−1=
+
+ ···
ν1
1 − v1 · n/c
c
c2
(5.22)
Si vede che al primo ordine in v/c questo rapporto dipende solo dalla proiezione della
velocità relativa, vr = vo − v1 , lungo la linea di vista, in accordo con la teoria della
relatività e con le osservazioni. Ma i termini successivi dello sviluppo in serie dipendono
dalle velocità assolute, che sono quindi misurabili in linea di principio. Storicamente, le
prime osservazioni di precisione furono eseguite da Ives e Stilwell (nel 1938, ma ad angolo
zero) e non confermano la (5.22), bensı́ la formula fornita dalla teoria della relatività.
Ironicamente, sembra che il reale intento dei due fisici fosse quello di screditare la teoria
della relatività.
1.6
Esperienze di fine secolo XIX
In base alle formule trovate, è possibile misurare la velocità della terra rispetto all’etere
′
se si riesce a misurare u in un laboratorio terrestre. Dei vari esperimenti di interferenza
progettati discuteremo brevemente e schematicamente quelli storici di Hoek, Fizeau e di
Michelson e Morley (MM), nonché gli effetti di aberrazione e lo spostamento Doppler
delle frequenze. I primi due non avevano la sensibilità necessaria per misurare i termini
quadratici in v/c (che è di ordine 10−4 per un esperimento terrestre), per cui è sufficiente
22
approssimare le (5.13) e (5.17) al primo ordine in v/c. Si ottengono facilmente le formule
(5.18) e (5.19), che riscriviamo per comodità
(
)
c
1
u= + 1− 2 v·e
n
n
′
c
v·e
u = − 2
n
n
Come vedremo, nella teoria della relatività la prima si ricava dalla cinematica relativistica
senza bisogno di introdurre l’etere (come fu notato da M. von Laue), mentre la seconda
′
diventa semplicemente u = c/n.
′
1.6.1
Hoek
L’esperimento di interferenza di Hoek (1868) è schematicamente rappresentato in Fig. [1]:
Figura 1.2: Esperimento di Hoek
L
2
S
1
T
F è una sorgente, T è l’interferometro e il tratto di lunghezza L contiene un dielettrico
trasparente (per esempio acqua) con indice di rifrazione n. Il raggio di luce si divide
in due raggi che percorrono il rettangolo in direzioni opposte e interferiscono in T . Si
suppone che la velocità dell’apparato rispetto al sistema assoluto sia parallela al braccio
orizzontale dell’interferometro raffigurato. Usando la (5.19) per calcolare i tempi t1 e t2
richiesti ai raggi per completare il giro dell’apparato, è facile ottenere
t1 − t2 =
L
nL
nL
L
−
+
−
c − v c + v c + v/n c − v/n
Al primo ordine in v/c si ottiene t1 − t2 = 0, in buon accordo con le osservazioni di Hoek.
Se al posto del valore di f dato da Fresnel avessimo usato f = 0 oppure f = 1 (l’ipotesi
23
di Stokes), il risultato sarebbe stato non nullo. L’esperimento elimina dunque questi due
casi e nello stesso tempo verifica la teoria di Fresnel. L’esperimento è anche in accordo
con il punto di vista relativistico, perché se la velocità della luce è c in tutti i riferimenti
inerziali e in ogni direzione (o c/n se è presente un dielettrico) allora il risultato nullo di
Hoek diventa ovvio.
Si noti comunque che l’indice di rifrazione dipende dalla frequenza (per il fenomeno della
dispersione), un fatto che richiederebbe l’introduzione di un’etere per ogni colore della luce. Le misure di precisione degli effetti del secondo ordine in v/c hanno comunque confermato la teoria della relatività, e la teoria di Fresnel è stata definitivamente
abbandonata.
1.6.2
Fizeau e Fresnel
È interessante osservare che la formula di Fresnel fu confermata anche da un esperimento
indipendente dovuto a Hyppolite Fizeau (1851, 1853). Questo esperimento è schematicamente rappresentato nella Fig. [2]: come sopra, F è una sorgente, T è l’interferometro e
nel tratto di lunghezza L vi è una forte corrente d’acqua con velocità v. Il raggio di luce
si divide in due raggi che percorrono il rettangolo in direzioni opposte e interferiscono in
T . Si suppone che la velocità dell’apparato rispetto al sistema assoluto sia parallela al
braccio orrizontale dell’interferometro. Rispetto alla figura di interferenza ottenuta con
acqua immobile, si ottiene un marcato spostamento delle frange.
Dall’esperienza di Hoek sappiamo che il moto dell’apparato rispetto all’etere non dà effetti
osservabili al primo ordine in v/c, perciò possiamo supporre che l’apparato sia in quiete nel
sistema assoluto. Possiamo usare in tal caso la (5.13), in cui v è semplicemente la velocità
dell’acqua rispetto all’etere. Si ottiene, con le notazioni usate sopra, lo spostamento di
fase
δF = ν(t1 − t2 ) =
2νLv 2
(n − 1) ∼ 2 × 10−6 (n2 − 1)Lv radians
c2
in accordo con le osservazioni di Fizeau.
L’esperimento determina la velocità della luce in un dielettrico in movimento, in accordo
con la (5.18), e dunque conferma la teoria di Fresnel se, come sopra, si ignorano i fenomeni dispersivi. Si noti che l’esperimento, con questa interpretazione, può essere usato
per misurare la velocità assoluta dell’acqua, piuttosto che la velocità della terra rispetto
all’etere, ma in realtà esso misura soltanto la velocità dell’acqua rispetto al laboratorio.
1.6.3
Michelson e Morley
Questo è il primo esperimento (1887) che misura effetti del secondo ordine in v/c. L’interferometro usato è schematizzato nella figura
Con la direzione indicata della velocità si ricava facilmente, usando la (5.8), il tempo
totale di andata e ritorno dei due raggi lungo i bracci dell’interferometro. Per i raggi uno
24
Figura 1.3: Esperimento di Fizeau
L
2
S
1
V
T
e due si ha, rispettivamente (si ricordi l’esercizio E4: qui i due nuotatori sono i raggi di
luce e la corrente è il drift dell’etere),
t∥ =
2Lv
,
− v2
c2
t⊥ = √
2L
− v2
c2
Da qui si deriva la differenza di fase
δF =
2Lν v 2
∼ 2 × 10−3 L rad = 0, 2 (L/1 m) rad
c c2
(6.1)
con precisione del secondo ordine in v/c. L’esperimento non ha rilevato spostamenti
significativi delle frange di interferenza in seguito alla rotatione dell’apparato, nonostante
Michelson e Morley fossero in grado di misurare spostamenti molto più piccoli di quello
previsto dall’Eq. (6.1). Più precisamente, la velocità della luce in due direzioni ortogonali
risultava identica entro un margine di ±5 Km/sec. In un esperimento del 1964 questo
margine è stato ridotto a ±1 Km/sec e, in tempi più recenti, praticamente a zero (ma
dipende dai punti di vista, v. più avanti).
1.6.4
Interpretazioni
(i) Per salvare la teoria dell’etere Lorentz e, indipendentemente, Fitzgerald proposero allora che il braccio dell’interferometro parallelo alla velocità
di traslazione della terra si
√
2
contraesse rispetto al braccio ortogonale del fattore 1 − v /c2 . Con questa ipotesi si
ha ovviamente t1 = t2 , e δF = 0. Non discutiamo qui i tentativi fatti, specialmente da
Lorentz, per derivare l’ipotesi della contrazione dalla teoria atomica della materia. La
formula della contrazione è infatti una semplice conseguenza cinematica delle trasformazioni di Lorentz, e in quanto tale non richiede ipotesi particolari sulla struttura della
25
Figura 1.4: Esperimento di Michelson-Morley
2
S
1
V
T
materia. Era opinione di Pauli, tuttavia, che non si dovesse rinunciare del tutto a una
tale spiegazione.
(ii) Un’altra interpretazione del risultato nullo di MM è supporre che la velocità della luce
sia uguale a c solo rispetto alla sorgente (come per i proiettili). Teorie di questo tipo,
dette emissive, sono però in difficoltà con il fenomeno dell’aberrazione stellare.
(iii) È anche interessante osservare come MM richieda la relatività del tempo. Si osservi
infatti l’esperimento da un sistema F rispetto al quale l’apparato si muove con velocità
v. Allora per i tempi di volo dei raggi si ottiene
ct1 =
2l1
,
1 − v 2 /c2
ct2 = √
2l2
1 − v 2 /c2
′
Se l0 è la lunghezza dei bracci nel√sistema di quiete F dell’apparato, per la contrazione
di Lorentz-Fitzgerald si ha l1 = l0 1 − v 2 /c2 , l2 = l0 ; dunque
2l2
ct1 = ct2 = √
1 − v 2 /c2
e si ha l’accordo con l’esperienza. Se si assume però che il tempo sia assoluto, che era il
punto di vista di Abraham11 , appare che un osservatore nel sistema di quiete misuri la
velocità della luce
√
′
c = c 1 − v 2 /c2
Secondo Einstein tuttavia, si deve ancora tenere conto della dilatazione del tempo, in base
′
′
alla quale per il tempo t in F si ha
√
′
t = t 1 − v 2 /c2
11
M. Abraham, Theorie der Elektrizität, Vol. 2, Leipzig 1908
26
′
′
cosicché infine ct1 = ct2 = 2l0 . Il punto di vista di Abraham è dunque in accordo con
l’esperienza di MM ma è in contrasto con il principio di relatività, a meno che non si
ammetta la dilatazione del tempo.
1.7
Esperienze moderne
A parte l’esperimento del ’64 (T. S. Jaseja et al., Phys. Rev. 133, A1221 (1964)), la
versione moderna dell’esperimento di MM usa frequenze di risonanza in cavità ottiche
criogeniche. Le frequenze di risonanza sono della forma νcav = nc/L, dove L è la lunghezza della cavità risonante e n = 1, 2, 3, . . . . Dunque una violazione dell’isotropia di
c, per esempio, può essere rivelata ruotando la cavità e misurando lo spostamento delle
frequenze. In questo modo si è stabilito il bound più preciso oggi noto12
∆cθ
< 10−15
c
dove
1
cθ /c = 1 + ( + δ − β)(v/c)2 sin2 θ + (β − α − 1)(v/c)2
2
parametrizza la dipendenza della velocità della luce dall’angolo tra la direzione di propagazione e la velocità dell’apparato rispetto al sistema assoluto (preferred ether frame),
nello schema di Mansouri-Sexl13 . In esperimenti recenti di Hills, Hall e Lipa et al.14 i
parametri α + 1/2, β − 1/2, δ risultano nulli a meno di una parte in 109 !
12
H. Müller, S. Herrmann, C. Braxmaier, S. Schiller and A. Peters, Phys. Rev. Lett. 91, 020401 (2003).
R. M. Mansouri and R. U. Sexl, Gen. Rel. Grav. 8, 515 (1977).
14
D. H. Hills and J. H. Hall, Phys. Rev. Lett. 64, 1697 (1990); J. A. Lipa, J. A. Nissen, S. Wang, D.
A. Stricker, and D. Avaloff, Phys. Rev. Lett. 90, 060403 (2003).
13
27
Capitolo 2
Le basi della relatività speciale
Il persistente fallimento dei tentativi di rilevare una qualsiasi influenza del moto della terra sulla propagazione della luce1 è ovviamente incompatibile con l’esistenza di un “etere
imponderabile” e conduce alla conclusione “altamente probabile, se non certa” (W. Pauli), che tutte le leggi della fisica, inclusa l’elettrodinamica, obbediscano al principio di
relatività.
2.1
Gli assiomi di Einstein
Fu A. Einstein che introdusse questo punto di vista relativistico moderno come il primo di
due assiomi, il secondo dei quali, “solo apparentemente incompatibile con il primo”, stabilisce inoltre che la velocità della luce sia la stessa in tutti i sistemi di riferimento inerziali.
A questo proposito, si può osservare che le equazioni di Maxwell predicono che la velocità
della radiazione elettromagnetica nel vuoto sia indipendente dal moto macroscopico della
sorgente, e l’esperimento di Michelson e Morley è compatibile con questo fatto con una
precisione del secondo ordine in v/c. L’astronomo de Sitter ha osservato che l’assenza di
immagini stellari multiple nei sistemi binari è un’elegante conferma di questo fatto.
Tuttavia essa potrebbe ancora dipendere da termini di ordine superiore in v/c, che sfuggono all’osservazione. È molto più semplice assumere, con Einstein, che la velocità della
luce nel vuoto sia del tutto indipendente dal moto della sorgente e dell’osservatore.
È interessante citare direttamente Einstein2
P1 Le leggi secondo le quali si modificano gli stati dei sistemi fisici sono
indipendenti dal fatto che questi cambiamenti di stato vengano riferiti all’uno
o all’altro di due sistemi di coordinate che si trovino in relativa reciproca
traslazione uniforme.
P2 ogni raggio di luce si muove nel sistema di coordinate “in quiete” con
la determinata velocità V , indipendente dal fatto che quel raggio di luce sia
1
Si ricordi che la precisione delle misure era del secondo ordine in v/c.
La traduzione è di P. Straneo, per il volume Cinquant’anni di Relatività, Ed. Giustine e Sansoni,
Firenze, 1955. Si veda anche la collezione di articoli in [2].
2
28
emesso da una sorgente in quiete, o da una sorgente in movimento (al giorno
d’oggi la V di Einstein si indica con c).
Da P1, nel sistema mobile in cui la sorgente è ferma la velocità è ancora c, cosicché si
potrebbe enunciare P2 nella versione equivalente
P3 la velocità della luce nel vuoto ha lo stesso valore in tutti i sistemi di
riferimento inerziali, in ogni direzione, tempo e luogo.
2.1.1
Osservazioni sui postulati
(i) Il principio di relatività P1 da solo non è sufficiente a determinare un gruppo univoco
di trasformazioni delle coordinate spazio-temporali. Infatti la meccanica newtoniana è
covariante rispetto al gruppo di Galilei, mentre la meccanica relativistica lo è rispetto al
gruppo di Lorentz.
Come ha mostrato Einstein però, gli assiomi P1 e P2 (o P3) sono sufficienti a determinare
il gruppo di simmetria senza bisogno di assumere valida in tutti i sistemi inerziali l’intera
teoria elettromagnetica di Maxwell, una semplificazione, questa, assai ragguardevole. Le
equazioni della meccanica invece, invarianti galileiane, dovranno essere riformulate in
modo tale da renderle compatibili con la nuova simmetria. La meccanica relativistica che
ne risulta differisce molto poco da quella newtoniana3 ma è indispensabile, per esempio,
a trattare le particelle veloci che viaggiano nei moderni acceleratori di particelle e alcuni
fenomeni di astrofisica relativistica, e ha collezionato numerose verifiche sperimentali.
(ii) Il carattere non ovvio del primo postulato, cioè del principio di relatività, si può
apprezzare considerando il fatto che, in base ad esso, il moto uniforme del centro di
massa dell’universo rispetto a un sistema qualunque non dovrebbe produrvi alcun effetto
osservabile. Evidentemente nessuno è in grado di verificare una simile asserzione e dunque,
se non vogliamo introdurre elementi metafisici nella meccanica, il principio di relatività
ha un preciso significato fisico solo per i sistemi isolati.
Il problema è quando si può dire che un sistema è isolato. L’esperienza mostra che per il
moto uniforme è sufficiente assumere che tutte le masse siano sufficientemente distanti, ma
che non può dirsi altrettanto per il moto accelerato. Nei sistemi accelerati appaiono infatti
campi di forza apparentemente privi di cause4 , e che per tale motivo Newton ricondusse
agli effetti dell’accelerazione assoluta, riferita cioè allo spazio assoluto. È assai probabile
che i campi inerziali dipendano invece dall’accelerazione rispetto “alla massa della terra
e degli altri corpi celesti” (espressione usata da Mach), la sola che ha significato fisico,
secondo Mach, e in ogni caso la sola che si può osservare.
(iii) Il ruolo principale dell’assioma P2, con il suo riferimento esplicito alla velocità della
luce, non è tanto quello di suggerire un ruolo speciale o privilegiato del campo EM in
natura, quanto quello di stabilire l’esistenza di una velocità limite insuperabile. Infatti dei
Le correzioni sono tutte di ordine v 2 /c2 , che è indubbiamente il motivo per cui non state scoperte
prima.
4
Quali, e dove, sarebbero le sorgenti?
3
29
due casi, che una velocità limite esista, o che non esista, solo il primo implica la simmetria
di Lorentz. Ma il valore della velocità limite, che proprio in virtù di tale proprietà deve
essere la stessa in tutti i sistemi di riferimento, non è fissato da questo argomento. Il
secondo postulato fissa precisamente questo valore, riconducendolo alla velocità della luce
nel vuoto.
Nel seguito ci proponiamo di determinare il gruppo di trasformazioni delle coordinate
spaziali e temporale che è in accordo con questo assioma, e di ripristinare cosı́ quel principio di relatività che nell’elettrodinamica di Maxwell-Lorentz sembrava perso. È un punto
centrale dell’analisi di Einstein che per fare questo è innanzitutto necessario definire in
maniera precisa come si determinano tali coordinate; si può infatti notare che le equazioni
della fisica, quali le equazioni del moto di Newton o le equazioni differenziali del campo
elettromagnetico, hanno un preciso significato fisico solo se le coordinate stesse sono precisamente definite. Ciò si ottiene dando alle coordinate spazio-temporali una definizione
di tipo operazionale, cioè data in termini di operazioni eseguibili in un laboratorio.
2.1.2
La definizione del tempo
Il problema spinoso è come confrontare il tempo di eventi che accadono in luoghi diversi.
Il problema sorge perché se le leggi fisiche sono locali e la velocità dei segnali è limitata, la
definizione del tempo comune a eventi in luoghi diversi necessita di una convenzione per
sincronizzare gli orologi. Ad esempio, per stabilire se due orologi identici separati da una
certa distanza indicano lo stesso tempo, si può inviare un raggio di luce dal primo verso
il secondo e regolare quest’ultimo in base al ritardo dovuto alla velocità di propagazione
finita del segnale. Ma questa procedura richiede ovviamente che si conosca il valore della
velocità della luce5 ; in altri termini, la velocità della luce deve essere nota se vogliamo
sincronizzare gli orologi, benché si richiedano orologi preventivamente sincronizzati per
determinare la velocità della luce. Anche il trasporto di un orologio da un punto all’altro
incontra la stessa difficoltà; per correggere i possibili effetti del trasporto, si deve disporre
di orologi preventivamente sincronizzati. I tempi degli eventi, pertanto, non possono
essere confrontati prima che si sia stabilita una procedura operativa per sincronizzare gli
orologi, ossia prima che si sia stabilito che cosa si intende per tempo comune a eventi
distanti.
Secondo il metodo di Einstein, il tempo comune di due eventi A e B può essere definito
quando si stabilisca, per definizione, che il tempo che la luce impiega per viaggiare da
A a B è uguale al tempo che impiega per tornare da B ad A. Quindi se il raggio parte
all’istante tA da A, giunge in B all’istante tB (misurato “vicino ” a B), e ritorna in A
′
all’istante tA (misurato vicino ad A), si avrà l’equazione6
′
tA − tB = tB − tA
(1.1)
5
Ricordiamo qui che la velocità della luce si può determinare con misure puramente elettromagnetiche.
′
′
un caso più generale si ha ponendo tA − tB = tB − tA , dove si assume che la partenza del segnale da
B non coincida necessariamente con il suo arrivo da A.
6
30
Diremo che i due orologi sono sincronizzati se questa relazione è valida. Con questo si è
innanzitutto definito un criterio per decidere quando due orologi distanti sono sı́ncroni, ma
non solo. Dall’uguaglianza dei tempi di andata e ritorno del segnale si deduce l’uguaglianza
della velocità della luce all’andata con la velocità della luce al ritorno, cioè, detta LAB la
distanza tra A e B, si ha
c=
LAB
LAB
= ′
tB − tA
tA − tB
(1.2)
Questo fatto non è dunque oggetto di verifica sperimentale. Con questo si assume però
che la velocità della luce sia la stessa per tutte le coppie di orologi sincronizzati, un dato
che non segue logicamente dalla definizione di Einstein. Si noti anche che la definizione
di Einstein non dipende dal valore numerico di c.
Segue anche dalla (1.2) che
c=
2LAB
tA − tA
(1.3)
′
anche se questa non è propriamente la definizione cinematica usuale della velocità. Tuttavia questa è la velocità della luce misurata in esperimenti a là Fizeau, e la (1.3) può
considerarsi un’acquisizione sperimentale. Dalla (1.2) si vede che se un segnale elettromagnetico parte da un orologio nel punto A al tempo tA , e arriva in B al tempo tB di un
orologio sincronizzato con A, si ha
tB = tA +
LAB
c
(1.4)
Volendo, si può usare questa relazione per regolare gli orologi, purché si conosca il valore
di c. Per questo la definizione originale di Einstein ci sembra quella logicamente più
semplice.
Se un raggio luminoso segue un percorso poligonale chiuso con lati li , si può misurare il
tempo di volo con un unico orologio; se
∑
li
c=
(1.5)
T
allora si può mostrare che un orologio in A è sincronizzato con orologi identici posti in B
e in C se e solo se questi sono sincronizzati tra loro. D’altronde la (1.5) può considerarsi
un’acquisizione sperimentale sin dai tempi di Fizeau, e il metodo di Einstein è quindi
libero da contraddizioni logiche.
Il tempo comune di eventi distanti è adesso definito da orologi sincronizzati posti nelle
immediate vicinanze degli eventi, trascurando l’inesattezza che deriva dal fatto che gli
orologi non coincidono esattamente con gli eventi; in particolare gli eventi A e B si
diranno simultanei (o contemporanei) se gli orologi suddetti indicano lo stesso tempo.
La procedura descritta deve essere applicata a tutti i sistemi di riferimento inerziali, con
gli orologi in quiete nei rispettivi sistemi. Ogni riferimento inerziale avrà quindi il suo
proprio tempo, definito da orologi sincronizzati che occupano posizioni fisse, e in tali
31
sistemi la velocità della luce risulterà per definizione costante, isotropa e numericamente
uguale a c. Non è detto, a priori, che questi tempi concordino per tutti gli osservatori
inerziali.
Osservazioni
Sin dall’inizio la procedura di sincronizzazione di Einstein è stata oggetto di analisi teoriche dettagliate, perché si riconosce in essa un certo grado di convenzionalità. Per gli
interessati, i lavori classici che analizzano questo grado di convenzionalità sono dovuti a
Robertson[10] e ai già citati Mansouri e Sexl[11]. L’aspetto più interessante dei lavori
di Robertson, Mansouri e Sexl è l’identificazione dei tre parametri delle trasformazioni
di coordinate che descrivono le varie convenzioni di sincronizzazione degli orologi. Si è
mostrato cosı̀ che esiste una sincronizzazione che mantiene il carattere assoluto della simultaneità, ma che tuttavia produce una teoria cinematicamente equivalente alla relatività
ristretta. Ovviamente si tratta di una definizione operativa differente della simultaneità.
In particolare, in quella teoria due raggi di luce emessi da eventi contemporanei secondo
la nuova definizione non si incontreranno nel punto di mezzo.
2.2
Le trasformazioni di Lorentz
Data la definizione del tempo in un sistema inerziale, passiamo ora a determinare il gruppo
di trasformazioni delle coordinate spazio-temporali che è in accordo con questa definizione
e con il principio di relatività.
2.2.1
Condizioni sulle trasformazioni
È conveniente introdurre la notazione xa , a ∈ {0, 1, 2, 3}, per indicare le coordinate, con
la corrispondenza x0 = ct, x1 = x, x2 = y, x3 = z. Le trasformazioni richieste devono
avere la proprietà di conservare i moti uniformi e dunque hanno la forma
′a
x =
3
∑
Lab xb + β a
(2.1)
a=0
La parte non omogenea descrive evidentemente le traslazioni di tempo e spazio, xa →
xa + β a , o anche,
′
t = t + β 0 /c,
′
x =x+β
che non cambiano la velocità relativa e sono anche simmetrie galileiane. Nel seguito considereremo solo le trasformazioni omogenee, corrispondenti fisicamente a trasformazioni
′
fra riferimenti con origini coincidenti al tempo comune t = t = 0.
L’assioma P 2 significa che l’equazione di un fronte d’onda sferico in F, cioè il cono di
equazione
−c2 (t − t0 )2 + (x − x0 )2 + (y − y0 )2 + (z − z0 )2 = 0
32
(2.2)
′
è la stessa che per il fronte d’onda in F ,
′
′
′
′
′
′
′
′
−c2 (t − t0 )2 + (x − x0 )2 + (y − y0 )2 + (z − z0 )2 = 0
(2.3)
e il problema è ora quello di trovare le trasformazioni di coordinate che hanno questa
proprietà. Ma con trasformazioni lineari, questo è possibile solo se (v. appendice)
′
′
′
′
′
′
′
′
−c2 (t − t0 )2 + (x − x0 )2 + (y − y0 )2 + (z − z0 )2
[
]
= λ2 −c2 (t − t0 )2 + (x − x0 )2 + (y − y0 )2 + (z − z0 )2
(2.4)
dove λ è in generale una funzione della matrice di trasformazione Lab . Applicando due
trasformazioni in successione, si ottiene anche7
′
′
λ(L)λ(L ) = λ(LL )
(2.5)
È conveniente scrivere la condizione di invarianza in forma concisa, nello spirito dell’Eq. (2.1). Introduciamo la matrice, detta metrica di Minkowski,


−1 0 0 0
 0 1 0 0 

(2.6)
ηab = 
 0 0 1 0 
0 0 0 1
La (2.4) si può scrivere nella forma
3
∑
′
′
′
′
ηab (x − x0 ) (x − x0 ) = λ
a
b
2
3
∑
ηab (x − x0 )a (x − x0 )b
(2.7)
a,b=0
a,b=0
Chiameremo l’espressione
∆s2 =
3
∑
ηab (x − x0 )a (x − x0 )b
(2.8)
a,b=0
l’intervallo spazio-temporale tra i due punti x e x0 ; diremo anche che ciascuno di essi
definisce le coordinate spazio-temporali di un evento.
Si può vedere che di tutte le trasformazioni lineari che soddisfano la (2.7), le dilatazioni,
o trasformazioni di scala,
′
x a = λxa ,
λ > 0,
sono le uniche per cui λ(L) ̸= 1. Per cominciare, la validità della (2.4) per tutti i punti è
possibile solo se
∑
(2.9)
ηab Lac Lbd = λ2 ηcd
a,b
7
Dal punto di vista matematico questa condizione definisce una rappresentazione irriducibile
unidimensionale del gruppo di simmetria.
33
Allora la matrice Λab = λ−1 Lab soddisfa la condizione di invarianza stretta, quella cioè con
λ = 1. In definitiva:∑ogni trasformazione lineare delle coordinate che preserva la forma
quadratica (x, y) = ab ηab xa y b a meno di un fattore di scala moltiplicativo, è della forma
′
x a = λΛab xb + β a
(2.10)
Le matrici Λab formano un gruppo di trasformazioni detto il gruppo di Lorentz; la sua
caratteristica è di lasciare invariata la forma quadratica, e dunque in particolare il cono
luce.
′
Oltre alle traslazioni spazio-temporali, x b = xb + ab , semplici trasformazioni che lasciano
invariato il cono luce sono le trasformazioni ortogonali delle coordinate (le familiari rotazioni), definite dalla condizione che in almeno un sistema di riferimento esse assumano la
forma
′i
x =
3
∑
Ri j xj ,
′
ct = ct
j=1
e le già citate trasformazioni di scala (dette anche dilatazioni), che come le rotazioni sono
lineari e omogenee ma non cambiano la velocità relativa dei sistemi di riferimento. Le
simmetrie di rotazione e traslazione corrispondono all’isotropia e omogeneità dello spazio,
e sono associate a importanti leggi di conservazione, sperimentalmente verificate. Le
trasformazioni di scala, invece, non sono simmetrie esatte delle leggi naturali8 .
Se λ e Λ fossero indipendenti allora L’Eq. (2.10) descriverebbe una dilatazione seguita da
una trasformazione di Lorentz (o viceversa). Resta aperta la possibilità che λ = λ(Λ),
′
′
nel qual caso λ(Λ)λ(Λ ) = λ(ΛΛ ); se Λ = R è una rotazione, nel senso che R00 = 1,
Ri0 = R0i = 0 e Rji è una matrice ortogonale, allora richiediamo senz’altro che λ(R) = 1:
per esempio, nel caso di una rotazione di angolo ϕ attorno all’asse z, la funzione λ(ϕ)
dovrebbe soddisfare λ(ϕ1 + ϕ2 ) = λ(ϕ1 ) + λ(ϕ2 ). L’unica possibilità è λ(ϕ) = exp(cϕ),
che però non è periodica. In effetti l’unica funzione reale continua λ(R) sul gruppo delle
rotazioni tale che λ(R1 R2 ) = λ(R1 )λ(R2 ) è il determinante, ma per le rotazioni det[R] = 1.
Il caso più generale sarà discusso nella prossima sezione9 .
2.2.2
Trasformazioni di Lorentz speciali, o boosts
Consideriamo il caso semplice di due riferimenti in moto relativo uniforme lungo l’asse
′
comune x, e coincidenti nell’istante iniziale t = t = 0. Usando la seguente proprietà delle
funzioni iperboliche,
(cosh ψ)2 − (sinh ψ)2 = 1
8
Occorre precisare che le dilatazioni non modificano le masse o le costanti di accoppiamento delle
interazioni, e che quindi non corrispondono a cambiamenti nelle unità di misura. L’invarianza di scala
è quindi possibile solo se tutte le masse sono nulle o formano uno spettro continuo, e le costanti di
accoppiamento sono numeri puri.
9
Vale la pena ricordare che anche per il gruppo di Lorentz vale l’affermazione che l’unica rappresentazione reale unidimensionale è quella triviale: λ(Λ) = 1. Questo renderebbe superflua ogni altra
discussione.
34
si verifica subito che la condizione di invarianza stretta (2.7) è soddisfatta da una “rotazione iperbolica” del tipo
′
ct = ct cosh ψ − x sinh ψ
(2.11)
′
x = −ct sinh ψ + x cosh ψ
′
(2.12)
′
y =y
z =z
(2.13)
′
′
La (2.13) significa che un moto lungo x in F viene trasformato in un moto lungo x in F e,
viceversa, può essere derivata richiedendo tale proprietà. Per determinare ψ osserviamo
′
′
che il punto x = 0, cioè l’origine di F , deve muoversi di moto uniforme con velocità
v = (v, 0, 0); questo determina
tanh ψ =
v
c
(2.14)
Il parametro ψ denota propriamente la rapidità della trasformazione, dato che ψ → ∞
per v → c. Inoltre tanh ψ ≤ 1 implica necessariamente v ≤ c. Che debba essere v < c si
vedrà tra poco. Si noti anche l’analogia formale con le rotazioni. Siccome
cosh2 ψ =
1
1 − tanh2 ψ
si ha poi
cosh ψ = √
1
1−
v 2 /c2
sinh ψ = √
,
v
1 − v 2 /c2
A questo punto, le trasformazioni di Lorentz speciali prendono la forma
′
x =√
x − vt
(2.15)
1 − v 2 /c2
t − vx/c2
′
t =√
1 − v 2 /c2
′
y =y
(2.16)
′
z =z
(2.17)
Il “fattore gamma”
1
γ=√
1 − v 2 /c2
(2.18)
35
2n
z }| {
è onnipresente in relatività; una regola utile è che se v/c = 0, 99999...9 ... allora γ ≃ 10n .
La matrice corrispondente10 è


γ
−vγ 0 0
 −vγ
γ
0 0 

L(v) = 
(2.19)
 0
0
1 0 
0
0
0 1
Ponendo momentaneamente γ ≡ γ(v) per indicare la dipendenza da v, è facile verificare
l’identità
(
′)
vv
′
γ(v)γ(v ) 1 + 2 = γ(w)
(2.20)
c
dove
′
v+v
w=
1 + vv ′ /c2
(2.21)
Questo significa che il prodotto di due trasformazioni di Lorentz collineari con velocità v
′
′
e v è una trasformazione di Lorentz con velocità w, cioè che L(v) · L(v ) = L(w).
′
Poniamo per semplicità di notazione λ(L(v)) = λ(v). Allora la (2.5) diventa, se anche v
è diretta secondo l’asse x,
′
λ(v)λ(v ) = λ(w)
e dato che λ(0) = 1, si deve avere λ(v)λ(−v) = 1. Sia Rπ una rotazione che inverte v:
Rπ v = −v. È facile vedere che L(−v) = Rπ L(v)Rπ (moltiplicate la matrice (2.19) per
quella che rappresenta Rπ ), e dunque che
λ(−v) = λ(Rπ )2 λ(v) = λ(v)
In conclusione si ha λ(v) = 1. Le formule inverse sono
′
′
x + vt
x= √
1 − v 2 /c2
y=y
′
′
z=z
(2.22)
′
(2.23)
′
t + vx /c2
t= √
1 − v 2 /c2
10
(2.24)
La numerazione di righe e colonne è nell’ordine 0, 1, 2, 3, ma certi autori usano invece 1, 2, 3, 0.
36
Figura 2.1: Sistemi in moto relativo uniforme
y
y’
v
x
x’
z
z’
Si noti che le trasformazioni di Lorentz si riducono a quelle di Galilei nel limite c → ∞.
Qui vediamo chiaramente la relatività della contemporaneità: in base a queste equazioni,
′
′
′
per due eventi simultanei (∆t = 0) ma separati spazialmente (∆x ̸= 0) in F , si ha
∆t =
v
∆x
c2
(2.25)
in F . Come anche nella simmetria galileiana, la coincidenza spaziale di eventi separati nel
tempo è relativa. Ma diversamente che dal caso galileiano, è relativa anche la coincidenza
temporale di eventi separati nello spazio. In relatività ristretta, solo alla coincidenza
spazio-temporale si può attribuire un carattere assoluto (cioè indipendente dal sistema di
coordinate).
Le trasformazioni di Lorentz speciali si possono scrivere in forma vettoriale
′
t = γ(t − v · x/c2 ),
′
x = x + (γ − 1)
1
γ=√
1 − v 2 /c2
x·v
v − γvt
v2
(2.26)
(2.27)
e valgono anche se la velocità relativa non è diretta lungo un asse cartesiano. Dato che
le formule dipendono solamente da v, si può pensare che definiscano una trasformazione
di Lorentz pura, senza rotazione. Si noti che vale ancora λ(v) = 1. Se i riferimenti F
′
e F sono∑
connessi da una rotazione R, come nella (3.3), allora nell’Eq. (2.27) occorre
′
′
sostituire 3j=1 Rij · xj al posto di xj .
37
2.2.3
La più generale trasformazione di Lorentz
Allo scopo di descrivere trasformazioni più generali, riprendiamo la metrica di Minkowski11
(2.6)


−1 0 0 0
 0 1 0 0 

ηab = 
 0 0 1 0 
0 0 0 1
Come abbiamo visto, si può scrivere l’intervallo spazio-temporale nella forma
2
∆s =
3
∑
ηab ∆xa ∆xb ,
∆xa = xa − xa0
(2.28)
a=0
Possiamo pensare alle grandezze xa e xa0 come alle coordinate di punti in uno spazio
vettoriale quadri-dimensionale detto spazio-tempo di Minkowski12 , o più semplicemente
spazio-tempo, i cui punti rappresentano gli eventi. L’espressione (2.28) definisce l’intervallo spazio-temporale tra due eventi, invariante di Lorentz. La formula (2.28) definisce
anche un prodotto scalare con metrica ηab , cioè la forma quadratica
(x, y) =
3
∑
ηab xa y b
(2.29)
a=0
è evidentemente bilineare e non degenere13 . Ma si noti che non è definita positiva. La
condizione di invarianza dell’intervallo prende la forma
3
∑
Λac Λbd ηcd = ηab
(2.30)
c,d=0
e identifica le trasformazioni di Lorentz come il gruppo delle isometrie della metrica ηab . Si
noti che la (2.30) implica det[Λ] = ±1. Si osservi anche che dalla (2.30) segue l’invarianza
del prodotto scalare
(x, y) = −x0 y 0 + x1 y 1 + x2 y 2 + x3 y 3
(2.31)
per ogni coppia di punti x, y. Vogliamo ora mostrare che le trasformazioni speciali discusse sopra essenzialmente esauriscono le trasformazioni di Lorentz. Consideriamo una
trasformazione di Lorentz generica
′a
x =
3
∑
Λab xb
a=0
11
Quanto segue è un piccola anticipazione del formalismo quadri-dimensionale.
Hermann Minkowski (1864-1909), a cui si deve la formulazione quadri-dimensionale della teoria della
relatività.
13
(x, y) = 0 per ogni y se e solo se x = 0.
12
38
e applichiamola al vettore14 ζ a = (1, 0, 0, 0), tale che (ζ, ζ) = −1. Si otterrà un vettore
della forma
Λ · ζ = (x, x)
dove −x2 + |x|2 = −1 perché le trasformazioni di Lorentz preservano il prodotto scalare.
Sia R una rotazione che riporta il vettore ottenuto lungo l’asse x,
R · Λ · ζ = (x, |x|, 0, 0)
Siccome |x| < x, possiamo porre u = c|x|/x < c e applicare il boost L(u); si trova
L(u) · R · Λ · ζ = (1, 0, 0, 0) = ζ
Segue da questo che L(u) · R · Λ ≡ R̄ è una rotazione spaziale. Dunque, poiché L(u)−1 =
L(u), si ha
Λ = R−1 · L(−u) · R̄
(2.32)
Si noti che questa trasformazione ha determinante 1. Vediamo da qui che la più generale
trasformazione di Lorentz propria (det Λ = 1) e ortocrona (Λ00 ≥ 1) è il prodotto di due
rotazioni con una trasformazioni di Lorentz speciale.
Possiamo ora completare la dimostrazione del fatto accennato che λ(Λ) = 1 è l’unico
fattore di scala ammesso: sappiamo che λ(R) = 1 per le rotazioni, e abbiamo visto sopra
che λ(L(u)) = 1 anche per i boosts. Dunque
′
′
λ(Λ) = λ(R−1 · L(−u) · R ) = λ(R−1 )λ(L(−u))λ(R ) = 1
E15: Perché una trasformazione di Lorentz che preserva ζ deve essere una rotazione?
2.3
Lunghezze e intervalli di tempo
Dalle trasformazioni di Lorentz (2.15), ((2.17)), ((2.16)), si ricava che un regolo (asta rigida) in moto con velocità v in un riferimento F , avente lunghezza propria L0 (la lunghezza
′
nel riferimento F nel quale il regolo è in quiete), ha lunghezza
√
v2
L = L0 1 − 2
(3.1)
c
se misurata inF . Il risultato dipende dalle trasformazioni di Lorentz e dal fatto che la
misura di L richiede che le posizioni degli estremi del regolo siano determinate simultaneamente in F . Allora dalla prima delle (2.15) segue che per eventi simultanei in F (∆t = 0)
′
si ha L0 = ∆x = γ∆x = γL. Si può anche calcolare direttamente ∆x: in questo caso
′
′
∆x = γ(∆x − v∆t )
14
che rappresenta un secondo-luce trascorso nell’origine delle coordinate.
39
′
Ma eventi simultanei in F non lo sono in F , e infatti si ha
v
′
′
∆t = 2 ∆x
c
′
Eliminando ∆t si riottiene la (3.1). Vediamo che la formula della contrazione dipende solo
dalla simmetria di Lorentz e non richiede alcuna ipotesi sulla struttura della materia. Essa
si deve considerare come una proprietà elementare del gruppo di Lorentz non deducibile
da concetti più elementari.
Per le applicazioni è necessario estendere la formula della contrazione ai moti accelerati,
ma per questo serve la seguente assunzione addizionale: la lunghezza di un elemento dℓ
di lunghezza è connesso all’elemento di lunghezza proprio dℓ
√0 , misurato nel SI momentaneamente in quiete col regolo, dalla formula (3.1): dℓ = 1 − v 2 /c2 dℓ0 . Dunque, per
esempio, dal punto di vista dell’equipaggio di un’astronave che viaggia dalla terra verso
Vega (a 26 anni luce) in linea retta, con velocità v(x) misurata in anni-luce/anno, la
distanza percorsa sarà
∫ 26 √
L (anni − luce) =
1 − v(x)2 dx
0
Se il moto è iperbolico (v. più avanti) si ha
razione misurata15 in anni-luce/anni2
√
1 − v(x)2 = (1 + gx)−1 , dove g è l’accele-
E16: Si calcoli la distanza per raggiungere Vega se g è l’accelerazione di gravità terrestre,
circa 9, 8 m/s2 .
E17: Si mostri che la lunghezza di un regolo mobile posto “di traverso” alla direzione del
moto è data dalla formula
L= √
L0 γ −1
1 − β 2 sin2 θ
dove θ è l’angolo del regolo con la direzione del moto.
L’assunzione fatta poggia la ragione sul fatto che è sempre possibile, in linea di principio,
correggere gli effetti dell’accelerazione sui regoli, e nessun esperimento noto la contraddice. Naturalmente, accelerazioni troppo elevate non possono essere applicate a oggetti
macroscopici per ragioni strutturali.
Simili considerazioni si possono fare riguardo al comportamento di orologi in movimento.
In tal caso l’intervallo di tempo proprio τ (il tempo indicato dall’orologio nel suo sistema
di quiete) è connesso all’intervallo T misurato in F dalla formula
√
v2
τ =T 1− 2
(3.2)
c
dove v è la velocità dell’orologio in F . Infatti, dalla seconda delle (2.16), segue che per
′
eventi spazialmente coincidenti in F (le posizioni successive delle lancette dell’orologio
15
Per esempio, se g = 980 cm/sec2 è la gravità terrestre si ha g = 1, 028 anni − luce/anni2 .
40
′
′
fermo in F ), si ha T = γT ≡ τ . Si vede da qui che l’orologio in movimento ritarda
rispetto agli orologi in quiete.
Come per i regoli, anche per gli orologi faremo l’assunzione extra che gli effetti dell’accelerazione si possano correggere. Il tempo proprio di un orologio in movimento lungo una
curva arbitraria si calcola allora con l’integrale
∫ T√
τ=
1 − v(t)2 /c2 dt
(3.3)
0
I limiti di integrazione si possono ovviamente cambiare. Per esempio, nel moto iperbolico
si ha
gt
v(t) = √
1 + g 2 t2 /c2
E17: Si calcoli il τ per raggiungere Vega se g è l’accelerazione di gravità terrestre, circa
9, 8 m/s2 . Che valore si deve prendere per T ?
Nota- Non discutiamo qui le verifiche sperimentali della formula importante (3.2), in
quanto le innumerevoli verifiche sperimentali dell’invarianza di Lorentz oggi disponibili
sono anche una verifica della dilatazione temporale e della contrazione delle lunghezze (che,
peraltro, non è mai stata osservata direttamente, cioè mediante regoli in moto). Tuttavia
la (3.2) ha un’applicazione immediata alla vita media delle particelle elementari instabili:
la vita media di particelle veloci si allunga del fattore γ. Per questo i muoni prodotti
negli strati alti dell’atmosfera dall’urto con i raggi cosmici arrivano a terra nonostante la
breve vita media di circa 2, 2 µs. La formula relativistica è stata confermata osservando
il decadimento di muoni ultra-relativistici, aventi γ ≃ 30 (con che velocità si spostano i
muoni con tale γ?), negli anelli di accumulazione del CERN, con precisione di livello 10−3 .
2.4
L’addizione delle velocità
La traiettoria di una particella in moto è descritta in F dalla funzione vettoriale x(t), e
′
′
′
in F da x (t ). Dalle trasformazioni di Lorentz si ricava facilmente
√
√
2
v2
u y 1 − c2
uz 1 − vc2
ux − v
′
′
′
,
uy =
,
uz =
(4.1)
ux =
1 − ux v/c2
1 − ux v/c2
1 − ux v/c2
In forma vettoriale
′
u =
u + (γ − 1)(u · v)v/v 2 − γv
γ(1 − u · v/c2 )
′
(4.2)
′
u + (γ − 1)(u · v)v/v 2 + γv
u=
γ(1 + u′ · v/c2 )
(4.3)
41
′
Orientiamo l’asse z in modo tale che uz = 0. Allora anche uz = 0 e dalla (4.1) segue
√
sin θ 1 − v 2 /c2
′
tan θ =
(4.4)
cos θ − v/u
Dalla (4.2) si trova
(
)1/2 (
)−1
v
v2 v2
uv
2
u = u 1 − 2 cos θ + 2 − 2 sin θ
1 − 2 cos θ
u
u
c
c
′
dove θ è l’angolo fra u e v. Introducendo il versore e nella direzione di u, e risolvendo
rispetto ad u, si ottiene la formula
√
[
′
′
′
′ ]1/2 ′
v · e(1 − u 2 /c2 ) + 1 − v 2 /u 2 + (1 − u 2 /c2 )(v · e)2 /u 2
u 1 − v 2 /c2
u=
(4.5)
1 − v 2 /c2 + (1 − u′ 2 /c2 )(v · e/c)2
′
Si noti che u = c se e solo se u = c, indipendentemente dalla direzione del moto.
′
Presentano interesse le formule di trasformazione dell’accelerazione nel caso che F sia
un sistema momentaneamente in quiete con la particella; differenziando le (4.1) nelle
′
′
′
componenti della velocità e ponendo successivamente ux = uy = uz = 0 e v = u, si
ottengono facilmente le formule volute
′
ax = (1 − β 2 )3/2 ax ,
′
ay = (1 − β 2 )ay ,
′
′
′
az = (1 − β 2 )az
(4.6)
′
dove β = u/c, ax = dux /dt, ax = dux /dt , eccetera. In forma vettoriale
(√
) a′ · u
2
a = (1 − β )a + (1 − β )
1−β −1
u
u2
2
′
2
(4.7)
Si possono scrivere le (4.6) nella forma suggestiva
(
)
d
u
′
√
=a
dt
1 − u2 /c2
′
Nel sistema istantaneamente in quiete vale la meccanica newtoniana cosicché a = F/m,
dove F è la forza, e la formula suggerisce allora che la definizione appropriata della quantità
di moto in relatività sia
mu
p= √
1 − u2 /c2
dove m è la massa a riposo della particella; ritorneremo sulla questione in seguito.
42
2.5
La luce nei dielettrici trasparenti
Usando le formule di trasformazione di Lorentz e la costanza di c nella condizione di invarianza della fase di un onda elettromagnetica piana, si trovano le formule di trasformazione
delle caratteristiche dell’onda valide nella teoria della relatività
1 − v cos θ/c
cos θ − v/c
′
′
′
′
′
ν =ν √
,
ν cos θ = ν √
,
ν sin θ = ν sin θ
(5.1)
2
2
2
2
1 − v /c
1 − v /c
′
′
dove θ e θ danno la direzione della normale all’onda in F e F rispettivamente. Si vede
che
√
sin θ 1 − v 2 /c2
′
tan θ =
(5.2)
cos θ − v/c
Questa formula è identica alla (4.4), dove si ponga u = c; cioè la direzione dei raggi di
luce si trasforma nello stesso modo della normale ai fronti d’onda, diversamente che nella
teoria dell’etere.
Se si introduce il vettore numero d’onde, k = (2πν/c)n, e si pone k 0 = 2πν/c, le formule
scritte indicano che le quattro grandezze (k 0 , kx , ky , kz ) si trasformano come le componenti
del vettore posizione di un evento, (x0 , x, y, z), dove si è posto x0 = ct. Infatti si può
scrivere la fase dell’onda nella forma
F = −k 0 x0 + kx x + ky y + kz z
da cui discende subito che F sarà invariante precisamente se le componenti k 0 e k si
trasformano come le componenti del vettore posizione x0 , x.
La velocità di gruppo, u, segue dalle formule scritte se si rammenta che
u=
∂ω
∂k
ω = 2πν
Con un calcoletto un pò più lungo che nel caso non relativistico, si ottiene
√
√
uy 1 − v 2 /c2
uz 1 − v 2 /c2
ux − v
′
′
′
ux =
,
uy =
,
uz =
1 − ux v/c2
1 − ux v/c2
1 − ux v/c2
cioè la stessa legge di composizione delle velocità che è valida per le particelle di massa
′
finita. Per un mezzo trasparente in quiete in F con indice di rifrazione n, la velocità
′
della luce in F è data dalla formula (4.5) con u = c/n, cioè
√
1/2
v · e(1 − 1/n2 ) + 1 − v 2 /c2 [1 − n2 v 2 /c2 + (1 − 1/n2 )(v · e)2 n2 /c2 ] c/n
u=
1 − v 2 /c2 + (1 − 1/n2 )(v · e/c)2
Al primo ordine in v/c si ritrova la formula di Fresnel (5.18)
(
)
c
1
u= + 1− 2 v·e
n
n
qui ottenuta senza fare ricorso all’ipotesi dell’etere.
43
2.5.1
Effetto Doppler e aberrazione secondo la relatività
′
L’effetto Doppler è contenuto nella (5.1): se la sorgente è in F , allora θ è l’angolo tra
la direzione del moto della sorgente e la direzione della luce in F e v cos θ = −vr , dove
vr è considerata positiva se la sorgente si allontana dall’osservatore. Si ottiene allora la
formula relativistica
√
1 − v 2 /c2
′
ν=ν
(5.3)
1 + vr /c
Si noti che secondo questa formula c’è un effetto Doppler anche quando vr = 0, ossia per
un puro moto trasverso.
L’aberrazione è contenuta nella (5.2) ( o nella (4.4), con u = c), valida per ogni coppia
′
di riferimenti inerziali. In particolare, se F è il sistema di quiete della sorgente e F
rappresenta un laboratorio terrestre nel suo moto attorno al sole, la direzione del raggio
′
′
′
in F è ϑ = π − θ, in F è ϑ = π − θ e dalla (5.2) si ottiene (A. Einstein, 1905)
√
sin ϑ 1 − v 2 /c2
′
tan ϑ =
(5.4)
cos ϑ + v/c
′
Introducendo l’angolo di aberrazione δϑ = ϑ − ϑ, al primo ordine in v/c si ha
v
δϑ = − sin ϑ
c
La discussione dell’aberrazione in relatività si è rivelata una questione assai delicata,
nonostante l’apparente semplicità del fenomeno. Ad esempio, la formula (5.4) si può
applicare ad una coppia qualsiasi di sistemi inerziali; si può allora notare che l’aberrazione
′
dipende solo dalla velocità relativa di F ed F , ed è quindi indipendente dalla velocità
′
della sorgente in F o in F . In ogni caso, se si riserva la designazione di aberrazione
stellare allo spostamento angolare delle stelle osservato dalla terra (il fenomeno osservato
e quantificato per la prima volta da Bradley) allora l’effetto si può certamente attribuire
al moto della terra rispetto alle sorgenti. Da questo punto di vista si può osservare che
l’aberrazione fornisce una prova diretta del moto della terra attorno al sole.
L’aberrazione diventa ovviamente significativa per velocità prossime a quella della luce.
Per esempio, in una ipotetica nave spaziale che viaggiasse attraverso la galassia con velocità prossima a c, tutte le stelle apparirebbero concentrate attorno alla direzione del moto
dell’astronave, e il resto del cielo sarebbe buio; si avrebbe inoltre una grande intensità
luminosa ultravioletta proveniente dalla direzione del moto, a causa dello spostamento
verso il blu della radiazione.
2.5.2
Onde di materia
È interessante ottenere il comportamento di onde diverse da quelle elettromagnetiche,
come ad esempio le onde di materia della teoria quantistica. La fase si scrive
(
)
x cos α + y sin α
F (t, x, y) = ν t −
w
44
dove w è la nuova velocità di fase. Dall’invarianza della fase si ottengono le formule di
facile dimostrazione
1 − v cos α/w
′
ν =ν √
,
1 − v 2 /c2
′
ν
ν cos α − vw/c2
′
√
cos
α
=
,
w′
w
1 − v 2 /c2
′
′
ν
ν
′
sin α
′ sin α =
w
w
′
dove come al solito α e α danno la direzione della normale all’onda in F e F rispettivamente. Si vede che
√
sin α 1 − v 2 /c2
′
tan α =
(5.5)
cos α − vw/c2
(
)−1/2
v2
2vw
v 2 w2
2
w = 1 − 2 sin α − 2 cos α + 4
(w − v cos α)
c
c
c
′
(5.6)
In base alla (5.5) una tale onda ha la stessa aberrazione di una particella con velocità
u=
c2
w
(5.7)
Questo fatto fu notato da De Broglie che ne diede la seguente semplice interpretazione
fisica: se si vuole che E = ℏω e p = ℏk allora
w=
ω
E
c2
=
=
|k|
|p|
u
perché in relatività (come vedremo) E = γmc2 e p = γmu.
45
Capitolo 3
Formalismo quadridimensionale ed
equazioni invarianti
Come abbiamo anticipato, le quattro coordinate di un evento in un sistema di riferimento
′
inerziale identificano un punto dello spazio-tempo. Ad ogni sistema F , F ,. . . , è associato
′
il proprio sistema di coordinate {xa }, {x a }, . . . , per mezzo del quale si possono identificare gli eventi, e le trasformazioni di Lorentz sono allora interpretabili come applicazioni
lineari operanti sullo spazio di Minkowski. Si noti che i quattro numeri xa , a ∈ {0, 1, 2, 3},
definiscono ciò che in algebra si chiama un quadri-vettore, o più semplicemente un vettore. È tipico delle componenti dei vettori trasformarsi linearmente per effetto di una
“rotazione” dei vettori di base. Nel seguito, useremo alcune lettere della parte centrale
dell’alfabeto latino, quali i, k, j, l, m, n, . . . , per indicare le componenti spaziali dei vettori.
Le lettere a, b, c, d, . . . denotano indici quadri-dimensionali.
Sottolineiamo il fatto essenziale che le coordinate devono essere definite operativamente.
Ad esempio, il tempo di ogni evento è indicato da un orologio “vicino” all’evento e sincronizzato agli altri orologi dalla procedura indicata precedentemente, mediante l’invio di
segnali elettromagnetici. Non è affatto scontato che lo spazio-tempo, inteso come l’insieme di tutti gli eventi, abbia la struttura di spazio vettoriale caratteristica della relatività
speciale, nè questa struttura deriva logicamente dalla sua definizione euristica di “insieme
di tutti gli eventi”. Tuttavia questo è ciò che si osserva localmente.
3.1
Prodotto scalare
Abbiamo anche visto che le trasformazioni di Lorentz non cambiano il valore della forma
quadratica (x0 = ct) che rappresenta l’intervallo spazio-temporale tra due eventi
Ds = −(x − y ) +
2
0
0 2
3
∑
(xi − y i )2
(1.1)
i=1
46
Indicheremo il secondo membro di questa equazione con la notazione propria delle forme
bilineari, (x − y, x − y), dove
(x, y) = (y, x) = −x0 y 0 +
3
∑
xj y j
j=1
Si ha allora
(x − y, x − y) = (x, x) + (y, y) − 2(x, y)
Usando la metrica diagonale ηab = ηba , tale che η00 = −1, ηik = δik , si può scrivere
(x, y) =
3
∑
ηab xa y b
(1.2)
a,b=0
Questa forma quadratica bilineare definisce nello spazio di Minkowski un prodotto scalare
non degenere, che però non è definito positivo. Per analogia con il caso euclideo, ηab si
chiama il tensore metrico o, più semplicemente, la metrica di Minkowski. Si noti che
mentre l’indice di xa è (convenzionalmente) posto in alto, gli indici della metrica sono
in basso; la ratio è nel fatto che la forma (x, y) è invariante di Lorentz, e diverrà chiara
quando discuteremo gli invarianti. En passant, gli indici in alto si dicono “controvarianti”,
quelli in basso “covarianti”.
Nel seguito faremo uso della convenzione di Einstein degli indici ripetuti, secondo la
quale in un prodotto in cui figurano coppie di indici uguali, uno controvariante e l’altro
covariante, si sottintende che siano sommati sui loro valori 0, 1, 2, 3. Per esempio, la (1.2)
si scriverà più semplicemente nella forma
(x, y) = ηab xa xb
Infine useremo unità di misura in cui c = 1 e adimensionale, salvo avviso contrario. Per
esempio, la luce si sposta di 30 centimetri in un nanosecondo, quindi prendendo come
unità di tempo il nanosecondo (ns), e di spazio 30 cm (chiamiamolo nanospazio, o nsp),
si avrà che c = 1 nsp/ns, ma si noti che c non è adimensionale. Se invece stipuliamo che
1 sec = 2, 998 × 1010 cm si ha ancora c = 1, ma ora c è un numero puro.
3.2
Gruppo di Lorentz
Come abbiamo ricordato sopra, le trasformazioni di Lorentz lasciano invariato l’intervallo
spazio-temporale. Possiamo quindi definire queste trasformazioni come elementi del gruppo delle isometrie dello spazio di Minkowski, gruppo che indicheremo semplicemente con
il simbolo L. In altri termini, si tratta di trasformazioni di coordinate lineari e omogenee
′
xa → x a = Λab xb
(2.1)
47
che preservano il prodotto scalare
(Λx, Λy) = (x, y)
Essendo non degenere, questo è possibile se e solo se
ηab Λac Λbd = ηcd
(2.2)
Valgono le seguenti proprietà elementari:
• le trasformazioni di Lorentz formano un gruppo di dimensione sei: le (2.2) sono un
sistema di 10 equazioni per 16 variabili.
• det Λ = ±1 per ogni Λ ∈ L
• gli elementi con determinante uguale a uno formano il sottogruppo proprio, indicato
con L+ . Le inversioni, (x0 , x) → (x0 , −x), e (x0 , x) → (−x0 , x), non sono dunque
in L+ , ma l’inversione completa (x0 , x) → (−x0 , −x) si.
• la componente 00 della (2.2) implica |Λ00 | ≥ 1; le matrici con Λ00 ≥ 1 e det Λ = 1
formano il sottogruppo proprio ortocrono, indicato con L↑+ . Le trasformazioni con
Λ00 ≤ −1 invertono l’ordinamento temporale degli eventi, le trasformazioni proprie
ortocrone invece lo preservano1 . Quindi l’affermazione che un evento p è nel futuro
di un altro evento q è invariante per trasformazioni di Lorentz proprie ortocrone.
È questo un fatto molto importante, perché senza di esso non si potrebbe dare un
significato invariante alla causalità.
• (Λ−1 )ca ηbc = ηac Λcb , che è ovvia.
3.3
Tensori e campi di tensori
Dal punto di vista matematico, la metrica è un esempio di tensore covariante simmetrico
di rango due (per dire ha due indici posti in basso, o pedici), mentre le coordinate di un
evento sono un esempio di tensore controvariante di rango uno (un solo indice posto in
alto, o apice), detto più semplicemente quadrivettore.
3.3.1
tensori algebrici
Più in generale, dato un sistema di coordinate inerziali (F , xa ), possiamo definire un
tensore controvariante di rango n assegnando l’insieme delle sue 4n componenti K a1 ...an ,
ai ∈ {0, 1, 2, 3}, insieme con una “legge di trasformazione” che permetta di calcolare le
nuove componenti se si passa a nuove coordinate con una trasformazione di Lorentz. La
definizione è la seguente:
′
se x a = Λab xb
1
′
allora K a1 ...an = Λab11 · · · Λabnn K b1 ...bn
L’inversione dell’ordine temporale di eventi causalmente disgiunti è invece possibile.
48
(3.1)
′
Il significato fisico della trasformazione di K in K è evidente: la formula (3.1) permette di
′
calcolare le componenti del tensore nel sistema di riferimento inerziale F con le coordinate
′
x a = Λab xb se sono date le componenti dello stesso tensore in F . Nel contesto della
relatività ristretta tali oggetti si chiamano anche tensori di universo. Si vede che i tensori
si trasformano come il prodotto delle componenti di n vettori controvarianti. Per esempio,
dati due vettori x e y, l’oggetto K = x ⊗ y, definito dalle componenti K ab = xa y b + xb y a ,
è un tensore di rango due con la proprietà aggiuntiva di essere simmetrico: K ab = K ba .
In modo analogo si definiscono i tensori covarianti Ka1 ...am , caratterizzati dalle regole di
trasformazione
′
Ka1 ...am = (Λ−1 )ba11 · · · (Λ−1 )bamm Kb1 ...bm
(3.2)
e i tensori misti di tipo [n, m], aventi n indici posizionati in alto e m posizionati in basso.
Alcuni esempi sono: il tensore unità, con componenti δba uguali a uno se a = b e zero
altrimenti, il tensore η ab definito dalla relazione (ricordarsi che è sottintesa la sommatoria
sui valori dell’indice ripetuto b)
η ab ηbc = δca
e che si potrebbe chiamare la metrica inversa. Questi tensori hanno la proprietà speciale di
′
′
essere invarianti sotto l’azione del gruppo di Lorentz, cioè δba = δba e η ab = η ab . Un altro
tensore speciale è il tensore completamente antisimmetrico eabcd , uguale a +1 se {a, b, c, d}
è un permutazione pari di {1, 2, 3, 0}, e a −1 se è una permutazione dispari. Infatti
Λaα Λbβ Λcγ Λdδ eabcd = det Λ eαβγδ
mostra che eabcd è un tensore invariante rispetto alle trasformazioni di Lorentz proprie
(det Λ = 1).
Da un punto di vista matematico moderno, uno spazio di tensori è uno spazio vettoriale
che trasporta una rappresentazione lineare del gruppo di Lorentz.
La metrica inversa stabilisce un isomorfismo tra i tensori covarianti e controvarianti, mediante l’operazione di “innalzamento e abbassamento degli indici”; ad esempio, per un
quadrivettore si ha
v a = η ab vb
va = ηab v b
La (2.2) e l’invarianza di ηab implicano subito la consistenza di queste formule con la
definizione dei tensori covarianti e controvarianti. In particolare, è facile verificare che
η ab = η ac η bd ηcd
L’insieme dei tensori di un dato tipo (covariante, controvariante o misto) forma in modo
naturale uno spazio vettoriale. Esistono però altre due operazioni importanti che si possono fare con i tensori: la contrazione su due indici mappa un tensore di rango [n, m] in
uno di rango [n − 1, m − 1] mediante la formula
...ak ...an
...a...an
Kba11...b
→ Kba11...a...b
m
j ...bm
(3.3)
49
Per un tensore di rango due, la contrazione si chiama traccia
Kba → Kaa = η ab Kab = ηab K ab
e il risultato è un’invariante di Lorentz. L’altra operazione binaria è il prodotto tensoriale,
che converte due tensori di rango [k, l] e [n, m] nel tensore di rango [k + n, l + m] dato
dalla formula naturale
...ak c1 ...cn
...ak c1 ...cn
(K · T )ab11...b
= Kba11...b
Td1 ...dm
l d1 ...dm
l
(3.4)
Si noti che il prodotto è associativo ma non commutativo. È anche utile osservare che i
sottospazi dei tensori simmetrici con traccia zero, e dei tensori completamente antisimmetrici, sono invarianti per trasformazioni di Lorentz. Per i quadrivettori abbiamo anche
il prodotto scalare
(u, v) = ηab ua v b = ua v a = ua va
(3.5)
e il quadrato della norma u2 = ηab ua ub . Due quadrivettori u e v di diranno ortogonali se
(u, v) = 0; si deve però notare che questo non significa affatto che formino un angolo di
π/2, perché la metrica non è definita positiva.
3.3.2
campi tensoriali
Dato che le equazioni importanti della fisica sono equazioni differenziali, la trattazione
algebrica dei tensori offre solo limitate possibilità. Le funzioni differenziabili a valori
tensoriali
...an
xa → Kba11...b
(x)
m
si chiamano genericamente campi di tensori, o campi tensoriali. La formula di trasformazione deve ora tenere conto che si trasformano anche gli argomenti dei campi
′
′
ab...
nm...
Kcd...
(x ) = Λan Λbm · · · (Λ−1 )uc (Λ−1 )vd · · · Kuv...
(x),
′
x =Λ·x
(3.6)
′
Se x a = Λab xb si ha
( −1 )b ∂
∂
′a = Λ
a ∂xb
∂x
Questo mostra che le derivate parziali si trasformano come se fossero quadrivettori covarianti: perciò poniamo ∂/∂xa = ∂a . È dunque chiaro che differenziando k volte un campo
tensoriale di rango [n, m] si ottiene un campo tensoriale di rango [n, m + k]. Ad esempio,
se ϕ(x) è un campo scalare, cioè se
′
′
′
ϕ (x ) = ϕ(x) ←→ ϕ (x) = ϕ(Λ−1 x)
allora ϕa (x) = ∂a ϕ(x) è un campo vettoriale covariante.
50
3.4
Equazioni invarianti
La regola per formare equazioni invarianti di Lorentz è assai semplice: è sufficiente equagliare a zero qualunque espressione formata con campi tensoriali e con le loro derivate
parziali, che sia essa stessa un campo tensoriale per il gruppo di Lorentz. Naturalmente si deve avere l’accortezza di rispettare le regole per la moltiplicazione, la somma, la
contrazione e la differenziazione dei tensori che vi compaiono. Il fondamento di questa
prescrizione è il fatto ovvio che le espressioni tensoriali si trasformano linearmente. Il
tensore nullo in un sistema di coordinate è allora automaticamente nullo in tutti gli altri.
3.4.1
Equazione di Klein-gordon
Un famoso esempio di equazione invariante di Lorentz è l’equazione di Klein-Gordon per
un campo scalare (o l’equazione delle onde se m = 0)
η ab ∂a ∂b ϕ − m2 ϕ = 0
(4.1)
Si noti il fatto interessante: il parametro m è chiaramente l’inverso di una lunghezza, ma
se insistiamo che m rappresenti una massa allora il termine m2 ϕ andrebbe scritto nella
forma (m2 c2 /ℏ2 )ϕ, per ragioni dimensionali. Le più semplici soluzioni sono le onde piane
ϕk = a exp(ika xa ),
k 2 + m2 = 0
√
e allora la frequenza k 0 = ± k2 + m2 : si riconosce la somiglianza, non casuale, con
la relazione momento-energia di una particella relativistica. Un’applicazione di queste
soluzioni si ha nella riflessione da uno specchio mobile. Supponiamo che lo specchio sia
ortogonale all’asse x, lungo il quale si muove verso destra con velocità v. L’onda piana
incida sullo specchio nel piano [x, y] con angolo di incidenza α e ampiezza a = 1, e sia
m = 0: allora l’onda incidente è
ϕin (t, x, y) = e−iωt+iω(x cos α+y sin α)
e l’onda riflessa
′
′
′
′
ϕout (t, x, y) = Re−iω t−iω (x cos α −y sin α )
Si noti che, a priori, sia l’ampiezza che la frequenza che l’angolo di riflessione sono diversi
′
′
dai corrispondenti parametri dell’onda incidente. Se v = 0 allora α = α e ω = ω .
L’azione dello specchio è descritta dalla condizione al contorno di Dirichlet
ϕin (t, vt, y) + ϕout (t, vt, y) = 0
il cui significato è che il campo totale a sinistra dello specchio deve annullarsi sulla sua
superficie, il piano di equazione x = vt. Si trovano allora le condizioni necessarie
′
ω sin α = ω sin α
′
51
′
′
ω(1 − v cos α) = ω (1 + v cos α )
e R = −1.
′
′
E18: Si risolvano le equazioni precedenti per α e ω . Si dovrebbe trovare (ricordarsi che
c = 1)
′
cos α =
(1 + v 2 ) cos α − 2v
1 − 2v cos α + v 2
′
ω
1 − 2v cos α + v 2
=
ω
1 − v2
che è la formula di Einstein per l’effetto Doppler da uno specchio mobile.
E19: Si ripristini la velocità della luce nelle formule precedenti.
E20: Si provi a ricavare la formula di Einstein dello specchio mobile applicando direttamente le trasformazioni di Lorentz, tenendo presente che nel sistema di quiete dello
′
′
specchio α = α e ω = ω .
3.4.2
Equazione di Proca
Sia ϕa un campo vettoriale: il tensore ϕab = ∂a ϕb − ∂b ϕa è antisimmetrico. Il sistema di
equazioni
∂a ϕab + m2 ϕa = 0
è manifestamente covariante di Lorentz. Dalla definizione di ϕab seguono direttamente le
equazioni
eabcd ∂a ϕbc = 0
o anche
∂a ϕbc + ∂c ϕab + ∂b ϕca = 0
E21: Quante sono le equazioni scritte sopra? È il sistema determinato?
Le equazioni scritte sopra per un tensore antisimmetrico ϕab sono le più semplici equazioni
invarianti non banali2 . Come vedremo, con opportune identificazioni, e se m = 0, queste
sono identiche alle equazioni di Maxwell per il campo elettromagnetico nel vuoto, con ϕa
nel ruolo dei potenziali elettromagnetici. Si noti la conseguenza interessante
∂a ϕ a = 0
valida se m ̸= 0 (questione: perché?).
2
∂a ϕbc = 0 è per noi un esempio di equazione invariante banale.
52
3.5
Il tempo proprio
L’intervallo di tempo proprio fra due eventi con coordinate (x0 , xk ) e (x0 + dx0 , xk + dxk )
è definito dalla formula
dτ 2 = −ηab dxa dxb = (dx0 )2 − dx · dx
Se un orologio si muove lungo una curva x(x0 ), l’intervallo di tempo proprio (si assume
che l’orologio abbia una risoluzione elevata affiché dτ e dx0 possano essere infinitesimi) è
dτ = dx0 (1 − v2 /c2 )1/2
Dalla formula per la dilatazione del tempo si vede allora che dτ è il tempo indicato
dall’orologio in movimento. Si deve però assumere quanto segue: il tempo indicato da
un orologio in movimento non dipende dalla sua accelerazione, cosicché l’aumento di
tempo proprio dell’orologio in ogni istante è lo stesso che si avrebbe nel sistema di quiete
dell’orologio nel dato istante. Si noti che lungo una curva di tipo luce |v| = 1 e dτ = 0.
3.6
Il cono luce e le relazioni causali
La metrica divide i quadrivettori in tre classi distinte:
• se ηab V a V b < 0 si dice che V a è di tipo tempo, o time-like
• se ηab V a V b > 0 allora V a è di tipo spazio, o space-like
• se ηab V a V b = 0, V a è di tipo luce, o nullo, o causale, o light-like.
L’insieme dei vettori nulli determina un cono con vertice nell’origine O3 , detto il cono
luce e indicato con C. La falda superiore C+ , dove x0 > 0, è il cono luce degli eventi nel
futuro di O, quella inferiore C− (x0 < 0) è il cono luce degli eventi nel passato di O. Ogni
evento in C+ è caratterizzato da un vettore di tipo tempo con x0 > 0, ed è perciò nel
futuro causale dell’origine.
Se V a = xa − y a , essendo xa ed y a le coordinate di due eventi p e q, la classe di V a
determina le possibili relazioni causali tra p e q.
Se V 2 < 0 e V 0 > 0, si dirà che p è nel futuro cronologico di q, oppure che q è nel passato
cronologico di p. Queste definizioni sono invarianti di Lorentz.
Se V 2 > 0,si dirà che gli eventi p e q sono spazialmente separati. In questo caso non ci
può essere una relazione causale tra p e q perché nessun segnale ha il tempo necessario
per arrivare dall’uno all’altro, cioè “p accade” prima che il segnale da q lo raggiunga, o
viceversa. Inoltre, la successione temporale di p e q può essere invertita con una opportuna
trasformazione di Lorentz. Per finire, se V 2 = 0, un raggio di luce può connettere p e q,
che appartengono dunque allo stesso cono luce.
3
L’evento con coordinate xa = 0.
53
E22: Sia p = (x0 , x, 0, 0), con x > x0 > 0, un evento nel futuro dell’origine (l’evento
(0, 0, 0, 0)). Si trovi un’osservatore per il quale l’origine è nel futuro di p. Quanti ce ne
sono? Si determini la velocità di un osservatore per il quale i due eventi sono simultanei.
E23: Mostrare che la somma di due vettori timelike diretti nel futuro è un vettore timelike
diretto nel fututo.
Le relazioni causali si possono estendere ai sottoinsiemi dello spazio di Minkowski. Non
è detto che il futuro causale di una regione spaziale, anche infinita, comprenda tutto lo
spazio-tempo.
3.7
Curve
Data una curva differenziabile parametrizzata xa (λ), λ ∈ R1 , sia ua = ẋa (λ) il quadrivettore tangente alla curva: se u è di tipo tempo e u0 > 0 diremo che la curva è del tipo
temporale e diretta nel futuro. Una tale curva è sempre all’interno del cono luce futuro
uscente da un qualunque evento sulla curva, e per la velocità, v = dx/dx0 , si ha |v| < 1:
la curva è dunque la possibile linea di universo di una particella in moto, e si può scegliere
per λ il tempo proprio τ .
Se invece u è di tipo spazio diremo che la curva è di tipo spaziale. Nessuna particella
può percorrere una tale curva, perché in tal caso dovrebbe muoversi più velocemente della
luce.4 Infine può darsi che u2 = ηab ua ub = 0, nel qual caso la curva è detta di tipo luce, o
curva nulla. Vedremo che le curve nulle rappresentano le linee di universo delle particelle
con massa zero. Si noti che non possono essere parametrizzate con il tempo proprio, dato
che dτ = 0 per eventi con separazione nulla.
Usando il tempo proprio, le componenti della quadrivelocità sono
1
u0 = γ = √
,
1 − v2
uk = γv k ,
vk =
dxk
dt
(7.1)
Ricordiamo che abbiamo posto c = 1, e quindi x0 = t. Segue la formula
u2 ≡ ηab ua ub = ua ua = −1
Si definisce quadriaccelerazione il quadrivettore wa = u˙a . Le sue componenti sono
w0 = γ
dγ
= γ 4v · a
dt
(7.2)
w = γa + w0 v
(7.3)
dove a = dv/dt = v̇ è l’accelerazione ordinaria. Vediamo che
4
L’impossibilità di questo fatto è indicata dalle trasformazioni di Lorentz, che diventano complesse se
v > 1.
54
′
′
• wa = (0, a ) nel sistema F istantaneamente in quiete con la particella; da questo
segue che w è un quadrivettore di tipo spaziale, w2 > 0.
• derivando rispetto a τ la formula ηab ua ub = −1 si ottiene la condizione ηab ua wb = 0;
si esprime questo dicendo che u e w sono quadrivettori ortogonali. Questo segue
anche dal punto precedente, perché nel sistema di quiete si ha u = (1, 0) e w = (0, a).
′
• w2 ≡ ηab wa wb = |a |2
Possiamo adesso scrivere la condizione di simultaneità (2.25) in forma invariante
ua ∆xa = 0
(7.4)
Cioè un osservatore caratterizzato dalla velocità ua , giudica simultanei gli eventi che
appartengono all’iperpiano ortogonale a ua .
E24: Si consideri la famiglia di curve parametrizzate
x0 = a sinh(bλ),
x1 = cosh(bλ),
x2 = x3 = 0
Qual’è l’espressione del tempo proprio lungo la curva? si calcoli la quadri-velocità in
funzione del tempo. Stesso problema per la quadri-accelerazione. Sono le curve di tipo
tempo, spazio o luce?
55
Capitolo 4
Meccanica relativistica
[Ref.] L. D. Landau e E. M. Lifchitz, Teoria dei campi, Editori Riuniti (1976).
′
La meccanica relativistica parte con l’assunzione che in un sistema di coordinate F in
cui una particella è momentaneamente in quiete, valgono le equazioni del moto della
meccanica non relativistica
′
d2 r
′
m ′2 = f
dt
(0.1)
Il principio di relatività permette allora di dedurre senza ambiguità le equazioni del moto
in ogni altro sistema F , se solo si assoggetta la (0.1) a una trasformazione di Lorentz.
Con ciò non si ha però una definizione della forza in F .
4.1
quantità di moto, energia e forza
Sia m la massa propria della particella, la massa misurata nel sistema a riposo; definiamo
l’impulso relativistico pa = mua , e la forza relativistica
fa =
dpa
dua
=m
= mwa
dτ
dτ
(1.1)
Si hanno le relazioni importanti
p 2 + m2 = 0
e inoltre
p0 =
√
m
p 2 + m2 = √
,
1 − v2
(1.2)
mv
p = mγv = √
1 − v2
(1.3)
Dalla (1.1) segue fa ua = 0, da cui f 0 = f · v. L’Eq. (1.2)
√definisce un iperboloide con
0
due componenti connesse, corrispondenti ai valori p = ± p2 + m2 . Il foglio fisico è la
componente con p0 > 0.
56
Poiché
1
d
d
d
=√
=γ
2
dτ
dt
1 − v dt
si può scrivere la (1.1) nella forma
dp
= γ −1 f ,
dt
dp0
= γ −1 f · v
dt
(1.4)
Nel sistema di riferimento dove la particella è istantaneamente in quiete, f coincide con la
forza Newtoniana, che indichiamo con fN . Perciò identifichiamo p = γmv con la quantità
di moto e p0 = γm con l’energia della particella; le formule esplicite, reintroducendo c,
sono
mv
p= √
= mv + · · ·
1 − v 2 /c2
E = cp0 = √
mc2
1
= mc2 + mv 2 + · · ·
2
1 − v 2 /c2
Si ha anche
√
E = m2 c4 + c2 p2
una forma che si può applicare anche a particelle di massa zero, nel qual caso E = c|p|. Il
quadrimpulso di una tale particella è un vettore nullo, p2 = 0. Vediamo che l’impulso si
riduce all’espressione Newtoniana a meno di termini di ordine v 2 /c2 , mentre nell’energia è
presente la costante mc2 , detto energia propria, o di quiete, della particella. Il significato
di questo fatto sarà discusso fra poco.
4.2
formule di trasformazione
Dal carattere vettoriale delle grandezze meccaniche introdotte si ricavano subito le regole
di trasformazione della forza
′
f ·v
′
f = f + (γ − 1) 2 v + γf 0 v/c,
v
′
′
′
f 0 = γ(f 0 + f · v/c)
(2.1)
e del momento
′
p ·v
′
p = p + (γ − 1) 2 v + γp 0 v/c
v
′
′
(2.2)
′
p0 = c−1 E = γ(p 0 + v · p /c)
(2.3)
Come al solito, γ = (1 − v 2 /c2 )−1/2 .
57
4.3
sistemi di particelle
Per un sistema di particelle il quadrimpulso è additivo
∑
Pa =
pan ,
p2n = −Mn2
n
dove la somma è definita sopra un piano di simultaneità dell’osservatore, cioè gli impulsi
vanno sommati a un tempo dato del sistema inerziale rispetto al quale i momenti stessi
sono riferiti. Tuttavia in assenza di collisioni ogni singolo pa è conservato e ha dunque lo
stesso valore su ogni altro piano di simultaneità. Se un sottoinsieme di particelle collide,
conservata sarà la somma dei quadri-momenti del sottoinsieme, che avrà dunque lo stesso
valore su ogni altro piano di simultaneità. In entrambi i casi è indifferente su quale piano
di simultaneità si calcola la somma, che risulterà cosı̀ composta dallo stesso numero di
termini per tutti gli osservatori. È allora evidente che P a è un quadri-vettore.
La massa invariante, definita dalla P 2 = −M 2 , è maggiore della somma dei quadrati delle
masse
∑
∑
∑
M2 =
Mn2 − 2
(pn , pm ) >
Mn2
n
n>m
n
perché i prodotti scalari (pn , pm ) di vettori di tipo tempo aventi p0n > 0 è sempre definito negativo. Ma si può dire di più: dato che −(pn , pm ) > Mn Mm si ha di fatto la
diseguaglianza più forte
∑
M>
Mn
Questo mostra che l’energia interna (cinetica, ad esempio) del sistema contribuisce alla massa invariante, un aspetto della famosa equivalenza massa-energia. Le formule di
′
trasformazione (2.2), (2.3) mostrano che il sistema di riferimento nel quale P = 0 è
fisicamente realizzabile se P 2 < 0. Infatti, dalle formule scritte si ricava (ripristinando c)
V=
cP
E
e dunque |V| < c se E > c|P|. Tale riferimento si chiama il sistema del centro di massa, e
lo indichiamo con F0 . Dalle formule di trasformazione si ricava allora la quantità di moto
totale nel laboratorio F
E0 /c2 V
P= √
1 − V 2 /c2
(3.1)
dove E0 è l’energia totale in F0 . Da qui si vede che la massa invariante del sistema è
uguale a E0 /c2 .
In ogni riferimento F si può definire un punto detto centroide
∑
n En Xn
XC = ∑
n En
58
che è la generalizzazione relativistica del centro di massa. Si trova facilmente
c2 P
dXC
=
dt
E
Questo mostra che tutti i punti XC sono in quiete in F0 , ma non coincidono in generale
con XC0 . Infatti il centro di massa definito sopra dipende da F .
4.4
Equazioni del moto
Abbiamo notato sopra che la forza relativistica si riduce alla forza Newtonian a nel sistema
di quiete istantaneo della particella. Per trovare la forza nel sistema del laboratorio F ,
usiamo il fatto che f a è un quadrivettore; allora
f = fN + (γ − 1)
fN · v
v,
v2
f 0 = γfN · v
(4.1)
Essendo f a ua = 0, si ha anche f 0 = f · v. Vediamo che la definizione (1.1) fornisce un
sistema di quattro equazioni differenziali che possono essere usate per determinare il moto
della particella (se la forza Newtoniana fN è nota)
dp
= γ −1 f ≡ F,
dt
m
dγ
=F·v
dt
(4.2)
f si chiama la forza di Minkowski, mentre F è semplicemente la forza. Infatti, solo con
questa definizione la forza è la derivata di una quantità di moto, che si conserva per sistemi
chiusi. Dalla (4.2) si deduce facilmente (ripristinando c)
mγ
dv
F·v
=F− 2 v
dt
c
(4.3)
Si vede da qui che l’accelerazione non è proporzionale alla forza, un fatto che complica la
descrizione delle traiettorie relativistiche. Se fN è dovuta alla presenza di un campo di
forza, cioè se fN è una funzione del punto, è evidente che la forza va calcolata nel punto
occupato dalla particella; la formula di trasformazione dei tensori (vedi Eq. (3.6)) mostra
allora che gli argomenti di f e f 0 sono le coordinate xa della particella in moto. Ad esempio,
′
′
′
per una carica in un campo elettromagnetico si ha fN = eE (t , x ), quest’ultimo essendo
′
il campo elettrico nel sistema di quiete della particella all’istante t , con la particella nel
′
punto x ; allora
′
′
′
E (t , x ) · v
dp
′
′
′
= eE (t , x ) + e(γ − 1)
v
γ
dt
v2
Come vedremo, dalla formula di trasformazione dei campi elettromagnetici (v. la (3.4))
si ha
′
′
′
(
)
E (t , x ) · v
v
′
′
′
E (t , x ) + (γ − 1)
v
=
γ
E(t,
x)
+
×
B(t,
x)
v2
c
59
′
′
dove (t, x) e (t , x ) sono connessi dalle formule di trasformazione (2.26) e (2.27). Si ha
quindi l’equazione del moto relativistica
(
)
mv
v
d
√
= eE(t, x) + e × B(t, x)
(4.4)
2
2
dt
c
1 − v /c
in cui la forza di Lorentz viene ricavata dalla forza puramente elettrica come conseguenza
necessaria della simmetria di Lorentz.
Per riassumere, l’equazione del moto di una particella relativistica è la (4.3), o la (4.2) o
anche la (1.1), dove il vettore f a si calcola in funzione della forza Newtoniana usando la
formula di trasformazione dei quadrivettori (4.1).
4.5
Moto uniformemente accelerato, o iperbolico
Supponiamo che la forza Newtoniana fN abbia sempre la direzione della velocità e sia
costante, fN = mg; ciò equivale a dire che in ogni sistema in cui la particella è istantaneamente in quiete, l’accelerazione è costante e diretta come la velocità. Orientando
quest’ultima lungo l’asse x, dalla (4.1) si ottiene la quadriforza per questo caso
f a = (mgγv, mgγ, 0, 0) = mg(u1 , u0 , 0, 0) = m(du0 /dτ, du1 /dτ, 0, 0)
(5.1)
Dall’eq. (4.2) si ottiene
dγv
=g
dt
o, ripristinando c e scegliendo il dato iniziale v(0) = 0,
v=√
gt
1 + g 2 t2 /c2
Si noti v → c per t → ∞; nemmeno una forza che agisce per un tempo infinito riesce a
spingere la particella oltre la velocità limite. Integrando si ottiene (scegliendo x(0) = 0)
(√
)
x(t) = c2 g −1
1 + g 2 t2 /c2 − 1
Osserviamo che
(x + c2 /g)2 − c2 t2 = c4 g −2
la quale mostra che la linea di universo della particella è un ramo di iperbole. Dalla Fig. [5]
si vede che la traiettoria è sempre esterna al cono luce passante per il punto (0, −c2 /g)
(scelto come origine nella figura)
Gli eventi al di là del piano x0 − c2 x/g = 0 non possono influenzare la particella, quelli al
di là del piano x0 + c2 x/g = 0 non possono esserne influenzati.
60
Figura 4.1: Moto iperbolico
t
x
Cerchiamo la curva parametrizzata dal tempo proprio; dalla (5.1) si ha
du0
= u1 ,
dτ
du1
= u0
dτ
e dunque, con i dati iniziali usati sopra, u0 = cosh gτ , u1 = sinh gτ ; da qui seguono le
formule (ripristinando c)
x0 = c2 g −1 sinh(gτ /c)
(5.2)
x1 = c2 g −1 (cosh(gτ /c) − 1)
(5.3)
La (5.2) mostra drammaticamente gli effetti relativistici sul tempo. Il tempo a bordo di
un veicolo spaziale uniformemente accelerato varia logaritmicamente con il tempo T⊕ di
un osservatore terrestre. Infatti, se gT⊕ /c ≫ 1, dalla (5.2) si ottiene1
τ ≃ cg −1 ln (2gT⊕ /c)
Ad esempio, un viaggio di 100 anni terrestri con g = 9, 81 m · sec−2 (l’accelerazione di
gravità terrestre, per rendere confortevole il viaggio) si compie in soli 5, 3 anni secondo
l’equipaggio della nave spaziale, e la distanza percorsa sarebbe di circa 96 anni luce.
4.6
Il razzo relativistico
Come semplice modello di un razzo relativistico prendiamo un punto materiale che accelera non perché soggetto all’azione di una forza, ma perché emette parte della sua
1
Si ricordi che sinh−1 (x) = ln(x +
√
x2 + 1).
61
massa propria, il propellente, in direzione opposta al moto, secondo il principio dei motori a reazione. Le equazioni del moto relativistiche si possono dedurre dal principio di
conservazione del quadri-impulso.
Il “rate of change” del quadri-impulso sia proporzionale al “rate of change” della massa propria e alla velocità di emissione del propellente, cioè (con un piccolo cavillo che
discuteremo fra un momento)
dP a
dm a
=f
U
dτ
dτ
(6.1)
dove U a è la quadri-velocità del propellente ed f la “costante” di proporzionalità da
determinare. Se V a indica la quadri-velocità del razzo si ha
Ṗ a = ṁV a + mV̇ a
(6.2)
e naturalmente Va V̇ a = 0; pertanto
Ṗ a Va = −ṁc2
(6.3)
e dalla consistenza di questa relazione con la (6.1) otteniamo
f = c2 (−U · V )−1
(6.4)
In definitiva, le equazioni del moto del razzo relativistico assumono la forma
Ua
Ṗ = −ṁc
U ·V
a
2
(6.5)
o anche
)
c2 ṁ ( a
mV̇ = −
δ b + c−2 V a Vb U b
U ·V
a
(6.6)
Interpretazione fisica – L’invariante U · V ha un semplice significato: detta urel la velocità
relativa del propellente al razzo, si ha
−c−2 U · V = √
1
dτ
=
dτp
1 − u2rel /c2
(6.7)
dove gli elementi di tempo proprio si riferiscono rispettivamente al razzo (dτ ) e al propellente (dτp ). D’altronde nello scrivere la (6.1) è sottinteso che U b sia la derivata rispetto
a τp mentre le altre sono derivate rispetto a τ (era questo il piccolo cavillo). Dunque
il fattore c2 /(−U · V ) tiene conto del fatto che il propellente, muovendosi relativamente
al razzo, ha un diverso tempo proprio. In altri termini, corregge l’equazione del moto
tenendo conto della dilatazione relativistica del tempo esistente fra il propellente e il razzo. Potremmo dunque togliere il fattore U · V dall’equazione a patto di considerare U b
come la derivata rispetto a τ anziché a τp , da calcolarsi comunque usando la (6.7). In
pratica si risolve l’equazione del moto assumendo che urel sia una costante caratteristica
del sistema.
62
Esempio: Supponiamo che il moto sia lineare e prendiamo la componente temporale
della (6.6); si trova facilmente (c = 1 per semplicità)
√
(
)
mγ˙v = ṁ 1 − u2rel γu − γv (1 − u2rel )−1/2
dove γv e γu sono i soliti fattori relativistici di razzo e propellente, rispettivamente, con
le velocità indicate per distinguerli, e il punto denota la derivata nel tempo proprio. Ma
dalla trasformazione di Lorentz al sistema di quiete si ha
′
′
γu = γv (γu + vUx ) = γv (1 − u2rel )−1/2 (1 − vurel )
perché ovviamente
1
′
,
γu = √
1 − u2rel
′
′
Ux = −γu urel
Sostituendo nella prima equazione si trova infine
mγ˙v = −ṁγv vurel
oppure, notando che γ˙v = γv3 v v̇,
v̇
ṁ
= − urel
2
1−v
m
Assumendo urel costante (fissata dal progettista del motore) l’integrazione è elementare e
porta al risultato
(
)c/2urel
m(τ )
c−v
=
m0
c+v
A questo semplice livello non è possibile dire molto di più: o si fissa una funzione m(τ ),
proprietà del sistema di propulsione, e si ricava v(τ ), oppure si richiede una traiettoria e
si progetta m(τ ). Per esempio, si potrebbe chiedere per quale m(τ ) si può ottenere un
moto uniformemente accelerato con accelerazione propria g, usando come propellente la
radiazione (urel = c). In tal caso
v(τ ) = c tanh(gτ /c)
e quindi
m(τ )
=
m0
√
1 − tanh(gτ /c)
1 + tanh(gτ /c)
Per raggiungere Vega (a 26 anni luce) con la g terrestre ci vogliono circa 6, 66 anni di
tempo proprio2 , per cui secondo la formula la massa iniziale dell’astronave (m0 ) dovrebbe
essere circa 782 volte la massa del veicolo all’arrivo (m(τ = 6, 66 anni)), ovvero contenere
una quantità di propellente di gran lunga superiore alla massa del veicolo (il che impone
la necessità di acquisire il propellente strada facendo, come per le automobili).
2
3, 33 anni di accelerazione più altrettanti di decelerazione.
63
E = mc2
4.7
Abbiamo già notato che la massa invariante di un sistema arbitrario è uguale a E0 /c2
(l’energia nel sistema di quiete F0 ), se valgono le trasformazioni di Lorentz. Ma possiamo
andare oltre. Consideriamo un sistema fisico arbitrario coinvolto in un processo di emissione di due particelle identiche in direzioni opposte. Non si pensi alle particelle come
a punti materiali, bensı́ come a sistemi composti, quali due particelle alfa, o due nuclei
più complessi oppure due impulsi di onde elettromagnetiche. Consideriamo il processo
nel riferimento del centro di massa F0 , dove P = 0. In tale riferimento il sistema rimane
fermo se vale la legge di conservazione del momento, mentre la conservazione dell’energia
richiede
′
′
E0 − E1 = 2ϵ
′
′
E0 ed E1 sono le energie prima e dopo il processo di emissione e 2ϵ è l’energia dei due
frammenti. In un laboratorio rispetto al quale il sistema si muove con velocità V lungo
l’asse x, l’energia dei frammenti è
ε1 = γ(ε − V p cos α)
ε1 = γ(ε + V p cos α)
e dalla conservazione dell’energia
2ε
E0 − E1 = ε1 + ε2 = √
1 − V 2 /c2
o anche
(
′
′
(E0 − E0 ) − (E1 − E1 ) = 2ε
√
)
1
1 − V 2 /c2
−1
(7.1)
Il primo termine è la differenza fra l’energia del sistema quando la sua velocità è V e
′
l’energia quando è in quiete, e dunque per basse velocità E0 − E0 = M0 V 2 /2, dove M0
′
è la massa iniziale. Analogamente, se M1 è la massa finale si ha E1 − E1 = M1 V 2 /2, e
quindi la (7.1) diventa, al primo ordine in V 2 /c2 ,
∆M = M0 − M1 =
2ε
c2
(7.2)
Si vede da qui l’equivalenza tra massa ed energia: in seguito all’emissione il sistema
perde massa (e dunque inerzia) nella quantità indicata. Si può anche osservare che nel
riferimento del laboratorio il sistema perde la quantità di moto
2ε/c2
V
∆P = √
1 − V 2 /c2
come si ricava dalle formule di trasformazione (2.2). Siccome la velocità del sistema
non cambia nel processo di emissione, questo è possibile solo se si ha una perdita di
64
massa inerziale pari a 2ε/c2 . Un caso ancora più generale è stato considerato da Lorentz
(1911). Scriviamo il quadrimpulso di un sistema chiuso arbitrario Σ1 (che può consistere
di particelle, molle in tensione, raggi di luce, etc...) nella forma
P= √
m0 u
1−
u2 /c2
= mu,
P0 = √
m0 c
1 − u2 /c2
= mc
dove u è la velocità del sistema di riferimento del centro di massa F0 ; considerando per
semplicità una trasformazione di Lorentz lungo l’asse x, si ha (β = v/c)
Px − mv
′
,
Px = √
1 − β2
′
Py = Py ,
′
Pz = P z
Ora il sistema interagisca con un altro sistema Σ2 . Le leggi di conservazione danno
∆P1 + ∆P2 = 0,
′
′
∆P1 + ∆P2 = 0,
∆E1 + ∆E2 = 0
Quindi (γ = (1 − β 2 )−1/2 )
′
′
∆P1x + ∆P2x = γ(∆P1x + ∆P2x − v∆m − v∆E2 /c2 ) = γv(∆E1 /c2 − ∆m) = 0
da cui ∆m = c−2 ∆E1 . In entrambi i casi possiamo concludere che se l’energia e la
quantità di moto sono le componenti di un quadri-vettore P a che si conserva per tutti i
processi fisici nei sistemi isolati, allora ad ogni trasferimento di energia ∆E, corrisponde
un trasferimento di massa ∆m = ∆E/c2 . In generale l’interazione cambia sia la massa
che la velocità del sistema,
√ per cui con ∆m si deve intendere la variazione della massa
relativistica: m = m0 / 1 − u2 /c2 . La relazione massa/energia è osservata soprattutto
nelle reazioni nucleari. Ad esempio nel processo
3
7 Li
+ H → 24 He +24 He
dalla conservazione dell’energia si ha
(MLi + MH − 2MHe )c2 = 2KHe − KH
Il difetto di massa nel primo membro è misurato e vale circa 17, 31 Mev, mentre le misure
della variazione di energia cinetica nel secondo membro danno 17, 28 Mev. La notazione
KX denota l’energia cinetica della specie X
KX = √
M X c2
1−
v 2 /c2
− M X c2
La trasformazione di massa in energia nelle reazioni nucleari è la principale fonte di energia
nelle stelle.
Nota: dal punto di vista di un fisico moderno non è forse molto sorprendente questa
equivalenza di massa ed energia, almeno se si parla di energia elettromagnetica. La
radiazione è infatti composta da uno streaming continuo di fotoni, particelle elementari
65
del tutto simili a molte altre particelle note, ma con l’eccezione di avere massa propria
pari a zero, m = 0 (anche la carica elettrica è zero, ma questa è un’altra storia). Per il
resto collidono, si propagano, possiedono momento (nel senso relativistico del termine)
che può essere trasferito, possono essere emessi e assorbiti, e cosı̀ via. Dunque non sono
considerati fondamentalmente diversi da altre particelle subatomiche. Altre forme di
energia, come il calore, sono anch’esse associate al moto disordinato di grandi numeri di
particelle microscopiche, che possono collidere e trasferire momento ed energia. Ma nel
1905, ai temi di Einstein, energia e materia erano veramente considerate “sostanze” diverse
del mondo. La scoperta che l’energia trasferisce inerzia è dunque da considerarsi come un
risultato profondo e fondamentale della teoria di Einstein, senza il quale nemmeno la sua
teoria relativistica della gravitazione sarebbe stata possibile.
4.8
Collisioni
La legge di conservazione del momento relativistico ha importanti applicazioni alla teoria
delle collisioni di particelle altamente energetiche. Il soggetto diventa rapidamente complicato all’aumentare del numero di particelle coinvolte, ma per collisioni di due particelle o
per il decadimento di una singola particella la trattazione matematica è fondamentalmente
semplice e tuttavia molto significativa.
4.8.1
L’effetto Compton
Figura 4.2: Effetto Compton
χ’
χ
θ
Questo riguarda la collisione di un fotone, particella di massa propria uguale a zero, con
un elettrone o un positrone. Il fotone (linea tratteggiata) e l’elettrone convergono verso il
centro di collisione ad angolo χ e sono diffusi in altre direzioni. Sono riportati gli angoli
′
di diffusione del fotone (θ e χ ) rispettivamente rispetto al fotone o all’elettrone incidenti.
66
Indichiamo con P µ e k µ i momenti relativistici della carica e del fotone, rispettivamente.
Alla collisione elastica e± + γ → e± + γ corrisponde la legge di conservazione
P µ + kµ = P
′µ
′
+kµ
(8.1)
Se l’elettrone finale non si osserva, conviene scrivere
′
P µ + kµ − k µ = P
′µ
e prendere la norma di entrambi i membri, ricordando che P 2 = P
allora
′
′2
′
= −m2 e k 2 = k 2 = 0;
′
−m2 + 2P · (k − k ) − 2k · k = −m2
Si ha però
′
′
k · k = −h2 νν (1 − cos θ),
−P · k = hν(E − P cos χ),
′
′
′
−P · k = hν (E − P cos χ )
′
dove θ, χ, χ sono rispettivamente l’angolo di diffusione del fotone rispetto al fotone
incidente, l’angolo di incidenza tra il fotone e l’elettrone iniziali e l’angolo di diffusione
del fotone rispetto all’elettrone diffuso (vedi figura), E l’energia dell’elettrone e P la sua
quantità di moto. Si trova in definitiva
′
′
′
′
Eh(ν − ν) = P (ν cos χ − ν cos χ) − 2h2 ν ν sin2 θ/2
′
Distinguiamo i due casi (A): χ = 0, nel qual caso χ = θ, e (B): χ = π (collisione frontale)
nel qual caso χ = π − θ. Nel caso (A), introducendo la lunghezza d’onda λ = c/ν e
′
∆λ = λ − λ (si noti che abbiamo reintrodotto c), con un semplice conto si trova la
formula
∆λ = 2λ
(k + P )c
sin2 θ/2
E − Pc
(8.2)
dove k = h/λ è il momento del fotone. Nel caso (B) (detto anche della “diffusione
Compton inversa”)
∆λ = 2λ
(k − P )c
sin2 θ/2
E + Pc
(8.3)
Per P → 0 entrambe le formule si riducono alla classica formula di Compton
∆λ =
h
(1 − cos θ)
mc
(8.4)
Se si ignora il momento del fotone (nel limite classico h → 0) si ha, per esempio
∆λ = 2λ
Pc
sin2 θ/2
E − Pc
(8.5)
che coincide con la formula classica per la diffusione elastica da una carica in moto. La
formula esprime semplicemente il fatto che nel sistema a riposo della carica la radiazione
67
è diffusa con la stessa frequenza della radiazione incidente, per cui lo spostamento ∆λ è
interamente dovuto all’effetto Doppler della carica in moto.
′
E: Mostrare che la frequenza ν della radiazione di una carica in moto è legata alla
frequenza ν della radiazione incidente dalla formula
)
(
)
(
V
V
′
′
ν 1 − cos χ = ν 1 − cos χ
c
c
dove V è la velocità della carica.
Usando ora V = P/E e λ = c/ν, si vede subito che questa formula diventa esattamente
la (8.5) per il caso χ = 0. Se χ = π si ottiene il limite classico del caso (B).C.V.D.
Le formule (8.2), (8.3) e (8.4) sono in ottimo accordo con i risultati sperimentali. Esse
confermano simultaneamente la relatività, la meccanica quantistica e la natura corpuscolare della radiazione elettromagnetica (si ricordi che l’ipotesi dei fotoni è dovuta ad
Einstein).
4.8.2
Energia di soglia
Certi tipi di collisioni possono avvenire solo se l’energia delle particelle incidenti supera
una certa soglia. Si tratta di processi con produzione di nuove particelle, per i quali è
dunque richiesta una soglia di energia minima. Un esempio è la produzione di mesoni
neutri per urto di protoni
p+p→p+p+π
Sia M ≃ 938 Gev la massa a riposo del protone e mπ ≃ 135 Mev quella del mesone. Si
assuma un protone inizialmente in quiete; si ha allora
P µ + M δ0µ = PTµ + pµπ
dove PT è il momento totale dei protoni nello stato finale. Da qui
2EM = −PT2 + m2π − 2PT · pπ − 2M 2
Per trovare il minimo di questa espressione (l’energia di soglia, appunto) calcoliamo i due
invarianti nel sistema del centro di massa dei protoni, dove PT = 0. Si ottiene subito
l’espressione
(Ecm + mπ )2 − 2M 2
2M
L’energia nel centro di massa non può essere inferiore a 2M , e questo minimo valore può
essere raggiunto se i protoni sono entrambi fermi nel sistema del centro di massa. Questo
significa che la configurazione finale che realizza l’energia minima si ha con i protoni che
si muovono insieme con la stessa velocità, uguale a quella del centro di massa. Allora la
soglia richiesta è
E=
Emin =
(2M + mπ )2 − 2M 2
2M
(8.6)
68
e corrisponde al fattore relativistico di rapidità
γmin = 1 +
2mπ
m2
+ π2
M
2M
Si noti che la conservazione dell’energia da sola non fornisce la soglia corretta. Infatti si
avrebbe
E = ET + Eπ − M > M + mπ
che suggerisce la soglia Emin = M + mπ ; ma questa è raggiunta solo se le velocità di tutte
le particelle partecipanti sono nulle, il che è impossibile in una collisione.
Si può misurare l’efficienza del processo di produzione chiedendosi quale frazione dell’energia cinetica del protone incidente contribuisce alla massa del mesone. L’energia cinetica
del protone è (γ − 1)M , per cui il rapporto
η=
mπ
M (γmin − 1)
=
1
2(1 + mπ /4M )
Con i valori citati delle masse l’efficienza è circa del 48%. Un altro esempio è la produzione
del mesone J/Ψ(3096)
e− + e+ → J/ψ → hadrons
che è rivelato come risonanza nel canale e+ + e− in adroni. Assumendo e+ in quiete (non
come nell’esperimento!) si ha
µ
pµ + mδ0µ = PJ/ψ
e da qui
Emin
M 2 − 2m2
=
2m
Con la massa della particella J/Ψ pari a 3096 Mev e m = 0, 5 Mev, l’efficienza è quasi
zero
η=
M
m(γmin − 1)
≃
2m
1
≃
M
3100
e l’energia cinetica richiesta avrebbe il valore (astronomico per i tempi della scoperta,
novembre 1976) di 9 × 103 Gev. Se invece i fasci di e± collidono frontalmente (come
nell’esperimento reale) si ha più semplicemente
2E = 2mγ = EJ/ψ ≥ M
per cui
1
Emin = M ∼ 1548 Mev
2
69
E: Mostrare che l’annichilazione di un fotone in una coppia elettrone positrone è impossibile. Si mostri che in presenza di un nucleone N la reazione
γ + N → N + e+ + e−
diventa possibile. Si mostri che l’energia di soglia del fotone è
(
m)
2
hν = 2mc 1 +
M
Con M = 938 Mev e m = 0, 5 Mev si verifichi che l’efficienza alla soglia è praticamente
del 100%.
4.8.3
Decadimento
Una classe importante di problemi riguarda la disintegrazione di una particella in due o
più frammenti. Nel caso di due frammenti il problema è interamente determinato. Sia la
particella instabile inizialmente in quiete. La conservazione dell’impulso relativistico dà
M = E1 + E2 ,
P1 + P2 = 0
Allora
(M − E1 )2 − |P2 |2 = m22
oppure
E1 =
M 2 − m22 + m21
2M
Analogamente
E2 =
M 2 − m21 + m22
2M
Il problema inverso è la fusione di due particelle in una di massa M . L’energia richiesta, nel
caso che una delle due sia inizialmente in quiete, si calcola dalla conservazione dell’impulso
nella forma
pµ1 + m2 δ0µ = P µ
eguagliando la norma dei due membri. Dunque
m21 + m22 + 2m2 E1 = M 2
da cui segue facilmente E1 . Nel caso del decadimento di una particella in volo si può
scrivere, per esempio,
pµ2 = P µ − pµ1
70
Da qui la relazione
m22
2
=M +
m21
√
− 2EE1 + 2P E12 − m21 cos θ
(8.7)
o anche
(2EE1 − 2M E01 )2 = 4P 2 cos2 θ(E12 − m21 )
e infine usando V = P/E
√
2
(1 − V 2 cos2 θ)E12 − 2E01 1 − V 2 E1 + E01
(1 − V 2 ) + m21 V 2 cos2 θ = 0
(8.8)
Le due radici per un valore dato di θ corrispondono al caso v0 < V , dove v0 è la velocità
della particella 1 nel sistema c.m. (centro di massa) e V quella della particella instabile.
Se invece v0 > V la radice è unica mentre nel caso degenere corrispondente a v0 = V si ha
una radice doppia. La spiegazione grafica dell’esistenza di due radici è la seguente. Dalle
formule di trasformazione si ha l’impulso della prima particella (per la seconda le formule
sono analoghe) in funzione delle grandezze riferite al sistema c.m.
px = γ(p0 cos α + V E0 ),
py = p0y = p0 sin α
da cui si ottiene l’equazione di un’ellisse
(px − γV E0 )2 p2y
+ 2 =1
γ 2 p20
p0
Se il semiasse maggiore, a = γp0 , è minore della distanza del centro dell’ellisse dall’origine,
distanza che è γV E0 , ossia se v0 < V , allora per un dato θ il vettore (px , py ) interseca
l’ellisse i due punti, che corrispondono appunto ai due valori possibili dell’energia. In
questo caso esiste anche un valore massimo per θ (quando il vettore (px , py ) è tangente
all’ellisse) che si trova facilmente annullando il discriminante dell’equazione (8.8)
√
p0 1 − V 2
sin θmax =
m1 V
4.9
Moto dello spin e precessione di Thomas
Consideriamo una particella dotata di momento angolare intrinseco, descritto nel sistema
di quiete (momentaneo) della particella dal vettore J0 ; si può pensare a J0 come al valore
medio dell’operatore del momento angolare nel sistema a riposo, oppure come al momento
angolare orbitale di una trottola nel limite in cui il suo momento di inerzia tende a zero
e la velocità angolare tende all’infinito, restando costante il loro prodotto. In entrambi i
casi, ci riferiremo al vettore J0 semplicemente come allo “spin” della particella. Si noti che
le conclusioni della relatività sul moto dello spin sono comunque indipendenti dal modello
preciso che governa i suoi “gradi di libertà interni”.
71
Se nel sistema di quiete F0 il momento torcente si annulla, il vettore J0 non precede
(rispetto a F0 )
dJ0
=0
dt′
(9.1)
La descrizione relativistica dello spin introduce il quadri-vettore J a che in F0 si riduce a
J0a = (0, J0 ); dunque si ha sempre J 2 > 0 e Ja ua = 0, dove ua = (γ, γv) è la quadri-velocità
della particella.
Qual’è ora l’equazione relativistica (cioè invariante di Lorentz) che descrive il moto dello
′
spin? Osservando che in F0 si ha dt = dτ , si potrebbe pensare che la corretta equazione
relativistica sia l’equazione invariante dJ a /dτ = 0. Tuttavia si vede facilmente che non
può essere cosı̀: la condizione di ortogonalità J a ua = 0 implicherebbe infatti la nuova
condizione u̇b J b = 0, u̇b = dub /dτ , che in generale non è vera. Scriviamo allora l’equazione
più generale che si riduce alla (9.1) nel sistema di quiete
dJ a
= ηua
dτ
(9.2)
Contraendo con ua e usando l’ortogonalità J a ua = 0 si trova
η = ab J b
(9.3)
Le formule (9.2) e (9.3) risolvono il problema posto. Si noti che si può anche scrivere la
(9.2) nella forma
dJ a
= Ωab J b ,
dτ
Ωab = ua u̇b − ub u̇a
(9.4)
La legge di trasporto di un vettore secondo questa equazione è detta trasporto di FermiWalker. Dalle trasformazioni di Lorentz si deducono le formule
J = J0 +
(γ − 1)
(J0 · v) v,
v2
J 0 = J · v = γ (J0 · v)
(9.5)
precessione dello spin
La (9.5) mostra che la parte spaziale di J a non rappresenta lo spin della particella “visto”
nel sistema del laboratorio, che è invece descritto dal vettore J0 . Dall’equazione del moto
si ha
)
(
dJ0
d (γ − 1)
(γ − 1)
dJ
=
+
(J0 · v) v +
(J0 · v)v̇ = ab J b v
2
dt
dt
dt
v
v2
Si vede facilmente che ab J b = −a0 J 0 + a · J = γ 2 v̇ · J, se si usano le formule esplicite per
la quadri-accelerazione
a=γ
dγv
= γ 4 (v · v̇)v + γ 2 v̇,
dt
a0 = γ 4 (v · v̇)
72
Inoltre J0 · v = γ −1 J · v = γ −1 J 0 e
dJ 0
= ab J b = γ 2 v̇ · J
dt
Possiamo quindi scrivere
(
(
))
dJ0
d (γ − 1) 0
(γ − 1)
2
= γ (v̇ · J) −
J
v−
(J0 · v)v̇
2
dt
dt
γv
v2
Un calcoletto un pò lungo ma elementare porta al risultato semplice
(
)
d (γ − 1) 0
γ−1
2
γ (v̇ · J) −
J
=
(J0 · v̇)
dt
γv2
v2
Questo si ottiene usando: (a) la formula di trasformazione di J per eliminare J in favore
di J0 , (b) l’equazione del moto per J 0 e (c) la relazione
dγ
= γ 3 v · v̇
dt
In definitiva si ottiene l’equazione per la precessione dello spin
dJ0
(γ − 1)
=
((J0 · v̇)v − (J0 · v)v̇) = Ω ∧ J0
dt
v2
dove la velocità angolare di precessione è
Ω=−
4.10
(γ − 1)
v ∧ v̇
v2
(9.6)
(9.7)
Principio variazionale
Il moto della particella libera può essere ricavato da un principio variazionale cha ha un
suo interesse particolare. Infatti l’azione di un sistema libero è il punto di partenza per
l’introduzione delle interazioni. Si consideri la seguente azione per una particella di massa
m
∫
∫ f√
I = −m
dτ = −m
−dxa dxa
(10.1)
γ(i,f )
i
dove γ(a, b) è una curva differenziabile timelike che unisce gli eventi i ed f . Si noti che
l’azione è invariante di Lorentz. Variando le coordinate degli eventi si ottiene, al primo
ordine in δxa , la formula
∫ f √
∫ f
∫ f
dxa
dpa a
a
a f
2
δI = −m
δ −dx = m
dδx = pa δx |i −
δx
(10.2)
dτ
dτ
i
i
i
dove pa = mua = mẋa è il quadri-impulso della particella. Se le variazioni sono nulle negli
estremi della curva, allora la condizione estremale δI = 0 equivale all’equazione del moto
73
ṗa = 0. Le soluzioni si chiamano curve estremali dell’azione.
Considerando l’azione sull’estremale come una funzione delle coordinate del punto terminale dell’estremale, dalla formula appena scritta si ottiene
P a = ∂a I
(10.3)
La “mass-shell condition”, p2 + m2 = 0, si traduce allora nella versione relativistica
dell’equazione di Hamilton-Jacobi
∂a I∂ a I + m2 = 0
(10.4)
Per un sistema di particelle libere scriveremo
∑
In
I=
n
Lagrangiana
Usando il tempo t di un sistema di riferimento inerziale l’azione può scriversi nella forma
∫ t2 √
I = −m
1 − v 2 dt
(10.5)
t1
Di qui leggiamo la lagrangiana
√
1
L = −m 1 − v 2 = −m + mv 2 + · · ·
2
(10.6)
Vediamo che per basse velocità dà la corretta lagrangiana non relativistica. L’esistenza
della lagrangiana permette di riconfermare le espressioni ottenute per il momento lineare
e l’energia. Infatti
p=
∂L
mv
=√
,
∂v
1 − v2
m
E =p·v−L= √
1 − v2
(10.7)
come volevasi dimostrare.
Simmetrie
L’equazione (10.2) si presta ad una importante applicazione. Consideriamo una o più
trasformazioni infinitesime delle variabili dinamiche
xa → x̄a = xa + δϵ xa
con la proprietà di non cambiare l’azione
I[x] = I[x̄] = I[x + δϵ x]
(10.8)
74
Se questo è il caso diremo che abbiamo a che fare con trasformazioni di simmetria. Allora
δϵ I = 0 anche indipendentemente dalla validità dalle equazioni del moto, e usando la
(10.2) si avrà l’identità
∫ f
dpa
a f
δϵ I = pa δϵ x |i −
δϵ xa = 0
(10.9)
dτ
i
L’azione possiede certamente le simmetrie di Lorentz e di traslazione spazio-temporale, ma
possiede anche simmetrie meno evidenti e più complicate, come ad esempio la simmetria
di invarianza per riparametrizzazione della traiettoria. Ora se le equazioni del moto sono
soddisfatte, la (10.9) si riduce alla
pa δϵ xa |i = pa δϵ xa |f
(10.10)
che è una legge di conservazione: l’equazione stipula che le grandezze pa δϵ xa sono le stesse
per ogni coppia di eventi sulla linea di universo della particella. Facciamo due esempi.
Se δϵ xa = ϵa allora si ha una simmetria di traslazione e la grandezza che si conserva è la
componente di pa lungo ϵb , cioè pa ϵa . Dato che ϵ è arbitrario ciò equivale a dire che si
conserva il quadri-impulso, come segue per altro direttamente dalle equazioni del moto.
Se invece
δϵ xa = ϵab xb ,
ϵab + ϵba = 0
E 25 Si dimostri che questa variazione rappresenta una trasformazione di Lorentz infinitesima. Si dimostri che I è invariante, cioè che vale la (10.8).
La legge di conservazione dice allora che si conservano le grandezze
Lab = xa pb − xb pa
4.11
(10.11)
Momento angolare
75
Capitolo 5
Elettrodinamica covariante
È ben noto che i campi elettromagnetici obbediscono alle equazioni di Maxwell. La prima
coppia di queste equazioni
rot E = −
1 ∂B
,
c ∂t
1a coppia
div B = 0
(0.1)
è equivalente al fatto che i campi derivano dai potenziali A e ϕ, secondo le formule
standard
E = −∇ϕ −
1 ∂A
,
c ∂t
B = rot A
(0.2)
La seconda coppia introduce l’interazione con le sorgenti dei campi, che sono le cariche
elettriche e le correnti,
rot B =
1 ∂E 4π
+
J,
c ∂t
c
div E = 4πρ
2a coppia
(0.3)
ρ è la densità di carica, J la densità di corrente, e sono entrambe vincolate dall’equazione
di continuità
∂ρ
+ div J = 0
∂t
5.1
(0.4)
Forma covariante delle equazioni
Per studiare la covarianza di queste equazioni rispetto al gruppo di Lorentz, introduciamo
il potenziale
Aa = (−ϕ, A),
Aa = (ϕ, A)
e il campo antisimmetrico
Fab = ∂a Ab − ∂b Aa
(1.1)
76
Allora il confronto con la (0.2) dà le componenti
Fj0 = Ej ,
Fij = eijk Bk
o in forma più esplicita


0 −Ex −Ey −Ez
 Ex
0
Bz −By 

Fab = 
 Ey −Bz
0
Bx 
Ez By −Bx
0
(1.2)
Da questo si verifica direttamente che le quattro equazioni
∂a Fbc + ∂b Fca + ∂c Fab = 0
(1.3)
sono esattamente identiche alla 1a coppia delle equazioni di Maxwell, e dunque che la
covarianza di queste equazioni è equivalente al fatto che Fab sia un tensore di universo
covariante (cioè un tensore nello spazio di Minkowski).
Per riscrivere la seconda coppia introduciamo formalmente la corrente quadri-dimensionale
di componenti
J a = (cρ, J)
(1.4)
L’equazione di continuità (0.4) assume la forma covariante
∂a J a = 0
(1.5)
e tale veramente sarà se J a è un quadri-vettore. Come vedremo, questo segue dall’invarianza di Lorentz della carica elettrica. L’Eq. (0.4) prende il nome di condizione di
conservazione della corrente.
Si verifica direttamente dalla (1.2) che le quattro equazioni
4π b
J ,
F ab = η ac η bd Fcd
(1.6)
c
sono esattamente identiche alla 2a coppia delle equazioni di Maxwell. Ad esempio, se
b = 0 si ha ∂k F k0 = −4πρ, perché F 00 = 0 e J 0 = cρ. Ma F k0 = −Ek , da cui si ottiene
appunto l’equazione div E = 4πρ. Si noti che che la covarianza delle (1.6) richiede che J a
sia un quadri-vettore. Mostriamo che questo fatto segue dall’invarianza di Lorentz della
carica elettrica.
∂a F ab = −
5.2
Corrente elettrica
Consideriamo una carica puntiforme di valore e, e sia z a (p) la sua linea di universo parametrizzata da p. Se la carica è invariante per trasformazioni di Lorentz allora l’integrale
esteso alla linea di universo
∫
a
J (x) = e δ (4) (x − z(p))dz a
(2.1)
77
definisce un campo di quadri-vettori che chiameremo la quadri-corrente elettrica. Si noti
che l’integrale non dipende dalla scelta del parametro p. Possiamo allora scegliere p = z 0 ,
cosı̀ che z 0 (p) = z 0 e l’integrale diventa
J a (x0 , x) = e δ (3) (x − z(x0 )) v a ,
va =
dz a
dx0
(2.2)
La definizione di J a come corrente elettrica è giustificata dalle seguenti proprietà
• vale l’equazione di continuità
∂a J a = 0
(2.3)
• J 0 rappresenta la densità di carica elettrica. Infatti
∫
J 0 dx = e
(2.4)
come segue immediatamente dalla (2.2).
L’invarianza di Lorentz della carica è resa necessaria dal principio di relatività, perché
la carica elettrica è la sorgente dei campi elettromagnetici e, dunque, misure dei campi
potrebbero rivelare la velocità del sistema di riferimento. Più concretamente, una dipendenza della carica dell’elettrone dalla velocità è sicuramente inamissibile perché altrimenti
non sarebbe possibile avere atomi elettricamente neutri. Inoltre gli spettri atomici sono
indipendenti dalla velocità degli elettroni negli atomi e dipendono dalla velocità di questi
ultimi solo attraverso l’effetto Doppler.
Il carattere vettoriale della corrente implica subito il carattere tensoriale di F ab , e con
esso la covarianza delle equazioni di Maxwell (1.3) e (1.6). Dato che la carica è additiva,
la corrente di un sistema di particelle sarà
∑ ∫
a
J (x) =
en δ (4) (x − zn (p)) dzna
(2.5)
n
oppure
J a (x0 , x) =
∑
en δ (3) (x − zn (x0 )) vna
(2.6)
n
La conservazione della corrente espressa dall’equazione ∂a J a = 0 ha una conseguenza
molto importante che ritroveremo anche nel caso di correnti conservate più generali di
J a . Si consideri la regione di spazio-tempo Ω racchiusa tra i due iperpiani x0 = ct1 e
x0 = ct2 > ct1 . Allora
∫
∫
∫
∫
∫
a 4
0 3
0 3
0
0=
∂a J d x =
J d x−
d3 x div J
(2.7)
J d x + dx
Ω
x0 =ct2
x0 =ct1
78
Se J tende a zero all’infinito in maniera sufficientemente rapida l’ultimo integrale si annulla
e si ha la legge di conservazione della carica elettrica
∫
dQ
= 0,
Q=
J 0 (t, x)d3 x
dt
Σ
dove Σ è l’iperpiano x0 = cte. Più in generale,
∫
Q = − J a Na (t, x)dV
Σ
dove Σ è l’iperpiano Na xa = cte e dV l’elemento di volume proprio sull’iperpiano, cioè,
per chi conosce le forme differenziali, dV = N a eabcd dxb dxc dxd /6.
′
′
Q è invariante di Lorentz: infatti, scegliendo l’iperpiano Σ definito da x 0 = cte, per la
′
conservazione della corrente Q non cambia e dV = d3 x . Ma allora
∫
∫
∫
′a
′
′
′
′
′
′
a
Q=−
J Na (t, x)dV = −
J Na (t, x )dV =
J 0 (t, x )d3 x = Q
Σ′
Σ′
Σ′
′
′
perché la normale a Σ per l’osservatore in moto che usa le coordinate x a è precisamente
′
Na = (−1, 0, 0, 0).
teorema di Gauss
Possiamo scrivere la (2.7) nella forma di un teorema di Gauss in quattro dimensioni. A
tale scopo indichiamo con ∂Ω il bordo orientato della regione Ω. Assumeremo che ∂Ω sia
l’unione disgiunta di certe ipersuperfici, alcune delle quali sono spaziali (il vettore normale
è di tipo tempo), altre temporali (il vettore normale è di tipo spazio), ma nessuna è nulla
(il vettore normale è di tipo nullo). Sia na il vettore normale al bordo, orientato verso
l’esterno di Ω sui tratti di ∂Ω che sono di tipo tempo, e verso l’interno sui tratti spaziali.
Infine sia K Aa un tensore, dove A indica gli altri indici possibilmente presenti. Allora si
ha
∫
∫
Aa 4
∂a K d x =
K Aa na dV
(2.8)
Ω
∂Ω
dove dV è l’elemento di volume sul bordo. La ricetta per dV è la seguente: scelte tre
coordinate (y 1 , y 2 , y 3 ) sul bordo, la distanza che vi è indotta dalla metrica di Minkowski
sarà
ds2 = ηab dxa dxb =
3
∑
hij (y)dy i dy j ,
hij (y) = ηab
i,j=1
∂xa ∂xb
∂y i ∂y j
perché se xa (y j ) sono le coordinate inerziali di un punto sul bordo, si ha evidentemente
a
dx =
3
∑
∂xa
j=1
∂y j
dy j
79
Se h = det(hij ), la formula per la misura è
√
dV = h d3 y
Si noti che dV , oltre a essere invariante per trasformazioni di Lorentz, lo è anche per
′
cambiamenti arbitrari di coordinate sul bordo, y i → y i (y). Si può interpretare dV come
l’elemento di volume proprio, misurato in un sistema di coordinate ripetto al quale l’elemento è in quiete. La sua invarianza spiega l’invarianza di Lorentz della carica Q o, più
in generale, del secondo membro della (2.8).
invarianza di gauge
La prescrizione Fab = ∂a Ab − ∂b Aa non determina i potenziali, perché la cosiddetta
trasformazione di gauge
′
Aa (x) = Aa (x) + ∂a f (x)
(2.9)
lascia invariati i campi elettromagnetici, e dunque anche le equazioni di Maxwell. È questa
la ben nota invarianza di gauge dell’elettrodinamica, che rende i potenziali non misurabili.
Questa stessa simmetria impedisce anche che le equazioni per i potenziali non possano
essere risolte univocamente. Tuttavia la seconda coppia diventa, sostituendovi la (1.1),
2Aa − ∂a ∂ b Ab = −
4π
Ja
c
(2.10)
Questo suggerisce di sfruttare l’invarianza di gauge per imporre la condizione di Lorenz
(non Lorentz)
∂a A a = 0
(2.11)
che ha il merito di semplificare grandemente le equazioni di campo e di essere invariante
di Lorentz (non Lorenz). Si osservi che la trasformazione di gauge Aa → Aa + ∂a Ψ, dove
2Ψ = 0, preserva la condizione di Lorenz e la (2.10).
5.3
Trasformazione dei campi
Consideriamo per prima una trasformazione di Lorentz speciale lungo x, con velocità v,
e poniamo Λba = (Λ−1 )ab ; si ha


γ γv 0 0
 γv γ 0 0 

(3.1)
Λb a = 
 0 0 1 0 
0 0 0 1
Dalla formula di trasformazione
′
′
Fab (x ) = Λac Λbd Fcd (x)
80
si ricavano le formule
′
Ex = Ex ,
v
′
Ey = γ(Ey − Bz ),
c
v
′
Ez = γ(Ez + By )
c
(3.2)
v
v
′
′
By = γ(By + Ez ), Bz = γ(Bz − Ey )
(3.3)
c
c
Si noti come il carattere elettrico o magnetico dei campi diventi un aspetto relativo. In
forma vettoriale
(
)
E·v
1
′
E = (1 − γ) 2 v + γ E + v ∧ B
(3.4)
v
c
′
Bx = Bx ,
(
)
B·v
1
B = (1 − γ) 2 v + γ B − v ∧ E
v
c
′
(3.5)
Interessanti sono anche le regole di trasformazione delle correnti
′
ρ = γ(ρ − vJx /c2 ),
′
Jx = γ(Jx − vρ),
′
Jy = Jy ,
′
Jz = Jz
(3.6)
Ad esempio, un filo percorso da corrente appare elettricamente carico a un osservatore
in moto rispetto al filo. Ciò si accorda con il fatto che un tale osservatore osservebbe,
secondo le (3.2), un campo elettrico direttamente proporzionale al campo magnetico del
filo. Le formule (3.6) mostrano anche che la distinzione fra correnti di convezione (J = ρv)
e correnti di conduzione dipende dal sistema di riferimento (ovvero è relativa). Per una
semplice spiegazione microscopica della misteriosa apparizione di cariche nei conduttori
in movimento si veda W. Pauli, Theory of Relativity, Dover Ed. (1958) oppure E. Purcell,
Elettricità e magnetismo, Collana “La Fisica di Berkeley“, Zanichelli 1973.
5.4
Elettrodinamica fenomenologica
Diamo qui un breve cenno alla formulazione relativistica delle più importanti equazioni
costitutive dell’elettrodinamica macroscopica. Per un dielettrico omogeneo e isotropo
queste sono
D = εE,
B = µH
(4.1)
mentre per i conduttori percorsi da corrente continua, o alternata con frequenza sufficientemente bassa1 , si ha la legge di Ohm per la corrente di conduzione
Jc = σE
(4.2)
I campi macroscopici in queste equazioni sono campi medi all’interno dei materiali, ε è la
costante dielettrica, µ la permeabilità magnetica2 e σ la conducibilità. Tutte le equazioni
1
Si veda, per esempio, il trattato di L. Landau, L. P. Pitaevskii e E. Lifschitz, Electrodynamics of
Continuous Media, 2 edition (15 Oct 1984)
√
2
Cosicché n = εµ è l’indice di rifrazione.
81
si riferiscono naturalmente a dielettrici o conduttori immobili. Sorge dunque la questione
di generalizzarle ai corpi in moto, e in questo la relatività è di grande aiuto.
Innanzitutto postuliamo che la coppia (D, H) corrisponda al tensore Hab nello stesso modo
in cui (E, B) corrispondono al tensore Fab . È facile convincersi che le uniche equazioni
tensoriali lineari che si riducono alle (4.1) nel sistema di quiete sono, rispettivamente,
Hab U b = εFab U b
(4.3)
Fab Uc + Fca Ub + Fbc Ua = 0
(4.4)
dove U a è la quadri-velocità del dielettrico. Queste sono le equazioni costitutive di
Minkowski. Per quanto riguarda la legge di Ohm è chiaro che deve aversi
J a + U a U b Jb = σF ab Ub
(4.5)
in quanto il secondo membro è ortogonale a U . Dalle Eq. (4.3) si ottiene facilmente
D + v × H = ε(E + v × B)
Analogamente, dalle (4.4),
B − v × E = µ(H − v × D)
Eliminando B dalla prima e D dalla seconda si ottengono le formule seguenti di Minkowski
(1911)
D=
ε(1 − v 2 )E − ε(εµ − 1)(v · E)v + (εµ − 1)v × H
1 − εµv 2
µ(1 − v 2 )H − (εµ − 1)v × E − µ(εµ − 1)(v · H)v
1 − εµv 2
√
Si noti che con le nostre unità 1/ εµ è la velocità della luce nel dielettrico.
E25: Si ripristini la velocità della luce nelle formule precedenti. Si approssimino le formule tenendo conto solo dei termini di ordine zero e uno in v/c.
Per la legge di Ohm si trova facilmente la formula
B=
J = σγ(E − (v · E)v + v × B) + ρv
L’ultimo termine rappresenta la corrente di trasporto dovuta al fatto che il conduttore
mobile appare elettricamente carico e dunque J − ρv = Jc rappresenta la vera corrente di
conduzione, per la quale vale la formula
Jc = σγ(E − (v · E)v + v × B)
(4.6)
Trascurando termini quadratici in v si ha il risultato più intuitivo
Jc = σ(E + v × B)
(4.7)
82
Infatti il vettore in parentesi è la forza di Lorentz per unità di carica.
E26: Si ripristini la velocità della luce nella formula ottenuta. Si approssimi la formula
tenendo conto solo dei termini di ordine zero e uno in v/c.
E27: Si mostri che la carica acquisita dal conduttore in moto è
ρ=
1 v · Jc
c2 1 − v 2 /c2
L’effetto è dunque trascurabile.
5.5
Campo di una carica in moto rapido
Per risolvere alcuni semplici problemi di radiazione elettromagnetica useremo il metodo
delle funzioni di Green. Le soluzioni dell’equazione delle onde non omogenea
∂a ∂ a ϕ = −j(x)
si ottengono se si conosce una distribuzione G(x, y) tale che
∂ 2 G(x, y) = −δ(x − y)
(5.1)
Allora una soluzione particolare dell’equazione è
∫
ϕ(x) = G(x, y)j(y)d4 y
È facile determinare le possibili funzioni di Green; infatti la formula
∫ ik·(x−y)
e
−4
G(x, y) = (2π)
d4 k
k2
(5.2)
(5.3)
determina formalmente una soluzione della (5.1), se non fosse per le singolarità del denominatore nei vettori nulli, per cui k 2 = 0. Se consideriamo k 2 come una funzione di
k 0 , il denominatore ha poli semplici nei punti k 0 = ±|k|, e per dare senso all’integrazione
in k 0 bisogna dunque dare una regola di aggiramento dei poli. A ciascuna prescrizione
corrisponde una diversa funzione di Green. Consideriamo allora la seguente prescrizione:
si spostino i due poli leggermente al di sotto dell’asse reale nel piano complesso della
variabile k 0 , cioè si consideri l’integrale
∫
∫
eik·(x−y)
eik·(x−y) 4
−4
4
−4
G− (x, y) = (2π)
d
k
=
(2π)
dk
(5.4)
−(k 0 + iε)2 + |k|2
k 2 − 2iεk 0
dove il limite ε → 0 è sottinteso e l’integrazione in dk 0 è fatta per prima. Usando il
teorema di Cauchy si trova facilmente [esercizio]
′
G− (x, x ) =
1
′
′
′
′ 2
′ δ(t − t − |x − x |) = θ(t − t )δ((x − x ) )
4π|x − x |
83
(5.5)
dove l’ultima eguaglianza è conseguenza della nota formula
)
1 ( 0
δ(x − |x|) + δ(x0 + |x|)
2|x|
δ(x2 ) =
(5.6)
che si studia nel corso di metodi matematici per la fisica. Ci sono due aspetti notevoli
′
nella formula (5.5). Il primo è l’annullarsi di G− quando l’evento x precede x (nel tempo).
Per questo G− si chiama la funzione di Green ritardada. Il secondo è che il supporto della
distribuzione è interamente contenuto nel cono luce; cioè il campo in x è completamente
′
determinato dal valore della sorgente nei punti x del suo supporto che si trovano sul cono
luce passato uscente da x, in accordo con la richiesta di causalità e con la propagazione a
velocità finita (c in questo caso) delle onde. Esiste anche una funzione di Green avanzata
′
G+ (x, x ) =
1
′
′
′
′ 2
′ δ(t − t + |x − x |) = θ(t − t)δ((x − x ) )
4π|x − x |
(5.7)
che si ottiene spostando i poli leggermente al di sopra dell’asse reale nel piano complesso
della variabile k 0 , cioè operando la sostituzione k 2 − 2iεk 0 → k 2 + 2iεk 0 nell’integrale
(5.4).
campo di una carica veloce
Le equazioni di Maxwell per i potenziali nella gauge di Lorenz sono
2Aa = −4πJ a ,
∂ a Aa = 0
Per una sola carica la corrente è J a = eż a (t)δ (3) (x − z(t)) e dunque, in base alla (5.2), la
soluzione ritardata dell’equazione assume la forma
∫
(
) ′
1
′
′
a
a ′
A (x) = e
ż
(t
)δ
t
−
t
−
|x
−
z(t
)|
dt
|x − z(t′ )|
Il calcolo procede usando la formula (v. il punto (3) della lista in appendice A)
)−1
) (
(x − z(t− )) · ż(t− )
′
δ t − t − |x − z(t )| = 1 −
δ(t − t− )
|x − z(t− )|
(
′
′
dove t− è l’unica soluzione dell’equazione
t − t− − |x − z(t− )| = 0
Chiameremo t− il tempo ritardato; l’interpretazione fisica è ovvia: il campo al tempo
t in x dipende solamente dalla posizione della carica al tempo t− , tale che t − t− sia
esattamente il tempo richiesto alla radiazione elettromagnetica per percorrere la distanza
|x − z(t− )|. Dunque l’evento di coordinate (t− , z(t− )) sta sull’intersezione del cono luce
passato uscente da x = (t, x) (il cosiddetto punto campo) con la linea di universo della
carica, dal che si capisce la ragione della sua univoca determinazione.
84
′
Un’ultima integrazione in t fornisce il risultato finale
Aa (t, x) =
eva (t− )
,
|x − z(t− )| − (x − z(t− )) · ż(t− )
va =
dz a
dt
(5.8)
Questi sono noti come i potenziali di Lienard-Wiechert. Introducendo il quadrivettore
nullo Ra = xa − z a (t− ) = (t − t− , x − z(t− )), si può riscrivere la formula precedente nella
forma covariante
eU a
Aa (x) = −
(5.9)
Rb U b
dove U a è la quadri-velocità e si sottintende che tutto nel secondo membro va calcolato nel
tempo ritardato t− , o equivalentemente al corrispondente tempo proprio ritardato τ− . È
chiaro che τ− = τ− (x): le derivate parziali si calcolano differenziando l’identità Ra Ra = 0
0 = 2Ra ∂b Ra = 2Ra (δba − U a ∂b τ− )
da cui
∂b τ− =
Rb
Rc U c
(5.10)
Il calcolo del campo elettromagnetico procede usando la formula
Fab (x) = ∂a Ab − ∂b Aa
tenendo presente la dipendenza di τ− da x: dal risultato appena esposto, con un semplice
conto si ottiene
e
e
Fab (x) =
(Ra Ub − Rb Ua ) −
(Ra U̇b − Rb U̇a )
3
(R · U )
(R · U )2
e
+
(R · U̇ )(Ra Ub − Rb Ua )
(5.11)
(R · U )3
dove è sottinteso che tutti i termini scritti sono calcolati nel tempo ritardato τ− . Il primo
termine, decrescente come R−2 a grandi distanze è il campo Coulombiano irriducibilmente
associato ad ogni carica. La radiazione elettromagnetica propriamente detta è descritta
dai termini successivi. Si noti che decrescono con il tipico andamento Fab ∼ R−1 . Nel seguito reintrodurremo c in tutte le formule scritte nella versione tridimensionale, lasciando
c = 1 solo per le formule scritte in notazione quadri-dimensionale. Se il moto è uniforme
solo il campo di Coulomb sopravvive: dalla (5.11) si ricava facilmente
(
(1 − β 2 )
v )
EC = e
R
−
R ,
B = n × EC
(5.12)
c
(R − R · v/c)3
dove n = R/R. Si noti che il vettore R∗ = R − Rv/c connette la posizione della carica
al tempo t con il punto campo x = (ct, x), e che
√
R·v
R−
= R∗ 1 − β 2 sin2 θ
c
85
dove θ è l’angolo tra R∗ e v (si consiglia di fare un disegno dei vettori coinvolti). Dunque
si può scrivere
e(1 − β 2 )
R∗
(5.13)
2
2
3/2
(1 − β sin θ) R∗3
che è il risultato che si otterrebbe con le trasformazioni di Lorentz dal rest system. Nel
caso generale si ottiene la formula più complicata
]
[(
e
v )
E = EC + 2
R
×
v̇
(5.14)
R
×
R
−
c (R − R · v/c)3
c
EC =
B=n×E
(5.15)
dove n = R/R.
radiazione
Per discutere la radiazione emessa dalla carica omettiamo nel seguito il campo Coulombiano EC ; l’intensità emessa nell’angolo solido dΩ è, in accordo con le formule generali (si
veda l’Eq. (4.10) nella Sezione §6.4),
c 2 2
c 2 2
dI =
E R dΩ =
B R dΩ
(5.16)
4π
4π
Uno sguardo alla (5.14) mostra subito che la distribuzione angolare della radiazione deve
essere assai complicata. Nel caso in cui v e v̇ siano vettori paralleli la formula si semplifica:
si ha in tal caso (si consulti [6], §73)
e
v̇ × n
B= 2
(5.17)
c R (1 − v cos θ/c)6
e
e2
a2 sin2 θ
dI =
dΩ
(5.18)
4πc3 (1 − v cos θ/c)6
dove a = |v̇|. Il denominatore è la correzione relativistica, ma per il resto la formula
coincide con il risultato standard della radiazione dipolare. L’intensità totale è l’integrale
su θ con la misura 2π sin θdθ, e risulta essere
I=
5 + β2
Idipole
5(1 − β 2 )4
(5.19)
where
2e2 a2
3c3
è la radiazione dipolare. Se v e v̇ sono ortogonali si trova invece
[
]
e2 a2
1
(1 − β 2 ) sin2 θ cos2 ϕ
dI =
−
dΩ
4πc3 (1 − β cos θ)4
(1 − β cos θ)6
e
5 − 2β 2
I=
Idipole
5(1 − β 2 )3
Idipole =
86
(5.20)
(5.21)
(5.22)
5.6
L’equazione di Lorentz-Dirac
Si vuole considerare l’effetto delle forze di reazione sulla carica dovute all’emissione di
radiazione. Nel sistema di riferimento dove la velocità della carica è piccola, il lavoro
medio della forza per unità di tempo deve corrispondere alla potenza totale irradiata, cioè
f ·v =−
2e2 2
|v̇|
3c3
(6.1)
dove le quantità barrate sono medie temporali del tipo
∫
1 T
A = lim
f (t)dt
t→∞ T 0
Con una manipolazione “alla Landau-Lifschitz” scriviamo
2e2 d
2e2
f · v = − 3 (v · v̇) + 3 v · v̈
3c dt
3c
(6.2)
Dobbiamo considerare una situazione in cui la funzione v · v̇ sia limitata, cosicché la
media temporale della sua derivata si annulli. Resta allora il secondo termine, che è
consistente con la presenza di una forza istantanea di reazione che dipende dalla derivata
dell’accelerazione
f=
2e2
v̈
3c3
(6.3)
La derivazione data qui di questa espressione non può che considerarsi euristica. Infatti le
forze di reazione nascono dagli effetti della radiazione emessa all’ordine (v/c)3 , e dunque
bisognerebbe mostrare che i contributi ai campi di radiazione dei termini di ordine (v/c)n ,
con n > 3, tendono tutti a zero in prossimità della carica elettrica nel sistema istantaneo
di quiete. Poiché questo si verifica ( vedere [6], §75), l’espressione (6.3) per una singola
carica è esatta nel sistema di quiete.
Poniamo
t0 =
2e2
3mc3
In elettrodinamica classica si introduce il raggio classico dell’elettrone con l’espressione
r0 =
e2
≃ 10−13 cm
mc2
Dato che la massa propria elettromagnetica di una carica puntiforme è infinita, cioè l’integrale che dà l’energia del suo campo elettrostatico diverge, si ritiene che r0 definisca il
limite di applicabilità dell’elettrodinamica classica, in quanto l’energia propria osservata
di una particella puntiforme è mc2 , non infinito. Allora t0 ∼ 10−24 s è il tempo che impiega la luce ad attraversare il raggio classico dell’elettrone e, come per r0 , definisce la scala
temporale che limita l’applicabilità dell’elettrodinamica classica alle particelle elementari.
87
Si noti che per un protone queste scale sono duemila volte più piccole, ma va detto che
un protone non è propriamente un oggetto elementare puntiforme. Ora l’equazione del
moto di una carica libera a bassa velocità sarebbe
t0 v̈ − v̇ = 0
(6.4)
la quale, oltre alla soluzione standard v = costante, ammette anche la soluzione di fuga
v = bet/t0
descrivente una particella che si auto-accelera per emissione di radiazione. Si potrebbe
porre b = 0 arbitrariamente, ma questo non è possibile se la velocità iniziale è diversa da zero. Dunque una particella, dopo avere attraversato un campo, dovrebbe autoaccelerarsi indefinitamente. L’assurdità di questo risultato richiede ovviamente una discussione più approfondita, cui accenneremo più avanti. Qui notiamo solo che ancora una
volta si trova che l’elettrodinamica classica non sembra essere una teoria del tutto priva
di contraddizioni.
Per includere questa forza nelle equazioni del moto relativistiche di una carica in un campo
esterno si deve trovare l’espressione relativistica della forza di reazione. È facile vedere
che l’unico quadri-vettore che nel sistema di quiete si riduce all’eq. (6.3) ed è ortogonale
alla quadri-velocità (come tutte le forze relativistiche pure) è
fa =
)
2e2 ( a
δb + c−2 U a Ub Ü b
3
3c
(6.5)
Infatti nel rest system Ü b = (a2 , v̈). Si ha in questo modo l’equazione del moto di
Lorentz-Dirac
U̇ a =
e a b
2e2
F bU +
(δ a + U a Ub ) Ü b
mc
3mc3 b
(6.6)
Notiamo che per un elettrone il coefficiente del secondo termine è t0 ∼ 10−24 s, e dunque
che la forza di frenamento dovrebbe rappresentare una piccola perturbazione della forza
esterna. In realtà occorrono altre due condizioni [6]: la prima è che la lunghezza d’onda
del campo esterno sia λ ≫ r0 , la seconda che l’intensità dei campi sia piccola nel senso che
E, B ≪ m2 c4 /e3 [6]. Se questa è soddisfatta, è talvolta conveniente esprimere le derivate
Ü a in funzione dei campi esterni
e2 a b c
e
F F U
mÜ a = ∂c F ab U b U c +
c
mc2 b c
(6.7)
Sostituendo nella (6.6) si trova infine la formula
mU̇ a =
e a b
3
3
F b U + et0 (∂c F ab )U b U c + ct20 (F db F bc U c Ud )U a + ct20 F ab Fbc U c
c
2
2
(6.8)
dove si vede che la retro-azione del campo sulle cariche è quadratica nei campi, dunque trascurabile se le intensità dei campi sono sufficientemente piccole, come indicato
88
sopra. Con campi di ordine |Fab | ∼ m2 c4 /e3 l’elettrodinamica classica non è più applicabile. I campi limite sono d’altronde molto intensi, per un elettrone essendo dell’ordine di
1018 Volt/m! Notiamo che il secondo termine è trascurabile rispetto al primo se vt0 ≪ λ,
e sarà soddisfatto per particelle relativistiche se ct0 ∼ r0 ≪ λ, che è la condizione scritta
sopra.
caso non relativistico
Per comprendere alcune implicazioni dell’equazione di Lorentz-Dirac, consideriamola nel
caso non relativistico, dove per una forza esterna generica essa prende la forma
v̇ − t0 v̈ = m−1 Fext
(6.9)
Questa è l’equazione di Abraham-Lorentz. Con la condizione asintotica naturale,
lim a(t) = 0,
t→−∞
si ha l’accelerazione
]
[
∫ t
1
t/t0
−u/t0
a(t) = e
Fext (u)e
du
b−
mt0 −∞
(6.10)
Il primo termine è la “runaway solution” vista sopra, che si può solo eliminare con la
scelta ad hoc b = 0, in generale non permessa. Inoltre a(t) dipende dal valore della forza
nei tempi precedenti a t, il prezzo che si paga se si vuole eliminare ȧ dall’equazione del
moto. Infine, scritta com’è, la (6.10) non ammette il limite t0 → 0, nonostante t0 sia
estremamente piccolo. Vogliamo vedere se si può imporre la condizione che il limite esista
e fornisca la relazione newtoniana a(t) = Fext (t)/m: a tale scopo poniamo formalmente
∫ ∞
1
Fext (u)e−u/t0 du
b=
mt0 −∞
nell’eq. (6.10). Si ottiene il risultato interessante
∫
et/t0 ∞
a(t) =
Fext (u)e−u/t0 du
mt0 t
(6.11)
Per eliminare il termine singolare in 1/t0 conviene passare alla variabile t0 s = u − t: allora
∫ ∞
ma(t) =
Fext (t + t0 s)e−s ds
(6.12)
0
Il limite t0 → 0 ora esiste e fornisce la formula di Newton; dunque la (6.12) può considerarsi come una ragionevole riformulazione del problema del frenamento per emissione di
radiazione. Si noti però il carattere acausale dell’equazione: a(t) dipende dai valori della
forza in tempi posteriori a t!
89
Capitolo 6
Principi variazionali
L’elettrodinamica è un esempio concreto di teoria dei campi, ma non è il solo. Allo scopo
di costruire teorie invarianti di Lorentz, è estremamente conveniente usare un principio
variazionale di minima azione, in cui le equazioni del moto per i campi ϕ si deducono
dalla condizione di stazionarietà di un funzionale della forma
∫
I[ϕ] = L[ϕ, x]d4 x
(0.1)
Terminologia: i campi ϕ hanno in generale molte componenti che indichiamo con ϕA (x),
con la notazione ∂ϕ intendiamo il campo le cui componenti sono ∂a ϕA (x), I[ϕ] è l’azione
ed L[ϕ, x] è la densità (cioè una quantità che si può integrare) lagrangiana. Per i nostri
scopi la lagrangiana è una funzione dei campi e delle coordinate del tipo
L[ϕ, x] = L(ϕ(x), ∂ϕ(x), x)
′
che possiede la proprietà di invarianza relativistica seguente: se indichiamo con ϕA (x) il
campo che risulta da una trasformazione di Poincarè (Lorentz e traslazioni), si ha
( ′
)
(
)
′
L ϕA (x), ∂a ϕA (x), x = L ϕA (Λ−1 (x − a)), ∂a ϕA (Λ−1 (x − a)), Λ−1 (x − a)
(0.2)
Ovvero L[ϕ, x] è invariante per trasformazioni di Lorentz. La richiesta serve naturalmente
a garantire la covarianza delle equazioni del moto. Infatti dalla (0.2) discende subito che
l’azione è invariante
′
I[ϕ ] = I[ϕ]
in quanto la misura di integrazione d4 x è invariante di Lorentz. Nel seguito assumeremo
che le formule di trasformazione dei campi siano lineari
∑
′
B
[Λ]ϕB (Λ−1 x)
(0.3)
ϕA (x) =
DA
B
′
Per le traslazioni pure si ha Λ = 1 e ϕ (x) = ϕ(x − a), cosicché la (0.2) sarà soddisfatta se
L[ϕ, x] = L[ϕ], cioè se la lagrangiana non dipende dalle coordinate in maniera esplicita.
90
6.1
Equazioni di Eulero e Lagrange
Se una “piccola” variazione, δϕA (x), di una data configurazione ϕA (x), non cambia il
valore di I al primo ordine in δϕA (x), si dice che l’azione è stazionaria nel “punto” ϕA (x).
In questo caso si ha
∫
δI
δI =
δϕA (x) d4 x = 0
δϕA (x)
Se le variazioni δϕA (x) sono arbitrarie e tra loro indipendenti, si ottiene la condizione
δI
=0
(1.1)
δϕA (x)
Questa espressione si chiama la derivata variazionale di I. La derivata variazionale
δF/δϕ(x) di un funzionale F [ϕ] è, per definizione, il coefficiente di δϕ(x) nell’espressione
della variazione prima δF
∫
δF
δF =
δϕ(x) d4 x
δϕ(x)
Se F dipende dalle derivate di ϕ(x), come nel caso dell’azione, il calcolo della derivata
variazionale comporta in generale una o più integrazioni per parti. Per calcolare la derivata
variazionale di I[ϕ] si noti che
)
∫ (
∂L
∂L
δI =
δϕA +
∂a δϕA d4 x
(1.2)
∂ϕA
∂∂a ϕA
Possiamo scegliere variazioni arbitrarie a supporto compatto (cioè nulle al di fuori di un
insieme chiuso e limitato). In tal caso, integrando per parti il secondo termine e usando
il teorema di Gauss per eliminare il termine di bordo, si ottiene facilmente
)
∫ (
∂L
∂L
δI =
− ∂a
δϕA d4 x
(1.3)
∂ϕA
∂∂a ϕA
La condizione di stazionarietà (1.1) prende allora la forma
δI
∂L
∂L
≡
− ∂a
=0
(1.4)
δϕA (x)
∂ϕA (x)
∂∂a ϕA (x)
Queste sono le equazioni di Eulero e Lagrange per i campi. Si noti che dall’invarianza
dell’azione segue automaticamente la covarianza delle equazioni del moto, in quanto
∑
δI
δI
A
DB
[Λ] ′ =
δϕA
δϕB
B
La lagrangiana è determinata solo parzialmente dalle equazioni del moto di una teoria,
perché il passaggio da L[ϕ] a
L1 [ϕ] = L[ϕ] + ∂a F a (ϕ(x))
non modifica le equazioni del moto. Questo si può vedere direttamente sostituendo L1
nelle equazioni di Eulero-Lagrange, oppure notando che la divergenza non contribuisce alla
variazione dell’azione se si usa il teorema di Gauss per eliminarla dal principio variazionale.
91
campo scalare
Un semplice esempio del formalismo Lagrangiano è fornito dalla teoria del campo scalare.
Una Lagrangiana invariante è
1
1
1
L(x) = − ∂a Φ∂ a Φ − U (Φ) = Φ̇2 − |∇Φ|2 − U (Φ)
(1.5)
2
2
2
dove U (Φ) è una funzione potenziale. Nell’ultima espressione, il primo termine è l’analogo
dell’energia cinetica e il secondo è richiesto dalla covarianza relativistica (il primo termine
da solo non è invariante di Lorentz). Conviene isolare in U (Φ) il termine quadratico,
1
U (Φ) = m2 Φ2 + V (Φ)
2
La costante m è una massa nelle unità ℏ = c = 1; nelle unità comuni si dovrebbe fare la
sostituzione m → mc/ℏ. Le equazioni di Eulero-Lagrange sono
−∂a ∂ a Φ + m2 Φ = −
∂V (Φ)
∂Φ
e si riducono all’equazione di Klein-Gordon se manca il potenziale.
l’equazione ammette le onde piane
In questo caso
Φ = A exp(±ipa xa )
dove p2 + m2 = 0. Questa è la formula soddisfatta dal quadrimpulso di una particella,
ed è in accordo con la teoria quantistica, secondo la quale l’onda piana è associata alle
particelle con impulso ed energia determinati e che per tale motivo sono completamente
de-localizzate.
6.2
Azione per il campo elettromagnetico
Le equazioni di Maxwell sono del primo ordine nei campi elettromagnetici e del secondo
ordine nei potenziali Aa , e quindi considereremo le componenti del campo Aa (x) come
le variabili dinamiche della teoria (le sue coordinate generalizzate, come si direbbe nel
linguaggio Lagrangiano). È dunque essenziale che l’azione sia invariante di gauge, oltre
che invariante di Lorentz.
Esistono due invarianti quadratici che si possono costruire con il tensore Fab . Essi sono
F 2 ≡ Fab F ab = 2(B2 − E2 )
(2.1)
e
∗ ab
F Fab = 2E · B
(2.2)
dove
∗ ab
F
1
= eabcd Fcd
2
92
è il cosiddetto tensore duale. Questo invariante è però una divergenza quadridimensionale
(
)
∗ ab
F Fab = ∂a eabcd Fbc Ad
e può quindi essere omesso. Il primo ha i requisiti necessari per essere usato come una
Lagrangiana, e dunque scriviamo l’azione
∫
1
Iem = −
Fab F ab d4 x
(2.3)
16π
Il segno negativo si capisce guardando la (2.1), secondo la quale F 2 contiene le derivate
temporali di A (cioè l’energia cinetica del campo) con segno negativo. Il fattore di normalizzazione è dovuto alla nostra scelta di usare le unità Gaussiane non razionalizzate.
Dato che Iem non contiene le cariche elettriche, si può interpretare Iem come l’azione per
il campo elettromagnetico libero.
Dalle equazioni di Maxwell (1.6) segue che l’azione deve anche contenere il termine lineare
in Aa 1
∫
Iin = Aa J a d4 x
(2.4)
dove J a è la corrente elettrica, che assumeremo indipendente dal campo Aa (x). È Iin
invariante di gauge? La sostituzione Aa → Aa + ∂a ψ trasforma Iin in
∫
∫
a 4
Iin + ∂a ψJ d x = Iin − ψ∂a J a d4 x
come segue dal teorema di Gauss se ψ si annulla all’infinito. Vediamo che l’azione è invariante di gauge se e solo se la corrente è conservata: ∂a J a = 0. Si può quindi considerare
la conservazione della carica elettrica come una conseguenza dell’invarianza di gauge.
Sia infine Im l’azione che descrive la materia elettricamente carica, che assumeremo
indipendente dal campo Aa (x). L’azione completa è
∫
∫
1
ab 4
I=−
Fab F d x + Aa J a d4 x + Im
(2.5)
16π
È adesso facile vedere che le equazioni di Eulero-Lagrange per il potenziale Aa (x) riproducono la seconda coppia delle equazioni di Maxwell (si ricordi che la prima coppia
segue direttamente dalla definizione (1.1)). Forse, più semplicemente, si può verificare la
formula
)
∫ (
1
ab
b
δI =
∂a F + J δAb d4 x
4π
da cui seguono le equazioni, purché si considerino le variazioni δAb come arbitrarie e
indipendenti tra loro.
1
In certe teorie vi possono essere accoppiamenti quadratici nei potenziali, essenzialmente dovuti al
fenomeno del diamagnetismo.
93
6.3
Azione per le particelle
L’azione Im non è altrettanto univocamente determinata, perché ovviamente dipende
dal modello di materia che si vuole adottare, e anche dal sistema fisico concreto che si
vuole considerare. Ad esempio un fluido elettricamente carico, uno sciame di particelle
puntiformi o un campo scalare complesso hanno tutti la propria azione particolare. Per gli
scopi dell’elettrodinamica classica è giustificato considerare le particelle puntiformi come
un modello sufficientemente adeguato. Vale allora la formula (2.5), che sostituita in Iin
dà immediatamente
∑ ∫
Iin =
en Aa (zn )dzn
n
ciascun integrale essendo esteso alla linea di universo della carica corrispondente. Per
quanto riguarda l’azione libera (il termine Im della (2.5)), se le particelle hanno massa
non nulla si può adottare l’azione2
∫ √
∑
∑ ∫
∑ ∫ √
Im = −
mn
−żn2 dp = −
mn dτn = −
mn dt 1 − vn2
(3.1)
n
n
n
Si passa dalla prima forma alla seconda ponendo p =√τn , nel qual caso żn2 = −1, e dalla
seconda alla terza usando la nota espressione dτ = dt 1 − v 2 . Si noti che la Lagrangiana
per una particella
√
1
L = −m 1 − v 2 = −m + mv2 + · · ·
2
fornisce la quantità di moto
p=
mv
∂L
=√
∂v
1 − v2
e l’energia
E =v·
∂L
m
−L= √
∂v
1 − v2
in accordo con la definizione di queste grandezze adottata in meccanica relativistica.
Limitandosi ad una sola particella, la variazione di Im rispetto a z a si può scrivere nella
forma
∫ 2 a
dz
δza dτ
(3.2)
δIm = −m
dτ 2
e
∫
dz b
δIin = e F ab (z)
δza dτ
dτ
2
ż = dz/dp, ż 2 = ża ż a e mn sono le masse proprie.
94
Dal principio variazionale δI = 0, con il potenziale Aa tenuto fisso, si ottengono cosı̀ le
equazioni del moto della carica nel campo elettromagnetico
dpa
dz a
= eF ab (z)ub ,
ua =
(3.3)
dτ
dτ
dove, come al solito, pa = mua è il quadri-impulso della particella. Queste equazioni sono
manifestamente covarianti. Riscrivendole per esteso si ha
(
)
d
mv
√
= e(E + v ∧ B)
(3.4)
dt
1 − v2
d
dt
(
m
√
1 − v2
)
= eE · v
(3.5)
e ritroviamo le equazioni del moto (4.4). Vediamo che la trattazione relativistica conduce
necessariamente alla formula della forza di Lorentz, che nelle vecchie trattazioni era invece
semplicemente postulata.
6.4
Il tensore energia-impulso
L’indipendenza della Lagrangiana dalle coordinate ha una importante conseguenza di
principio, il teorema di conservazione del quadri-impulso.
6.4.1
Caso generale
Se L(x) non dipende esplicitamente3 da xa , si ha
(
)
(
)
∂L
∂L
∂L
∂L
∂L
∂a L =
∂a ϕ A +
∂b ∂a ϕ A =
− ∂b
∂a ϕ A + ∂b
∂a ϕA
∂ϕA
∂∂b ϕA
∂ϕA
∂∂b ϕA
∂∂b ϕA
Se le equazioni di Eulero-Lagrange risultano soddisfatte, questa equazione si riduce alle
quattro condizioni
∂a T ab = 0
(4.1)
in cui
T ab = δba L −
∂L
∂b ϕ A
∂∂a ϕA
(4.2)
T ab si chiama il tensore energia-impulso canonico, e l’Eq. (4.1) è la sua legge di conservazione. Dal teorema di Gauss (2.8) si ottengono le costanti del moto (ripristinando
c)
∫
dPa
1
Pa =
T 0a (x0 , x)d3 x,
=0
(4.3)
c
dx0
3
′
Cioè se vale la (0.2) con Λ = 1, tenendo conto che ϕ (x) = ϕ(x − a).
95
Queste rappresentano il quadrimpulso del campo sull’iperpiano a x0 fissato. Per esempio
−T 00 = ∂0 ϕA
∂L
−L
∂∂0 ϕA
(4.4)
è manifestamente la densità di energia4 , e dunque −cP0 è l’energia, in accordo con le
proprietà generali del quadrimpulso. È molto importante osservare che le grandezze Pa
sono non solo conservate, ma determinano anche le componenti di un quadrivettore (v.
appendice). Per finire, notiamo che in generale il tensore canonico non è simmetrico,
perciò definiamo
T ab = T ac η cb
ambiguità di Tab
La non univocità della Lagrangiana si riflette ovviamente sulla forma del tensore T ab .
Oltre a questo però, esiste anche un’ambiguità di carattere più profondo che vogliamo ora
descrivere. Si consideri il nuovo tensore energia-impulso
1
T ab = T ab + ∂c Fbac ,
Fbac = −Fbca
(4.5)
dove Fbac è una funzione tensoriale dei campi, antisimmetrica in a e c. Allora la legge
di conservazione (4.1) rimane valida. Dal teorema di Gauss segue che il quadrimpulso
totale non cambia se Fbac (x) si annulla in maniera talmente rapida da annullare il suo
flusso attraverso i bordi all’infinito. La possibilità di ridefinire il tensore energia-impulso
in questo modo non è un fatto deprecabile, perché può utilmente essere usata per renderlo
simmetrico: T ab = T ba , proprietà che assumeremo valida da ora in poi. In questo caso, il
tensore del “momento angolare”
M abc = T ab xc − T ac xb
risulta anch’esso conservato
∂a M abc = T cb − T bc = 0
(4.6)
Le costanti del moto
∫
ab
J = M 0ab (x0 , x)d3 x = −M ba
(4.7)
rappresentano la versione relativistica del momento angolare. Un altro caso dove la non
univocità del tensore energia-impulso risulta essenziale, si ha per il campo elettromagnetico, dove può essere impiegata per ripristinare l’invarianza di gauge, apparentemente
violata dal tensore canonico.
significato delle componenti di Tab
4
Si ricordi che L è una densità Lagrangiana, e che la formula per l’energia in una teoria con Lagrangiana
L è E = q̇∂L/∂ q̇ − L.
96
Abbiamo già notato che T 00 è la densità di energia e c−1 T 0k ≡ Gk la densità della quantità
di moto. Integrando la legge di conservazione
∂0 T 00 = −∂k T k0
su un volume spaziale V si ottiene (ripristinando c)
∫
∫
dEV
d
00
=
T dx = −c
T k0 nk da
dt
dt V
∂V
dove EV è l’energia nel volume V . Quindi le componenti cT k0 ≡ S k rappresentano il flusso
di energia nella direzione k (x, y oppure z). Analogamente, dalla legge di conservazione
della quantità di moto in un volume V
∫
∫
dPVk
d1
0k
=
T dx = −
T jk nj da
dt
dt c V
∂V
vediamo che le componenti T jk rappresentano il flusso della k-esima componente dell’impulso nella j-esima direzione. Le T jk sono a volte chiamate le componenti del tensore
degli sforzi, perché il flusso di impulso attraverso una superficie determina la forza agente
sulla medesima.
Come sopra, sia G il vettore (tridimensionale) di componenti c−1 T 0k e S quello di componenti cT k0 . Se il tensore energia-impulso è simmetrico si ha, dunque
1
G = 2S
(4.8)
c
un risultato noto come teorema di Planck : ad ogni corrente di energia è associato un trasporto di quantità di moto. La (4.8) è una versione generalizzata del teorema di equivalenza
massa-energia.
Consideriamo ora il tensore energia-impulso di alcuni sistemi fisici importanti.
6.4.2
Campo scalare
La Larangiana (1.5) e la (4.2) conducono subito alla formula
Tab = ∂a Φ∂b Φ + ηab L
Ad esempio, se il campo è spazialmente uniforme, cioè se Φ(x) = ϕ(t), il tensore degli
sforzi è isotropo (includiamo il termine di massa in V (ϕ))
)
1 ( 2
Tjk = δjk ϕ̇ − V (ϕ) = δjk p
2
Il coefficiente di δjk può essere interpretato come la pressione (v. sotto). Inoltre T0j = 0
e l’energia
1
T00 = ρ = ϕ̇2 + V (ϕ)
2
Si noti che il tensore è simmetrico, Tab = Tba . Nel caso generale la densità di impulso è
G = −Φ̇∇Φ
97
6.4.3
Campo elettromagnetico
La definizione (4.2) applicata alla Lagrangiana del campo elettromagnetico libero
L=−
1
Fab F ab
16π
determina il tensore canonico
(
)
1
1
a
ac
nm a
Tb=
F ∂b Ac − Fnm F δ b
4π
4
(4.9)
che, come si può vedere, non è invariante di gauge.
sommiamo la quadri-divergenza
−
Sfruttando l’arbitrarietà (4.5),
1
∂c (F ac Ab )
4π
Usando le equazioni del moto ∂c F ac = 0 si ottiene il tensore invariante di gauge
(
)
1
1
a
ac
nm a
Tb=
F Fbc − Fnm F δ b
4π
4
(4.10)
Esplicitandone le componenti troviamo la densità e il flusso di energia (anche uguale alla
densità di impulso G)
T 00 =
1
(E2 + B2 ),
8π
S=
1
(E ∧ B)
4π
(4.11)
e il tensore degli sforzi di Maxwell
(
)
1
1
1
2
2
Tik =
−Ei Ek + δik E − Bi Bk + δik B
4π
2
2
(4.12)
Osserviamo che il quadrimpulso elettromagnetico
∫
Pa = T 0a (x0 , x)dx
non può essere un vettore di tipo spaziale, perché in tal caso sarebbe possibile annullare P0
con una trasformazione di Lorentz. Ma questo comporta l’annullarsi dei campi. Dunque
P 2 ≤ 0, ossia
∫
E
1
|P| ≤ P0 = ,
E=
(E2 + B2 ) dx
c
8π
Valgono le formule di trasformazione
′
Px =
Px − (v/c2 )E
√
,
1 − β2
′
P y = Py ,
′
Pz = Pz ,
98
E − vPx
′
E =√
1 − β2
(4.13)
Se P 2 = 0 e se α è l’angolo, misurato in F , tra la direzione di propagazione del raggio di
′
luce e la velocità di F rispetto a F , otteniamo dalla (4.13) la formula di Einstein
1 − β cos α
′
E
E = √
1 − β2
Se invece P a è di tipo tempo, P 2 < 0, esiste sempre un sistema di coordinate F0 in cui
P0 = 0. Se E0 è il valore dell’energia totale in F0 , segue dalle (4.13) che in F
E=√
E0
1−
β2
,
P=
v
E
c2
dove v è la velocità di F0 rispetto ad F . Un esempio di questo caso è un’onda sferica di
spessore finito.
Se σ è la superficie di un dielettrico con normale esterna n, la forza esercitata dal campo
sull’elemento di superficie dσ è
dfi = −Tik nk dσ
Per questo a volte è il tensore σik = −Tik ad essere chiamato tensore degli sforzi elettromagnetici. Si dovrebbe anche osservare che la traccia si annulla
ηab T ab = 0
ma sul significato di questa equazione non ci addentriamo. Il tensore (4.10) soddisfa alla
legge di conservazione (4.1) (o, come si usa dire, è conservato), solo in assenza di correnti
e cariche. Calcolando la divergenza del tensore e usando le equazioni di Maxwell, si trova
infatti la formula importante
∂a T ab = −F bc J c
(4.14)
La componente temporale è l’equazione del bilancio energetico
∂T 00
+ div S = −E · J
∂t
dove S = E ∧ B/4π è il vettore di Poynting, cioè le componenti T k0 del tensore energiaimpulso. Le rimanenti equazioni esprimono la densità della forza di Lorentz attraverso la
divergenza di un tensore.
6.4.4
Fluido perfetto
L’idrodinamica relativistica presenta un interesse di principio, perché dovrebbe essere
applicata non solo quando è relativistica la velocità macroscopica del fluido, ma anche
quando è tale la velocità microscopica delle particelle nel fluido. Sia µ = mn0 la densità
di massa del fluido, dove n0 rappresenta il numero di particelle per unità di volume proprio
99
del fluido ed m è la massa propria delle particelle. Se epsilon è l’energia interna per unità
di massa e s l’entropia per unità di massa, la ben nota relazione termodinamica (valida
nel sistema di coordinate dove un elemento di volume del fluido è in quiete)
p
dϵ = T ds + 2 dµ
(4.15)
µ
mostra che se il moto del fluido è isoentropico, ds = 0, si possono considerare epsilon e p
come funzioni univoche di µ. L’energia interna e la pressione sono allora
ρ = µ + µϵ(µ),
p = µ2
dϵ
dµ
La condizione ds = 0 si può scrivere nella forma
(
)
ρ+p
1
T ds = d
− dp = 0
µ
µ
(4.16)
Faremo uso di questa relazione in seguito. Determiniamo ora il tensore energia-impulso
del fluido isoentropico (o perfetto). Nel sistema di coordinate dove un elemento di volume
del fluido è in quiete, la forza per unità di superficie che il fluido esercita sul bordo
dell’elemento vale pn, dove n è la normale esterna e p è la pressione idrostatica (legge di
Pascal). Inoltre T 0j = 0, perciò il tensore energia-impulso ha la forma


ρ 0 0 0
 0 p 0 0 
0

Tab = 
(4.17)
 0 0 p 0 
0 0 0 p
L’unico tensore che nel sistema di quiete si riduce a 0 Tab e che dipende solamente dalla
velocità del fluido ma non dalle sue derivate (come nel caso di fluidi viscosi) è
Tab = (ρ + p)ua ub + pηab
(4.18)
dove ua è il campo di quadrivelocità del fluido. Per le componenti abbiamo (ripristinando
c)
T 00 =
ρ + pv 2 /c2
,
1 − v 2 /c2
T 0i =
(ρ + p)v i /c
,
1 − v 2 /c2
T ij =
ρ + p vivj
+ pδ ij
2
2
2
1 − v /c c
Si noti l’identità ua T ab = −ρub . La traccia è
T aa = 3p − ρ
(4.19)
Gli autovalori del tensore degli sforzi, cioè le pressioni principali, non sono necessariamente
positivi. Ad esempio, per un campo magnetico lungo x, By = Bz = 0, si ha


ρ 0 0 0
 0 −ρ 0 0 

Tab = 
 0 0 ρ 0 
0 0 0 ρ
dove ρ = B 2 /8π è la densità di energia. Una pressione negativa (tensione) agisce lungo x.
100
(a) limite non relativistico
Nel trattare il limite non relativistico non è sufficiente ignorare i termini di ordine v/c
o superiori. Bisogna infatti notare che ρ contiene l’energia di quiete µc2 , dove µ = mno
è la densità di massa propria delle particelle del fluido, mentre la densità di massa non
relativistica si riferisce all’unità di volume in movimento con il fluido. Si deve dunque
porre
µ0
µ= √
1−
v2
c2
= µ0 +
µ0 v 2
+ ···
2c2
e poi passare al limite c → ∞, dove µ0 è la densità di massa non relativistica usuale. Inoltre
sia la pressione che l’energia interna epsilon(µ) sono trascurabili rispetto all’energia di
quiete µc2 . In questo modo si ottengono le formule
1
T 00 − µo c2 = µ0 v 2 + µ0 ϵ
2
c−1 T 0j = µ0 v j
T jk = µ0 v j v k + pδ jk
Il flusso di energia è cT j0 , e vale
)
(
v2
p
2
S − µ0 c v = µ0 ϵ +
+
v
µ0
2
Queste espressioni coincidono con i risultati della meccanica dei fluidi non relativistica
(v. Cap. [1] del testo di L. D. Landau e E. M. Lifshitz, Fluid Mechanics: Volume 6 (Course
of Theoretical Physics), Butterworth-Heinemann, Second Edition, (1987))
(b) equazioni del moto
L’equazione di conservazione
∂a T ab = 0
contiene le equazioni del moto relativistiche del fluido. Infatti, derivando il tensore si
ottiene
(ρ + p)ub
∂(ρ + p)ub
∂p
∂ua
+
u
=− a
a
b
b
∂x
∂x
∂x
(4.20)
Contraendo con ua si ottiene la formula
∂a ((ρ + p)ua )) = ua ∂a p
(4.21)
101
e quindi l’equazione del moto prende la forma
∂p
∂ua
=
−
− ua ub ∂b p
(4.22)
∂xb
∂xa
e nel limite non relativistico si riduce alle ben note equazioni di Eulero. Dobbiamo ancora
imporre la condizione che il moto sia isoentropico. Riscriviamo la (4.21) nella forma
(
)
ρ+p
ρ+p
1
a
u ∂a
− u a ∂a p +
∂a (µua ) = 0
(4.23)
µ
µ
µ2
(ρ + p)ub
Dalla (4.16) si vede che i primi due termini si elidono, e si ottiene l’equazione di continuità
∂(µua )
=0
∂xa
(4.24)
Se invece assumiamo l’equazione di continuità la (4.23) diventa
(
)
ρ+p
1
a
u ∂a
− u a ∂a p = 0
µ
µ
che è equivalente alla condizione T µua ∂a s = 0. Introducendo l’entropia per unità di
volume, σ = µs, e usando nuovamente la (4.24) si ottiene l’equazione di continuità per la
corrente di entropia
∂a σua
=0
∂xa
6.4.5
Particelle libere
√
0
1 − v 2 , e la quantità di moto è
L’energia di una particella
libera
è
p
=
mγ
=
m/
√
j
j
j
2
p = mγv = mv / 1 − v , quindi la densità di energia di un sistema di particelle è
∑ mn
∑∫
00
(3)
0
√
T (x) =
δ (x − zn (x )) =
δ (4) (x − zn (p)) p0n dzn0
(4.25)
2
1
−
v
n
n
n
e la densità della quantità di moto è
∑ mn v j
∑∫
n
0j
(3)
0
√
T =
δ (x − zn (x )) =
δ (4) (x − zn (p)) pjn dzn0
2
1 − vn
n
n
Come abbiamo spiegato, il flusso di energia è
∑ mn v j
∑∫
n
j0
(3)
0
√
T =
δ (x − zn (x )) =
δ (4) (x − zn (p)) p0n dznj
2
1
−
v
n
n
n
(4.26)
(4.27)
e siccome pjn dzn0 = p0n dznj , vediamo che T 0j = T j0 . Infine, dalla (4.26) segue la formula
per il flusso di quantità di moto
∑∫
∑ mn v j
n
(3)
0
k
kj
√
(4.28)
δ (4) (x − zn (p)) pjn dznk
δ (x − zn (x ))vn =
T =
2
1
−
v
n
n
n
102
Le formule scritte sono le componenti del tensore
∑
T ab (x0 , x) =
pan vnb δ (3) (x − zn (x0 ))
(4.29)
n
dove vna = dzna /dx0 . Come sopra possiamo usare un parametro invariante e scrivere
∑∫
dz b
ab
T (x) =
dp δ (4) (x − zn (p)) pan n
(4.30)
dp
n
dove pan è il quadrimpulso considerato come una funzione di p (e non mn dzna /dp). Per la
traccia si ottiene, usando per esempio la (4.29)
∑
√
T =−
mm 1 − vn2 δ (3) (x − zn (x0 ))
(4.31)
n
La media spaziale sull’unità di volume è negativa
∫
∑
√
T dx = −
mm 1 − vn2 < 0
n
Calcoliamo la divergenza del tensore energia-impulso nei due casi seguenti: (a) le particelle
si muovono sotto l’azione di un campo elettromagnetico, (b) le particelle sono libere
eccetto che per occasionali collisioni localizzate. Nel caso (a) si ha, usando per convenienza
la (4.30) con p = τn ,
∑∫
dpb
ab
∂a T (x) =
dτn δ (4) (x − zn (τn )) n =
dτn
n
∫
∑
=
en dτn δ (4) (x − zn (τn )) F bc (zn )ucn = F bc (x)J c (x)
(4.32)
n
Se Fab = 0 il tensore è conservato e il quadrimpulso pn è costante. Nel caso (b) supponiamo
che le particelle n e m abbiano una collisione a τn = τm = τc : allora
dpn
= ∆pn δ(τn − τc ),
dτn
dpm
= ∆pm δ(τm − τc )
dτm
dove ∆pn (∆pm ) è la variazione di quadrimpulso della particella n (m) nella collisione.
Allora
∑∫
dpb
ab
∂a T (x) =
dτn δ (4) (x − zn (τn )) n = δ (4) (x − z(τc ))∆(pbn + pbm )
dτn
n
dove z(τc ) = zn (τc ) = zm (τc ) è il punto dove avviene la collisione. Vediamo che la conservazione di T ab è equivalente alla legge di conservazione del quadrimpulso nelle collisioni.
Il caso con più collisioni si generalizza facilmente.
Le equazioni (4.14) e (4.32) danno le leggi di conservazione per un sistema chiuso di
cariche e campi
)
( ab
ab
=0
(4.33)
+ Tmat
∂a Tem
103
Capitolo 7
Teoria della gravitazione
La relatività ristretta è basata sull’assunzione della completa equivalenza di tutti i sistemi
di riferimento inerziali. È certamente insoddisfacente, anche da un punto di vista epistemologico, che solamente tali sistemi siano considerati equivalenti, o almeno che non sia
data una ragione logica per escludere tutti gli altri. Questo difetto è rimosso dalla teoria
della relatività generale, oggetto di questo corso. La relatività generale è la teoria di spazio, tempo e gravitazione formulata da Einstein nel 1915. Essa è largamente considerata
come una teoria matematica astrusa, e infatti solitamente si insegna solo all’università. Il
linguaggio matematico naturale della teoria è la geometria differenziale delle varietà lorentziane, varietà che ammettono una metrica con tre autovalori positivi e uno negativo,
e che non possiedono, in generale, la struttura di spazio vettoriale comunemente associata
allo spazio-tempo di Minkowski. La connessione di queste strutture matematiche con la
fisica è dovuta al genio di Einstein, e afferma che ogni varietà del tipo indicato rappresenta
il modello matematico di un possibile continuum spazio-temporale, con la metrica che ne
descrive allo stesso tempo la struttura causale, la misura delle grandezze geometriche e
il campo gravitazionale che, come sappiamo dai tempi di Newton, dipende dalla presenza
della materia.
Ne consegue che la geometria dello spazio-tempo non può essere assegnata a priori (come
avviene in relatività ristretta o nella fisica classica, dove la geometria è quella di Euclide
che si impara sui banchi di scuola), ma sarà determinata dalle sorgenti del campo. Insomma essa è dinamica, e si ricordi a questo proposito che il modello Euclideo dello spazio
invariabile ha descritto le nostre esperienze geometriche con successo per oltre venti secoli!
Il fondamento fisico di questa teoria è la proprietà fondamentale dei campi gravitazionali
che va sotto il nome di principio di equivalenza forte il quale, quando venga formulato
nella maniera appropriata scoperta da Einstein, si rivela per quello che veramente è, ossia
un potente principio di simmetria di gauge.
7.1
Il principio di equivalenza
Ref. [1] S. Weinberg, Gravitation and Cosmology: principles and applications of the general
theory of relativity, John Wiley & sons, Inc. (1972), Cap. [3].
104
Il principio di equivalenza coincide essenzialmente con l’osservazione che in una navicella
spaziale sufficientemente piccola e in caduta libera gli effetti del campo gravitazionale
sono trascurabili. Questo segue generalizzando ai campi arbitrari la scoperta di Galileo
secondo la quale, nel debole campo di gravità terrestre, tutti i pesi cadono con la stessa
accelerazione. Dalla seconda legge del moto si conclude allora che la forza gravitazionale
è proporzionale alla massa inerziale del peso, e dalla terza legge che è anche proporzionale
alla massa inerziale della sorgente (la terra, nel caso in esame). Non occorre dunque distinguere la massa gravitazionale passiva, che determina l’intensità della forza di gravità,
dalla massa inerziale che compare nella seconda legge del moto. Se indichiamo quest’ultima con mI , e con mG la massa gravitazionale passiva tale che F = mG g⊕ , le osservazioni
di Galileo comportano l’eguaglianza universale mG = mI . Se non fosse esattamente cosı̀,
l’accelerazione impartita dal campo gravitazionale
(
a=
mP
mI
)
g⊕ ≃ 9.81 cm · sec−2
g⊕ ,
non sarebbe la stessa per tutti i pesi. Esperimenti mediante pendoli fabbricati con materiali diversi furono eseguiti da Newton, Bessel e Potter, senza rivelare differenze significative.
Il primo esperimento di precisione è di Eötvös (1889, 1922), secondo il quale per molte
coppie di sostanze (A, B) si ha il limite
(
mI
mP
(
)
−
A
mI
mP
)
≤ 10−9
(1.1)
B
Misure più recenti di Dicke, Roll, Krotkov (1964) e Braginsky (1972), hanno portato
la precisione a 10−11 e un recente esperimento a Washington (1994, 1999) addirittura a
10−13 ! (si visiti il sito http://relativity.livingreviews.org/ per un aggiornamento
scritto da C. Will1 ).
All’uguaglianza mG = mI si può dare la seguente importante interpretazione, suggerita
′
dallo stesso Einstein. Sia K un sistema accelerato rispetto al sistema inerziale K, con
′
accelerazione g: in K è allora “presente” un campo gravitazionale uniforme con acce′
′
′
lerazione g = −g. Infatti l’osservatore in K osserva una forza inerziale mI g che è la
′
stessa per tutti gli oggetti materiali, e uguale alla “forza peso” mG g . Si può estendere
allora il principio di relatività almeno ai sistemi non relativistici uniformemente accelerati,
perché il moto delle particelle libere in tali sistemi non può essere usato per determinare
l’accelerazione del riferimento: si può tranquillamente attribuire il moto accelerato delle
particelle a un campo gravitazionale. Si può anche dire che il passaggio a un sistema di
riferimento accelerato genera un campo di forze inerziali che, dal punto di vista meccanico,
è del tutto indistinguibile da un campo gravitazionale2 . Più in generale,
1
Il più recente aggiornamento è in http://babbage.sissa.it al riferimento gr-qc/0510072
Quali siano le sorgenti di questo campo è un problema che ha grande importanza concettuale, ma
nel quale preferiamo non addentrarci.
2
105
A. la transizione da un sistema di coordinate a un altro, arbitrariamente accelerato rispetto al primo, non può essere fisicamente distinta da un cambiamento del campo gravitazionale. Non si dovrebbe quindi assumere l’esistenza
di sistemi di coordinate privilegiati.
Abbiamo appena visto che un campo uniforme può essere generato passando a un opportuno sistema di riferimento, ma ovviamente questo campo può essere nuovamente eliminato
semplicemente ritornando alle coordinate inerziali iniziali. Questa è anzi la proprietà
di tutti i campi cosı̀ generati, siano essi uniformi o no: la trasformazione di coordinate
inversa li elimina globalmente. È questa una proprietà del campo gravitazionale del nostro sole (per esempio) o della Terra? Certamente no. La scoperta di Galileo che tutti
i pesi cadono con la stessa accelerazione implica immediatamente che in un sistema di
riferimento sufficientemente piccolo e in caduta libera senza rotazione rispetto alla massa
media dell’universo, il campo gravitazionale non può essere rivelato perché l’osservatore, i
corpi di prova, gli strumenti e il sistema stesso accelerano tutti allo stesso modo. Essendo
il campo gravitazionale non omogeneo, questa cancellazione della gravitazione per mezzo
delle forze inerziali elimina il campo solo in una piccola regione spaziale e se non si aspetta
troppo a lungo: per esempio, visto che le linee di forza del campo terrestre convergono
verso il centro della terra, due palline in caduta libera avranno una piccola accelerazione
relativa trasversale alla direzione radiale di caduta libera.
Ma vale tutto ciò anche per gli altri fenomeni naturali? Per esempio, un’onda elettromagnetica che rimbalza fra due specchi in caduta libera si comporterà come in assenza
di gravitazione? Un atomo in caduta libera avrà le stesse frequenze di transizione di un
atomo in assenza di gravità? Cioè, in uno stato di caduta libera si potrà parlare veramente di “assenza di gravitazione”, o questo si potrà dire solo per le equazioni del moto?
Einstein riteneva che si potesse affermare la cancellazione degli effetti gravitazionali nei
sistemi locali in caduta libera da tutte le leggi della fisica, non solo dalle leggi del moto.
Per lo spazio-tempo di un campo gravitazionale arbitrario, dunque, si assume valido il il
principio di equivalenza forte 3 , secondo il quale:
B. In un intorno sufficientemente piccolo di ogni evento p, esiste un sistema di
coordinate X a , che chiameremo localmente inerziale in p, rispetto al quale le
leggi fisiche assumono la forma che hanno nella teoria della relatività ristretta
in assenza di gravitazione.
In particolare, in ogni punto è definito un intervallo spazio-temporale che nelle coordinate
X a assume con grande approssimazione (poiché in generale il campo non è uniforme nè
costante) la forma canonica della relatività ristretta
ds2 = ηab dX a dX b
(1.2)
dove ηab è la metrica di Minkowski. Le coordinate X a sono determinate a meno di trasformazioni di Lorentz, X a → Λab X b , perché queste formano il gruppo di simmetria della
3
Una formulazione maggiormente precisa sarà data più avanti.
106
metrica di Minkowski. Una teoria che si fonda su tale principio è dunque localmente
invariante di Lorentz. Si noti che l’uguaglianza delle masse inerziale e gravitazionale implica il principio di equivalenza solamente per le equazioni del moto, mentre in [B] se ne
afferma la validità per tutte le leggi naturali. Per questa ragione si distingue un principio
di equivalenza forte da un principio di equivalenza debole, quest’ultimo valido solo per le
leggi del moto. È facile capire che una teoria basata su questo principio deve abbandonare
la relatività ristretta: due osservatori distanti in caduta libera accelerano l’uno rispetto
all’altro, ciò nonostante osservano le stesse leggi.
7.2
Metrica e gravitazione
L’asserzione [B] contiene due idee notevoli:
• si afferma che lo spazio-tempo è localmente Euclideo, nel senso che ogni punto è in
un intorno che è in corrispondenza biunivoca e continua (in una parola, omeomorfo)
con un aperto di R4 (cioè ad ogni punto corrispondono quattro coordinate, e la
corrispondenza è continua e invertibile).
• Poi si dice che esiste una metrica Lorentziana4 , e che le coordinate in un intorno di
p si possono scegliere localmente inerziali: il prodotto scalare fra due vettori5 con
origine in p è (u, v) = ηab ua v b (ma solo in p), dove ua (v b ) sono le componenti di u
(v) rispetto alle coordinate localmente inerziali.
Il primo punto è uno degli assiomi che definiscono le varietà differenziabili, il secondo
punto è nella definizione di varietà Riemanniana, se la metrica è definita positiva, o semiRiemanniana nel caso contrario, e l’esistenza delle coordinate localmente inerziali è un
teorema di questa geometria (tranne che in un contesto matematico si chiamano coordinate
normali di Riemann). Vediamo dunque che il linguaggio matematico atto a incorporare
automaticamente il principio di equivalenza, è quello delle varietà differenziabili sulle quali
è definita una metrica di Lorentz, cioè un campo di tensori simmetrici di rango due con tre
autovalori positivi e un solo autovalore negativo (v. appendice [A]). Siccome la definizione
di varietà è leggermente elaborata, e dato che tale rigore non è strettamente richiesto in
una trattazione elementare della relatività generale, abbiamo posto la definizione di varietà
differenziabile in appendice [A]. Ora vogliamo discutere più in dettaglio come le varietà
metriche realizzano le idee di Einstein sul campo gravitazionale in modo naturale.
Consideriamo la relatività ristretta dal punto di vista di un sistema di coordinate locali
arbitrario, di cui sono funzione le coordinate cartesiane inerziali, X a = X a (xb ). Queste
funzioni sono in generali definite in intorno aperto dello spazio-tempo e sono differenziabili e invertibili con inverse differenziabili. Le matrici Jacobiane ∂X a /∂xb sono allora
invertibili, hanno per inverse le matrici ∂xa /∂X b , e determinano l’elemento di linea nella
forma
4
Chiamasi Lorentziana una metrica con tre (o n − 1 in dimensione n) autovalori positivi e un solo
autovalore negativo.
5
Il concetto di vettore tangente è definito in appendice.
107
ds2 = gab (x)dxa dxb
(2.1)
dove
gab (x) = ηcd
∂X c ∂X d
∂xa ∂xb
(2.2)
Ricordiamo qui che vale la convenzione di Einstein, secondo la quale si somma sugli indici
ripetuti. Si noti che det g < 0. La metrica inversa è
∂xa ∂xb
g (x) = η
∂X c ∂X d
ab
cd
(2.3)
′
Più in generale, passando alle coordinate x a si ha la formula di trasformazione
′
′
gab (x ) =
∂xc ∂xd
gcd (x)
∂x′ a ∂x′ b
(2.4)
come segue facilmente dalla (2.1). Non solo la metrica, ma anche i tensori si trasformano
in modo analogo. Ad esempio, per il vettore tangente a una curva si ha6
′
′
dx a
∂x a dxb
=
dτ
∂xb dτ
Per i vettori si hanno quindi le formule di trasformazione
′
ua =
′
∂x a a
u ,
∂xb
′
ua =
∂xb
ua
∂x′ a
(2.5)
dove ua = gab ub . Insomma, tutto procede come in relatività ristretta, eccetto che le
′
′
matrici ∂x a /∂xb e le loro inverse ∂xa /∂x b prendono il posto delle matrici di Lorentz Λab .
6
Si usi la formula di derivazione delle funzioni composte.
108
7.2.1
Moto di una particella
Come è noto dalla relatività ristretta, le equazioni del moto di una massa puntiforme
libera seguono dal principio variazionale
∫
δ
dτ = 0,
(
)1/2
dτ = −gab dxa dxb
in cui la massa è assente; si ha intanto
∫
δ
)
∫ (
1
a
b
a
c
b
gab ẋ dδx + ∂c gab ẋ δx dx
dτ = −
2
)
∫ (
1
d
a
b c
=
(gab ẋ ) − ∂a gbc ẋ ẋ δxa dτ = 0
dτ
2
(2.6)
dove
ẋa =
dxa
dτ
è il quadrivettore velocità, tangente alla curva e normalizzato: gab ẋa ẋb = −1. Dalla (2.6)
otteniamo le equazioni del moto
d
1
(gab ẋa ) − ∂a gbc ẋb ẋc = 0
dτ
2
Calcolando la derivata
1
gab ẍb + ∂c gab ẋc ẋb − ∂a gbc ẋb ẋc = 0
2
oppure, simmetrizzando il secondo termine e moltiplicando l’equazione per la metrica
inversa,
ẍa + Γabc (x)ẋb ẋc = 0
(2.7)
Qui abbiamo introdotto i coefficienti di connessione affine, o simboli di Christoffel del
secondo tipo,
1
Γabc (x) = g ad (∂b gdc + ∂c gbd − ∂d gbc )
(2.8)
2
Le eq. (2.7) esprimono semplicemente l’asserzione che rispetto alle coordinate inerziali il
moto libero è dato dalle equazioni Ẍ a = 0, le cui soluzioni, le rette, sono le geodetiche
dello spazio di Minkowski.
Secondo l’asserzione [A], il passaggio alle coordinate xa ha introdotto un campo gravitazionale, e infatti le (2.7) descrivono un movimento accelerato in cui le forze sono
determinate dai coefficienti Γabc . Le componenti della metrica gab (x) sono allora l’analogo dei potenziali. L’argomento che ha condotto alle (2.7) è valido anche in un campo
gravitazionale, solamente che in questo caso sono locali le coordinate inerziali stesse7 .
7
Cosicché non si potrà eliminare il campo con un’unica trasformazione di coordinate.
109
C. Perciò interpretiamo le (2.7) come le equazioni del moto di una particella
in un campo gravitazionale, e le componenti della metrica, le dieci funzioni
′
gab (x), come il campo gravitazionale stesso. Nel sistema x , esso sarà descritto
′
′
dalle funzioni gab (x ) date dall’equazione (2.4).
È importante ricordarsi che possiamo eliminare totalmente questo campo semplicemente
ritornando alle coordinate inerziali X a . Proprio perché rappresentano le “forze” gravitazionali, i coefficienti di connessione non possono trasformarsi come tensori. Passando alle
′
coordinate x a si ha8
′
′
′
Γ abc (x ) =
′
∂x a ∂xβ ∂xγ α
∂x a ∂ 2 xα
Γ
(x)
+
∂xα ∂x′ b ∂x′ c βγ
∂xα ∂x′ b ∂x′ c
(2.9)
′
Solo in questo modo, infatti, le equazioni del moto nelle coordinate x assumono la stessa
forma delle (2.7).
coordinate localmente inerziali
Usando la connessione è facile costruire in un intorno di ogni punto un sistema di coordinate locali in caduta libera. A tale scopo, sia p un evento e indichiamo con eaα la matrice
invertibile che diagonalizza la metrica in p,
eaα ebβ gab (xp ) = ηλβ ,
eaα ebβ η αβ (xp ) = gab
La trasformazione x → X data da
1
xa = xap + ebα X α − Γabc (xp )ebα ecβ X α X β + F a (X)
2
(2.10)
dove F è una funzione liscia che si annulla in p insieme con le derivate prime e seconde,
è localmente invertibile in un intorno aperto di p, perché
( a)
∂x
= eaα
∂X α |p
e dunque definisce una trasformazione di coordinate; se indichiamo con ḡαβ e Γ̄αβγ la
metrica e la connessione nelle nuove coordinate, in p (cioè per X α = 0) si ha
Γ̄αβγ = 0
ḡαβ = ηαβ ,
ossia
(
∂ḡλβ
∂X γ
)
=0
|p
8
Usando la (2.8) il conto è un pó tedioso, ma elementare. Un metodo più diretto è riscrivere le (2.7)
nelle nuove coordinate.
110
Le coordinate X α sono dunque inerziali in p, e nell’intorno dove la (2.10) è invertibile la
metrica è costante a meno di termini che contengono solo derivate seconde o di ordine
superiore della metrica. Come vedremo, queste sono connesse alla curvatura dello spaziotempo attraverso il tensore di Riemann. Una geodetica uscente da p con vettore tangente
uα e parametro affine s, nelle coordinate X α ha un’espansione del tipo
α
X α = uα s + Cβγδ
uβ uγ uδ s3 + · · ·
α
con coefficienti Cβγδ
calcolabili; in matematica le X α si chiamano coordinate localmente
geodetiche in p. I geometri mostrano che in un intorno di p (che si può prendere convesso),
è possibile scegliere le funzioni F α (X) tali che le geodetiche uscenti da p siano descritte
da funzioni lineari del parametro affine in tutto l’intorno; tali coordinate si chiamano
coordinate normali di Riemann.
metrica e gravitazione
Nel seguito useremo i termini “campo metrico” e “campo gravitazionale” come sinonimi,
e si noti che non si tratta solo di una questione terminologica. Studiare un campo gravitazionale o la geometria della metrica Lorentziana che lo rappresenta, sono veramente la
stessa cosa. Si può anche fare la seguente analogia: esplorando lo spazio con cariche elettriche ed aghi magnetici si determina il campo elettromagnetico, esplorandolo con regoli
graduati ed orologi si determina il campo metrico, che è anche il campo gravitazionale.
Ad esempio, provate a studiare la metrica
ds2 = −(1 + gx/c2 )2 c2 dt2 + dx2 + dy 2 + dz 2
dove g è una costante (se fosse g = 0 si avrebbe la metrica di Minkowski, ossia l’assenza
di campo). Ecco alcune questioni rilevanti:
1. qual’è il dominio di definizione delle coordinate? Quale di esse rappresenta il tempo?
e perché?
2. come si calcola la metrica inversa? e la connessione Γabc (x, y, z)?
3. quali sono le geodetiche nulle e temporali?
4. che proprietà hanno le curve coordinate x = x0 > 0, y = z = 0? sono geodetiche?
possiedono accelerazione?
5. quanto vale l’intervallo di tempo proprio fra due eventi delle curve?
6. esiste una trasformazione di coordinate che converte il campo nella metrica di
Minkowski: siete capaci di trovarla?
7. è la superficie x = −c2 /g una singolarità del campo? dello spazio-tempo? delle
coordinate?
111
8. quanto “tempo” impiega una particella a raggiungere la detta superficie da un punto
qualunque lungo una geodetica? e un raggio di luce?
9. un raggio di luce viaggia dal punto x = x0 , y = z = 0 al punto x = x1 , y = z = 0:
quanto tempo coordinato impiega?
10. una sorgente nell’origine, x = y = z = 0, emette un raggio di luce di frequenza
propria ν che viene rivelato nel punto x = x1 , y = z = 0: quanto vale la frequenza
propria osservata?
11. una particella è ferma rispetto alle coordinate (t, x, y, z); come si muove rispetto a
un osservatore inerziale? quanto vale l’accelerazione?
Si noti il “sapore” marcatamente geometrico delle domande, nonostante tutte corrispondano, più o meno direttamente, a problemi di fisica gravitazionale.
7.2.2
Distanze spaziali e intervalli di tempo
È interessante discutere certe restrizioni imposte al sistema di coordinate locali dal carattere Lorentziano della metrica. Fino ad ora non abbiamo specificato quale delle quattro
coordinate debba rappresentare il tempo, perché infatti è la metrica che determina le
relazioni causali, non le coordinate. Tuttavia è comodo fare la convenzione che x0 sia una
coordinata temporale, nel senso che le linee corrispondenti a valori fissi delle rimanenti
coordinate, xj = (x1 , x2 , x3 ), rappresentano curve temporali9 . I vettori tangenti a queste
curve sono di tipo tempo e normalizzati
gab ua ub = −1
e hanno componenti
ua = δ0a (−g00 )−1/2
Infatti, dal carattere temporale delle curve xj = xj0 , segue che g00 < 0. Sulla superficie
determinata localmente dalla condizione x0 costante, tutte le curve sono spaziali (perché
la metrica ha tre autovalori positivi) e quindi la metrica indotta, di componenti gij ,
deve essere una matrice definita positiva. Tuttavia questa non determina le distanze
spaziali perché gli eventi con lo stesso valore di x0 non sono, in generale, simultanei
per gli osservatori che seguono le linee temporali (cioè che hanno quadrivelocità ua ). In
relatività ristretta, la condizione che due eventi con separazione ∆X a siano simultanei per
un osservatore con quadrivelocità ua , è ua ∆X a = 0. Poiché differenze finite di coordinate
9
Il fatto che la metrica abbia un autovalore negativo implica che almeno una delle quattro linee
coordinate (una linea coordinata è una curva lungo la quale una sola coordinata varia) sia una curva
temporale (in inglese, timelike).
112
curvilinee non definiscono un quadrivettore, mentre differenze infinitesime10 sı̀, scriveremo
la condizione di simultaneità per eventi vicini
ua δxa = (−g00 )−1/2 ga0 δxa = 0
(2.11)
Da questa segue la differenza di tempo coordinato tra eventi simultanei
√
√
−g00 δx0 = γj δxj ,
γj = g0j / −g00
La distanza è il valore dell’intervallo ds2 tra eventi simultanei: sostituendo δx0 nella
metrica si ottiene la distanza spaziale
)
(
g0i g0j
2
i
j
δxi δxj
(2.12)
ds = (gij − γi γj )δx δx = gij +
g00
Questa metrica non è in generale Euclidea. Ad esempio, si consideri la trasformazione di
coordinate (T, R, θ, Z) → (t, r, ϑ, z), dove
ϑ = θ − ωT,
r = R,
z = Z,
t=T
e (T, R, θ, Z) sono coordinate cilindriche nello spazio di Minkowski. Un punto di coordinate (r, ϑ, z) si muove rispetto al riferimento inerziale di moto circolare uniforme, con
velocità angolare ω. La semplicità della trasformazione t = T è ingannevole; a causa della
dilatazione relativistica del tempo, gli orologi che segnano il tempo t devono marciare
tanto più rapidamente quanto più sono lontani dall’asse di rotazione. La variabile t è un
esempio di tempo coordinato. La metrica di Minkowski, ds2 = −c2 dT 2 +dR2 +R2 dθ2 +dZ 2 ,
si trasforma nella metrica di Langevin
ds2 = −(c2 − ω 2 r2 )dt2 + 2ωr2 dt dϑ + dr2 + r2 dϑ2 + dz 2
Questo è il campo gravitazionale che si manifesta rispetto al disco rotante situato nel
piano z = 0. Calcolando la metrica spaziale con la (2.12) si trova
r2 dϑ2
ds = dr +
+ dz 2
2
2
2
1 − ω r /c
2
2
Da qui vediamo che la circonferenza del cerchio di raggio r, misurata con regoli in quiete
sul disco, è
2πr
L= √
> 2πr
1 − ω 2 r2 /c2
un risultato che viola la geometria Euclidea! Dal punto di vista dell’osservatore inerziale
che vede il disco girare, il fenomeno si spiega osservando che i regoli disposti lungo la
circonferenza appaiono contratti rispetto a quelli disposti lungo un diametro, perché i
primi sono disposti nel senso della velocità, che vale ωr, mentre i secondi sono trasversali
al moto. L’osservatore sul disco la pensa diversamente però, dato che vede i regoli in
quiete. Tuttavia nota che esiste un campo gravitazionale, e potrà concludere che l’effetto
sia dovuto al comportamento dei regoli nel campo di gravità. Seguendo Einstein, possiamo
concludere:
10
′
δx a =
′
∂x a
δxb
∂xb
è la formula di trasformazione di un vettore.
113
D. la geometria fisica, o naturale, che si ottiene esplorando lo spazio-tempo
mediante misure con regoli graduati ed orologi11 , non è a priori conforme agli
enunciati della geometria Euclidea, nè di qualunque altro sistema assiomatico.
Non è quindi corretto assumere a priori la validità di un sistema geometrico assiomatico indipendentemente dalle proprietà della materia (inclusa la
radiazione).
Per quanto riguarda il tempo, osserviamo soltanto che l’intervallo di tempo proprio tra
eventi con identiche coordinate spaziali è, ovviamente,
√
dτ = −g00 (x) dx0
(2.13)
e dipende dal punto. Per esempio, sulla piattaforma rotante si ha
√
dτ = 1 − ω 2 r2 /c2 dt
la quale significa che un orologio standard (cosı̀ chiamato per distinguerlo dall’orologio
fittizio che indica il tempo coordinato) posto in r ritarda rispetto a un orologio identico
posto nel centro. Come prima, secondo l’osservatore inerziale il fenomeno è dovuto alla
dilatazione relativistica del tempo, visto che l’orologio posto in r viaggia con velocità ωr
rispetto al sistema inerziale. L’osservatore rotante, però, vede l’orologio in quiete e quindi
interpreta il ritardo come un effetto dovuto al campo gravitazionale della piattaforma12 . Si
può dunque avere un ritardo degli orologi anche indipendentemente dal loro moto relativo,
un effetto dovuto al campo metrico/gravitazionale che va sotto il nome di “spostamento
verso il rosso” (o effetto Einstein o anche red shift).
11
Naturalmente si usano anche particelle di prova e segnali elettromagnetici.
Si deve assumere che gli effetti di stress sui materiali dei regoli e degli orologi siano stati
preventivamente determinati e opportunamente corretti.
12
114
Capitolo 8
Appendici
A
Invarianza della fase
Denotiamo con C la cresta d’onda che è nell’origine al tempo t = 0. La fase in F è
(
)
(
x cos α + y sin α
r)
F(t, x, y) = ν t −
=ν t−
c
c
e si può interpretare come il numero di oscillazioni del campo che si osservano in X = (x, y)
durante l’intervallo di tempo che intercorre tra l’arrivo in X di C e l’istante t (intervallo
che ammonta a t − r/c secondi).
′
Sia F un sistema di riferimento in moto relativo uniforme rispetto al sistema assoluto F ,
′
con velocità v nella direzione dell’asse x, e coincidente con F nell’istante t = t = 0. Sia
′
′
′
′
′
X = (x , y ) il punto di F che coincide con X = (x, y) al tempo t = t: evidentemente il
′
numero di oscillazioni del campo in X , contate a partire dal passaggio di C fino al tempo
′
′
t = t, coincide con quello determinato in F e determina la fase dell’onda in F
(
′
′
′
′)
x cos α + y sin α
′
′
′
′
′
′
F (t , x , y ) = ν t −
c′
′
′
′
′
′
′
′
Dunque si ha F(t, x, y) = F (t , x , y ). Inoltre (x , y ) coincide con (x, y) al tempo t = t,
e quindi si ha la trasformazione di Galilei
′
x = x − vt
′
′
y =y
t =t
′
′
′
′
L’affermazione F(t, x, y) = F (t , x , y ) per ogni trasformazione di Galilei è precisamente
ciò che si intende quando si dice che F(t, x, y) è un invariante del gruppo di Galilei.
B
La delta di Dirac
Sia hn (x, x0 ) una successione di funzioni tali che
∫
hn (x, x0 )dx = 1
115
∫
lim
n→0
hn (x, x0 )f (x)dx = f (x0 )
(B.1)
dove gli integrali sono estesi alla retta reale. Esempio:
√
1 −(x−x0 )2 /n
hn (x, x0 ) =
e
πn
Si noti che limn→0 hn (x, x0 ) = 0 se x ̸= x0 , ma è infinito se x = x0 , e dunque non
definisce una funzione. Tuttavia il limite (B.1) esiste e definisce un funzionale lineare sullo
spazio delle funzioni f , chiamate in questo contesto funzioni di prova. Questi funzionali
si chiamano distribuzioni, o anche funzioni generalizzate. In accordo con l’uso che ne fanno
i fisici, noi scriveremo δ(x − x0 ) per indicare il funzionale definito dalla (B.1)
δ(x − x0 ) = lim hn (x, x0 )
(B.2)
n→0
e scriveremo anche
∫
δ(x − x0 )f (x)dx = f (x0 )
(B.3)
Però bisogna ricordarsi che δ(x − x0 ) non è una funzione e che il significato preciso della
(B.3) si trova nell’Eq. (B.1). La funzione generalizzata δ(x − x0 ) si chiama delta di Dirac.
Conviene prendere le funzioni f di classe C ∞ e con supporto compatto (cioè nulle nel
complementare di un insieme chiuso e limitato). Si può allora definire la derivata di
δ(x − x0 ) integrando per parti
∫
′
′
δ (x − x0 )f (x)dx = −f (x0 )
(B.4)
′
La definizione si può applicare a qualsiasi funzione generalizzata T (x): la derivata T (x)
è la funzione generalizzata tale che
∫
∫
′
′
T (x)f (x)dx = − T (x)f (x)dx
(B.5)
per ogni funzione di prova f (x). Esempio: sia θ(x) la funzione scalino di Heaviside,
θ(x) = 1 se x > 0 e θ(x) = 0 se x < 0. Si ha
∫
∫ ∞
θ(x)f (x)dx =
f (x)dx
0
e dunque per il teorema fondamentale del calcolo
∫
′
θ (x)f (x)dx = f (0)
′
Questo significa che θ (x) = δ(x), un fatto piuttosto intuitivo. Se x = (x1 , . . . , xn ) ∈ Rn
definiamo
δ (n) (x) = δ(x1 ) · · · δ(xn )
(B.6)
Nello spazio di Minkowski avremo δ (4) (x) = δ(x0 )δ(x1 )δ(x2 )δ(x3 ). Per i nostri scopi, le
principali proprietà della delta di Dirac sono
116
1. δ(x) = δ(−x)
2. δ(ax) = |a|−1 δ(x)
3. f (x) abbia N zeri semplici xn : allora
δ(f (x)) =
∑
1
δ(x − xn )
|f (xn )|
′
n
4. sia A una matrice non singolare: allora
δ (n) (Ax) = | det A|−1 δ (n) (x)
5. se Λ è nel gruppo di Lorentz proprio ortocrono
δ (4) (Λx) = δ (4) (x)
cioè δ (4) (x) è uno scalare, invariante per trasformazioni di Lorentz.
Le proprietà sono tutte conseguenze della formula di trasformazione delle variabili di
integrazione. Ad esempio
∫
∫
(n)
n
−1
δ (Ax)f (x)d x = | det A|
δ (n) (x)f (A−1 x)dn x = | det A|−1 f (0)
da cui segue la quarta proprietà. Un caso particolare della terza proprietà è la formula
δ(x2 − x20 ) =
1
(δ(x − x0 ) + δ(x + x0 ))
2|x0 |
(B.7)
Una importante rappresentazione integrale discende dalla trasformata di Fourier
∫
˜
f (k) = eikx f (x)dx
La formula di inversione
∫
1
f (x) =
f˜(k)e−ikx dk
2π
implica (lo scambio degli integrali non sarebbe ammesso, ma si può giustificare)
∫
∫
∫
∫
∫
−ikx
ikx
dx f (x) dk e
= dk e f (x)dx = dk f˜(k) = 2π f (0)
L’ultimo passaggio segue dalla formula di inversione. Dunque si ha
∫
∫
1
1
−ikx
δ(x) =
dk e
=
dk eikx
2π
2π
(B.8)
L’ultimo passaggio è evidente, oppure segue dalla parità della delta, secondo cui δ(x) =
δ(−x).
117
C
Testi di Riferimento
Abbreviazioni: RS e RG stanno per relatività speciale e generale, rispettivamente. I testi
di base sono tutti altamente raccomandabili, ma ovviamente ciascuno può studiare dove
gli pare e piace.
Le abbreviazioni dei testi sotto indicati, Wei, Sch, LL, Rin, Law, Wil, PP, Mø, Pau
e Ber, sperabilmente, si commentano da sole.
testi di base
* B. Schutz[3], A First Course in General Relativity. I Cap. [1,2,3,5,6,7,8] coprono
materiale simile al corso, con metodi elementari ma approfonditi (difficili sono i
concetti).
* S. Weinberg[4], Gravitation and Cosmology: Principles and Applications of the General Theory of Relativity. Il Cap. [2] offre una sintesi della RS. I Cap. [3,4,5,6,7]
offrono le basi della RG. Il libro è considerato un classico, ed è eccellente sotto tutti
gli aspetti.
* W. Rindler[5], Introduction to Special Relativity. Trattato elementare ma brillante.
* L. Landau e E. Lifsitz[6], The Classical Theory of Fields. Libro eccellente. I
Cap. [1,2,3,4] discutono la RS e l’elettrodinamica, non richiede conoscenze matematiche sofisticate.
testi complementari
* D. F. Lawden[7], Introduction to Tensor Calculus, Relativity and Cosmology.
* C. Will[8], Theory and Experiments in Gravitational Physics.
* W. Panofski & M. Phillips[9], Classical Electricity and Magnetism, Cap. [15,16,17,18].
Il testo di Will si occupa di relatività generale. Il PP include un capitolo sulle basi
sperimentali della relatività che vale la pena di leggere.
testi datati
Fra i testi datati, i più istruttivi mi sembrano i seguenti:
* C. Møller, The Theory of Relativity, Oxford, 1972.
* W. Pauli, Theory of Relativity, Dover New Ed., 1986.
* P. G. Bergmann, Introduction to the Theory of Relativity, Dover, 1976.
* M. Born, Einstein’s Theory of relativity, Dover New Ed., 1962.
118
Tutti offrono punti di vista alternativi e approfondimenti su varie questioni di principio
e dunque possono anche essere considerati come testi complementari. Il libro di Møller
ha una interessante introduzione al quadro storico entro cui si è sviluppata la teoria della
relatività. I due seguenti offrono esposizioni molto brillanti della teoria, ma Pauli è forse
troppo conciso per uno studente alle prime armi. Il libro di Max Born è indirizzato ai
non esperti, ma offre discussioni interessanti e approfondite dei concetti fondamentali.
D
Argomeni da studiare per l’esame
In linea di principio tutti gli argomenti discussi nel corso dovrebbero essere studiati. Ma
in pratica, allo scopo di facilitare la preparazione dell’esame, si richiederà molto meno,
come di seguito specificato.
1. Fisica pre-relativistica: il primo capitolo del libro di Møller offre una panoramica
dei problemi che hanno condotto alla relatività. Gli studenti dovrebbero avere
un’idea delle difficoltà poste alla teoria dell’etere dall’esperimento di Michelson e
Morley.
2. Relatività speciale: Schutz, Rindler e/o Landau-Lifschitz vanno tutti bene. Gli
studenti devono sapere la definizione del tempo secondo Einstein, i postulati della
relatività, la derivazione delle trasformazioni di Lorentz, la dilatazione del tempo e la
contrazione delle lunghezze, l’addizione delle velocità, l’effetto Doppler e la formula
dell’aberrazione. Ma anche la definizione del tempo proprio, del moto iperbolico,
dello spazio-tempo, la metrica di Minkowski e tutto l’apparato quadri-dimensionale,
il cono luce, i quadri-vettori, ecc. Integrate i vostri appunti sui libri consigliati.
3. Tensori: i tensori si possono studiare sul Schutz, gli studenti devono sapere cosa
sono i tensori e come si trasformano.
4. Dinamica Relativistica: le equazioni di Eulero-Lagrange per i sistemi continui
(campi) sono in LL, Cap.[4], ¶[32], il principio variazionale per le particelle in LL
Cap. [2-3]. Gli studenti devono sapere le equazioni di Eulero-Lagrange, le equazioni
del moto relativistiche per le particelle, le formule per la quantità di moto e l’energia, le loro formule di trasformazione e il teorema di equivalenza massa-energia.
La formulazione covariante delle equazioni di Maxwell, il campo elettromagnetico in relatività, le formule di trasformazione, la corrente elettrica, l’equazione di
continuità, la forza di Lorentz e l’equazione del moto per le cariche, la loro derivazione da un principio variazionale, il tutto anche in forma covariante. Le equazioni
fenomenologiche di Minkowski sono facoltative.
5. Tensore energia-impulso: su LL, Cap. [4], c’è tutto per l’elettrodinamica. Lo
studente deve sapere la definizione del tensore energia-impulso canonico, il significato fisico delle sue componenti, la legge di conservazione, il tensore per i fluidi perfetti
e le particelle e come trattare il caso elettromagnetico. Anche Wei, Cap. [2], offre
agganci con l’argomento.
119
6. Relatività Generale: Wei, i Cap. [3,4,5,6,7] coprono tutto quel che si è detto a
lezione (e molto di più), tranne la teoria di Nordstrøm, che non è richiesta per l’esame. Lo stesso dicasi di Sch. Quindi studiate. Le cose minime da sapere includono
il principio di equivalenza, l’uguaglianza della massa inerziale e gravitazionale, la
metrica dello spazio-tempo, le forze gravitazionali, cosa sono le geodetiche e il loro
significato fisico, il red-shift e la sua verifica sperimentale, il principio di covarianza
generale, qualche esempio di equazione covariante rispetto al gruppo generale di
trasformazioni, il limite newtoniano delle equazioni geodetiche, un’idea del tensore
di Riemann e delle equazioni di Einstein quale si può ottenere sul Sch. Se non
sapete o non capirete granché, ma ve la cavate bene con la RS, sarò soddisfatto.
Però provateci.
120
Bibliografia
[1] Neil Ashby, Relativity in the Global Positioning System, Living Rev. Relativity 6,
(2003), 1. URL (cited on ¡date¿): http://www.livingreviews.org/lrr-2003-1
[2] A. Einstein, The Principle of Relativity, Dover Publications (2000).
[3] B. Schutz, A First Course in General Relativity, Cambridge University Press, 1985.
[4] S. Weinberg, Gravitation and Cosmology: Principles and Applications of the General
Theory of Relativity, Wiley & Sons, 1972.
[5] W. Rindler, Introduction to Special Relativity, Oxford 1981.
[6] L. Landau e E. Lifsitz, The Classical Theory of Fields, IV Ed. 1987, oppure Teoria
dei campi, Editori Riuniti, 1976.
[7] D. F. Lawden, Introduction to Tensor Calculus, Relativity and Cosmology, Dover
Ed. s 1982.
[8] C. Will, Theory and Experiments in Gravitational Physics, Cambridge Revised
Ed. 1993.
[9] W. Panofski & M. Phillips, Classical Electricity and Magnetism, Dover 2nd Edition,
1962.
[10] H. P. Robertson, Rev. Mod. Phys. 21, 379 (1949).
[11] R. M. Mansouri and R. U. Sexl, Gen. Rel. Grav. 8, 497 (1977); Gen. Rel. Grav. 8,
515 (1977); Gen. Rel. Grav. 8, 809 (1977).
121