Introduzione alla Fisica Moderna

Università del Salento
FACOLTÀ DI SCIENZE MATEMATICHE, FISICHE E NATURALI
Corso di Laurea in Fisica
INTRODUZIONE ALLA FISICA MODERNA
ROSARIO ANTONIO LEO
Anno Accademico 2007/2008
INDICE
nozioni elementari. richiami
1
Punto materiale
iii
2
Sistemi di particelle
v
iii
i meccanica analitica
1
1 principio di d’alembert ed equazioni di lagrange
3
1.1 Vincoli
3
1.1.1 Definizioni
3
1.1.2 Classificazione dei vincoli
3
1.2 Gradi di libertà e coordinate lagrangiane
4
1.3 Principio di d’Alembert ed equazioni di Lagrange
4
1.4 Potenziali generalizzati e funzioni di dissipazione
8
1.4.1 Potenziali generalizzati
8
1.4.2 Equazioni di Lagrange in presenza di forze non derivabili
da un potenziale
9
1.4.3 Trasformazioni di gauge e lagrangiana di una particella immersa in un campo elettromagnetico 11
2 principio variazionale di hamilton ed equazioni di lagrange
15
2.1 Principio di Hamilton
15
2.2 Applicazioni del calcolo delle variazioni 18
2.2.1 Cammino più breve fra due punti in un piano 19
2.2.2 Il problema della brachistocrona
20
2.3 Leggi di conservazione
23
2.3.1 Coordinate cicliche
23
2.3.2 Funzione energia
25
3 applicazioni delle equazioni di lagrange
27
3.1 Problema dei due corpi
27
3.1.1 Movimento in un campo centrale
28
3.2 Piccole oscillazioni
31
3.2.1 Impostazione del problema 31
3.2.2 Riepilogo
35
3.2.3 Osservazioni
35
3.2.4 Un particolare problema
36
4 formalismo hamiltoniano
39
4.1 Equazioni di Hamilton
39
4.1.1 Un esempio
41
4.2 Notazione simplettica
42
4.3 Coordinate cicliche e metodo di Routh 43
4.4 Principio variazionale di Hamilton modificato 46
i
Indice
Parentesi di Poisson
47
Trasformazioni canoniche 49
Equazioni di Hamilton-Jacobi 54
Variabili angolo-azione nel caso unidimensionale
56
4.8.1 Esempio: l’oscillatore armonico unidimensionale
Bibliografia (Parte 1)
59
4.5
4.6
4.7
4.8
ii
57
relatività ristretta e introduzione alla meccanica quantistica
61
5 relatività speciale
63
5.1 Trasformazioni di Lorentz 63
5.1.1 Premessa
63
5.1.2 Concetto di evento 63
5.1.3 Principio di inerzia
64
5.1.4 Postulati della Relatività Ristretta e trasformazioni di Lorentz
64
5.2 Alcune conseguenze delle trasformazioni di Lorentz
70
5.2.1 Legge di trasformazione delle velocità
70
5.2.2 Contrazione delle lunghezze
71
5.2.3 Dilatazione dei tempi
72
5.3 Lo spazio di Minkowski
73
5.4 Quadrivelocità e quadriaccelerazione 77
5.5 Dinamica relativistica 78
5.6 Energia cinetica e momenti 80
5.7 Quadrimomento, tensore momento angolare 81
5.8 Equazioni del moto 82
5.9 Meccanica analitica relativistica (cenni) 83
5.9.1 Carica in moto in un campo elettromagnetico 85
5.10 *L’interferometro di Michelson e Morley 87
6 introduzione alla meccanica quantistica
91
6.1 *Il corpo nero 91
6.2 L’effetto fotoelettrico 93
6.3 Effetto Compton 95
6.4 Onde di materia di de Broglie 97
Bibliografia (Parte 2) 99
a la trasformata di legendre
101
a.1 Definizione 101
b note sulle unità di misura
103
c costanti fisiche fondamentali
105
ii
N O Z I O N I E L E M E N TA R I . R I C H I A M I
1
punto materiale
L’idea di punto materiale è uno dei concetti di base della meccanica analitica. Il
punto materiale è caratterizzato dalla sua massa. La posizione di un punto materiale in un sistema di riferimento Oxyz, supposto inerziale salvo avviso contrario,
è determinata dal raggio vettore r = x x̂ + yŷ + zẑ. Definiamo velocità
v=
dr
= ẋ x̂ + ẏŷ + żẑ,
dt
quantità di moto
p = mv,
e accelerazione
a=
d2 r
dv
= 2.
dt
dt
Sappiamo che, in un sistema di riferimento inerziale, valgono i principi della
dinamica. Se F è la forza risultante agente sulla particella di massa m si ha che,
per il secondo principio della dinamica,
F=
dp
dv
=m
= ma,
dt
dt
(1)
con m supposta costante rispetto al tempo.
Supponiamo che la particella sia libera. Allora x (t), y(t), z(t) sono tra loro
indipendenti. Se F = F (r, v, t) = F ( x, y, z; ẋ, ẏ, ż; t) dalle (1) otteniamo:
m ẍ (t) = Fx ( x, y, z; ẋ, ẏ, ż; t) ,
mÿ(t) = Fy ( x, y, z; ẋ, ẏ, ż; t) ,
(2)
mz̈(t) = Fz ( x, y, z; ẋ, ẏ, ż; t) .
Assegnate le condizioni iniziali r(0) = r0 e v(0) = v0 , se in un intorno di (r0 , v0 , 0)
le funzioni Fx , Fy e Fz sono “buone” (per esempio sono lisce, cioè sono di classe
C ∞ ), allora il sistema di equazioni (2) per t > 0 ammette, almeno in un intorno
di (r0 , v0 , 0), un’unica soluzione. Viene così soddisfatto, almeno localmente, il
principio deterministico newtoniano. Le equazioni (2) sono dette equazioni del
moto. Osservazione: la quantità di moto si conserva, cioè p è costante, se F = 0
identicamente.
Definiamo momento angolare della particella rispetto ad O
LO = r × p.
(3)
iii
nozioni elementari. richiami
Definiamo momento della forza F rispetto al punto O
dp
dLO
= r×
= r × F ≡ NO .
dt
dt
(4)
Dalla (4) si vede che il momento angolare si conserva, cioè LO è costante, se
NO = 0 identicamente. Per esempio se consideriamo F forza centrale tale che
il centro della forza è O, allora NO = 0 e quindi LO è costante. Il momento
angolare della particella rispetto ad un punto O0 individuato rispetto ad O dal
vettore posizione rO0 è dato da
LO0 = (r − rO0 ) × p.
Si vede facilmente che
dLO0
dr 0
dr 0
= (r − rO0 ) × F − O × p = NO0 − O × p,
dt
dt
dt
dove NO0 è il momento delle forze rispetto a O0 .
Se F è una forza conservativa allora F = −∇U (r), dove U (r) è l’energia potenziale.
Indichiamo con T = 21 mv2 l’energia cinetica della particella. Sappiamo che se F è
una forza conservativa vale il principio di conservazione dell’energia meccanica:
T + U = costante.
Ricordiamo che vale, anche se la forza non è conservativa, il teorema dell’energia
cinetica:
L=
Z B
A
F · dr =
1 2 1 2
mv − mv = TB − TA .
2 B 2 A
Esercizi
1. Studiare il moto di una particella di massa m soggetta alla forza
F = −kr − αv
(k, α > 0)
dove r vettore posizione della particella e v velocità, con le condizioni iniziali
r (0) = r0 6 = 0 e v (0) = v0 k r0
2. Studiare il moto di una particella di massa m e carica q in un campo magnetico B uniforme e costante. Siano r(0) = r0 e v(0) = v0 6= 0
3. Studiare il moto di una particella di massa m e carica q in un campo elettrico
E e in un campo magnetico B, uniformi e costanti e tra loro ortogonali.
iv
2 sistemi di particelle
2
sistemi di particelle
Supponiamo di avere un sistema di N particelle puntiformi. Sia Oxyz il sistema
di riferimento (inerziale). Siano mi e ri rispettivamente la massa ed il vettore
posizione dell’i-esima particella. Definiamo centro di massa
∑iN=1 mi ri
,
M
rCM =
con M = ∑iN=1 mi . Detta inoltre vi =
velocità del centro di massa sarà:
vCM =
dri
dt
la velocità dell’i-esima particella, la
∑iN=1 mi vi
.
M
Definiamo infine la quantità di moto
N
pCM =
∑ mi vi = MvCM .
i =1
Ogni particella del sistema interagisce con le altre particelle e con il mondo esterno. Sia Fij la forza che la j-esima particella ( j 6= i ) esercita sulla i-esima. Se vale la
forma debole del principio di azione e reazione allora
Fij + F ji = 0.
Per la seconda legge della dinamica
N
dpi
(e)
= Fi = Fi + ∑ F ji ,
dt
j=1,j6=i
(e)
dove Fi è la forza totale agente sulla i-esima particella, Fi è la forza totale esterna
agente sulla i-esima particella e ∑ N
j=1,j6=i F ji è la forza totale interna agente sulla
N
N
i-esima particella. Poiché ∑i=1 ∑ j=1,j6=i F ji = 0 allora
N
dpCM
(e)
= ∑ Fi = F (e) ,
dt
i =1
dove F(e) è la risultante delle forze esterne. Se F(e) = 0 allora pCM è costante e
quindi il centro di massa si muove di moto rettilineo uniforme, assumendo che la
massa M sia costante. Definiamo momento angolare del sistema di N particelle
puntiformi rispetto ad O
N
LO =
∑ ri × pi .
i =1
Si ricava banalmente che
N
dLO
= ∑ r i × F i = NO .
dt
i =1
v
nozioni elementari. richiami
Osserviamo
che se vale la forma forte del principio di azione e reazione, cioè se
ri − r j × F ji = 0 ∀i, j 6= i, allora
N
∑ ri × Fi
NO =
(e)
(e)
= NO
i =1
(e)
Se NO = 0 allora LO è costante.
Sia r0 i il vettore posizione dell’i-esima particella rispetto al centro di massa, cioè
si ha r0 i = ri − rCM . Allora
N
∑ (rCM + ri − rCM ) × pi = rCM × pCM + LCM .
LO =
i =1
Definiamo energia cinetica del sistema di N particelle
N
T=
1
∑ 2 mv2i .
i =1
Vale ancora il teorema dell’energia cinetica:
N
L=
∑
Z 2
i =1 1
Fi · dri = T2 − T1 ,
dove con 1 e 2 sono rispettivamente le configurazioni iniziale e finale del sistema.
Osserviamo che
N
∑
Z 2
i =1 1
N
Fi · dri =
∑
Z 2
(e)
i =1 1
N
Fi · dri + ∑
N
∑
Z 2
i =1 j=1,j6=i 1
F ji · dri
ed inoltre
F ji · dri + Fij · dr j = F ji · dri − dr j = F ji · dr ji
con F ji · dr ji 6= 0 in generale.
Se tutte le forze sono conservative allora
1 N N (e)
(e)
Uij (1) − Uij (2) .
L = ∑ Ui (1) − Ui (2) +
∑
2 i,j=1,j6=i
i =1
Vale il principio di conservazione dell’energia meccanica:
N
T + U = T + ∑ Ui
(e)
i =1
+
1 N
Uji = costante.
2 i,j=∑
1,i 6= j
Esercizi
1. Dimostrare che
dLCM
dt
= NCM .
2. Dimostrare che LCM = ∑iN=1 (ri − rCM ) × p0 i , con p0 i = mi (vi − vCM ).
vi
Parte I
MECCANICA ANALITICA
1
P R I N C I P I O D I D ’ A L E M B E RT E D E Q U A Z I O N I D I L A G R A N G E
1.1
vincoli
1.1.1 Definizioni
Fissato un sistema di riferimento inerziale, la posizione di una particella puntiforme è, ad ogni istante, individuata dal vettore r(t). La particella è libera se non è
soggetta ad alcuna condizione che ne limiti la traiettoria; in caso contrario si dice
che essa è vincolata. Allo stesso modo per un sistema di N particelle, se tutte le
particelle che costituiscono il sistema sono libere, il sistema è detto libero; altrimenti si dice che è vincolato.
La presenza di vincoli comporta l’introduzione di forze che agiscono sulle particelle limitandone la mobilità. Queste forze sono dette forze vincolari o reazioni
vincolari. Chiameremo attive le forze che non sono dovute a vincoli.
1.1.2 Classificazione dei vincoli
Classifichiamo i vincoli:
• In base alla forma delle relazioni che legano le coordinate delle particelle:
– vincoli olonomi: possono essere espressi da relazioni del tipo
f (r1 , r2 , . . . , r N , t) = 0.
(1.1)
Il sistema si dirà, in tal caso, olonomo. Ad esempio:
* una particella che si muove nel piano xy lungo la retta y = mx + q;
2
2
* il corpo rigido: le reazioni vincolari sono del tipo ri − r j − cij =
0 (la distanza tra due punti generici del corpo rigido è costante);
– vincoli anolonomi: non possono essere espressi da relazioni del tipo
(1.1). Tali vincoli possono essere espressi da vincoli di diseguaglianza
o equivalentemente da vincoli di uguaglianza in cui compaiono anche
le velocità. Esempi:
* particella vincolata a stare all’interno di una sfera di centro O e
raggio a. In tal caso il vincolo si esprime con krk2 − a2 < 0.
• In base alla dipendenza dal tempo:
– vincoli scleronomi: non dipendono dal tempo;
– vincoli reonomi: dipendono dal tempo.
3
principio di d’alembert ed equazioni di lagrange
• In base al tipo di reazione vincolare
– vincoli lisci: la reazione vincolare è sempre normale al vincolo;
– vincoli scabri: la reazione vincolare ha una componente tangenziale al
vincolo (sono presenti forze di attrito).
1.2
gradi di libertà e coordinate lagrangiane
La configurazione di un sistema libero formato da N particelle è definita dagli
N vettori posizione ri (t), con i = 1, . . . N, ed è quindi individuata, in uno spazio
tridimensionale, da 3N quantità scalari o coordinate indipendenti.
Definiamo numero di gradi di libertà del sistema il minimo numero di coordinate indipendenti in grado di individuare la configurazione. Secondo questa
definizione un sistema libero di N particelle in uno spazio tridimensionale ha 3N
gradi di libertà. In un sistema vincolato le coordinate non sono tra loro indipendenti. Se i vincoli sono olonomi e sono espressi mediante k equazioni del tipo (1.1),
allora il numero di coordinate indipendenti sarà n = 3N − k e quindi si avranno
n gradi di libertà. Possiamo pertanto introdurre n coordinate indipendenti che
tengano conto dei vincoli. Siano q1 , q2 , . . . , qn tali coordinate. Esse non hanno in
generale le dimensioni di una lunghezza e non possono essere raggruppate per
formare le tre componenti di un vettore.
Ad esempio, si consideri un pendolo nel piano. Il sistema avrebbe due gradi
di libertà se non fosse vincolato; dato che la distanza tra la particella e l’origine è
fissata uguale a l si ha invece un solo grado di libertà. Si può allora individuare lo
stato del sistema in ogni istante utilizzando una sola coordinata quale, ad esempio,
l’angolo θ.
È possibile esprimere i vettori posizione mediante le nuove coordinate tramite
le trasformazioni
r i = r i ( q1 , q2 , . . . , q n , t ) .
(i = 1, ...N)
Le coordinate qi , con i = 1, . . . n, sono dette coordinate lagrangiane o generalizzate
del sistema.
1.3
principio di d’alembert ed equazioni di lagrange
Definiamo spostamento virtuale infinitesimo di un sistema un cambiamento di configurazione relativo ad una variazione δri delle coordinate, compatibile con le
forze ed i vincoli a cui il sistema è sottoposto ad un dato istante t. Chiamiamo
tale spostamento virtuale per distinguerlo da uno spostamento reale dri in cui si
considera un intervallo dt nel quale variano forze e vincoli.
4
1.3 principio di d’alembert ed equazioni di lagrange
Consideriamo un sistema di N particelle. Supponiamo che il sistema sia in
equilibrio, cioè ogni particella del sistema è in equilibrio. Allora
Fi = 0,
(1.2a)
Fi · δri = 0,
(1.2b)
N
δL =
∑ Fi · δri = 0,
(1.2c)
i =1
( a)
con i = 1, . . . N, dove δL è il lavoro virtuale infinitesimo. Se poniamo Fi = Fi
+
Φi , dove
e Φi sono rispettivamente la forza attiva totale e la forza vincolare
agenti sulla i-esima particella, la (1.2c) diventa:
( a)
Fi
N
δL =
N
∑ Fi
· δri + ∑ Φi · δri = 0.
( a)
i =1
(1.3)
i =1
Assumeremo d’ora in avanti che il lavoro virtuale delle forze vincolari sia nullo, cioè ∑iN=1 Φi · δri = 0, e che i vincoli siano olonomi bilaterali e lisci. Allora
possiamo scrivere la (1.3) come
N
∑ Fi
( a)
· δri = 0,
(1.4)
i =1
che è il principio dei lavori virtuali.
Osserviamo che i δri , con i = 1, . . . N, non sono in generale linearmente indipen( a)
denti e quindi i Fi non sono automaticamente nulli.
Siano q1 , q2 , . . . , qn le coordinate lagrangiane del sistema scelte. Allora
r i = r i ( q1 , q2 , . . . q n , t ) ,
n
δri =
(1.5a)
∂ri
∑ ∂qk δqk ,
(1.5b)
k =1
con i = 1, ...N. Supponendo che il lavoro virtuale delle forze vincolari sia nullo si
ha
N
δL =
∑ Fi
( a)
N
· δri =
i =1
n
=
( a)
i =1
N
∑ ∑ Fi
k =1
∑ Fi
( a)
·
i =1
∂ri
∂qk
n
·
∂ri
∑ ∂qk δqk =
k =1
!
n
δqk =
∑ Qk
( a)
δqk ,
k =1
dove
( a)
Qk =
N
∑ Fi
( a)
i =1
·
∂ri
∂qk
(k = 1, ...n)
sono dette forze generalizzate (attive). Poiché le δqk sono indipendenti si ha
( a)
δL = 0 ⇒ Qk = 0.
(k = 1, ...n)
5
principio di d’alembert ed equazioni di lagrange
( a)
Si può dimostrare che Qk = 0 con k = 1, . . . n è condizione necessaria e sufficiente per l’equilibrio, in presenza di vincoli olonomi bilaterali lisci.
La relazione (1.4) è applicabile solo al caso statico. Se si vuole applicare il
principio dei lavori virtuali anche al caso di moto del sistema, bisogna partire dalle
dpi
i
N equazioni del moto dp
dt = Fi ⇔ Fi − dt = 0 per i = 1, ...N. Se continuiamo ad
assumere che le forze vincolari non compiono lavoro virtuale, la (1.4) diventa:
N
∑
i =1
( a)
Fi
dpi
−
dt
· δri = 0.
(1.6)
Osserviamo che le forze vincolari non compaiono esplicitamente.
Indichiamo d’ora in poi con Fi la forza attiva totale agente sull’i-esima particella.
Come nel caso statico occorre ottenere un’espressione che contenga solo gli spostamenti virtuali delle coordinate generalizzate (che sono indipendenti). Partiamo,
come nel caso statico, dalle trasformazioni
n
r i = r i ( q1 , . . . , q n , t )
δri =
∂ri
∑ ∂qk δqk
(i = 1, ...N)
k =1
vi =
n
dri
∂r
∂r
= ∑ i q˙k + i .
dt
∂qk
∂t
k =1
(1.7)
Come prima abbiamo
N
∑ Fi · δri =
i =1
n
∑ Qk δqk ,
k =1
∂ri
. Osserviamo che le qk non hanno necessariamente le didove Qk = ∑iN=1 Fi · ∂q
k
mensioni di una lunghezza, così come le Qk non hanno in generale le dimensioni
di una forza. Consideriamo ora
!
N
N
n
dpi
dvi ∂ri
∑ dt · δri = ∑ ∑ mi dt · ∂qk δqk =
i =1
k =1 i =1
( )
n
N
d
∂ri
d ∂ri
=∑ ∑
mi vi ·
− mi vi ·
δqk .
dt
∂qk
dt ∂qk
k =1 i =1
Osserviamo che
∂vi
∂r
= i.
∂q˙k
∂qk
(1.8)
Inoltre
d ∂ri
∂v
= i.
dt ∂qk
∂qk
6
(1.9)
1.3 principio di d’alembert ed equazioni di lagrange
In base a queste osservazioni possiamo scrivere:
( )
n
N
N
∂vi
∂vi
d
dpi
∑ dt · δri = ∑ ∑ dt mi vi · ∂q̇k − mi vi · ∂qk δqk =
i =1
k =1 i =1
( "
#
)
n
N d
∂ N 1
∂
1
=∑
∑ 2 mi v2i − ∂qk ∑ 2 mi v2i δqk =
dt
∂
q̇
k
i =1
i =1
k =1
n d
∂
∂T
=∑
T −
δqk ,
dt ∂q̇k
∂qk
k =1
dove T = ∑iN=1 12 mi v2i . Allora il principio di d’Alembert è nel nostro caso equivalente alla relazione
n ∂T
d
∂
∑ dt ∂q̇k T − ∂qk δqk = 0.
k =1
Dato che gli spostamenti virtuali infinitesimi δqk , con k = 1, . . . n, sono indipendenti, possiamo scrivere n equazioni del moto
∂T
d ∂T
−
= Qk .
(1.10)
dt ∂q̇k
∂qk
Se supponiamo che le forze attive siano tutte conservative e derivino da un’unico
potenziale U, si ha Fi = −∇i U e quindi
N
Qk =
∂ri
∑ Fi · ∂qk
i =1
N
= − ∑ ∇i U ·
i =1
∂U
∂ri
=−
.
∂qk
∂qk
Tenendo presente che U dipende solo da q e non da q̇ (cioè ∂∂U
q̇k = 0; k = 1, ...n), le
n equazioni del moto (1.10) possono essere scritte nel modo seguente:
d
∂
∂
(T − U ) −
( T − U ) = 0.
dt ∂q̇k
∂qk
Definendo
L = T−U
lagrangiana del sistema, possiamo scrivere le equazioni di Lagrange:
d
∂
∂L
L −
= 0.
dt ∂q̇k
∂qk
(1.11)
(1.12)
Osservazione: se consideriamo F = F (q, t) funzione di classe opportuna, si può
dimostrare che L0 (q, q̇, t) = L(q, q̇, t) + dF
dt è un’altra funzione lagrangiana che
porta alle stesse equazioni del moto.1
1 Si è qui utilizzata la notazione, che ricorrerà per brevità in seguito, q = (q1 , q2 , . . . qn ) per indicare
l’ennupla delle coordinate generalizzate; tuttavia bisogna tenere sempre presente che tale ennupla
non è, in generale, un vettore (basti pensare che, come già osservato, le qi possono avere anche
dimensioni diverse.)
7
principio di d’alembert ed equazioni di lagrange
Osservazione: le equazioni di Lagrange possono essere ancora scritte nella forma
usuale se U = U (q, q̇, t) e
d ∂U
∂U
+
.
(1.13)
Qk = −
∂qk
dt ∂q̇k
La funzione U è detta potenziale generalizzato, o potenziale dipendente anche
dalle velocità e dal tempo. La funzione lagrangiana può ancora essere definita
come L = T − U.
1.4
potenziali generalizzati e funzioni di dissipazione
1.4.1 Potenziali generalizzati
Consideriamo una particella puntiforme di massa m e carica q in un campo
elettromagnetico E, B. Su di essa agisce la forza di Lorentz:
v
F = q E+ ×B .
(1.14)
c
Le equazioni del moto sono perciò
m
v
d2 r
dv
= m 2 = q E+ ×B .
dt
dt
c
Siano ora ϕ e A i potenziali scalare e vettoriale rispettivamente in modo che
E = −∇ ϕ −
1 ∂A
,
c ∂t
B = ∇ × A.
Riscriviamo la forza di Lorentz mediante le precedenti:
1 ∂A v
F = q −∇ ϕ −
+ × (∇ × A) =
c ∂t
c
1 ∂A 1
1
= q −∇ ϕ −
+ ∇(A · v) − (v · ∇)A
c ∂t
c
c
(1.15)
(1.16)
(1.17)
dove si è tenuto conto del fatto che ∇ · v = 0 e quindi v × (∇ × A) = ∇(A ·
∂A
v) − (v · ∇)A. Osserviamo ora che dA
dt = ∂t + ( v · ∇) A; inoltre dato che A non
d∇ ( A · v )
v
dipende da v,
= dA
dt
dt ; infine ∇v ϕ = 0. Allora
1
1 dA
F = q −∇ ϕ − A · v −
=
c
c dt
1
d
1
= q −∇ ϕ − A · v +
∇v ϕ − A · v
=
c
dt
c
d∇ v U
= −∇U +
,
dt
q
dove U = qϕ − c A · v è un esempio di potenziale generalizzato, ovvero potenziale
dipendente dalle derivate rispetto al tempo delle coordinate generalizzate (che
8
1.4 potenziali generalizzati e funzioni di dissipazione
qui corrispondono con le solite coordinate cartesiane). La funzione lagrangiana è,
allora, la seguente:
L = T−U =
q
mv2
− qϕ + A · v.
2
c
Esercizi
1. Scrivere le equazioni di Lagrange di una carica puntiforme in un campo
elettromagnetico. Dimostrare che esse coincidono con le equazioni del moto
di partenza.
2. Scrivere la lagrangiana e le equazioni di Lagrange per i seguenti sistemi:
a) pendolo piano semplice;
b) pendolo piano doppio;
c) pendolo piano il cui punto di sospensione è libero di muoversi orizzontalmente su una retta liscia .
3. Due punti materiali, uno di massa m1 e l’altro di massa m2 , sono collegati
da una fune (inestensibile e di massa trascurabile) che passa attraverso un
foro in un tavolo perfettamente liscio, in modo che m1 , per t = 0, abbia un
moto circolare uniforme sulla superficie del tavolo ed m2 rimanga sospesa.
Nell’ipotesi che m2 possa muoversi solo in direzione verticale, si scriva la
lagrangiana e si ricavino le equazioni di Lagrange. Discutere la presenza di
integrali primi del moto .
Figura 1.:
Da sinistra: problema 2b, problema 2c, problema 3.
1.4.2 Equazioni di Lagrange in presenza di forze non derivabili da un potenziale
Supponiamo che su una particella puntiforme agisca anche la seguente forza
viscosa:
Fa = −(α x v x i + αy vy j + αz vz k)
9
principio di d’alembert ed equazioni di lagrange
dove i coefficienti α x , αy , αz sono caratteristici del mezzo2 e i, j, k sono i versori
degli assi coordinati. Osserviamo che, se introduciamo la cosiddetta funzione di
dissipazione di Rayleigh
F=
1
(α x v2x + αy v2y + αz v2z ),
2
abbiamo che Fa = −∇v F. Più in generale se il sistema è formato da N particelle,
la forza viscosa totale è data da:
N
Fa = −
∑ (αx vkx i + αy vky j + αz vkz k),
k =1
dove si intende vk = (vkx , vky , vkz ) è la velocità della k-esima particella.
funzione di dissipazione in questo caso è data da:
F=
La
1 N
(α x v2kx + αy v2ky + αz v2kz ).
2 k∑
=1
La forza viscosa agente sulla k-esima particella può ovviamente essere scritta
come Fa,k = −∇vk F. Se il sistema ha n gradi di libertà e q j con j = 1, . . . n sono le
coordinate generalizzate, le equazioni di Lagrange sono le seguenti:
∂L
d ∂L
−
= Qj
(1.18)
dt ∂q̇ j
∂q j
dove le Q j sono le forze generalizzate associate alle forze viscose e non derivabili
da un potenziale, e L è la lagrangiana, scritta tenendo conto di tutte le forze
conservative. Sappiamo che:
N
Qj =
∂r
∑ Fa,k · ∂qkj
k =1
N
= − ∑ ∇ vk F ·
∂rk
∂q j
= − ∑ ∇ vk F ·
∂vk
∂F
=− .
∂q̇ j
∂q̇ j
k =1
N
k =1
Allora in conclusione possiamo scrivere le equazioni di Lagrange (1.18) nel modo
seguente:
d ∂L
∂L
∂F
−
+
= 0.
dt ∂q̇ j
∂q j
∂q̇ j
Evidentemente siamo in grado di scrivere esplicitamente le equazioni del moto
conoscendo le due funzioni scalari L e F.
2 In realtà questi coefficienti dipendono oltre che dal mezzo anche dalla forma e dalle dimensioni del
corpo immerso nel fluido.
10
1.4 potenziali generalizzati e funzioni di dissipazione
1.4.3 Trasformazioni di gauge e lagrangiana di una particella immersa in un campo
elettromagnetico
Siano ϕ ed A i potenziali scalare e vettoriale nel campo elettromagnetico. Sappia2
q
mo che la lagrangiana assume la forma: L = mv2 − qϕ + c A · v. Il sistema ha tre
gradi di libertà. Operiamo le seguenti trasformazioni di gauge:
1 ∂χ(r, t)
;
c ∂t
A →A0 = A + ∇χ(r, t).
ϕ → ϕ0 = ϕ −
Il campo elettromagnetico è invariante per trasformazioni di gauge. Sia ora L0 =
q 0
mv2
0
2 − qϕ + c A · v la nuova lagrangiana. Allora:
mv2
q ∂χ q
q
− qϕ +
+ A · v + ∇χ · v
2
c ∂t
c
c
q ∂χ q
= L+
+ ∇χ · v
c ∂t
c
q dχ
= L+
.
c dt
L0 =
Concludendo, L0 ed L differiscono per la derivata totale rispetto al tempo di una
funzione scalare di r e di t. Le equazioni di Lagrange sono, di conseguenza,
invarianti per trasformazioni di gauge.
Problemi
1. Se L = L(q, q̇, t) è una lagrangiana per un sistema ad n gradi di libertà
dF (q,t)
che verifica le equazioni di Lagrange, dimostrare che L0 = L + dt , con
F funzione arbitraria di classe opportuna, verifica anch’essa le equazioni di
Lagrange.
Dimostrazione. Osserviamo che
j = 1, . . . n
dF (q,t)
dt
= ∑nk=1
∂F (q,t)
∂qk q̇k
+
∂F (q,t)
∂t .
Allora per
∂L0 (q, q̇, t)
∂L(q, q̇, t) ∂F (q, t)
=
+
∂q̇ j
∂q̇ j
∂q j
∂L0 (q, q̇, t)
∂L(q, q̇, t)
∂ dF (q, t)
=
+
∂q j
∂q j
∂q j
dt
11
principio di d’alembert ed equazioni di lagrange
Dunque abbiamo che, sempre per j = 1, . . . n e supponendo che
∂ dF (q,t)
∂q j
dt
=
d ∂F (q,t)
dt ∂q j ,
d
dt
d
dt
d
dt
∂L
∂q̇ j
∂L0
∂q̇ j
∂L0
∂q̇ j
−
∂L
=0⇔
∂q j
−
d ∂F (q, t) ∂L0
∂ dF (q, t)
−
+
=0⇔
dt ∂q j
∂q j
∂q j
dt
−
∂L0
= 0.
∂q j
2. Siano q1 , . . . qn un insieme di coordinate generalizzate indipendenti di un sistema ad n gradi di libertà con lagrangiana L(q, q̇, t), dove q = (q1 , . . . qn ) e
q̇ = (q̇1 , . . . q̇n ). Si supponga di passare ad un altro sistema di coordinate generalizzate indipendenti s1 , . . . sn per mezzo di una trasformazione puntuale
qk = qk (s, t) con k = 1, . . . n ed s = (s1 , . . . sn ). Dimostrare che la forma delle
equazioni di Lagrange è invariante rispetto alle trasformazioni puntuali.
Dimostrazione. Per j, k = 1, . . . n abbiamo
n
q̇ j =
∂q j
∑ ∂si ṡi +
i =1
∂q j
∂q̇ j
∂q j
⇒
=
∂t
∂ṡi
∂si
Ora, L = L(q(s, t), q̇(s, ṡ, t), t), dunque
∂L
=
∂sk
n
n
∂L ∂q j
∂L ∂q̇ j
+
∑ ∂q j ∂sk ∑ ∂q̇ j ∂sk
j =1
j =1
n
∂L ∂q̇ j
∂L ∂q j
=
∑ ∂q̇ j ∂ṡk ∑ ∂q̇ j ∂sk
j =1
j =1
n
n ∂L d ∂q j
d ∂L ∂q j
∑ dt ∂q̇ j ∂sk + ∑ ∂q̇ j dt ∂sk =
j =1
j =1
n n
d ∂L ∂q j
∂L ∂q̇ j
=∑
+∑
.
dt ∂q̇ j ∂sk j=1 ∂q̇ j ∂sk
j =1
∂L
d
∂L
In conclusione, per k = 1, . . . n, ricordando che dt
∂q̇ j − ∂q j = 0 per j =
1, . . . n,
d ∂L
∂L
−
=
dt ∂ṡk
∂sk
n n
n
n
d ∂L ∂q j
∂L ∂q̇ j
∂L ∂q j
∂L ∂q̇ j
=∑
+∑
−∑
−∑
=
dt ∂q̇ j ∂sk j=1 ∂q̇ j ∂sk j=1 ∂q j ∂sk j=1 ∂q̇ j ∂sk
j =1
n d ∂L
∂L ∂q j
=∑
−
= 0.
dt ∂q̇ j
∂q j ∂sk
j =1
∂L
=
∂ṡk
d ∂L
=
dt ∂ṡk
12
n
1.4 potenziali generalizzati e funzioni di dissipazione
3. Dimostrare che vale la seguente forma di Nielsen delle equazioni di Lagrange:
∂ Ṫ
∂T
−2
= Qj
∂q̇ j
∂q j
(j = 1, . . . n)
dove T = T (q, q̇, t) è l’energia cinetica, Ṫ ≡
generalizzata.
dT
dt
e Q j è la j-esima forza
Dimostrazione. Partiamo dalle equazioni di Lagrange (1.10), valide anche in
presenza di forze attive generalizzate non conservative. Osserviamo che:
dT (q, q̇, t)
=
dt
n
∑
j =1
∂ Ṫ
∂T
=
∂q̇k
∂qk
=
∂T
∂qk
=
∂T
∂qk
∂T
∂T
∂T
⇒
q̇ j +
q̈ j +
∂q j
∂q̇ j
∂t
n ∂ ∂T
∂2 T
∂ ∂T
+∑
=
q̇ j +
q̈ j +
∂
q̇
∂q
∂
q̇
∂
q̇
∂t
∂q̇ j
j
k
k j
j =1
n ∂ ∂T
∂T
∂
∂ ∂T
+∑
=
q̇ j +
q̈ j +
∂q
∂
q̇
∂
q̇
∂
q̇
∂t
∂q̇ j
j
j
k
k
j =1
d ∂T
+
.
dt ∂q̇k
Allora
∂T
∂ Ṫ
−2
= Qk ⇔
∂q̇k
∂qk
∂T
d ∂T
∂T
+
−2
= Qk ⇔
∂qk
dt ∂q̇k
∂qk
d ∂T
∂T
−
= Qk .
dt ∂q̇k
∂qk
13
P R I N C I P I O VA R I A Z I O N A L E D I H A M I LT O N E D E Q U A Z I O N I
DI LAGRANGE
2.1
principio di hamilton
Prenderemo ora in considerazione solo quei sistemi di N particelle puntiformi,
con vincoli olonomi lisci, per i quali tutte le forze attive sono derivabili da un
solo potenziale scalare generalizzato (questa richiesta è fatta solo per semplicità e
senza perdere in generalità), funzione cioè delle coordinate e delle velocità delle
particelle e del tempo. Questi sistemi sono detti monogenici. In particolare, se il
potenziale è funzione esplicita solo delle coordinate di posizione delle particelle
il sistema è detto conservativo. Vedremo fra poco, come sia possibile ottenere le
equazioni di Lagrange relative ad un sistema monogenico a partire da un principio integrale (il principio variazionale di Hamilton), il quale prende in considerazione l’intero moto del sistema tra due istanti t0 e t1 e le “piccole” variazioni di
questo moto rispetto a quello reale. Per fare questo avremo bisogno di elementi
di calcolo delle variazioni, che cercheremo di esporre nel modo più elementare
possibile, utilizzando soltanto le tecniche familiari del calcolo differenziale.
La configurazione del sistema (olonomo e monogenico), oggetto di studio, è
supposta descritta dai valori di n coordinate generalizzate q1 , q2 , . . . qn e corrisponde alla posizione di un punto q = (q1 , . . . , qn ) in uno spazio n-dimensionale che,
come sappiamo, è detto spazio delle configurazioni. Al variare del tempo il punto
q(t), che rappresenta il sistema, si muove nello spazio delle configurazioni descrivendo una curva che è, ovviamente, la traiettoria del moto del sistema. Come
abbiamo già accennato, il principio variazionale prende in considerazione solo
quelle traiettorie che costituiscono un insieme di traiettorie variate sincrone. In altre parole, si considerano tutti quei movimenti q = q(t) del sistema con t ∈ [t0 , t1 ],
intervallo base, tali che q(t0 ) = q(0) e q(t1 ) = q(1) . Chiameremo ammissibile un
movimento q(t) che gode di questa proprietà. Noi supporremo sempre, salvo
avviso contrario, che le funzioni siano di classe C ∞ .
In figura 2 sono riportate, in uno spazio delle configurazioni bidimensionale,
alcune traiettorie ammissibili, che partono dalla configurazione iniziale q(0) al
tempo t0 e arrivano alla configurazione finale q(1) al tempo t1 . Sappiamo che
è possibile introdurre per il nostro sistema (olonomo e monogenico) la funzione
lagrangiana
L = T − V,
(2.1)
dove T è l’energia cinetica del sistema e V è il potenziale generalizzato. Naturalmente si avrà
L = L (q, q̇, t)
(2.2)
15
2
principio variazionale di hamilton ed equazioni di lagrange
Figura 2.:
Alcune traiettorie ammissibili in uno spazio delle configurazioni bidimensionale
Consideriamo il funzionale azione
S [q(t)] =
Z t1
t0
L (q, q̇, t) dt,
(2.3)
dove q(t) è un moto ammissibile (cioè q(t0 ) = q(0) e q(t1 ) = q(1) ). Osserviamo
che S [q(t)] ha valori in R e non è una funzione di funzione (non è una funzione
del tempo), ma un integrale di linea che dipende dal moto q(t). Il valore che
S [q(t)] assume dipende ovviamente dal moto ammissibile q(t) scelto.
Introduciamo il principio variazionale di Hamilton:
Principio variazionale di Hamilton - Tra i moti ammissibili del sistema compresi
tra gli istanti t0 e t1 , il moto reale è quello che rende stazionaria l’azione.
Ricordiamo cosa si intende per punto stazionario di una funzione f : R → R
di classe opportuna. Si dice che x0 ∈ R è un punto stazionario di f se f 0 ( x0 ) = 0.
Un punto stazionario (o critico) di una funzione può allora essere un estremante
relativo (di massimo o di minimo) o di flesso orizzontale oppure né estremante
relativo né flesso orizzontale. Inoltre se x0 è un punto stazionario si ha
f ( x0 + e) − f ( x0 ) = f 0 ( x0 )e + O(e2 ) = O(e2 ).
In modo analogo diremo che l’azione è stazionaria lungo una certa traiettoria
se su di essa assume, a meno di infinitesimi di ordine superiore al primo, lo stesso
valore corrispondente a traiettorie che differiscono da quella considerata per uno
spostamento infinitesimo. Più precisamente se indichiamo con q(t) un moto ammissibile che rende stazionaria l’azione e con q(t, e) = q(t) + eh(t) una traiettoria
diversa, dipendente dal parametro e ∈ R (assumiamo |e| 1) e dalla funzione
vettoriale h(t) = (h1 (t), . . . , hn (t)) soggetta alla condizione h(t0 ) = h(t1 ) = 0 (infatti q(t, e) deve essere un moto ammissibile e pertanto q(t0 , e) = q(0) e q(t1 , e) =
q(1) ), abbiamo che
S [q(t, e)] − S [q(t)] = O(e2 ).
16
(2.4)
2.1 principio di hamilton
Vogliamo ora provare che una traiettoria ammissibile q(t) che rende stazionaria
l’azione soddisfa le equazioni di Lagrange
∂L(q, q̇, t)
d ∂L(q, q̇, t)
−
= 0.
(k = 1, . . . n)
dt
∂q̇k
∂qk
Abbiamo infatti:
S [q(t, e)] − S [q(t)] =
Z t1 h i
=
L q(t) + eh(t), q̇(t) + eḣ(t), t − L (q(t), q̇, t) dt =
(2.5)
t0
Z t1 n ∂L (q(t), q̇(t), t)
∂L (q(t), q̇(t), t)
=
hi ( t ) +
ḣi (t) edt + O(e2 ).
∑
∂q
∂
q̇
t0 i =1
i
i
Osserviamo che
•
∂L
∂q̇i ḣi ( t )
•
R t1
t0
d
dt
=
d
dt
∂L
∂q̇i hi ( t )
∂L
∂q̇i hi ( t )
dt =
−
h
i t1
∂L
h
(
t
)
∂q̇i i
t0
d ∂L
dt ∂q̇i
h i ( t );
= 0.
Allora la (2.5) può essere riscritta come
S [q(t, e)] − S [q(t)] =
n Z t1 ∂L (q(t), q̇(t), t)
d ∂L (q(t), q̇(t), t)
=∑
−
hi (t)edt + O(e2 ).
∂q
dt
∂
q̇
i
i
i =1 t0
(2.6)
Se imponiamo la condizione che l’azione sia stazionaria lungo q(t), valga cioè
la (2.4), e teniamo presente che hi (t), con i = 1, . . . n, sono funzioni di classe C ∞
arbitrarie, soggette soltanto alla condizione hi (t0 ) = hi (t1 ) = 0, abbiamo
Z t1 d ∂L (q(t), q̇(t), t)
∂L (q(t), q̇(t), t)
−
hi (t)dt = 0.
(i = 1, . . . n)
∂qi
dt
∂q̇i
t0
Vogliamo ora provare che queste equazioni implicano che
∂L (q(t), q̇(t), t)
d ∂L (q(t), q̇(t), t)
−
= 0,
∂qi
dt
∂q̇i
(i = 1, . . . n)
cioè sono soddisfatte le equazioni di Lagrange. Vale il seguente lemma:
Lemma fondamentale del calcolo variazionale - Se una funzione liscia f :
[t0 , t1 ] → R verifica la proprietà
Z t1
t0
f (t) g(t)dt = 0
(2.7)
per ogni funzione liscia g : [t0 , t1 ] → R, soggetta alla condizione g(t0 ) = g(t1 ) = 0,
allora f (t) = 0 ∀t ∈ [t0 , t1 ].
17
principio variazionale di hamilton ed equazioni di lagrange
Dimostrazione. Ragioniamo per assurdo e supponiamo che ∃t∗ ∈ (t0 , t1 ) in cui
f non si annulli. Senza perdere in generalità possiamo supporre f (t∗ ) > 0.
Per continuità ∃ I (t∗ ) ⊂ (t0 , t1 ), intorno di t∗ , in cui f è sempre positiva, avendo indicato con I (t∗ ) un intorno aperto di t∗ . Possiamo sempre prendere una
funzione liscia g, stante la sua arbitrarietà,
che sia positiva in I1 (t∗ ) ⊂ I (t∗ ) e
R t1
1
nulla altrove . Ne consegue che t0 f (t) g(t)dt > 0. Questo è assurdo. Allora
f ( t ) = 0 ∀ t ∈ ( t0 , t1 ) ⇒ f ( t ) = 0 ∀ t ∈ [ t0 , t1 ].
Se chiamiamo δqi (t) = ehi (t) la variazione dell’i-esima componente di q(t)
e con δS la corrispondente variazione dell’azione, relativa all’infinitesimo δq, la
relazione (2.6) può essere scritta nella forma:
n Z t1 ∂L
d ∂L
δS = ∑
−
δqi (t)dt.
∂qi
dt ∂q̇i
i =1 t0
Questo risultato ci dice, anche per il lemma precedente, che se l’azione è stazionaria lungo q(t), cioè se δS = 0, allora valgono le equazioni di Lagrange. In modo
sintetico possiamo scrivere:
∂L(q, q̇, t)
d ∂L(q, q̇, t)
δS = 0 ⇔
−
= 0.
(i = 1, . . . n)
∂qi
dt
∂q̇i
Abbiamo visto che le equazioni di Lagrange (o di Eulero-Lagrange) nelle ipotesi
fatte (sistemi, cioè, olonomi e monogenici) discendono da una legge generale, il
principio variazionale di Hamilton. Non possiamo stabilire, a priori, se il moto
reale q(t), che soddisfa le equazioni di Lagrange, ha la proprietà di minimizzare
l’azione, anche se il principio di Hamilton è spesso detto principio della minima
azione.
2.2
applicazioni del calcolo delle variazioni
Possiamo utilizzare il principio variazionale per studiare le proprietà di stazionarietà o estremali di funzionali diversi dall’azione.
Supponiamo in particolare di avere una famiglia di curve in uno spazio ndimensionale, ognuna descritta da una funzione vettoriale liscia y( x ) con x ∈
[ x0 , x1 ], tutte soggette alle condizioni y( x0 ) = y(0) e y( x1 ) = y(1) , e una funzione scalare liscia U = U (y( x ), ẏ( x ), x ). Vogliamo determinare y( x ) che rende
stazionario il funzionale
J [y( x )] =
Z x1
x0
u (y( x ), ẏ( x ), x ) dx.
Notiamo che possono esserci casi più complessi, in cui ad esempio U è funzione
anche di derivate di ordine superiore al primo di y( x ), oppure x ∈ Rm con m ≥ 2.
La trattazione del problema può anche essere portata avanti esattamente come nel
1 Osserviamo che la funzione g scelta si annulla, ovviamente, in t0 e t1 .
18
2.2 applicazioni del calcolo delle variazioni
caso dell’azione: si ricerca y( x ) che rende stazionario il funzionale J. Non sempre
è semplice stabilire poi se la funzione trovata abbia la proprietà di minimizzare
o di massimizzare J. Ricordiamo che condizione necessaria perché y( x ) sia un
minimo o un massimo locale per J è che esso sia un punto stazionario. Si arriverà
ovviamente a n equazioni scalari che continueremo a chiamare di Lagrange o di
Eulero-Lagrange:
∂u
∂u
d
−
= 0.
(k = 1, . . . n)
dx ∂ẏk
∂yk
2.2.1 Cammino più breve fra due punti in un piano
Siano dati A( x0 , y0 ) e B( x1 , y1 ) in un piano. Supponiamo che x0 < x1 . Se indichiamo2 una generica curva regolare3 con y = y( x ) di estremi A e B e con s l’ascissa
curvilinea, abbiamo che:
q
q
2
2
ds = (dx ) + (dy) = 1 + ẏ2 ( x )dx.
In questo caso allora
Z x1 q
1 + ẏ2 ( x )dx.
J [y( x )] =
x0
p
Ovviamente u = u(ẏ) = 1 + ẏ2 ( x ) e y( x ) è nel nostro caso una funzione scalare.
Adoperando le equazioni di Eulero-Lagrange:
d ∂u
∂u
−
= 0.
dx ∂ẏ
∂y
x0
Figura 3.:
Cammini ammessi tra due punti nel piano.
∂u
Essendo ∂u
∂y = 0, ∂ẏ = c (costante rispetto ad x). Di conseguenza ẏ ( x ) = a
(costante) e quindi y( x ) = ax + b, cioè la curva che minimizza il funzionale J è il
segmento di estremi A e B. Imponendo in particolare che y( x0 ) = y0 e y( x1 ) = y1
y −y
x y −x y
otteniamo a = x11 − x00 e a = 1 x10 − x00 1 . Si prova facilmente, in questo caso, che y( x ),
che rende stazionario J, minimizza il funzionale. In altre parole possiamo dire che
2 Se x0 = x1 possiamo considerare funzioni del tipo x = x (y).
3 In realtà possiamo sempre supporre che y sia liscia.
19
principio variazionale di hamilton ed equazioni di lagrange
la curva che nel piano xy conginge A e B ed ha lunghezza minima è il segmento
di estremi A e B.
e2
J [y( x ) + eh( x )] − J [y( x )] =
2
Nel nostro caso uẏẏ (ẏ( x )) = √
Z x1
x0
1
(1+ẏ2 ( x ))2
uẏẏ (ẏ( x ))ḣ2 ( x )dx + O(e3 ).
> 0. Perciò, per |e| 1, J [y( x ) + eh( x )] ≥
J [y( x )], cioè la funzione trovata minimizza il funzionale.
Esercizi
1. Verificare che il moto reale di una particella libera e isolata rende minima
l’azione.
2. Una particella è soggetta al potenziale U ( x ) = Fx, con F costante. La particella si muove dal punto x = 0 al punto x = a nell’intervallo di tempo
t0 . Si assuma che il moto della particella si possa esprimere nella forma
x (t) = A + Bt + Ct2 . Trovare i valori di A, B, C che rendono minima l’azione.
2.2.2 Il problema della brachistocrona
Il problema della brachistocrona può essere espresso nel modo seguente:
Dati due punti A e B in un piano verticale, con A ad altezza maggiore
di B, trovare tra tutti gli archi di curva che li congiungono, la traiettoria
che una particella puntiforme di massa m, con velocità iniziale nulla, deve
percorrere per andare da A a B in modo che il tempo di percorrenza sia il
minimo possibile.
Figura 4.:
Schema del problema della brachistocrona.
Per risolvere il problema poniamo l’origine degli assi in A ≡ (0, 0) e orientiamo
l’asse delle ordinate verso il basso. Supponiamo B ≡ ( x1 , y1 ) con x1 > 0 e y1 > 0
(se x1 = 0, cioè se B appartiene all’asse delle y il problema è banale: la soluzione
è data dal segmento AB). Le equazioni della traiettoria (passante per i punti
assegnati):
y = y( x )
y (0) = 0
y ( x1 ) = y1
20
(x ∈ [0, x1 ])
2.2 applicazioni del calcolo delle variazioni
Consideriamo la solita ascissa curvilinea s a partire da A:
q
q
ds = (dx )2 + (dy)2 = 1 + ẏ2 ( x )dx.
Supponiamo i vincolo olonomi e lisci. Fissiamo in y = 0 il livello 0 dell’energia
potenziale (relativa alla forza peso). Allora:
p
1 2
mv − mgy = 0 ⇒ v = 2gy,
2
dove g è l’accelerazione di gravità e v l’accelerazione in y (notare che y > 0, v > 0
se x ∈ [0, x1 ]).
s
ds
1 + ẏ2 ( x )
dt =
=
dx.
(x ∈ (0, x1 ])
v
2gy( x )
Poniamo u(y( x ), ẏ( x )) =
p
2g
Z T
0
q
1+ẏ2 ( x )
y( x )
dT ≡ J [u( x )] =
Z x1
0
u(y( x ), ẏ( x ))dx.
Fra tutte le traiettorie, passanti per A e B, quella che rende stazionario il funzionale J (condizione necessaria per il minimo) soddisfa le equazioni di Lagrange con
x ∈ (0, x1 ]:
∂u(y, ẏ)
d ∂u(y, ẏ)
−
= 0.
(2.8)
dx
∂ẏ
∂y
Ora,
∂u
∂ẏ
=
d
dx
√
y
√ẏ
1+ẏ2
∂u(y, ẏ)
∂ẏ
e dunque
=−
ÿ
ẏ2
p
+√ p
√
2y y 1 + ẏ2
y (1 + ẏ2 )3
p
1 + ẏ2
∂u
=−
√ .
∂y
2y y
(2.9)
(2.10)
L’equazione (2.8), per le relazioni (2.9) e (2.10), diventa, per x ∈ (0, x1 ]:
p
1 + ẏ2
ẏ2
ÿ
− √ p
+√ p
−
√ =0⇔
2y y
2y y 1 + ẏ2
y (1 + ẏ2 )3
ÿ( x )
1
1 d
1 d
+
=0⇔
ln (1 + ẏ( x )) +
ln y( x ) = 0
2
1 + ẏ ( x ) 2y( x )
2 dx
2 dx
s
y( x )
2
(1 + ẏ ( x ))y( x ) = c ⇔
ẏ( x ) = 1 ⇒
c − y( x )
Z
y( x )
dy =
c − y( x )
Z
dx.
(2.11)
21
principio variazionale di hamilton ed equazioni di lagrange
Posto y = 2c (1 − cos τ ) con τ parametro, dalla (2.11)
x=
c
(τ − sin τ ).
2
(Nota bene: x (0) = 0)
Concludendo, le equazioni parametriche della traiettoria sono date da:
c
(τ − sin τ )
2
c
(1 − cos τ )
2
x (τ ) =
y(τ ) =
con τ ∈ [0, τ1 ]. Le equazioni trovate sono quelle di una cicloide. Sostituendo i
valori delle coordinate di B si trovano dalle precedenti c e τ1 . Il sistema siffatto
ammette sempre soluzione. Rimane da provare (cosa non banale) che la soluzione
trovata minimizza il funzionale.
Possiamo tentare una soluzione del problema cambiando semplicemente punto
di vista e cercando un’espressione del tipo x = x (y). In tal caso
ds
=
v
dt =
q
Posto ϕ =
p
2g
s
1 + ẋ2
dy.
2gy
1+ ẋ2
y
Z T
0
dt = F [ x (y)] =
Z y1
0
ϕ( x (y), ẋ (y), y)dy.
Le equazioni di Lagrange sono
d
dy
Poiché
∂ϕ
∂x
∂ϕ
∂ ẋ
= 0,
−
∂ϕ
∂ ẋ
∂ϕ
= 0.
∂x
= costante, da cui
ẋ
√ √
y 1+ ẋ2
ẋ2
1+ ẋ2
=
y
√
a
⇒
= √1a ⇔
2
dy
dx
a−y
y
=1
da cui si prosegue come in precedenza. Osserviamo però che in questo caso
ϕ xx = ϕ x ẋ = 0 e che ϕ ẋ ẋ = √ 1 2 3 > 0. Allora, se x (y) rende stazionario il
y(1+ ẋ (y))
funzionale, abbiamo che
F [ x (y) + eh(y)] − F [ x (y)] =
e2
2
Z y1
0
ϕ ẋ ẋ ḣ2 (y)dy + O(e3 ) ≥ 0
ovvero F [ x (y) + eh(y)] ≥ F [ x (y)], cioè x (y) è un minimo.
22
2.3 leggi di conservazione
2.3
leggi di conservazione
2.3.1 Coordinate cicliche
Abbiamo visto che il moto di un sistema di particelle olonomo e monogenico con
n gradi di libertà è governato dalle equazioni di Lagrange
d ∂L (q, q̇, t) ∂L (q, q̇, t)
−
=0
dt
∂q̇
∂qk
(k = 1, . . . n)
dove L = T − U e qk sono le coordinate generalizzate. Apriamo una piccola parentesi. Introdotto un sistema di assi cartesiani solidale con un sistema di riferimento inerziale, nel caso di un punto materiale soggetto ad una forza conservativa
abbiamo:
L=
1
m ẋ2 + ẏ2 + ż2 − U ( x, y, z).
2
Si vede che
∂L
∂ ẋ
∂L
∂ẏ
∂L
∂ż
= m ẋ ≡ p x ,
= mẏ ≡ py ,
= mż ≡ pz ,
dove p x , py e pz sono le componenti rispettivamente lungo x, y e z della quantità
di moto. In analogia nel caso più generale possiamo chiamare
pk =
∂L (q, q̇, t)
∂q̇k
il momento canonico o momento coniugato alla coordinata generalizzata qk . Osser∂L
= 0, cioè se la lagrangiana non dipende esplicitamente da qk , si
viamo che se ∂q
k
ha
d ∂L
dpk
=
= 0.
dt ∂q˙k
dt
Allora pk è costante rispetto al tempo. Diamo allora la seguente definizione:
Definizione - Una coordinata generalizzata si dice ciclica o ignorabile se la lagrangiana L, pur essendo funzione esplicita di q̇k , non dipende esplicitamente da
qk .
Possiamo pertanto enunciare la seguente proprietà: il momento coniugato ad una
coordinata generalizzata ciclica si conserva.
In modo equivalente possiamo dire che il momento coniugato ad una coordinata
23
principio variazionale di hamilton ed equazioni di lagrange
ciclica è un integrale primo del moto, in quanto si traduce in una relazione del
tipo f (q1 , . . . , qn , q̇1 , . . . , q̇n , t) = costante. Se qk è una coordinata ciclica, allora L è
invariante rispetto ad una trasformazione qk → qk + α, con α costante. Ora, se qk ,
coordinata ciclica, è uno spostamento, si ha che una traslazione rigida lungo tale
direzione non ha effetto alcuno sul moto del sistema e il corrispondente momento
coniugato, che è una quantità di moto, si conserva. Se invece la coordinata ciclica
qk è un angolo il sistema è invariante per rotazioni intorno all’asse corrispondente
e il relativo momento coniugato, che è un momento angolare, si conserva.
Troviamo per esempio i momenti generalizzati nel caso di una particella in
moto in un campo elettromagnetico. Abbiamo visto che la lagrangiana di una
particella di massa m e carica4 q in un campo elettromagnetico è data da:
L=
1
q
m( ẋ2 + ẏ2 + ż2 ) − qϕ + A · v
2
c
dove v = ẋ x̂ + ẏŷ + żẑ è la velocità della particella, c è la velocità della luce nel
vuoto, ϕ, A sono il potenziale scalare e vettoriale rispettivamente. Il momento
coniugato a x è dato da
q
q
Px = m ẋ + A x = p x + A x
c
c
dove p x = m ẋ è la componente lungo x dell’usuale quantità di moto della particella. In maniera analoga i momenti coniugati ad y e z sono rispettivamente:
q
Py = py + Ay ,
c
q
Pz = pz + Az .
c
Possiamo scrivere allora in forma vettoriale il momento generalizzato come
q
P = p + A.
c
Ora, se per ipotesi ϕ, A non dipendono esplicitamente da x, cioè x è una variabile
ciclica, allora il momento coniugato rispetto ad x, cioè Px , è una costante del moto.
Esercizi
• Verificare l’esistenza di una coordinata ciclica nell’esercizio 2c di pagina 9.
Dare un’interpretazione fisica del corrispondente momento coniugato.
• Verificare l’esistenza di una coordinata ciclica nell’esercizio 3 di pagina 9.
Dare un’interpretazione fisica del corrispondente momento coniugato.
• Si scriva in coordinate cilindriche la lagrangiana di una particella di massa
m e carica q in un campo magnetico (costante) generato da un filo rettilineo
percorso da corrente stazionaria I. Esistono coordinate cicliche? (Piccolo
suggerimento: scrivere il potenziale vettore A imponendo che valga la gauge di
Coulomb, div A = 0.)
4 Qui con il simbolo q non indichiamo una coordinata generalizzata!
24
2.3 leggi di conservazione
2.3.2 Funzione energia
Sia L = L (q, q̇, t) la lagrangiana di un sistema con n gradi di libertà, dove q =
(q1 , . . . , qn ). Si ha che
n ∂L
∂L
∂L
dL
=∑
q˙k +
q¨k + .
dt
∂qk
∂q̇k
∂t
k =1
Poiché per k = 1, . . . n si ha, dalle equazioni di Lagrange,
n
dL
=∑
dt
k =1
d
⇔
dt
"
d ∂L
dt ∂q˙k
∂L
∂qk
=
d ∂L
dt ∂q̇k
allora:
n
∂L
∂L
∂L
∂L
d
q¨k +
q˙k +
q˙k +
=∑
⇔
∂q˙k
∂t
dt ∂q˙k
∂t
k =1
#
∂L
∂L
∑ ∂q˙k q˙k − L + ∂t = 0.
k =1
n
(2.12)
Chiamiamo funzione energia la quantità
n
h (q, q̇, t) =
∂L
∑ ∂q˙k q˙k − L.
k =1
Allora la relazione (2.12) si scrive anche:
dh
∂L
=− .
dt
∂t
Se L = L (q, q̇), cioè se ∂L
∂t = 0, h è una costante del moto. Sotto opportune
ipotesi h è proprio l’energia totale del sistema. Se l’energia cinetica è una funzione
omogenea di secondo grado delle q˙k , cioè T = ∑nk,j=1 Ai,k (q, t)q̇k q̇ j con Akj = A jk , e
se il potenziale V non dipende da q̇, allora ∂∂Lq̇i = 2 ∑nk=1 Aik q̇k e quindi ∑in=1 ∂∂Lq̇i q̇i =
2T. Allora
n
h=
∂L
∑ ∂q̇i q̇i − L = 2T − T + V = T + V
i =1
che è l’energia totale del sistema. Se la lagrangiana non dipende esplicitamente
dal tempo abbiamo allora che l’energia del sistema è una costante del moto.
25
3
APPLICAZIONI DELLE EQUAZIONI DI LAGRANGE
3.1
problema dei due corpi
Supponiamo di avere un sistema isolato di due particelle di massa m1 ed m2 ,
soggette alla mutua interazione di natura conservativa. Rispetto ad un osservatore
O inerziale indichiamo con r1 ed r2 i vettori posizione delle due particelle. Il
vettore posizione del centro di massa è:
R=
m1 r1 + m2 r2
,
m1 + m2
(3.1)
mentre il vettore posizione relativo è dato da
r = r2 − r1 .
(3.2)
Possiamo esprimere r1 ed r2 mediante i vettori appena introdotti:
m2
r,
m1 + m2
m1
r.
r2 = R +
m1 + m2
r1 = R −
(3.3)
Assumiamo che l’energia potenziale (relativa alla mutua interazione) abbia la
seguente proprietà:
U = U ( r ).
(3.4)
La forza agente sulla particella 2 è data da F2 = −∇r2 U (r) = −∇r U (r), mentre
la forza agente sulla particella 1 è F1 = −∇r1 U (r) = ∇r U (r). Abbiamo pertanto
F1 + F2 = 0 (forma debole del principio di azione e reazione). Notiamo che se
U = U (r ) allora F2 = − dU
dr r̂ = − F1 (forma forte del principio di azione e reazione).
La lagrangiana del sistema delle due particelle è
L=
1
1
m1 kṙ1 k2 + m2 kṙ2 k2 − U (r).
2
2
(3.5)
Sulla base delle relazioni (3.3), la (3.5) si può scrivere come
L=
m1 + m2 Ṙ2 + 1 m1 m2 kṙk2 − U (r)
2
2 m1 + m2
(3.6)
La quantità µ = mm1 1+mm2 2 è detta massa ridotta (si noti che µ1 = m11 + m12 e che se
m2 m1 , allora r1 ≈ R e µ ≈ m2 ).
Dall’espressione (3.6) si deduce che Ṙ = V è costante, essendo R ciclica. Il centro di massa perciò è in quiete o si muove di moto rettilineo uniforme. Possiamo
27
applicazioni delle equazioni di lagrange
prendere in ogni caso come sistema di riferimento proprio quello del centro di
massa, avendo dunque la lagrangiana nella forma:
L=
1
µ kṙk2 − U (r).
2
È interessante notare come il problema dei due corpi si riconduca al problema di
una particella di massa pari alla massa ridotta immersa in un campo esterno.
3.1.1 Movimento in un campo centrale
Si abbia una particella P di massa m (che possiamo riguardare anche come la
massa ridotta di due particelle puntiformi) in un campo esterno. Assumiamo che
tale campo sia conservativo e che l’energia potenziale (o potenziale) dipenda solo
dalla distanza della particella P da un punto O, fisso rispetto ad un sistema di
riferimento inerziale. Chiamiamo come al solito vettore posizione della particella
−→
r = OP e v = ṙ il vettore velocità. Abbiamo allora:
L=
1 2
mv − U (r ),
2
dove U (r ) è l’energia potenziale. La forza agente sulla particella è
F = −∇U (r ) = −
dU
r̂.
dr
Essa è centrale e il centro della forza è il punto O.
Notiamo che l’energia potenziale ha simmetria sferica, dunque ogni soluzione
delle equazioni del moto deve essere invariante per rotazioni attorno ad un asse
arbitrario passante per O. Il momento angolare della particella P rispetto ad O,
cioé l = mr × v = r × p (con p quantità di moto della particella), si conserva. Si
dimostra facilmente che il moto si svolge in un piano (piano dell’orbita) ortogonale alla direzione (costante) di l, sempre che l 6= 0. Se l = 0, r è parallelo a p e il
moto è unidimensionale.
Supponiamo che l = l0 6= 0 (l0 costante). Il sistema ha due gradi di libertà,
considerato che il moto avviene in un piano. Possiamo, pertanto, esprimere la
lagrangiana in coordinate polari:
L=
1
m(ṙ2 + r2 θ̇ 2 ) − U (r ).
2
Si vede subito che θ è ciclica e dunque il suo momento coniugato pθ =
è costante. Osserviamo che
pθ = mr2 θ̇ = l0
(3.7)
∂L
∂θ̇
= mr2 θ̇
(3.8)
l0
che è costante. Notiamo, per inciso, che 21 m
= 12 r2 θ̇ è la cosiddetta velocità areolare
ed è una costante del moto. Abbiamo così ottenuto, in modo semplice, la seconda
legge di Keplero:
28
3.1 problema dei due corpi
Il vettore posizione della particella (o di un pianeta considerato puntiforme) rispetto al centro dell’orbita (o centro della forza) spazza aree
uguali in intervalli di tempo uguali.
Osservazione. Questa legge è stata ottenuta semplicemente supponendo che la
forza agente sulle particelle sia centrale (senza assegnare la dipendenza esplicita
da r).
Utilizzando le equazioni di Lagrange
d
dt
∂L
∂ṙ
−
∂L
=0⇔
∂r
mr̈ − mr θ̇ 2 +
∂U (r )
= 0.
∂r
(3.9)
Per la (3.8) abbiamo
mr θ̇ 2 =
l02
.
mr3
Allora la (3.9) può essere riscritta nel modo seguente:
mr̈ −
l02
∂U (r )
+
= 0.
3
mr
∂r
Osserviamo che nel nostro caso la lagrangiana non dipende esplicitamente dal
tempo e che l’energia cinetica è una funzione omogenea di secondo grado rispetto
a ṙ e θ̇. Ne consegue che la funzione energia h è una costante del moto ed è proprio
l’energia totale della particella E. Possiamo, allora, osservare:
∂L
∂L
ṙ + θ̇ − L =
∂ṙ
∂θ̇
1
1 l02
1
= m(ṙ2 + r2 θ̇ 2 ) + U (r ) = mṙ2 +
+ U (r )
2
2
2 mr2
E=
(3.10)
dove abbiamo tenuto conto della (3.8).
Osservazione. Grazie alla conservazione del momento angolare, il moto è come
unidimensionale con un potenziale efficace
Ueff (r ) =
1 l02
+ U (r ).
2 mr2
(3.11)
Se r (0) =qr0 , supposto che nell’intervallo di tempo considerato r = r (t) è crescen2
te, dr
dt =
m ( E − Ueff (r )) e, quindi,
t=
dr 0
Z r (t)
r0
q
2
m (E
.
(3.12)
− Ueff (r 0 ))
29
applicazioni delle equazioni di lagrange
Si può ricavare anche l’anomalia θ in funzione di r. Infatti dalla (3.8) otteniamo:
dθ =
l0 1
dr
l0 1
q
dt =
2
2
mr
mr
2
m ( E − Ueff (r ))
(abbiamo qui considerato un intervallo di tempo in cui r = r (t) è crescente) e, di
conseguenza,
θ (r ) − θ (r0 ) =
l0
m
dr 0
Z r (t)
1
r
r0
q
02
2
m (E
.
− Ueff
(r 0 ))
Se il dominio di variazione di r ha due limiti, rmin ed rmax , il movimento è limitato
e tutta l’orbita è contenuta nella corona circolare centrata in O, con raggio interno
rmin e raggio esterno rmax . Questo discorso non vuol dire affatto che l’orbita, nel
caso di moto limitato, è chiusa. Perché ciò accada, è necessario e sufficiente che
∆θ =
2l0
m
dr 0
Z rmax
1
rmin
r
q
02
2
m (E
− Ueff (r 0 ))
= 2π
j
n
(3.13)
con j, n ∈ N. Ricordiamo, per inciso, che l’anomalia θ è definita sempre a meno
di multipli di 2π. Ora, se indichiamo con
T0 = 2
dr 0
Z rmax
rmin
q
2
m (E
(3.14)
− Ueff (r 0 ))
il periodo della funzione r = r (t) (stiamo supponendo che il moto sia limitato e
che r ∈ [rmin , rmax ]), dopo un tempo pari a nT0 , si avrà una variazione di θ pari
a 2πj (multiplo di 2π) e, pertanto, il vettore posizione ritornerà ad essere quello
iniziale, cioé r(nT0 ) = r(0).
In generale, per un potenziale generico U (r ), supponendo l’esistenza di moti
limitati, la traiettoria non è un’orbita chiusa.
Teorema [Bertrand] - Le uniche forze centrali che danno luogo ad orbite chiuse per
ogni condizione iniziale corrispondente a moti limitati sono:
• quella proporzionale all’inverso del quadrato di r (come la forza gravitazionale);
• quella corrispondente alla legge di Hooke (dipendenza lineare da r).
Supponiamo ora che F = − rk2 r̂ o, in modo equivalente, U (r ) = kr , con k > 0. Per
il teorema di Bertrand, le orbite relative a moti limitati sono chiuse. Il potenziale
efficace, in questo caso, è:
Ueff =
1 l02
k
− .
2 mr2
r
Per r = r0 =
l02
mk ,
di Ueff possiamo ricavare le seguenti informazioni:
30
2
Ueff ha il valore minimo, esattamente pari a − 12 mk
. Dal grafico
l2
0
3.2 piccole oscillazioni
Figura 5.:
Andamento del potenziale efficace nel problema dei due corpi.
2
• E = E0 = − 21 mk
, ṙ (t) = 0 ⇒ r (t) = r0 costante. In questo caso l’orbita della
l2
0
particella è circolare. Il moto è circolare uniforme con frequenza ω =
l0
mr02
(questa espressione discende in modo immediato dalla (3.8)).
2
• Se E = E1 ∈ − 12 mk
,
0
, il moto è limitato con r ∈ [rmin , rmax ]. Si può
2
l
0
dimostrare che la traiettoria è un’ellisse.
• Se E = E2 ≥ 0, r (t) è inferiormente limitato e superiormente non limitato.
Si può dimostrare che la traiettoria è per E2 = 0 una parabola e per E2 > 0
un’iperbole.
Un’altra costante del moto è il vettore di Laplace-Runge-Lenz dato da:
A = p × L − mkr̂.
3.2
piccole oscillazioni
3.2.1 Impostazione del problema
Supponiamo di avere un sistema di N particelle con vincoli olonomi e scleronomi
con n gradi di libertà, soggette a forze conservative. Indichiamo con q1 , q2 . . . qn le
coordinate generalizzate e con V = V (q1 , . . . qn ) l’energia potenziale. Il sistema si
dice in equilibrio nella configurazione q0 = (q01 , . . . , q0n ) se le forze generalizzate
che agiscono su di esso sono nulle, ossia:
∂V (q) Qj = −
= 0.
(∀ j)
∂q j q=q
0
L’energia potenziale nella configurazione di equilibrio q0 ha un valore estremale
o in generale stazionario. Se tutte le velocità generalizzate nella configurazione
di equilibrio sono nulle, il sistema rimarrà nella posizione di equilibrio per un
31
applicazioni delle equazioni di lagrange
tempo indefinito. Una configurazione di equilibrio si dice stabile se una piccola
perturbazione del sistema provoca un moto che raggiunge configurazioni vicine;
al contrario si dirà instabile se una perturbazione infinitesima provoca un allontanamento indefinito da tale configurazione.
Noi intendiamo studiare il moto del sistema nelle immediate vicinanze di una configurazione di equilibrio stabile, dove l’energia potenziale ha un minimo. Indichiamo con ηi gli spostamenti delle coordinate generalizzate dall’equilibrio; ovvero
∀i:
qi = q0i + ηi .
Consideriamo lo sviluppo dell’energia potenziale1 attorno alla configurazione di
equilibrio stabile q0 :
n
V (q1 , . . . qn ) = V (q01 , . . . q0n ) + ∑
j =1
Poiché per ipotesi
∂V (q) ∂q j q=q
∂V 1
ηj +
∂q j q=q
2
0
n
∑
j,k =1
∂2 V η j ηk + . . .
∂q j ∂qk q=q
0
= 0 ∀ j e V (q01 , . . . q0n ) è una costante che può
0
essere posta uguale a zero senza perdere in generalità2 , abbiamo in definitiva,
fermandoci al termine quadratico dello sviluppo:
1
V ( q1 , . . . q n ) =
2
n
∑
j,k =1
∂2 V 1
η j ηk =
∂q j ∂qk q=q
2
0
n
∑
V jk η j ηk .
(3.15)
j,k =1
La matrice V = (V jk ) è una matrice simmetrica e reale. La condizione che q0
sia una configurazione di minimo implica che ∀η = (η1 , . . . ηn ) ∈ Rn si abbia
ηT Vη = ∑nj,k=1 V jk η j ηk ≥ 0, ovvero V è semidefinita positiva.
Anche l’energia cinetica può essere sviluppata in modo simile. Mostriamo prima che in presenza di vincoli olonomi e scleronomi l’energia cinetica è una forma
quadratica omogenea delle velocità generalizzate. Infatti, detta mk la massa della
k-esima particella e vk la sua velocità3 :
!
n n
1 N
1 N
1 N
∂rk ∂rk
2
T = ∑ mk vk = ∑ mk vk · vk = ∑ mk ∑ ∑
q̇i q̇ j
2 k =1
2 k =1
2 k =1
∂qi ∂q j
i =1 j =1
dove si è ricordato che vk = ∑nj=1
1 n n
T= ∑∑
2 i =1 j =1
N
∂r ∂r
∑ mk ∂qki ∂qkj
k =1
∂rk
∂q j q̇ j
⇒ v2k = ∑in=1 ∑nj=1
∂rk ∂rk
∂qi ∂q j q̇i q̇ j .
Ne consegue:
!
q̇i q̇ j
che è quanto era nostra intenzione dimostrare.
1 Supponiamo sempre le funzioni che trattiamo di grado opportuno.
2 Ricordiamo infatti che l’energia potenziale è definita a meno di una costante additiva.
3 Indichiamo con rk il vettore posizione della k-esima particella rispetto ad un punto O solidale con
un sistema di riferimento inerziale
32
3.2 piccole oscillazioni
Considerando ora spostamenti ηi rispetto alla configurazione di equilibrio e
fermandoci al primo termine (quadratico) nelle η̇i , abbiamo:
1 n
T= ∑
2 i,j=1
"
N
∑ mk
k =1
#
1 n
∂rk ∂rk η̇
η̇
=
Tij η̇i η̇ j .
i
j
∂qi ∂q j q=q
2 i,j∑
=1
(3.16)
0
La matrice (costante) T = (Tij ) è simmetrica, reale ed è definita positiva in senso
stretto. Pertanto i suoi autovalori sono reali e strettamente positivi e quindi T è
senz’altro diagonalizzabile.
La lagrangiana del sistema nelle approssimazioni fatte può scriversi:
L=
1 n
1 n
T
η̇
η̇
−
Vkj ηk η j .
j
kj
k
2 k,j∑
2 k,j∑
=1
=1
(3.17)
Si vede che le ηi assumono de facto il ruolo di nuove coordinate generalizzate. La
k-esima equazione di Lagrange assume la forma:
1
2
n
1
n
∑ Tkj η̈j − 2 ∑ Vkj ηj = 0.
j =1
(3.18)
j =1
Posto η(t) = (η1 (t), . . . , ηn (t)), l’insieme delle equazioni può essere sintetizzato
nella scrittura
Tη̈(t) + Vη(t) = 0.
(3.19)
Le equazioni (3.18) (o l’equazione matriciale (3.19)) sono equazioni differenziali
del secondo ordine lineari a coefficienti costanti omogenee. Vedremo, ora, come
sia possibile scrivere un sistema di n equazioni differenziali del secondo ordine
lineari disaccoppiate perfettamente equivalente al sistema trovato.
Cerchiamo soluzioni delle (3.19) del tipo:
η = aeiωt
(3.20)
con ω ∈ R e a ∈ Rn − {0} costante4 . Richiedendo che la (3.20) sia soluzione della
(3.19) otteniamo:
(−ω 2 T + V)aeiωt = 0 ⇔ (V − ω 2 T)a = 0
(3.21)
dove ω 2 = λ ha il significato di autovalore e a di autovettore corrispondente.
Non si tratta però di un classico problema agli autovalori: infatti si tratta qui
di determinare gli autovalori della matrice V rispetto alla matrice T5 . Sarà importante far vedere che tutti i nostri autovalori sono maggiori o uguali a zero,
4 Una soluzione fisicamente accettabile deve essere reale; naturalmente è la parte reale della (3.20)
che descrive il sistema.
5 Avremmo ancora il classico problema agli autovalori se T fosse proporzionale alla matrice identità
In .
33
applicazioni delle equazioni di lagrange
perché altrimenti ω non sarebbe reale6 . Gli autovalori di V rispetto a T sono dati
dall’equazione:
det(V − λT) = 0.
Ora, come detto T è diagonalizzabile, ovvero detta M = Diag(µ1 , . . . µn ), dove
∀k = 1, . . . n, µk > 0 sono gli autovalori di T non tutti necessariamente distinti,
esiste una trasformazione di similitudine U matrice ortogonale a valori reali, tale
che:
T = U T MU.
(3.22)
Ovviamente se T è già diagonale, allora T = M e U = In . Definiamo inoltre
√
√
M1 = Diag( µ1 , . . . µn ). Si vede immediatamente che M1 è simmetrica a valori
reali positivi e che M = M21 . La (3.22) può essere riscritta:
T = U T M1 M1 U = (M1 U)T M1 U.
(3.23)
Sia Ṽ la matrice simmetrica a valori reali definita positiva non in senso stretto,
che soddisfa la seguente relazione:
V = (M1 U)T ṼM1 U.
(3.24)
Pertanto Ṽ e V sono legate da una trasformazione di congruenza. In base alle
(3.23) e alle (3.24), l’equazione del determinante
det[(M1 U)T ṼM1 U − λ(M1 U)T M1 U] = 0
m
T
det[(M1 U) ] det[Ṽ − λI] det[M1 U] = 0
m
det[Ṽ − λI] = 0
ovvero trovare gli autovalori di V rispetto a T vuol dire trovare gli autovalori
(nel senso usuale) di Ṽ. I suoi autovalori saranno necessariamente, in virtù delle
proprietà già citate, maggiori o uguali a zero.
Ritorniamo ora all’equazione di Lagrange (3.19), che può essere riscritta per le
(3.23) e (3.24):
(M1 U)T M1 Uη̈(t) + (M1 U)T ṼM1 Uη(t) = 0
m
(M1 U)T [M1 Uη̈(t) + ṼM1 Uη(t)] = 0
m
M1 Uη̈(t) + ṼM1 Uη(t) = 0
Se poniamo M1 Uη(t) = Ψ(t), otteniamo (ricordando che M1 U è una matrice
costante)
Ψ̈(t) + ṼΨ(t) = 0.
(3.25)
6 Se ciò avvenisse avremmo un moto con andamento esponenziale (crescente o decrescente) con
conseguente allontanamento dalla posizione di equilibrio.
34
3.2 piccole oscillazioni
Sia Λ = Diag(λ1 , . . . λn ) matrice diagonale degli autovalori di Ṽ non tutti necessariamente distinti ma tutti maggiori o uguali a zero. Esiste (essendo Ṽ diagonalizzabile) una matrice ortogonale S tale che
Ṽ = S T ΛS.
L’equazione (3.25) diventa perciò:
Ψ̈(t) + S T ΛSΨ(t) = 0 ⇔ SΨ̈(t) + ΛSΨ(t) = 0.
Posto Q(t) = SΨ(t) abbiamo in definitiva
Q̈(t) + ΛQ(t) = 0
(3.26)
ovvero ∀k, ricordando che λk = ωk2 :
Q̈k (t) + ωk2 Qk (t) = 0
(3.27)
cioè n oscillatori armonici disaccoppiati; ciascuno di essi vibra con una propria
frequenza (modo normale). Le Qk vengono dette coordinate normali o principali.
Osserviamo che le ωk2 non sono tutte necessariamente distinte.
3.2.2 Riepilogo
Q(t) = SΨ(t) = (SM1 U)η(t).
Osserviamo che se T = αIn , con α > 0, allora M1 =
√
αSη(t).
Se sono noti η (0), η̇ (0), stato iniziale, si ha:
√
(3.28)
αIn , U = In e Q(t) =
Q(0) =(SM1 U)η(0),
Q̇(0) =(SM1 U)η̇(0).
Possiamo allora risolvere il sistema (3.26) con queste condizioni iniziali. Determinato Q = Q(t), abbiamo poi:
η(t) = SΨ(t) = (SM1 U)−1 Q(t).
3.2.3 Osservazioni
Abbiamo ottenuto, in concreto, nelle pagine precedenti il seguente risultato, noto
in algebra lineare:
Siano date due matrici n × n simmetriche a valori reali, la prima T definita positiva e la seconda V semidefinita positiva. Allora esiste una matrice
invertibile a valori reali C tale che
C T TC = I
(3.29)
C T VC = Diag(λ1 , . . . λn ) = Λ
(3.30)
dove i λ j ≥ 0 sono le radici dell’equazione caratteristica det(V − λT) = 0.
35
applicazioni delle equazioni di lagrange
Possiamo ovviamente scrivere λ j = ω 2j , con ω j ≥ 0. è facile far vedere, usando
le notazioni precedenti, che C−1 = SM1 U. In base alle relazioni (3.29) e (3.30) si
ottengono in modo agevolo ed immediato i modi normali di vibrazione. Infatti:
Tη̈(t) + Vη(t) = 0
m
C T Tη̈(t) + C T Vη(t) = 0
m
C T TCC−1 η̈(t) + C T VCC−1 η(t) = 0
m
C−1 η̈(t) + ΛC−1 η(t) = 0
m (Q = C−1 η)
Q̈(t) + ΛQ(t) = 0
3.2.4 Un particolare problema
Figura 6.:
Schema del problema.
Siano dati N + 1 oscillatori di costante k vincolati agli estremi come in figura.
Siano gli N oggetti ad essi vincolati di massa m. La lunghezza a riposo di ciascuna
molla sia l0 cosicché la distanza tra le pareti sia ( N + 1)l0 . Se indichiamo con q j
la deviazione dalla posizione di equilibrio della j-esima particella. Allora, posto
q0 = q N +1 = 0, abbiamo che
U=
k
2
N +1
∑
( q j − q j −1 )2 .
j =1
Con la convenzione assunta, l’equazione del moto della j-esima particella è:
mq¨j + k (2q j − q j−1 − q j+1 ) = 0.
D’ora in poi poniamo per semplicità nella trattazione m = 1 e k = 1. Indichiamo
ora:




2 −1 0
0 ... 0
0
q1
 −1 2 −1 0 . . . 0
0 


 q2 



q=
V
=
0
−
1
2
−
1
.
.
.
0
0
.

 ... 


 ... ... ... ... ... ... ... 
qN
0
0
0
0 . . . −1 2
36
3.2 piccole oscillazioni
La matrice V è simmetrica definita positiva. Infatti sia assegnato un vettore x di
dimensioni opportune,
x T Vx =
N −1
∑ vij xi x j = x12 + ∑ (xi − xi+1 )2 + x2N ≥ 0.
i =1
i,j
La quantità sopra è nulla solo se x è il vettore nullo. Le equazioni del moto
possono sintetizzarsi nella relazione:
q̈ + Vq = 0.
Per risolvere il nostro problema occorre trovare gli autovalori della matrice V.
Essendo la matrice simmetrica definita positiva gli autovalori saranno tutti reali e
positivi. Dalla relazione (Vx)i = λxi , moltiplicando per xi e sommando su i:
N
N
N
N −1
N
i =1
j =1
i =1
i =1
i =1
∑ xi ∑ vij x j = xT Vx = λ ∑ xi2 ⇔ x12 + ∑ (xi − xi+1 )2 + x2N = λ ∑ xi2 .
Perciò si ha:
N
N −1
N −1
i =1
i =1
i =2
λ ∑ xi2 ≤ x12 + 2
∑ (xi2 + xi2+1 ) + x2N = 3x12 + 4 ∑
N
xi2 + 3x2N ≤ 4 ∑ xi2 ,
i =1
dove si è tenuto conto dell’ovvia relazione ( xi − xi+1 )2 = xi2 + xi2+1 − 2xi xi+1 ≥
0 ⇒ xi2 + xi2+1 ≥ 2xi xi+1 . Perciò abbiamo che λ ≤ 4.7
Per trovare gli autovalori procediamo nel modo solito.
Indichiamo
con D N (λ) =
2 − λ −1 = (2 − λ)2 − 1.
det(V − λI N ). Osserviamo che D1 = 2 − λ, D2 = −1 2 − λ In generale, vista la struttura della matrice si vede che D N (λ) = (2 − λ) D N −1 (λ) −
D N −2 (λ). Cerchiamo soluzioni del tipo D N (λ) = µ N . L’equazione dopo le
opportune semplificazioni diventa:
µ2 − (2 − λ ) µ + 1 = 0 ⇒
p
2 − λ ± (2 − λ ) − 4
= cos θ ± i sin θ = e±iθ
µ=
2
dove si è effettuata l’opportuna sostituzione 2 cos θ = 2 − λ (in virtù del fatto che
λ ∈]0, 4[) e si è tenuto conto delle relazioni di Eulero. Ora occorre trovare a ∈ C
tale che D N (λ) = a(λ)eiNθ + ā(λ)e−iNθ . Per questo imponiamo come ”condizioni
iniziali” i due determinanti già noti:
D2 (λ) = ae2iθ + āe−2iθ = (2 − λ)2 − 1 = 4 cos2 θ − 1 = e2iθ + e−2iθ + 1
D1 (λ) = aeiθ + āe−iθ = 2 − λ = 2 cos θ = eiθ + e−iθ
7 In verità la disuguaglianza è stretta se x non è il vettore nullo. Se x1 6= 0 o x N 6= 0, allora il
fatto che la disuguaglianza sia stretta è palese nell’ultimo passaggio. Se invece x1 = x N = 0 l
segno di disuguaglianza stretta si sarebbe potuto introdurre addirittura già al primo passaggio.
Infatti per ∑iN=−1 1 ( xi − xi+1 )2 = ∑iN=−1 1 xi2 + ∑iN=−1 1 xi2+1 − 2 ∑iN=−1 1 xi xi+1 ≤ 2 ∑iN=−1 1 ( xi2 + xi2+1 ) ⇔
∑iN=−1 1 xi2 + ∑iN=−1 1 xi2+1 ) + 2 ∑iN=−1 1 xi xi+1 ≥ 0 ⇔ ∑iN=−1 1 ( xi + xi+1 )2 ≥ 0 in cui l’uguaglianza vale
solo se ogni addendo è nullo, ovvero xi = − xi+1 , i = 1, . . . N − 1. Dall’ipotesi x1 = x N = 0 segue
che necessariamente tutti i termini devono essere nulli.
37
applicazioni delle equazioni di lagrange
( a − 1)e2iθ + ( ā − 1)e2iθ = 1
⇔
( a − 1)eiθ + ( ā − 1)e−iθ = 0
be2iθ + b̄e2iθ = 1
beiθ + b̄e−iθ = 0
ove si è posto b = a − 1. Risolvendo il sistema si ha b(λ) =
eiθ
, ā
eiθ −e−iθ
=
−iθ
− eiθe−e−iθ .
D N (λ) =
e−iθ
eiθ −e−iθ
⇒ a =
Perciò:
2i sin [( N + 1)θ ]
sin [( N + 1)θ ]
ei ( N + 1 ) θ − e − i ( N + 1 ) θ
=
=
iθ
−
iθ
2i sin θ
sin θ
e −e
Poiché siamo alla ricerca degli zeri della funzione, occorre che sia ( N + 1)θ = mπ,
con m ∈ {1, . . . N }. Ricordando la relazione che lega θ a λ, è necessario che
mπ
λm = 4 sin2 2( N
.
+1)
Sia ora Λ = (δij λi )i,j=1,...N . Cerchiamo la matrice S tale che V = S T ΛS. è
noto che per costruire la matrice S occorre disporre degli autovettori. Perciò in
generale da (V − λI)x = 0, ponendo come al solito 2 − λ = 2 cos θ e x1 = γ sin θ


(
2
−
λ
)
x
−
x
=
0
2
1



 x1 = γ sin θ


− x1 + (2 − λ ) x2 − x3 = 0
x2 = 2γ sin θ cos θ = γ sin 2θ
⇒
.


.
.
.
.
..




− x N −1 + (2 − λ ) x N = 0
x N = γ sin Nθ
Possiamo perciò scrivere:


sin Nπ+1


 sin N2π
+1 
x = γ

...


sin NNπ
+1
dove γ è una costante da scegliere opportunamente. Ad esempio, volendo normalizzare l’autovettore:
||x||2 = γ
N
∑
n =1
sin2 nθ = γ
N
1 − cos nθ
= 1.
2
n =1
∑
Ricordando le solite identità di Eulero:
N
1 − cos nθ
N
1 N
N
1 N 2iθ n
2inθ
=
+
1
−
<
e
=
+
1
−
<
e
.
∑
2
2
2 n∑
2
2 n∑
n =1
=1
=1
2i ( N +1)θ −1
L’ultima quantità è pari a N2 + 1 − 21 < e
k-esimo autovettore è


π
sin
N +1
r

2 
 sin N2π
(k)
+1 
x =

.
...
N+1 

sin NNπ
+1
e2iθ −1
=
N
2
+1−
1
2
=
N +1
2 .
Perciò il
La matrice S è così determinata. Ricordando poi che Qm = ∑nN=1 Smn qn è possibile
individuare mediante queste trasformazioni come stimolare il sistema (ovvero
come agire sulle qn ) per ottenere il moto normale associato alla coordinata Qm .
38
4
F O R M A L I S M O H A M I LT O N I A N O
4.1
equazioni di hamilton
Vedremo ora una formulazione diversa della meccanica, nota come formulazione
hamiltoniana. La sua rilevanza risiede nel fatto che è in grado di fornire un’impostazione teorica adatta ad essere estesa ad altre aree della fisica. Così, ad esempio
l’approccio hamiltoniano costituisce il linguaggio con cui è formulata la meccanica
quantistica.
Nella formulazione hamiltoniana della meccanica si descrive il modo di un sistema di particelle con un insieme di equazioni differenziali del primo ordine
(ricordiamo che le equazioni di Lagrange, tipiche della formulazione lagrangiana,
sono equazioni differenziali del secondo ordine). Il numero complessivo di condizioni iniziali in grado di determinare in modo univoco il moto dovrà sempre
essere uguale a 2n, dove n è il numero di gradi di libertà del sistema di particelle. Di conseguenza nell’approccio hamiltoniano dovranno esserci 2n equazioni
differenziali del primo ordine, le quali descriveranno l’evoluzione del punto rappresentativo del sistema in uno spazio 2n-dimensionale, detto spazio delle fasi.
Avremo allora 2n coordinate indipendenti in grado di definire lo stato del sistema. Un modo naturale, anche se non unico, per introdurle è, nota la lagrangiana
del sistema, associare ad ogni coordinata generalizzata qk , con k = 1, . . . n, un’altra
coordinata data dal momento coniugato ad essa, cioè pk = ∂∂L
q̇k . Le variabili ( q, p )
sono dette canoniche. Si passa, in ultima analisi, dal sistema di variabili (q, q̇, t),
proprio della formulazione lagrangiana, al sistema di nuove variabili (q, p, t), con
il quale possiamo formulare la meccanica hamiltoniana. Il metodo che ci permette di passare da un sistema all’altro è fornito dalle trasformazioni di Legendre.
Studieremo prima un caso semplice, cioè un sistema ad un solo grado di libertà.
Sia L = L (q, q̇, t) la lagrangiana del sistema. Abbiamo:
dL =
∂L
∂L
∂L
∂L
dq + dq̇ + dt = ṗdq + pdq̇ + dt
∂q
∂q̇
∂t
∂t
dove abbiamo utilizzato la definizione di momento coniugato p =
∂L
∂q
(4.1)
∂L
∂q̇
e l’equazio-
d ∂L
dt ∂q̇
ne di Lagrange
=
= ṗ. L’hamiltoniana del sistema H(q, p, t) è definita
mediante la seguente trasformazione detta di Legendre:
H(q, p, t) = q̇p − L(q, q̇, t).
(4.2)
Notiamo che l’hamiltoniana risulta in realtà funzione di (q, p, t) solo dopo aver
∂L(q,q̇,t)
espresso q̇ in funzione di (q, p, t) utilizzando la relazione p =
. Valgono le
q̇
seguenti relazioni:
dH =
∂H
∂H
∂H
dq +
dp +
dt
∂q
∂p
∂t
(4.3)
39
formalismo hamiltoniano
Inoltre, per le (4.1) e (4.2), si ha
dH = q̇dp + pdq̇ − ṗdq − pdq̇ −
∂L
∂L
dt = q̇dp − ṗdq − dt
∂t
∂t
(4.4)
Dal confronto tra la (4.3) e la (4.4) emerge che
∂H(q, p, t)
= q̇
∂p
∂H(q, p, t)
= − ṗ
∂q
(4.5a)
(4.5b)
e
∂H
∂L
=− .
∂t
∂t
(4.6)
Le relazioni (4.5a) e (4.5b) sono dette equazioni di Hamilton e costituiscono un
sistema di due equazioni differenziali del primo ordine nelle due variabili indipendenti (coordinate canoniche) q e p. Queste nuove variabili definiscono lo stato
del sistema nel cosiddetto spazio delle fasi, che è ovviamente di dimensione 2.
La procedura precedente si può generalizzare al caso di un sistema avente n
gradi di libertà. Sia L = L (q, q̇, t) la lagrangiana del sistema, con q = (q1 , . . . , qn )
e q̇ = (q˙1 , . . . , q˙n ). Si ha:
n
dL =
n
∂L
∂L
∂L
dq
+
∑ ∂q j j ∑ ∂q˙j dq˙j + ∂t dt =
j =1
j =1
n
=
∑
j =1
∂L
ṗ j dq j + p j dq˙j + dt
∂t
(4.7)
(4.8)
∂L
d ∂L
(si è utilizzato ∂∂Lq˙j = p j e ∂q
= dt
∂q˙j = ṗ j ). Posto p = ( p1 , . . . , pn ), possiamo
j
come prima definire l’hamiltoniana del sistema in funzione di (q, p, t) mediante
la trasformazione di Legendre
n
H (q, p, t) =
∑ q˙j p j − L (q, q̇, t) .
(4.9)
j =1
Avremo allora
n
dH =
∑
j1
∂H
∂H
dq j +
dp j
∂q j
∂p j
+
∂H
dt
∂t
(4.10)
e, per la (4.8) e la (4.9),
n
dH =
∑
j =1
n
=
∑
j =1
40
n
∂L
q˙j dp j + p j dq˙j − ∑ ṗ j q j + p j dq˙j − dt =
∂t
j =1
(4.11)
∂L
q˙j dp j − ṗ j dq j − dt.
∂t
(4.12)
4.1 equazioni di hamilton
Dalla (4.10) e dalla (4.12) si deduce che per i = 1, . . . n
∂H(q, p, t)
= q̇i
∂pi
∂H(q, p, t)
= − ṗi
∂qi
(4.13a)
(4.13b)
e
∂H
∂L
=− .
∂t
∂t
(4.14)
Le equazioni (4.13a) e (4.13b) vengono chiamate, come nel caso di un solo grado
di libertà, equazioni di Hamilton e costituiscono 2n equazioni differenziali nelle
variabili canoniche q e p.
In conclusione, la costruzione dell’hamiltoniana avviene attraverso i seguenti
passaggi:
• si costruisce la lagrangiana L in funzione delle coordinate generalizzate q,
delle velocità generalizzate q̇ ed eventualmente del tempo t attraverso la
relazione L = T − V (supponendo le forze derivanti da un unico potenziale
o potenziale generalizzato);
• si definiscono i momenti coniugati pi attraverso la relazione
pi =
∂L (q, q̇, t)
∂q̇i
(i = 1, . . . n);
(4.15)
• si scrive l’hamiltoniana del sistema utilizzando la trasformazione di Legendre (4.9) (ovviamente in questa scrittura intervengono q, q̇, p e t);
• a partire dalle (4.15) si cerca di ottenere q̇ in funzione di q, p e t;
• con l’ausilio del risultato precedente si può, infine, esprimere l’hamiltoniana
H in funzione di q, p e t.
4.1.1 Un esempio
Supponiamo che le equazioni che definiscono le coordinate generalizzate non
dipendano esplicitamente dal tempo e che le forze in gioco derivino da un potenziale V funzione solo delle coordinate generalizzate. Vogliamo vedere come
possiamo scrivere l’hamiltoniana del sistema. Siano n i gradi di libertà e siano
q1 , . . . , qn le coordinate generalizzate. È semplice dimostrare che l’energia cinetica
si può scrivere
T=
1 n
τij (q)q̇i q˙j
2 i,j∑
=1
dove q = (q1 , . . . , qn ). La lagrangiana è data da
L = T − V.
41
formalismo hamiltoniano
Il momento coniugato a qi è
pi =
∂L
=
∂q̇i
n
∑ τij (q)q˙j .
j =1
La matrice simmetrica τ = τij è definita positiva ed è quindi invertibile. Allora
n
q̇ j =
∑
τ −1
i =1
ij
pi .
Si può dimostrare che nel nostro caso l’hamiltoniana è uguale all’energia totale,
cioè
n
H=
∑ q̇i pi − L(q, q̇) = T + V.
i =1
Osserviamo che
n 1 n
−1
−1
τ
(
q
)
τ
τ
pk pl =
ij
∑
2 i,j∑
ik
jl
=1
k,l
1 n −1 =
∑ τ ik δil pk pl =
2 i,k,l
=1
n 1
= ∑ τ −1 p i p k .
2 i,k=1
ik
T=
In definitiva otteniamo che:
H=
1 n −1 τ
p i p k + V ( q ).
2 i,k∑
jk
=1
Se τ è diagonale, lo sarà anche la sua inversa e dunque
H=
4.2
1 n −1 2
τ
p i + V ( q ).
2 i∑
i
=1
notazione simplettica
Le equazioni di Hamilton non trattano le coordinate generalizzate e i momenti
coniugati in modo simmetrico, come si evince immediatamente dalle (4.13). Accenniamo qui brevemente ad un modo elegante di scrivere queste equazioni in
forma unitaria attraverso la cosiddetta notazione simplettica.
Se il sistema ha n gradi di libertà, possiamo costruire un vettore colonna formato
da 2n elementi (righe), e cioè:
ηi = q i ,
ηi + n = p i .
42
(i = 1, . . . n)
4.3 coordinate cicliche e metodo di routh
Il vettore colonna così costruito è dato da
 q1 
 ... 
 qn 

η=
 p1  .
 . 
..
pn
Si ha ovviamente
∂H
∂H
=
,
∂ηi
∂qi
∂H
∂H
=
.
∂ηi+n
∂pi
(i = 1, . . . n)
Definiamo la seguente matrice 2n × 2n formata da quattro matrici n × n:
0
In
J=
−In 0
dove In è la matrice identità n × n e 0 è la matrice nulla n × n. Notiamo che
0 −In
T
−1
J =J =
.
In
0
Si vede che J−1 = −J. Allora J2 = −I2n e det J = 1. La matrice J è detta matrice simplettica standard. Possiamo scrivere le equazioni di Hamilton nel modo
seguente
2n
η̇k =
∂H
∑ Jkj ∂ηj
(k = 1, . . . 2n)
j =1
o in maniera sintetica
η̇ = J
∂H
.
∂η
Questa notazione è detta simplettica.
4.3
coordinate cicliche e metodo di routh
Sia H = H(q, p, t) l’hamiltoniana del sistema di particelle con n gradi di libertà, dove q = (q1 , . . . , qn ) e p = ( p1 , . . . , pn ) sono le coordinate canoniche (indipendenti).
Si ha:
dH
=
dt
n
n
∂H
∂H
∂H
q̇
+
∑ ∂q j j ∑ ∂p j ṗ j + ∂t .
j =1
j =1
(4.16)
Per le equazioni di Hamilton (4.13) e per la (4.14), la (4.16) diventa:
n
n
dH
∂H
∂H
∂L
= − ∑ ṗ j q̇ j + ∑ q̇ j ṗ j +
=
=−
dt
∂t
∂t
∂t
j =1
j =1
(4.17)
43
formalismo hamiltoniano
dove L è la lagrangiana del nostro sistema. Si vede, allora, che l’hamiltoniana è
una costante del moto se non dipende in modo esplicito dal tempo (o, in maniera
equivalente, se la lagrangiana non dipende esplicitamente dal tempo).
Abbiamo avuto già modo di osservare che, se le equazioni di trasformazione che definiscono le coordinate generalizzate non dipendono esplicitamente dal
tempo e se il potenziale dipende solo dalle coordinate generalizzate, allora H coincide con l’energia totale ed è una costante del moto. Il fatto che H coincida con
l’energia totale e sia una costante del moto sono due risultati in qualche modo indipendenti. Possono cioè verificarsi situazioni in cui l’hamiltoniana è una costante
del moto ma non è uguale all’energia totale, e viceversa1 .
Se qn è una coordinata ciclica, allora pn = ∂∂L
q̇n è una costante del moto. In questo
caso l’hamiltoniana del sistema sarà funzione della costante pn e non, ovviamente, di qn . Ponendo pn = α, abbiamo H = H(q1 , . . . , qn−1 ; p1 , . . . , pn−1 ; α, t), cioè
l’hamiltoniana è di fatto funzione di sole 2(n − 1) coordinate, essendo α costante.
Possiamo poi studiare l’evoluzione temporale delle coordinate generalizzate qn
attraverso l’equazione canonica q̇n = ∂H
∂α .
Si possono combinare i vantaggi della formulazione hamiltoniana nel trattare le
coordinate cicliche con quelli della formulazione lagrangiana per lo studio delle
coordinate non cicliche con un metodo dovuto a Routh. In sostanza si effettua
una trasformazione di Legendre per passare dal sistema (q, q̇) al sistema (q, p)
solo per le coordinate cicliche, ricavando per esse le equazioni del moto in forma hamiltoniana mentre le rimanenti equazioni del moto rimangono espresse in
forma lagrangiana.
Supponiamo che qs+1 , . . . , qn siano coordinate cicliche. Introduciamo la seguente funzione di Routh (o routhiana):
n
R(q1 , . . . , qn ; q̇1 , . . . , q̇s ; ps+1 , . . . , pn , t) =
∑
q̇ j p j − L(q1 , . . . , qn ; q̇1 , . . . , q̇n , t) (4.18)
j = s +1
dove L è, ovviamente, la lagrangiana del sistema (notare che nella (4.18) non è
stata ancora inserita l’informazione che qs+1 , . . . , qn sono cicliche). Dalla (4.18)
otteniamo:
n
s ∂L
∂L
dR = ∑ (dq̇ j p j + q̇ j dp j ) − ∑
dq j +
dq̇ j +
∂q j
∂q̇ j
j = s +1
j =1
(4.19)
n ∂L
∂L
∂L
dq j +
dq̇ j − .
− ∑
∂q j
∂q̇ j
∂t
j = s +1
Tenendo presente che per j = s + 1, . . . , n
∂L
= pj
∂q̇ j
∂L
=0
∂q j
la (4.19) diventa:
n
dR =
∑
j = s +1
s
q̇ j dp j − ∑
j =1
∂L
∂L
dq j +
dq̇ j
∂q j
∂q̇ j
−
∂L
.
∂t
(4.20)
1 Per una discussione articolata, arricchita da esempi, rimandiamo alla lettura di Herbert Goldstein
et al., Meccanica Classica, Zanichelli, pagg. 328-332.
44
4.3 coordinate cicliche e metodo di routh
Dalla (4.20) si deduce che

 ∂R = − ∂L
∂q j
∂q j
per j = 1, . . . , s
 ∂R = − ∂L
∂p j
∂q̇ j
,
per j = s + 1, . . . , n

 ∂R = 0
∂q j
 ∂R = q̇ j
∂p j
.
Allora le equazioni di Lagrange per j = 1, . . . , s si possono scrivere mediante la
funzione di Routh:
d ∂R
∂R
−
= 0.
dt ∂q̇ j
∂q j
In conclusione la funzione di Routh è una funzione di Hamilton in rapporto
alle coordinate cicliche qs+1 , . . . , qn e una funzione di Lagrange in rapporto alle
coordinate non cicliche q1 , . . . , qs . Osserviamo ad abundantiam che le coordinate
cicliche non compaiono esplicitamente nella lagrangiana e, quindi, nella funzione
di Routh, cioè:
R = R( q1 , . . . , q s ; p1 , . . . p n ; t )
dove, per j = s + 1, . . . , n, p j sono integrali primi del moto.
Vediamo un piccolo esempio. Una particella di massa m si muove in un campo
di forze centrali il cui potenziale è U = U (r ) con r distanza della particella dal
centro di forza. Sappiamo che il moto avviene in un piano (sempre che il momento
angolare rispetto al centro di forza, che è costante, sia diverso da zero). Possiamo
esprimere la lagrangiana della particella in tale piano in coordinate polari. Si ha:
L=
1
m(ṙ2 + r2 θ̇ 2 ) − U (r ).
2
Chiaramente θ è una coordinata ciclica. La funzione di Routh è definita nel modo
seguente:
R = θ̇ pθ − L,
∂L
∂θ̇
dove pθ =
che:
R=
= mr2 θ̇ è il momento coniugato a θ. Con semplici calcoli si ricava
1 p2θ
1
− mṙ2 + U (r ).
2m r2
2
Osserviamo che
pθ
.
mr2
∂R
∂θ
= 0 (e dunque pθ è una costante del moto), mentre
∂R
∂pθ
= θ̇ =
Inoltre
d ∂R
∂R
−
= 0,
dt ∂ṙ
∂r
cioè
mr̈ −
p2θ
+ U 0 (r ) = 0
mr3
45
formalismo hamiltoniano
(ricordiamo che −U 0 (r )r̂ è la forza centrale agente sulla particella).
Il metodo di Routh, che, in certi casi, può tornare utile ai fini del calcolo, non
è, in definitiva, altro che un ibrido concettuale tra la formulazione lagrangiana
e quella hamiltoniana, senza nulla aggiungere di sostanziale all’analisi ed allo
studio di un sistema meccanico.
4.4
principio variazionale di hamilton modificato
Abbiamo visto che le equazioni Rdi Lagrange possono essere ottenute dal principio
t
di Hamilton imponendo δS = t01 L(q, q̇, t)dt = 0, richiedendo cioè che il moto
reale, fra tutti i moti ammissibili nello spazio delle configurazioni, sia quello che
rende stazionaria l’azione. Se vogliamo dedurre le equazioni di Hamilton da un
principio variazionale occorre, in qualche modo, modificare il precedente principio, perché l’integrale possa essere valutato su percorsi del punto rappresentativo
del sistema nello spazio delle fasi. Nell’approccio hamiltoniano le coordinate
canoniche q e p sono considerate indipendenti nello spazio delle fasi; di conseguenza devono essere considerate indipendenti anche le loro variazioni. L’idea è
di considerare l’azione scritta nel modo seguente:
!
Z
S[q(t), p(t)] =
t1
t0
n
∑ p j q̇ j − H(q, p, t)
dt
(4.21)
j =1
con (q(t0 ) = q0 , p(t0 ) = p0 ) e (q(t1 ) = q1 , p(t1 ) = p1 ). Un moto nello spazio delle fasi (q̃(t), p̃(t)) è ammissibile se (q̃(t0 ) = q0 , p̃(t0 ) = p0 ) e (q̃(t1 ) = q1 , p̃(t1 ) =
p1 ). Il moto reale nello spazio delle fasi è quello tra i moti ammissibili che rende
stazionaria l’azione (4.21), cioè
!
Z
δS = δ
n
t1
∑ p j q̇ j − H(q, p, t)
t0
dt = 0.
j =1
Questo principio variazionale di Hamilton modificato ha esattamente la stessa
forma variazionale tipica in uno spazio delle configurazioni di dimensione 2n.
Ripetendo i ragionamenti fatti nel secondo capitolo, otteniamo 2n equazioni di
tipo Lagrange (o di Eulero-Lagrange), cioè
(
"
#)
"
#
n
n
d
∂
∂
p j q̇ j − H(q, p, t)
−
p j q̇ j − H(q, p, t) = 0
dt ∂q̇k j∑
∂qk j∑
=1
=1
⇔ ṗk +
d
dt
(
∂
∂ ṗk
"
#)
n
∑
j =1
p j q̇ j − H(q, p, t)
∂
−
∂pk
"
n
∑ p j q̇ j − H(q, p, t)
=0
j =1
⇔ q̇k −
46
∂H
=0
∂qk
#
∂H
=0
∂pk
4.5 parentesi di poisson
che sono nell’ordine la seconda e la prima equazione di Hamilton. Osserviamo
infine che il principio variazionale di Hamilton modificato è formulato in modo
tale che agli estremi per i = 1, . . . , n non solo δqi = 0 ma anche δpi = 0. Una conseguenza immediata di questa considerazione è che, se F (q, p, t) è una funzione
di classe opportuna (liscia), allora
n
∑ p j q̇ j − H(q, p, t) +
j =1
dF (q, p, t)
dt
(4.22)
dà luogo alle stesse equazioni di Hamilton.
4.5
parentesi di poisson
Supponiamo di avere un sistema lagrangiano con n gradi di libertà. Indichiamo come al solito con q = (q1 , . . . , qn ) le coordinate generalizzate e con p =
( p1 , . . . , pn ) i momenti coniugati individuando così il nostro sistema (q, p) di coordinate canoniche. Sia H(q, p, t) l’hamiltoniana del sistema. Supponiamo di avere
una funzione f (q, p, t) : F × R → R di classe opportuna, indicato con F lo spazio
delle fasi. Una funzione siffatta è detta anche variabile dinamica. Tenendo conto
delle equazioni di Hamilton si ha:
df
=
dt
n
∂f
=
∂t
j =1
n ∂ f ∂H
∂ f ∂H
∂f
∂f
=∑
−
+
= { f , H}q,p +
∂q j ∂p j
∂p j ∂q j
∂t
∂t
j =1
∑
∂f
∂f
q̇ j +
ṗ j
∂q j
∂p j
+
dove
n
{ f , H}q,p =
∑
j =1
∂ f ∂H
∂ f ∂H
−
∂q j ∂p j
∂p j ∂q j
è detta parentesi di Poisson2 di f ed H rispetto al sistema di coordinate canoniche
(q, p). Si vede subito che f è una costante del moto se { f , H}q,p + ∂∂tf = 0. In
df
particolare se la variabile dinamica f non dipende esplicitamente dal tempo, dt =
0 ⇔ { f , H}q,p = 0. Più in generale, se abbiamo due variabili dinamiche f (q, p, t)
e g(q, p, t), si definisce parentesi di Poisson di f e g rispetto alle coordinate canoniche
(q, p) la quantità:
n
{ f , g} =
∑
j =1
∂ f ∂g
∂ f ∂g
−
.
∂q j ∂p j
∂p j ∂q j
Le parentesi di Poisson godono delle seguenti proprietà (siano f , g, f 1 , f 2 , g1 , g2
variabili dinamiche arbitrarie):
2 Talvolta per semplicità di notazione quando ciò non comporta equivoci il pedice alle parentesi è
omesso. Inoltre la parentesi di Poisson è talvolta indicata in letteratura con il simbolo [·, ·] o [·, ·] PB .
47
formalismo hamiltoniano
1. { f , g} = −{ g, f }, da cui ovviamente { f , f } = 0;
2. se c è costante rispetto alle coordinate canoniche, allora { f , c} = 0;
3. { f 1 + f 2 , g} = { f 1 , g} + { f 2 , g} e { f , g1 + g2 } = { f , g1 } + { f , g2 }, ovvero le
parentesi sono operatori lineari;
4. { f 1 · f 2 , g} = f 1 { f 2 , g} + f 2 { f 1 , g};
5. si dimostra la seguente identità, per nulla banale, detta di Jacobi:
{ f , { g, h}} + { g, {h, f }} + {h, { f , g}} = 0
Valgono inoltre le seguenti relazioni:
n
o n
o
∂f
∂g
• ∂t∂ { f , g} = ∂t , g + f , ∂t ;
∂f
• { f , q j } = − ∂p j e { f , p j } =
∂f
∂q j
• {qi , q j } = 0, { pi , p j } = 0, {qi , p j } = δij (parentesi di Poisson fondamentali).
Notiamo per inciso che le equazioni di Hamilton possono essere scritte anche nel
modo seguente:
∂H
∂pk
∂H
ṗk = −
∂qk
q̇k =
= { q k , H},
= { p k , H}.
Osserviamo come l’asimmetria delle equazioni di Hamilton “scompaia” utilizzando le parentesi di Poisson.
Esercizi
1. Dimostrare l’identità di Jacobi nel caso in cui n = 1.
2. Dimostrare che se due variabili dinamiche f e g, che non dipendono esplicitamente dal tempo, sono entrambe integrali primi del moto, allora anche
{ f , g} è un integrale primo del moto (Suggerimento: utilizzare l’identità di
df
Jacobi e il fatto che dt = 0 ⇔ { f , H} = 0, dove H è l’hamiltoniana).
3. Dimostrare che, se due variabili dinamiche f e g (in generale dipendenti
dal tempo) sono entrambe integrali primi del moto, allora anche { f , g} è un
integrale primo del moto.
4. Sia dato un punto materiale di massa m e sia l’hamiltoniana del nostro sistema H( x1 , x2 , x3 , p1 , p2 , p3 , t), in coordinate cartesiane. Dimostrare, utilizzando le parentesi di Poisson fondamentali, che { L j , pk } = e jkl pl , dove e jkl è il
simbolo di Levi-Civita, o delle permutazioni di 1,2,3. Ricordiamo che tale
48
4.6 trasformazioni canoniche
simbolo vale 1 se ( j, k, l ) è una permutazione ciclica di (1, 2, 3), −1 se ( j, k, l )
è una permutazione ciclica di (2, 1, 3) ed è nullo altrimenti. Analogamente
si può vedere che { L j , Lk } = e jkl Ll e { L j , L2 } = 0.
5. Supponiamo di avere un punto materiale in un potenziale a simmetria sferica. Si scriva in coordinate sferiche l’hamiltoniana e il momento angolare
della particella rispetto al centro della forza. Calcolare { L2 , H}, {L, H}.
4.6
trasformazioni canoniche
Le equazioni differenziali del moto, nel formalismo hamiltoniano, benché del primo ordine, non semplificano, in generale, i calcoli rispetto a quelle del formalismo
lagrangiano. La novità nell’approccio hamiltoniano risiede nel fatto che le coordinate e i momenti coniugati hanno la stessa rilevanza. Esistono casi in cui tutte
le n coordinate generalizzate sono cicliche; in tale circostanza tutti i momenti coniugati sono costanti del moto. Se poniamo per semplicità pi = αi (costante) per
∂H(α1 ,...,αn )
i = 1, . . . , n, allora q̇i =
= ωi , valore costante, e quindi integrando si ha
∂αi
qi (t) = ωi t + qi (0). Abbiamo visto come sia possibile, in questo caso, integrare
banalmente le equazioni del moto.
Il fatto rilevante è che esistono problemi meccanici (quelli cosiddetti integrabili)
per i quali è possibile avere n coordinate generalizzate cicliche. Naturalmente punto fondamentale è saper passare da un sistema di coordinate canoniche (q, p) ad
un altro sistema di coordinate canoniche (Q, P), anche per ricercare, ove esistano,
coordinate generalizzate cicliche.
Un modo, potremmo dire naturale, per ottenere nuove coordinate canoniche
relative ad un sistema meccanico lagrangiano (e quindi hamiltoniano) è di partire da trasformazioni nello spazio delle configurazioni Q = Q(q, t), esprimere la
lagrangiana in termini di Q e Q̇, ottenere i momenti coniugati corrispondenti tramite la relazione Pi = ∂∂L
ed infine riscrivere l’hamiltoniana in funzione di (Q, P),
Q̇i
nuove coordinate canoniche, ed eventualmente del tempo in modo esplicito. Si
può avere una trasformazione da un sistema di coordinate canoniche (q, p) ad un
altro (Q, P) in maniera più generale, considerando (nello spazio delle fasi) come
indipendenti le coordinate generalizzate e i momenti coniugati (ricordiamo che
questo assunto è tipico della formulazione hamiltoniana). Si può, in altre parole, avere nello spazio delle fasi una trasformazione simultanea delle coordinate
generalizzate e dei momenti coniugati, cioè:
(
Q = Q(q, p, t)
P = P(q, p, t)
(4.23)
con (q, p) e (Q, P) vecchie e nuove, rispettivamente, coordinate canoniche. Trasformazioni di questo tipo, nello spazio delle fasi, sono dette canoniche e permettono, in termini delle nuove coordinate canoniche (Q, P), una nuova descrizione
equivalente della dinamica del nostro sistema meccanico, se, ovviamente, esiste
una nuova hamiltoniana funzione di (Q, P, t), che dia luogo alle equazioni di
49
formalismo hamiltoniano
Hamilton. Possiamo in definitiva dare la seguente definizione di trasformazione
canonica:
Definizione (trasformazione canonica) - Se (q, p) è un sistema di coordinate
canoniche con hamiltoniana H(q, p, t),
(
Q = Q(q, p, t)
P = P(q, p, t)
è una trasformazione canonica se esiste una nuova hamiltoniana K(Q, P, t) che
permette di scrivere le equazioni del moto nella forma
(
Q̇i =
Ṗi =
∂K
∂Pi
∂K
− ∂Q
i
,
con i = 1, . . . , n.
Sottolineiamo una proprietà rilevante delle trasformazioni canoniche (proprietà
che sarà evidente in seguito): le trasformazioni canoniche sono indipendenti dal
problema fisico specifico. In altre parole la trasformazione (q, p, t) → (Q, P, t),
se è canonica per un particolare sistema meccanico, è canonica per tutti i sistemi
meccanici con lo stesso numero di gradi di libertà.
Abbiamo visto che le equazioni di Hamilton possono essere ottenute dal principio di Hamilton modificato, cioè
!
Z
δS = δ
n
t1
∑ pi q̇i − H(q, p, t)
t0
dt = 0.
i =1
Analogamente, se Q e P sono le nuove coordinate canoniche e K(Q, P, t) è la
nuova hamiltoniana, il principio di Hamilton modificato diventa:
!
Z
δS = δ
n
t1
∑ Pi Q̇i − K(Q, P, t)
t0
dt = 0.
i =1
Poiché le variazioni delle coordinate canoniche (relative a tutti i moti ammissibili
nello spazio delle fasi) devono essere nulle agli estremi, deve valere (vedi (4.22))
la seguente relazione (trasformazione canonica):
n
n
i =1
i =1
∑ pi q̇i − H(q, p, t) = ∑ Pi Q̇i − K(Q, P, t) +
dF
dt
(4.24)
dove F (q, p, t), che supponiamo liscia, è detta funzione generatrice della trasformazione canonica (4.24). La relazione (4.24) può essere scritta:
n
n
i =1
i =1
∑ pi dqi − ∑ Pi dQi − (H − K)dt = dF.
50
(4.25)
4.6 trasformazioni canoniche
La struttura della (4.25) induce a prendere in considerazione la sottoclasse di
trasformazioni in cui è possibile scegliere (q, Q) come variabili indipendenti in
∂p
6= 0 e P =
luogo di (q, p). Richiediamo allora che p = p(q, Q, t) abbia3 det ∂Q
P(q, Q, t). La funzione generatrice è detta, in questo caso, di tipo 1. Si ha:
F (q, p, t) = F (q, p(q, Q, t), t) = F1 (q, Q, t).
La relazione (4.25) può, allora, essere scritta in questo caso:
n
n
i =1
i =1
n
∑ pi dqi − ∑ Pi dQi − (H − K)dt =
=
n
∂F1
∂F1
∂F1
dqi + ∑
dQi +
dt
∂qi
∂Qi
∂t
i =1
i =1
∑
Di conseguenza, per i = 1, . . . , n:
∂F1
∂qi
∂F1
Pi = −
∂Qi
∂F1
K = H+
.
∂t
pi =
(4.26)
(4.27)
(4.28)
Una volta nota la funzione generatrice di tipo 1, tramite la (4.26) si ottiene p =
p(q, Q, t) e P = P(q, Q, t). Invertendo poi la prima delle due equazioni appena
ricavate, si ottiene Q = Q(q, p, t); si può pertanto esprimere anche P in funzione di (q, p, t). Osserviamo che l’inversione è garantita dalla proprietà di non
∂p
∂2 F1
degenerazione ∂Q
= det ∂q∂Q
6= 0.
Possiamo riassumere il discorso appena fatto nel modo seguente:
Per ogni funzione F1 (q, Q, t) liscia, soggetta alle proprietà di non
degenerazione, la trasformazione (q, p, t) → (Q, P, t), definita, per i =
1, . . . , n, da
(
i
pi = ∂F
∂qi
∂Fi
Pi = − ∂Q
i
e dalla formula inversa Q = Q(q, p, t), è canonica; ad ogni hamiltonia1
na H(q, p, t) corrisponde l’hamiltoniana K = H + ∂F
∂t . In particolare, se
∂F1
∂t = 0, K = H.
Ad esempio, sia F1 = qQ la funzione generatrice di tipo 1 (n = 1). Allora p = Q
e P = −q. Vale a dire, (q, p) → ( p, −q) è una trasformazione canonica. Inoltre
K = H. Notare che la trasformazione canonica è indipendente dal sistema fisico
in esame.
3 Ovvero la matrice jacobiana
∂p
∂Q
=
∂pk
∂Q j
è assunta non singolare.
51
formalismo hamiltoniano
Può capitare che non sia possibile avere una funzione generatrice di tipo 1.
Questo accade se p può essere funzione di (q, P, t) e non di (q, Q, t). Allora si
può porre:
n
F = F2 (q, P, t) − ∑ Qi Pi .
i =1
La relazione (4.25) diventa in questo caso
n
n
n
n
i dQi − (H − K)dt = dF2 − ∑ Qi dPi − ∑ P
i dQi
∑ pi dqi − ∑ P
i =1
i =1
i =1
i =1
ovvero
n
n
i =1
i =1
∑ pi dqi + ∑ Qi dPi − (H − K)dt = dF2 .
(4.29)
F2 è detta funzione generatrice di tipo 2. Dalla (4.29) otteniamo
∂F2
,
∂qi
∂F2
Qi =
,
∂Pi
pi =
K = H+
(4.30)
(4.31)
∂F2
.
∂t
(i = 1, . . . , n)
2
∂p
∂ F2
Notiamo che bisogna imporre la condizione di non degenerazione ∂P
= det ∂q∂P
6=
0. Invertendo la (4.30) otteniamo P = P(q, p, t) e, quindi, nella (4.31) Q in
funzione (q, p, t).
Facciamo ora alcuni esempi per sistemi ad un grado di libertà:
2
• F2 = qP; allora p = ∂F
∂q = P e Q =
canonica identica, con K = H.
∂F2
∂P
= q. Otteniamo cioè la trasformazione
• F2 = 12 (q + αP)2 , con α > 0. Allora p =
∂F2
∂q
= q + αP ⇒ P =
p−q
α ,
mentre
∂F2
∂P
Q =
= α(q + αP) = α(q + p − q) = αp. La trasformazione canonica è
p−q
dunque (q, p) → (αp, α ), con K = H.
Può accadere che siano scelte come variabili indipendenti p e Q. In tal caso
∂q
6= 0. Allora
q = q(p, Q, t), con la condizione det ∂Q
n
F = F3 (p, Q, t) + ∑ qi pi .
(4.32)
i =1
La funzione generatrice si dice in tal caso di tipo 3. La relazione (4.25) diventa per
la (4.32)
n
n
n
n
i =1
i =1
dq ⇒
i dqi − ∑ Pi dQi − (H − K)dt = dF3 + ∑ qi dpi + ∑ p
∑p
i i
i =1
i =1
n
n
i =1
i =1
− ∑ qi dpi − ∑ Pi dQi − (H − K)dt = dF3
52
4.6 trasformazioni canoniche
da cui
∂F3
,
∂pi
∂F3
Pi = −
,
∂Qi
∂F3
K = H+
.
∂t
qi = −
(4.33)
(4.34)
(i = 1, . . . , n)
∂q
6= 0 può pertanto essere scritta, in base alla (4.33) coLa condizione det ∂Q
2
∂ F3
me det ∂p∂Q
(condizione di non degenerazione). Proponiamo alcuni esempi di
funzioni generatrici siffatte sempre nel caso di sistemi ad un grado di libertà:
∂F2
3
• F3 = − pQ. Allora q = − ∂F
∂p = Q e P = − ∂Q = p. In questo caso la
trasformazione canonica è la trasformazione identica, cioè (q, p) → (q, p),
con K = H.
p+ Q > 0 ⇒ Q = ln q − p e P = − ∂F2 =
3
• F3 = −e p+Q . Allora q = − ∂F
∂p = e
∂Q
e p+Q = qe p e− p = q. La trasformazione canonica è, allora, la seguente:
(q, p) → (ln q − p, q), con q > 0 e K = H.
Se sono scelte come variabili indipendenti p e P, abbiamo q = q(p, P, t) con la
∂q
condizione det ∂P
6= 0 e
n
n
i =1
i =1
F = F4 (p, P, t) + ∑ qi pi − ∑ Qi Pi .
(4.35)
La funzione generatrice è detta di tipo 4. La relazione (4.25) diventa per la (4.35):
n
n
i dqi − ∑ P
i dQi − (H − K)dt =
∑ p
i =1
i =1
n
n
n
n
= dF4 + ∑ qi dpi + ∑ p
i dqi − ∑ Qi dPi − ∑ P
i dQi ⇒
i =1
n
n
i =1
i =1
i =1
i =1
i =1
− ∑ qi dpi − ∑ Qi dPi − (H − K)dt = dF4
da cui
∂F4
,
∂pi
∂F4
Qi =
,
∂Pi
∂F4
K = H+
∂t
qi = −
(4.36)
(4.37)
(i = 1, . . . , n)
2
∂ F4
La condizione det ∂q
∂P 6 = 0 può essere scritta in base alla (4.36) come det ∂P∂p 6 = 0.
4
Ad esempio, se, per n = 1, F4 = pP, allora q = − ∂F
∂p = − P ⇔ P = − q e
Q=
∂F4
∂P
= p. La trasformazione canonica è, pertanto, la seguente: (q, p) → ( p, q),
53
formalismo hamiltoniano
con K = H.
Osserviamo, infine, che una funzione generatrice non deve essere necessariamente una dei quattro tipi per tutti i gradi di libertà. Si può usare una funzione
generatrice che mescoli i quattro tipi. Così per n = 2 F = F23 (q1 , p2 ; P1 , Q2 ; t) −
Q1 P1 + q2 p2 rappresenta una funzione generatrice di tipo 2 per il primo grado di
libertà e di tipo 3 per il secondo.
Accenniamo infine (senza dimostrazioni) ad una bella proprietà riguardante le
parentesi di Poisson e le trasformazioni canoniche. Sia data una trasformazione
canonica:
Q = Q(q, p, t)
.
(4.38)
P = P(q, p, t)
Se f (Q, P, t) e g(Q, P, t) sono due variabili dinamiche, si può dimostrare che:
{ f (Q, P, t), g(Q, P, t)}Q,P =
= { f (Q(q, p, t), P(q, p, t), t), g(Q(q, p, t), P(q, p, t), t)}q,p ,
ovvero le parentesi di Poisson sono invarianti per trasformazioni canoniche. In particolare sono invarianti per trasformazioni canoniche le parentesi fondamentali. Inoltre
si può far vedere che, se (q, p) sono coordinate canoniche, le trasformazioni (4.38)
sono canoniche solo se sono soddisfatte le parentesi fondamentali per le nuove
variabili. In definitiva, assegnate le trasformazioni, il test basato sulle parentesi
di Poisson è conclusivo per stabilire se esse sono canoniche senza passare per le
funzioni generatrici o precisare specifici problemi fisici.
4.7
equazioni di hamilton-jacobi
Abbiamo visto che nell’approccio hamiltoniano il moto di un sistema meccanico
nello spazio delle fasi con n gradi di libertà è determinato dalla soluzione di 2n
equazioni differenziali ordinarie del primo ordine rispetto al tempo, che coinvolgono 2n variabili dipendenti dal tempo (le coordinate canoniche) ed una variabile
indipendente (il tempo appunto).
Vogliamo ora far vedere che lo stesso problema fisico può essere risolto in
un modo completamente diverso: attraverso la determinazione di una funzione4 S(q1 , . . . qn , t) soluzione di un’equazione differenziale alle derivate parziali,
contenente n + 1 derivate parziali del primo ordine rispetto a q1 , . . . qn e a t.
Supposta nota l’hamiltoniana del sistema in esame H(q, p, t), con q = (q1 , . . . qn )
e p = ( p1 , . . . pn ) coordinate canoniche, assumiamo che esista una trasformazione
canonica Q = Q(q, p, t) e P = P(q, p, t) che dia luogo ad una nuova hamiltoniana
K nulla. In questo caso:
∂K
Q̇i = ∂P
=0
i
∂K
Ṗi = − ∂Qi = 0
4 In realtà, come vedremo, S dipende in generale anche da n + 1 costanti arbitrarie
54
4.7 equazioni di hamilton-jacobi
cioè Q e P sono costanti nel tempo. Se F è la funzione generatrice, abbiamo la
condizione
∂F
H(q, p, t) +
= 0.
(4.39)
∂t
Se facciamo l’ipotesi che la funzione generatrice sia del secondo tipo, abbiamo
che:
∂F2 (q, P, t)
.
pi =
∂qi
L’equazione (4.39) può essere pertanto riscritta:
∂F2
∂F2
H q,
,t +
= 0.
∂q
∂t
(4.40)
La (4.40) è nota come equazione di Hamilton-Jacobi ed è, per la funzione generatrice, un’equazione differenziale alle derivate parziali prime nelle n + 1 variabili
(q1 , . . . qn , t). F2 è, in letteratura, indicata usualmente col simbolo S. La funzione
S è detta funzione principale di Hamilton. Supponiamo che esista una soluzione
completa del tipo S = S(q1 , . . . qn ; α1 , . . . αn+1 ; t) dove α1 , . . . αn+1 sono costanti di
integrazione indipendenti. L’equazione di Hamilton-Jacobi non dà informazioni
sui nuovi momenti Pi da cui dovrebbe dipendere S. Sappiamo che questi nuovi
momenti sono tutti costanti. Osserviamo che nella (4.40) la funzione S non compare direttamente ma solo mediante le derivate parziali rispetto a qi e a t. Allora,
se S è soluzione dell’equazione di Hamilton-Jacobi, anche S+costante è soluzione.
Questa proprietà implica che una delle n + 1 costanti di integrazione deve comparire come costante additiva. Si può, allora, scegliere una soluzione completa che
dipende da n costanti indipendenti, cioè:
S = S ( q1 , . . . q n ; α1 , . . . α n ; t ).
(4.41)
Possiamo benissimo scegliere queste costanti esattamente uguali ai nuovi momenti: Pi = αi . Questa scelta non contraddice l’ipotesi iniziale che la funzione generatrice della trasformazione canonica sia di tipo 2 e quindi che p = p(q, P, t). Si
possono scegliere i nuovi momenti, essendo costanti, assegnando al tempo t = 0
q e p. In particolare, sappiamo che
pi =
∂S
(q; α; t)
∂qi
(4.42)
con α = (α1 , . . . , αn ); invertendo la (4.42) possiamo ottenere α al tempo t = 0 in
funzione di q e p. Le nuove coordinate generalizzate sono date da:
∂S
= β i (costanti).
(4.43)
∂αi
Le costanti β i possono essere calcolate conoscendo i valori al tempo t = 0 delle coordinate canoniche. Possiamo poi, invertendo le trasformazione canoniche,
esprimere le vecchie coordinate canoniche (q, p) in funzione delle nuove5 ( β, α):
q = q( β, α, t)
.
(4.44)
p = p( β, α, t)
Qi =
5 β = ( β 1 , . . . β n ), α = ( α1 , . . . α n ).
55
formalismo hamiltoniano
Queste relazioni ci dicono che possiamo ottenere, mediante una trasformazione
canonica, le coordinate canoniche (q, p) in funzione del tempo, cioè di determinare il moto del sistema nello spazio delle fasi una volta che siano assegnate le
condizioni iniziali. Le relazioni (4.44) ci danno, in altre parole, la soluzione delle
equazioni di Hamilton, noti q(0) e p(0).
Da un punto di vista matematico abbiamo ottenuto un’equivalenza tra un’equazione differenziale alle derivate parziali in n + 1 variabili del primo ordine e
2n equazioni differenziali ordinarie del primo ordine. Questa equivalenza può
essere, nel nostro caso, imputata al fatto che sia l’equazione di Hamilton-Jacobi
sia le equazioni di Hamilton derivano dal medesimo principio di Hamilton modificato. Possiamo ora cercare di comprendere il significato fisico della funzione
generatrice del secondo tipo S. Osserviamo che, essendo α quantità costanti,
dS(q, α, t)
=
dt
∂S
∑ ∂qi q̇i +
i
∂S
.
∂t
(4.45)
Se teniamo presenti le (4.42), la (4.45) diventa:
dS(q, α, t)
=
dt
∑ pi q̇i +
i
∂S
=
∂t
∑ pi q̇i − H
(4.46)
i
dove abbiamo tenuto conto della (4.39). Balza evidente dalla (4.46) e da quanto
detto sul principio di Hamilton modificato che S rappresenti (a meno di costanti
additive) l’azione.
Vediamo un caso particolare. Supponiamo che H non dipenda esplicitamente
dal tempo. Allora la funzione principale di Hamilton deve avere la seguente
struttura:
S(q, α, t) = W (q, α) − at
(4.47)
dove W (q, α) è detta funzione caratteristica di Hamilton. Osserviamo che
pi =
Allora
4.8
dW
dt
∂S
∂W
=
.
∂qi
∂qi
=
∂W
∂qi q̇i
= pi q̇i e quindi W =
R
pi dqi .
variabili angolo-azione nel caso unidimensionale
Sia H(q, p) l’hamiltoniana nel nostro sistema ad un solo grado di libertà, con (q, p)
coordinate canoniche.
Supponiamo che il sistema abbia un moto periodico e che esista una trasformazione canonica (indipendente dal tempo) (q, p) → (ψ, J ), indotta da una funzione generatrice di tipo 1 F1 (q, ψ) indipendente dal tempo, in modo tale che ψ
sia ciclica6 . Ovviamente il nuovo momento coniugato J è una costante del mo∂H ( J )
to e H = H( J ). Abbiamo, per la prima equazione di Hamilton, ψ̇ = ∂J = ω
(costante), da cui ψ(t) = ωt + ψ0 .
6 Ricordiamo che l’hamiltoniana non cambia, cioé K = H.
56
4.8 variabili angolo-azione nel caso unidimensionale
Poiché, per ipotesi, il moto è periodico, le coordiante canoniche q e p saranno
funzioni periodiche. Avremo come conseguenza che il moto deve essere periodico
in ψ. Assumiamo che il periodo sia 2π. La nuova coordinata generalizzata ψ
è detta variabile angolo, mentre J è detta variabile azione ed assume il ruolo di
momento angolare. Per quanto detto, F1 (q, ψ) deve essere periodica rispetto a ψ
di periodo 2π:
dF1 =
∂F1
∂F1
dq +
dψ = pdq − Jdψ.
∂q
∂ψ
Dopo un periodo, F1 torna al valore iniziale e ψ consegue una variazione di 2π.
0=
I
dF1 =
I
pdq − J
Z 2π
0
dψ =
I
pdq − 2π J ⇒ J =
1
2π
I
pdq.
Questa relazione può essere presa proprio come definizione della variabile azione.
4.8.1 Esempio: l’oscillatore armonico unidimensionale
L’oscillatore armonico unidimensionale ha hamiltoniana
H=
1 2 1 2
p + kq ,
2m
2
dove m è la massa della particella e k > 0 è una costante. Possiamo porre ω 2 =
e riscrivere l’hamiltoniana:
H=
k
m
1 2 1 2 2
p + ω mq = E
2m
2
E è costante e il suo valore è fissato dalle condizioni iniziali. Pertanto:
q
p = 2mE − m2 ω 2 q2
F1 (q, ψ) =
=
Z
Per calcolare I =
√
dF1 =
Z q
Z
pdq − J
Z
dψ =
2mE − m2 ω 2 q2 dq − J
Rp
Z
dψ.
2mE − m2 ω 2 q2 dq, poniamo sin θ =
pm
2E ωq.
Allora
Z r
Z
mω 2 q2
2E
E
sin 2θ
2
I = 2mE
1−
dq =
cos θdθ =
θ+
,
2E
ω
ω
2
pm
dove ovviamente
θH= arcsin
2E ωq . Osserviamo che in questi casi abbiamo
H
1
1
J = 2π
pdq = 2π
pdq = ωE , cioé E = Jω. In base poi al calcolo di I possiamo
scrivere esplicitamente F1 (q, ψ) in funzione di θ e ψ, cioé:
E
sin 2θ
F1 =
θ+
− Jψ.
ω
2
57
formalismo hamiltoniano
Poiché F1 deve essere una funzione periodica, ωE θ − Jψ = J (θ − ψ) = 0 cioé θ = ψ.
pm
ωq,
In base a quest’ultimo risultato, F1 = ωE sin ψ cos ψ. Poiché sin θ = sin ψ = 2E
E=
mω 2 q2
sinψ
e, in definitiva,
F1 (q, ψ) =
1
mωq2 cot ψ.
2
Allora
p=
∂F1
= mωq cot ψ
∂q
J =−
1 ωq2
∂F1
= m 2
∂ψ
2 sin ψ
1
= mωq2 (1 + cot2 ψ)
2
1
1 p2
E
= mωq2 +
= .
2
2 mω
ω
In conclusione
(
p
ψ = arccot mωq
J = 21 mωq2 +
58
2
1 p
2 mω
.
BIBLIOGRAFIA
[1] H. Goldstein, C. Poole, J. Safko: Meccanica Classica, Zanichelli, II edizione.
[2] L. D. Landau, E. M. Lifsič: Meccanica, Editori riuniti.
[3] V. I. Arnold: Metodi matematici della meccanica classica, Editori riuniti.
[4] M. Anselmino, S. Costa, E. Predazzi: Origine classica della fisica moderna,
Levrotto & Bella (contenente una trattazione su tutti gli argomenti del corso).
[5] A. Fasano, S. Marmi: Meccanica analitica, Bollati Boringhieri.
59
Parte II
R E L AT I V I TÀ R I S T R E T TA E I N T R O D U Z I O N E A L L A
MECCANICA QUANTISTICA
5
R E L AT I V I TÀ S P E C I A L E
Avvertenza! In questo capitolo indicheremo i tensori in grassetto, v, mentre i vettori saranno
indicati secondo la notazione ~v.
5.1
trasformazioni di lorentz
5.1.1 Premessa
Le equazioni di Maxwell, che hanno permesso di unificare sia i campi elettrici e magnetici sia l’ottica geometrica, non sono invarianti per trasformazioni di
Galileo. Premettiamo due semplici considerazioni.
• Nelle equazioni compare esplicitamente la velocità di propagazione dei segnali elettromagnetici: c = e01µ0 . Secondo il principio di relatività di Galileo
passando da un sistema di riferimento inerziale ad un altro le velocità si
sommano come vettori, dunque la velocità di un segnale luminoso dipende
dal sistema di riferimento inerziale e sarà diversa al cambiare del sistema.
La spiegazione che si dette sulla comparsa del modulo della velocità di un
segnale elettromagnetico nelle equazioni si basò sull’esistenza di un mezzo
(estremamente rigido e rarefatto) le cui deformazioni dovrebbero corrispondere ai campi elettromagnetici. Il mezzo come sappiamo fu chiamato etere e
si pose il problema di individuare il sistema di riferimento ad esso solidale.
Le equazioni di Maxwell, così come formulate, dovevano essere valide in
tale sistema di riferimento.
• La presenza di asimmetrie in alcuni fenomeni elettromagnetici, quando si
passa da un sistema di riferimento inerziale ad un altro, non trova una spiegazione nell’ambito della teoria della relatività di Galileo. Ad esempio, una
carica puntiforme q ferma in un sistema di riferimento inerziale genera un
campo elettrostatico, ma la stessa carica per un altro sistema di riferimento
inerziale è in moto e genera anche un campo magnetico.
Inoltre l’esperimento di Michelson e Morley dimostrò, senza ombra di dubbio,
che l’etere non esiste e che la velocità della luce (nel vuoto) non dipende dalla
velocità della sorgente.
5.1.2 Concetto di evento
L’idea che è alla base della teoria della relatività è di decomporre tutto ciò che
accade in eventi. Un evento rappresenta la minima determinazione possibile, individuata dall’assegnazione di tre coordinate spaziali ed una temporale. In altre
63
relatività speciale
parole, un evento è un qualcosa che accade in un dato punto dello spazio in un
particolare istante di tempo. Se abbiamo un sistema di assi cartesiani Oxyz, un
evento è una quaterna di numeri ( x, y, z, t). Tutto ciò che accade deve ammettere
una descrizione in termini di relazioni o coincidenze tra eventi. L’insieme degli
eventi costituisce lo spaziotempo.
5.1.3 Principio di inerzia
Postuliamo l’esistenza di una particolare classe di sistemi di riferimento, rispetto
ad ognuno dei quali tutti i punti materiali isolati o sono fermi o si muovono con
velocità vettoriale costante. Questi sistemi di riferimento sono detti, come ben
sappiamo, inerziali.
Dobbiamo altresì assumere (per misurare lunghezze e intervalli di tempo) che
si abbia una classe di regoli rigidi ideali ed una classe di orologi ideali. Due regoli
ideali hanno la proprietà di essere della medesima lunghezza se sono in quiete,
indipendentemente dalla loro storia passata. Analogamente, due orologi ideali
battono il tempo nello stesso modo se sono in quiete, a prescindere dalla loro
storia passata. Noi supporremo che in ogni luogo di un sistema di riferimento vi
sia un orologio in quiete. Il grosso problema è quello di sincronizzare tutti questi
orologi ideali. Un modo per sincronizzare due orologi, uno posto in A e l’altro
posto in B 6≡ A, solidali con il nostro sistema di riferimento inerziale, può essere
il seguente: lanciamo da A verso B un segnale elettromagnetico (supposta nota la
velocità della luce1 ), sincronizziamo l’orologio in B con quello in A tenendo conto
della distanza tra A e B e del tempo impiegato dal segnale a raggiungere B.
Noi affrontiamo lo studio della cosiddetta Relatività Ristretta o Speciale, che
si occupa del rapporto esistente fra la descrizione dei fenomeni fisici compiute da
osservatori solidali con sistemi di riferimento inerziali. La Relatività Generale
avrà lo scopo di estendere lo studio ad osservatori non inerziali.
5.1.4 Postulati della Relatività Ristretta e trasformazioni di Lorentz
Oltre al principio d’inerzia, alla base della relatività ristretta vi sono due postulati:
Primo postulato: principio di relatività - Le leggi della Fisica sono le stesse in
tutti i riferimenti inerziali.
Secondo postulato: costanza della velocità della luce - La velocità della luce
nel vuoto assume lo stesso valore, indipendentemente dalla direzione, in tutti i sistemi di
riferimento inerziali.
Vediamo, ora, come ottenere le trasformazioni di Lorentz utilizzando i postulati
della relatività ristretta, supponendo che il tempo sia omogeneo e che lo spazio sia
omogeneo e isotropo. Supponiamo di avere due sistemi di riferimento inerziali
1 Per misurare la velocità del segnale può essere usato un solo orologio, sempre che il percorso
seguito dal segnale sia chiuso.
64
5.1 trasformazioni di lorentz
Figura 7.:
Rappresentazione dei sistemi di riferimento in esame.
S(Oxyz) e S0 (O0 x 0 y0 z0 ), il quale si muove rispetto al primo con velocità costante v
diretta lungo la direzione positiva delle x in modo che x ≡ x 0 (vedi figura 7). Un
evento è caratterizzato in S dalle coordinate spaziotemporali ( x, y, z, t). Lo stesso
evento avrà in S0 coordinate spaziotemporali ( x 0 , y0 , z0 , t0 ). Cerchiamo le relazioni
x 0 = x 0 ( x, y, z, t),
y0 = y0 ( x, y, z, t),
z0 = z0 ( x, y, z, t),
(5.1)
t0 = t0 ( x, y, z, t),
sulla base dei due postulati. Supponiamo che si sia proceduto a sincronizzare gli
orologi in ognuno dei due sistemi di riferimento inerziali e che quando O0 ≡ O,
t = t0 = 0 (è il modo più semplice di sincronizzare due orologi2 uno solidale con
S, l’altro solidale con S0 ). Osserviamo che poiché lo spazio è isotropo abbiamo potuto scegliere, assolutamente in generalità, i due sistemi inerziali come precisato
sopra. Una prima osservazione: l’ipotesi di omogeneità dello spazio e del tempo
richiede che le (5.1) siano lineari. Altre osservazioni:
1. Poiché continuamente l’asse x coincide con l’asse x 0 , o in modo equivalente
0
y=0
y =0
⇔
, y0 e z0 sono espressi mediante una combinazione
z=0
z0 = 0
lineare di y e z.
2. Il piano x − y (caratterizzato dall’equazione z = 0) si deve trasformare nel
piano x 0 − y0 (cioè z0 = 0); analogamente il piano x − z (caratterizzato dall’equazione y = 0) si deve trasformare nel piano x 0 − z0 (cioè y0 = 0). Allora y0
dev’essere proporzionale solo ad y e z0 deve essere proporzionale solo a z.
3. Si può far vedere che un’asta posta lungo l’asse y solidale con S deve avere
la stessa lunghezza in S0 ; ciò comporta che y0 = y. Analogamente si prova
che z0 = z.
4. Per ragioni di simmetria t0 non può dipendere linearmente né da y né da z.
Altrimenti, ad esempio, due orologi, fermi in S, uno posto sull’asse delle y
2 Non è assolutamente detto che due orologi, uno solidale con S e l’altro con S0 , battano il tempo allo
stesso modo.
65
relatività speciale
in y = +1 e l’altro posto sullo stesso asse in y = −1, sarebbero in disaccordo
osservati da S0 . Questo fatto sarebbe in contrasto con l’ipotesi di isotropia
dello spazio.
5. Poiché il punto O0 ed ogni altro punto del piano y0 − z0 ha rispetto ad S
equazione oraria x = vt, allora x 0 , nella trasformazione cercata, deve essere
proporzionale a x = vt.
Le considerazioni precedenti portano a dire che le trasformazioni (5.1) devono
essere, in particolare, del tipo:
x 0 = γ( x − vt),
(5.2a)
0
y = y,
(5.2b)
z0 = z,
(5.2c)
0
t = ax + bt.
(5.2d)
Il nostro scopo è ora quello di determinare le costanti γ, a e b utilizzando il secondo postulato della relatività. Supponiamo che, quando O ≡ O0 , cioè al tempo
t = t0 = 0, un’onda elettromagnetica sferica venga emessa da O ≡ O0 . In base
al secondo postulato della relatività l’onda elettromagnetica si propaga in tutte le
direzioni con velocità c (velocità della luce nel vuoto) sia in S sia in S0 . Consideriamo allora un punto del fronte d’onda ( x, y, z) al tempo t in S. Le coordinate
spaziotemporali ( x, y, z, t), che definiscono l’evento in S, dovranno soddisfare la
seguente relazione:
x 2 + y2 + z2 = c2 t2 .
(5.3)
Lo stesso evento in S0 avrà coordinate spaziotemporali ( x 0 , y0 , z0 , t0 ), che, per quanto detto, dovranno essere legate dalla relazione:
x 02 + y 02 + z 02 = c 2 t 02 .
(5.4)
Ponendo le (5.2) nella (5.4), otteniamo:
γ2 ( x − vt)2 + y2 + z2 = c2 ( ax + bt)2
2
2 2
2
2
2
2
2
2 2
2 2
(5.5)
2
(γ − c a ) x + y + z − 2xt(γ v + c ab) = (c b − γ v )t .
La relazione (5.6) deve coincidere con la (5.3) per ogni x, y, z, t. Si ha, allora,

2
2 2


γ − c a = 1
γ2 v + c2 ab = 0


 c2 b2 − γ2 v2 = c2
.
Tenendo presente che se v = 0, b = 1 dalle (5.7) otteniamo:

1


γ= q


2


1 − vc2
.
v

a
=
−
γ

2

c


b = γ
66
(5.6)
(5.7)
(5.8)
5.1 trasformazioni di lorentz
In conclusione le trasformazioni di Lorentz sono le seguenti:
x 0 = γ( x − vt),
0
y = y,
(5.9a)
(5.9b)
0
z = z,
(5.9c)
v 0
t = γ t− 2x ,
c
(5.9d)
con
γ= q
1
1−
v2
c2
.
(5.10)
Dalle (5.9) è facile ricavare le trasformazioni inverse
x = γ( x 0 + vt),
(5.11a)
0
(5.11b)
0
(5.11c)
y=y,
z=z,
v t = γ t0 + 2 x .
c
(5.11d)
Notiamo che se v c, allora γ ≈ 1 ed inoltre dalle (5.11) si riottengono le
trasformazioni di Galileo. Siano ( x, y, z, t) le coordinate spaziotemporali in S di
un evento e siano ( x 0 , y0 , z0 , t0 ) le coordinate spaziotemporali in S0 dello stesso
evento. Notiamo che:
v 2
c2 t02 − x 02 − y02 − z02 = c2 γ2 t − 2 x − γ2 ( x − vt)2 − y2 − z2
c
2 2
2
= c t − x − y2 − z2 .
Allora c2 t2 − x2 − y2 − z2 (che, come vedremo tra poco, può essere riguardato
come la distanza al quadrato nello spaziotempo fra il nostro evento e l’evento
di coordinate (0, 0, 0, 0)) è una quantità scalare invariante per trasformazioni di
Lorentz.
v
Poniamo x0 = ct e sinh χ = q c v2 = βγ, con β = vc . Si ha ovviamente cosh χ =
1− 2
c
q
2
1 + sinh χ = γ. Allora le trasformazioni di Lorentz (relativamente alle due
coordinate che cambiano) posson essere scritte anche nel modo seguente:
x00 = cosh χx0 − sinh χx,
0
x = cosh χx − sinh χx0 .
(5.12a)
(5.12b)
Da queste relazioni si evidenzia una certa analogia con le rotazioni in due dimensioni:
x 0 = cos θx − sin θy,
y0 = sin θx + cos θy.
67
relatività speciale
Questa analogia si estende al fatto che, mentre le rotazioni conservano le lunghezze x2 + y2 , le (5.12) conservano la quantità x02 − x2 , che, come abbiamo accennato,
rappresenta ancora una “distanza al quadrato” nello spaziotempo. Le trasformazioni di Lorentz, come si evince dalla (5.12), possono allora esere considerate come
“rotazioni generalizzate” nello spaziotempo. Supponiamo di avere un evento A
definito da ( x A , y A , z A , t A ) e un evento B definito da ( x B , y B , z B , t B ) nel sistema
di riferimento inerziale S. Possiamo definire il quadrato della distanza tra i due
eventi nel modo seguente:
∆s2 = c2 (t B − t A )2 − ( x B − x A )2 − (y B − y A )2 − (z B − z A )2
= c2 ∆t2 − ∆x2 − ∆y2 − ∆z2
(5.13)
dove, ovviamente, ∆t2 rappresenta l’intervallo temporale tra i due eventi al quadrato e ∆x2 + ∆y2 + ∆z2 l’intervallo spaziale al quadrato. Nel sistema S0 la distanza al quadrato tra i due eventi è data da ∆s02 = c2 ∆t02 − ∆x 02 − ∆y02 − ∆z02 , con
∆t0 = t0B − t0A , ∆x 0 = x 0B − x 0A , ∆y0 = y0B − y0A , ∆z0 = z0B − z0A . Si può agevolmente
dimostrare che ∆s2 = ∆s02 . Possiamo riscrivere la (5.13) in forma differenziale
ds2 = c2 dt2 − dx2 − dy2 − dz2 .
Il fatto che le coordinate spaziali e quelle temporali abbiano segni opposti nella
definizione di distanza al quadrato tra due eventi è una caratteristica dello spaziotempo. Osserviamo che per un segnale luminoso ds2 = 0. Se una particella
si muove con velocità inferiore alla velocità della luce, si ha ds2 > 0 e, quindi ds
è reale. In tal caso si dice che l’intervallo è di genere tempo. Se invece ds2 < 0
l’intervallo è detto di genere spazio. Gli intervalli per i quali ds2 = 0 si dicono di
tipo luce.
Tardioni si dicono i punti materiali che si muovono con velocità inferiore a quella
della luce, tachioni i corpi (immaginari) che si muovono con velocità superiore a
quella della luce. I corpi che si muovono alla velocità della luce si dicono di tipo
luce.
Osserviamo che due eventi separati da un intervallo di tipo tempo non possono
mai essere simultanei, cioè non esiste un sistema di riferimento in cui tali eventi
risultino simultanei. Invece è possibile trovare un sistema di riferimento in cui
i due eventi si verifichino nello stesso luogo, cioè l’intervallo spaziale tra i due
eventi sia nullo.
In relazione ad un determinato sistema di riferimento inerziale S, possiamo rappresentare gli eventi associando agli assi cartesiani x, y, z un quarto asse, quello
del tempo. Per facilitare la visualizzazione consideriamo un solo asse spaziale,
quello delle x (figura 8). Gli assi x e ct sono assunti ortogonali; si tratta di una
scelta di pura convenienza. Fatta questa scelta, in un altro sistema di riferimento
inerziale S0 , che si muove rispetto ad S con velocità costante diretta lungo la direzione positiva dell’asse x, x 0 e ct0 non sono più ortogonali. Il punto O rappresenta
l’evento (0, 0). Il moto rettilineo uniforme di una particella con velocità V < c,
passante per x = 0 al tempo t = 0, è rappresentato da una retta passante per O e
formante con l’asse ct un angolo inferiore a π4 . Le due rette limite rappresentano
la propagazione di segnali che viaggiano alla velocità della luce.
68
5.1 trasformazioni di lorentz
Figura 8.:
Diagramma di Minkowski: a sinistra considerando una sola dimensione
spaziale, a destra considerate due dimensioni spaziali.
All’interno della regione (cono) aOc abbiamo c2 t2 − x2 > 0, cioè l’intervallo tra
l’evento ( x, t) e l’evento (0, 0) è di tipo tempo. In tale regione t > 0, cioè ogni
evento ha luogo dopo l’evento O. Poiché due eventi, separati da un intervallo di
tipo tempo, non possono mai essere simultanei in alcun riferimento inerziale, non
è possibile scegliere un sistema di riferimento in cui un arbitrario evento, posto
all’interno della regione aOc, abbia luogo prima di O, cioè avvenga al tempo
t < 0. Tutti gli eventi all’interno di aOc sono, allora, posteriori ad O, fanno cioè
parte della regione del futuro assoluto (la quale, nel caso si consideri più di una
dimensione spaziale, è un cono o un ipercono, detto appunto cono del futuro).
Nello stesso modo si può far vedere che ogni evento posto in dOb avviene prima
dell’evento O, e questo è vero in qualunque riferimento inerziale. La regione dOb
è detta appunto del passato assoluto (cono del passato).
Sottolineiamo che gli eventi posti nel passato e nel futuro possono essere messi
in relazione causale con l’evento O.
Gli eventi all’interno delle regioni aOd e cOb sono separati dall’evento O da un
intervallo di tipo spazio. Se D è un evento in tali regioni, si può sempre trovare
un riferimento inerziale in cui D ed O sono simultanei, anche se non possono mai
avvenire nello stesso luogo per alcun riferimento. Esistono sistemi di riferimento
in cui D avviene prima di O e altri in cui avviene dopo. La regione tra il cono del
futuro e il cono del passato è indicata come il presente di O (o anche come l’altrove
assoluto di O, perché, come abbiamo detto, in nessun sistema di riferimento un
evento, che appartiene a questa regione, e l’evento O possono verificarsi nello
stesso luogo).
Gli eventi posti lungo le bisettrici appartengono al cono-luce e sono connessi
per l’appunto all’evento O da segnali luminosi.
Riassumendo in relatività
• il futuro è individuato dagli eventi che soddisfano la relazione ct > | x |;
• il presente è individuato dagli eventi che soddisfano la relazione |ct| < | x |;
• il passato è individuato dagli eventi che soddisfano la relazione −ct > | x |.
69
relatività speciale
Notiamo che nell’ambito della fisica non relativistica (o newtoniana) rispetto ad
O
• il futuro si ha per t > 0;
• il presente si ha per t = 0;
• il passato si ha per t < 0.
Infine osserviamo che il ragionamento svolto per l’evento O si può ripetere per
ogni altro evento. Questo vuol dire che ad ogni evento possiamo associare un
cono del futuro ed un cono del passato.
5.2
alcune conseguenze delle trasformazioni di lorentz
5.2.1 Legge di trasformazione delle velocità
Tra le conseguenze principali delle trasformazioni di Lorentz vi è una diversa legge di trasformazione della velocità rispetto a quella prevista dalle trasformazioni
galileiane. Dovremo, ovviamente, ritrovare che la velocità della luce (nel vuoto)
è un invariante relativistico, cioè ha lo stesso valore in tutti i sistemi di riferimento inerziali. Consideriamo i sistemi di riferimento inerziali S ed S0 già visti. Le
componenti3 del vettore velocità di una particella rispetto ad S sono:
dx (t)
dy(t)
Vy =
dt
dt
Le corrispondenti componenti rispetto ad S0 saranno
Vx =
dx 0 (t0 )
dy0 (t0 )
0
V
=
y
dt0
dt0
Dalle trasformazioni di Lorentz si ottiene:
Vx0 =
Vz =
dz(t)
.
dt
Vz0 =
dz0 (t0 )
.
dt0
dx = γ(dx 0 + vdt0 ) = γ(Vx0 + v)dt0 ,
dy = dy0 = Vy0 dt0 ,
dz = dz0 = Vz0 dt0 ,
v
v dt = γ dt0 + 2 dx 0 = γ 1 + 2 Vx0 dt0 .
c
c
Da queste relazioni ricaviamo:
Vx =
dx
V0 + v
= x v 0,
dt
1 + c2 Vx
(5.14a)
Vy =
Vy0
dy
1
=
,
dt
γ 1 + cv2 Vx0
(5.14b)
Vz =
1
Vz0
dz
=
.
dt
γ 1 + cv2 Vx0
(5.14c)
(5.14d)
3 Supponiamo assegnata in S la legge oraria della particella ( x (t), y(t), z(t)) e la corrispondente legge
oraria in S0 ( x 0 (t0 ), y0 (t0 ), z0 (t0 )).
70
5.2 alcune conseguenze delle trasformazioni di lorentz
Osserviamo che se c → +∞, allora γ = 1 (o anche se
Vx = Vx0 + v
v
c
Vy = Vy0
1, allora γ ≈ 1) e
Vz = Vz0 .
cioè otteniamo la trasformazione galileiana della velocità. Facilmente si ottiene
dalle (5.14) la trasformazione inversa:
Vx − v
,
1 − cv2 Vx
Vy
1
,
Vy0 =
γ 1 − cv2 Vx
1
Vz
Vz0 =
.
γ 1 − cv2 Vx
Vx0 =
Ricordiamo che γ =
(5.15a)
(5.15b)
(5.15c)
q 1
2
1− v2
= √1
1− β2
c
, dove β = vc . Osserviamo che
lim γ( β) = +∞.
lim γ( β) = 1,
β → 1−
β → 0+
Se Vy0 = Vz0 = 0 e Vx0 = V 0 , allora dalle (5.14) otteniamo
Vx = V =
V0 + v
,
1 + cv2 V 0
Vy = 0,
Vz = 0.
Se V 0 = c (velocità della luce nel vuoto) allora dalla precedente si ha V = c.
Inoltre sempre dalla precedente se 0 < V 0 < c, allora 0 < V < c (e viceversa)4 .
Esercizio
2
2
2
Dimostrare che, se v0 x + v0 y + v0 z = c2 , allora v2x + v2y + v2z = c2 e viceversa.
5.2.2 Contrazione delle lunghezze
Si chiama lunghezza propria di un’asta la sua lunghezza in un sistema di riferimento in cui è in quiete. Supponiamo di avere un’asta rigida in quiete in S e posta
lungo l’asse x. Se le sue estremità sono nei punti di coordinata x1 e x2 > x1 , la
sua lunghezza propria è ovviamente data da:
l0 = x 2 − x 1 .
Per misurare la lunghezza dell’asta nel sistema di riferimento S0 , che si muove rispetto ad S con una velocità v diretta lungo la direzione positiva dell’asse x, basta
avere le coordinate degli estremi dell’asta nello stesso istante di tempo e dunque
valutare gli eventi ( x10 , t10 ) e ( x20 , t20 ) con t10 = t20 . I due eventi sono simultanei in
S0 ma non in S. Naturalmente, per misurare la lunghezza propria in S possiamo
determinare gli estremi dell’asta in tempi diversi ed abitrari. Sappiamo che
x = γ( x 0 + vt0 )
4 Noi supponiamo che v ∈ (0, c).
71
relatività speciale
e, quindi,
x1 = γ( x10 + vt10 )
x2 =
γ( x20
+ vt10 )
⇒ x2 − x1 = γ( x20 − x10 ).
Chiamata l la lunghezza dell’asta in S0 , avremo allora
r
v2
l0 = γl ⇔ l = 1 − 2 l0 < l0 .
c
(5.16)
Il sistema S0 , che è in moto rispetto all’asta, misura, pertanto, una lunghezza minore della lunghezza propria dell’asta. Questo fenomeno è noto come contrazione
delle lunghezze.
Esercizio
La lunghezza dell’asta rispetto al sistema di riferimento S0 può essere determinata considerando i suoi estremi nella stessa posizione in tempi diversi? In caso
affermativo, qual è la relazione tra questa lunghezza dell’asta e la sua lunghezza
a riposo?
5.2.3 Dilatazione dei tempi
La dilatazione dei tempi è una delle conseguenze più straordinarie della relatività
ristretta. Consideriamo due sistemi di riferimento inerziali S e S0 come in figura
7 e supponiamo che un orologio, a riposo nel sistema di riferimento inerziale S0 ,
misuri in uno stesso punto dello spazio x00 un intervallo temporale tra due eventi
A : ( x00 , t0A ) e B : ( x00 , t0B ), con t B > t A . L’intervallo temporale tra i due eventi
∆τ = t0B − t0A è detto tempo proprio. La loro distanza è ovviamente di tipo tempo.
Nel sistema S i due eventi A e B hanno le seguenti coordinate spaziotemporali:
x A = γ( x00 + vt0A ),
v t A = γ t0A + 2 x00 ,
c
x B = γ( x00 + vt0B ),
v t B = γ t0B + 2 x00 .
c
Allora
∆t = t B − t A = γ∆τ > ∆τ,
(5.17)
cioè l’intervallo di tempo tra i due eventi, misurato in S, risulta maggiore dell’intervallo di tempo proprio. Questo risultato ci dice che l’orologio mobile rispetto
ad S ha una frequenza minore. Possiamo, in altre parole, affermare che la frequenza di un orologio mobile rallenta rispetto a quella di un orologio fermo. Notiamo
che in S0 i due eventi avvengono nello stesso luogo ed il loro intervallo temporale
è misurato da un solo orologio posto in quel punto (intervallo di tempo proprio),
mentre nell’altro sistema di riferimento S i due eventi si verificano in punti diversi dello spazio ed occorrono due orologi per misurare il loro intervallo di tempo
(non proprio).
72
5.3 lo spazio di minkowski
Vediamo di capire meglio con un esempio. Supponiamo che in S0 una sorgente
luminosa posta nell’origine emetta al tempo t0 = 0 un raggio di luce in direzione dell’asse y0 e che uno specchio, posto a distanza L, rifletta il raggio di luce
facendolo tornare in O0 (figura a)
Ovviamente avremo ∆τ = 2L
c . Questo è il tempo complessivo che il raggio di
luce impiega per tornare in O0 nel sistema S0 . L’intervallo di tempo trovato è,
naturalmente, proprio. Vediamo ora quale ragionamento fa il sistema S, supponendo che al tempo t = t0 = 0 (quando viene emesso il raggio di luce) O ≡ O0 .
Lo specchio è solidale con S0 che si muove con velocità v nella direzione positiva
dell’asse delle x. Il raggio luminoso avrà in S una traiettoria come quella in figura
in b. Il sistema S ha bisogno di due orologi, uno in O l’altro in R (ovviamente sincronizzati) per valutare l’intervallo temporale ∆t, che il raggio luminoso impiega
per tornare sull’asse delle x. Tenendo presente la figura precedente in b si ottiene
facilmente:
c∆t
2
2
=
v∆t
2
2
+ L2 ,
c2 ∆t2 = v2 ∆t2 + 4L2 ,
∆t = q
2 Lc
1−
v2
c2
= γ∆τ.
Ritroviamo, cioè, nell’esempio specifico, la formula (5.17) relativa alla dilatazione
dei tempi.
5.3
lo spazio di minkowski
In maniera molto sintetica possiamo dire che lo spazio vettoriale di Minkowski,
M, è lo spaziotempo. Un punto di tale spazio è, come abbiamo già avuto modo
di dire, un evento.
Le coordinate di un punto-evento, in un sistema di riferimento S, possono essere definite come ( x0 , x1 , x2 , x3 ) = (ct, x, y, z) (notare che tutte le componenti hanno
le dimensioni di una lunghezza). Le coordinate x µ (µ = 0, 1, 2, 3), con la conven-
73
relatività speciale
zione dell’indice in alto, sono dette controvarianti e si trasformano passando da un
sistema S ad uno S0 nel solito modo:
x 00
x 01
x 02
x 03
= γ( x0 − βx1 ),
= γ( x1 − βx0 ),
= x2 ,
= x3 .
(5.18)
Le precedenti possono essere scritte anche in forma matriciale, adoperando la
notazione di Einstein:
x 0µ = Λν x ν
µ
(5.19)
dove
γ
− βγ

− βγ
γ
µ
Λ = (Λν ) = 
 0
0
0
0

0
0
1
0

0
0 
.
0 
1
Il punto evento { x µ } è anche detto quadrivettore controvariante perché obbedisce
µ
alle (5.19). Ricordiamo che in Λν si indica l’elemento alla µ-esima riga e ν-esima
colonna.
Abbiamo già visto che la distanza al quadrato tra l’evento { x µ } e l’evento
O(0, 0, 0, 0) è definita come s2 = ( x0 )2 − ( x1 )2 − ( x2 )2 − ( x3 )2 . Tale quantità, come ben sappiamo, è un invariante relativistico: assume lo stesso valore in tutti
i riferimenti inerziali. Se introduciamo la seguente matrice, detta tensore metrico
covariante


1 0
0
0
 0 −1 0
0 

g = ( gµν ) = 
 0 0 −1 0 
0
0
0
−1
allora s2 = gµν x µ x ν . Tramite il tensore metrico gµν viene introdotta una distanza
al quadrato s2 tra l’evento { x µ } e l’evento O(0, 0, 0, 0), la quale è una forma quadratica maggiore, uguale o minore di 0. Lo spazio di Minkowski viene dotato di
una metrica pseudoeuclidea. Notiamo che la quantità gµν x µ x ν può essere riguardata
anche come un prodotto scalare, con l’avvertenza che gµν x µ x ν = 0 ; x µ = 0 per
µ = 0, 1, 2, 3. Il nostro tensore metrico è come si vede lo stesso in ogni punto
dello spazio di Minkowski, proprietà che non sarà valida in relatività generale.
Possiamo introdurre le coordinate covarianti di un punto evento
xµ0 = gµν x ν
(5.20)
cioè ( x0 , x1 , x2 , x3 ) = ( x0 , − x1 , − x2 , − x3 ). Allora s2 = gµν x µ x ν = xν x ν . Dalle
relazioni (5.18) si ottiene facilmente:
x00
x10
x20
x30
74
= γ( x0 + βx1 ),
= γ( x1 + βx0 ),
= x2 ,
= x3 .
(5.21)
5.3 lo spazio di minkowski
Queste relazioni possono essere scritte in forma matriciale nel modo seguente:
xµ0 = (Λ−1 )νµ xν
(5.22)
dove

γ βγ 0 0
 βγ γ 0 0 
.
=
 0
0 1 0 
0
0 0 1

Λ −1
Si dice che { xµ } è un quadrivettore covariante se obbedisce alle (5.22). Il tensore metrico controvariante è definito nel modo seguente: ( gµν ) = g−1 . Osserviamo che in
M abbiamo g = g−1 . Chiaramente vale la relazione: gµν gνλ = δµλ (simbolo di Kronecker). Se con ∆x µ indichiamo la variazione tra le coordinate omologhe controvarianti di due eventi, la distanza al quadrato tra questi due eventi è naturalmente
data da: ∆s2 = gµν ∆x µ ∆x ν . Possiamo dare una versione infinitesima della metrica se prendiamo due eventi “molto vicini tra loro”: ds2 = gµν dx µ dx ν = dxν dx ν .
Questa forma quadratica differenziale dà ovviamente la metrica5 di M. Notiamo
µ
che dalla (5.19) dx 0µ = Λν dx ν ed essendo
dx 0µ =
∂x 0µ ν
dx
∂x ν
si ha:
Λν =
µ
∂x 0µ
.
∂x ν
Una quaterna ( A0 , A1 , A2 , A3 ) si dice che è un quadrivettore controvariante se
ogni componente Aµ si trasforma per effetto di una trasformazione di Lorentz nel
modo seguente:
A0µ = Λν Aν
µ
cioè nello stesso modo delle coordinate controvarianti di un punto evento. Osserviamo che, se Aν = Aν (x), allora A0ν = A0ν (x0 ). Un quadrivettore covariante
{ Aµ } è un insieme di quattro quantità ( A0 , A1 , A2 , A3 ) che, per effetto di una trasformazione di Lorentz, si trasformano come le coordinate covarianti di un punto
evento:
A0µ = Aν (Λ−1 )νµ .
Osserviamo che possiamo ottenere Aµ moltiplicando il corrispondente quadrivettore controvariante per il tensore metrico covariante, ovvero:
Aµ = gµν Aν .
5 Prendendo la forma quadratica differenziale per definire la metrica includiamo anche il caso in cui
il tensore metrico dipende dal punto.
75
relatività speciale
Inversamente si ha Aµ = gµν Aν , dove gµν è il tensore metrico controvariante.
Un quadritensore di rango n completamente controvariante ha la forma T µ1 ,...µn e si
trasforma nel modo seguente:
T 0µ1 ,...µn = Λν11 Λν22 · · · Λνnn T ν1 ,...νn .
µ
µ
µ
Un quadritensore di rango n completamente covariante ha la forma Tµ1 ,...µn e si trasforma nel modo seguente:
Tµ0 1 ,...µn = Tν1 ,...νn (Λ−1 )νµ11 (Λ−1 )νµ22 · · · (Λ−1 )νµnn .
Un quadritensore di rango n p volte controvariante e q volte covariante ha la forma
µ ,...µ
Tν11,...νq p e si trasforma nel modo seguente:
0µ ,...µ
λ ,...λ
p
1
Tν1 ,...ν
= Λλ11 · · · Λλpp (Λ−1 )σν11 · · · (Λ−1 )νqq Tσ11,...σq p .
q
µ
µ
σ
Osserviamo che:
• un quadritensore di rango 1 è un quadrivettore;
• un quadritensore di rango 0 è uno scalare ed è invariante per trasformazioni
di Lorentz (è detto anche scalare di Lorentz).
I quadritensori di rango 2, che hanno, ovviamente, 16 componenti, si trasformano
nel modo seguente:
• tensori completamente controvarianti: T 0µν = Λα Λνβ T αβ ;
µ
0 = ( Λ −1 ) α ( Λ −1 ) T ;
• tensori completamente covarianti: Tµν
ν αβ
µ
β
0µ
• tensori misti: Tν = Λα (Λ−1 )ν Tβα .
µ
β
In generale si dice che il tensore metrico covariante abbassa gli indici, il tensore metrico controvariante li innalza. Un quadritensore di rango 2 T µν si dice
simmetrico se T µν = T νµ ; si dice antisimmetrico se T µν = − T νµ . Un generico
quadritensore può essere sempre scomposto in una parte simmetrica ed una anµν
tisimmetrica. Infatti Ts = 12 ( T µν + T νµ ) è un quadritensore simmetrico, mentre
µν
µν
µν
Ta = 12 ( T µν − T νµ ) è antisimmetrico; infine T µν = Ta + Ts .
Il prodotto scalare tra due quadrivettori A = { Aµ } e B = { Bν } è definito come
A · B = gµν Aµ Bν = A0 B0 − A1 B1 − A2 B2 − A3 B3 . Un quadrivettore A = { Aµ }
si dice di tipo tempo se A · A > 0, di tipo spazio se A · A < 0, di tipo luce se
A · A = 0.
Esercizi
• Dimostrare che, se S( x ) è uno scalare di Lorentz ed è di classe opportuna,
∂S( x )
∂S( x )
allora ∂xµ è un quadrivettore covariante, mentre ∂xµ è un quadrivettore
controvariante.
76
5.4 quadrivelocità e quadriaccelerazione
µ ,...µ
• Dimostrare che, se Tν11,...νq p ( x ) è un tensore p volte controvariante e q volte
µ ,...µ p
controvariante
∂Tν11,...νq ( x )
(di classe opportuna) allora
∂x αµ ,...µ è un tensore p
p
∂Tν11,...νq ( x )
e q + 1 volte covariante, mentre
è un tensore
∂xα
controvariante
volte controvariante e q volte covariante.
volte
p+1
• Dimostrare che gµν è un tensore covariante di rango 2.
• Dimostrare che gµν è un tensore controvariante di rango 2.
5.4
quadrivelocità e quadriaccelerazione
Nella meccanica newtoniana se il moto di una particella è descritto dalla legge
d~r (t)
oraria ~r = ~r (t) (di classe opportuna), la velocità è definita come ~v(t) = dt . In relatività ristretta il tempo è una componente di un quadrivettore e non uno scalare
di Lorentz. Poiché è utile scrivere le equazioni della fisica in modo tale che risultino manifestamente valide in ogni sistema di riferimento inerziale (formulazione
covariante delle leggi della fisica), conviene parametrizzare il moto di una particella massiva, nello spazio di Minkowski, rispetto ad una grandezza che sia uno
scalare di Lorentz. La scelta naturale è l’invariante s, definito da ds2 = gµν dx µ dx ν ,
che può essere chiamato cammino proprio. Avremo allora, in M, la cosiddetta linea
d’universo x µ = x µ (s), che non è altro che una curva (successione di eventi propri
della particella
in
moto). Se, come abbiamo detto, la particella ha massa, allora
2
ds2 = c2 1 − vc2 dt2 > 0 essendo la velocità della particella al tempo6 t |v(t)| < c.
Possiamo scrivere, indicato con τ il tempo proprio e assumendo la convenzione
che s sia crescente al variare del tempo:
r
ds =
1−
v2
cdt = cdτ.
c2
Il quadrivettore velocità (o semplicemente quadrivelocità) controvariante di una
particella massiva, il cui moto in M è descritto dalla linea d’universo x µ = x µ (s),
è definito come7
uµ =
dx µ
dx µ
dx µ
=
=γ
ds
cdτ
cdt
(5.23)
Chiaramente u = {uµ } è un quadrivettore controvariante perché si trasforma
µ
come u0µ = Λν uν . Osserviamo che:
• le componenti della quadrivelocità sono
v
vy vz x
u = γ, γ, γ, γ ;
c
c
c
6 Nel caso di una particella di massa nulla o di un raggio luminoso, poiché ds2 = 0 occorre introdurre
un parametro scalare diverso dal tempo proprio.
µ
µ
7 Alcuni definiscono la quadrivelocità come uµ = c dx
ds . In tal caso u ha le dimensioni di una velocità,
mentre nel nostro caso è adimensionale.
77
relatività speciale
• sussiste la relazione
u · u = gµν u u = γ
µ ν
2
v2
1− 2
c
= 1.
(5.24)
Definiamo la quadriaccelerazione controvariante come:
wµ =
d2 x µ
duµ
=
.
ds
ds2
In base alla (5.24) otteniamo
gµν uµ
duν
= 0 ⇔ gµν uµ wν = 0 ⇔ u · w = 0.
ds
Ovvero quadrivelocità e quadriaccelerazione sono ortogonali.
Le componenti della quadriaccelerazione sono
γ2
~v ·~a,
c3
γ2 i γ2
i
i
w = 2 a + 2 (~v ·~a)v .
c
c
w0 =
(5.25)
con i = 1, 2, 3, ( a1 , a2 , a3 ) = ( a x , ay , az ) e (v1 , v2 , v3 ) = (v x , vy , vz ).
Esercizio
Dimostrare che le componenti della quadriaccelerazione sono quelle espresse
dalla (5.25).
5.5
dinamica relativistica
Si può facilmente constatare che in relatività ristretta, a causa della legge di composizione delle velocità, se il momento di una particella avente massa a riposo
m0 è definito come ~p = m0~v, allora la conservazione del momento di sistemi di
particelle isolati non è più valida in ogni sistema di riferimento inerziale8 . Se richiediamo che la conservazione del momento in sistemi isolati sia una legge della
Fisica, bisogna allora definire in relatività il momento come:
~p = q
m0
1−
v2
c2
~v = m(v)~v
(5.26)
dove
m(v) = q
m0
1−
v2
c2
(5.27)
può essere riguardata come la massa relativistica della particella. Osserviamo che
se vc 1, allora m(v) ≈ m0 e ~p ≈ m0~v, come in meccanica newtoniana.
8 Si veda Charles Kittel et al., La fisica di Berkeley, volume 1 - Meccanica, Zanichelli, pagg. 411-416.
78
5.5 dinamica relativistica
Studi sperimentali hanno mostrato che la ii legge della dinamica continua
ancora a valere, cioè nel caso di una particella:
d~p ~
=F
dt
(5.28)
dove ~p è il momento relativistico ed ~F è la forza totale agente sulla particella.
La (5.28), in base alla (5.26), può essere scritta come
Se
v
c
dm0 γ~v ~
= F.
(5.29)
dt
1 si ottiene la relazione non relativistica. Due osservazioni sulla (5.29):
1. se il modulo della velocità della particella aumenta e si approssima a c, il
termine γ tende a smorzare tale incremento;
2. se richiediamo che la (5.29) sia una legge della Fisica, quando si passa da un
sistema di riferimento inerziale ad un altro, a differenza di quanto avviene
nella meccanica newtoniana, la forza ~F deve cambiare esattamente come
cambia dmdt0 γ~v .
Dalla (5.29) otteniamo
m0 γ~a + m0
dove ~a =
d~v
dt
dγ
~v = ~F
dt
(5.30)
è l’ordinaria accelerazione. Poiché
dγ
dt
=
γ3
~v
c2
·~a, la (5.30) diventa
γ3
(~v ·~a)~v = ~F.
c2
Moltiplicando scalarmente per ~v ambo i membri della precedente si ha:
m0 γ~a + m0
(5.31)
γ3 2
v (~v ·~a) = ~F · ~v
c2
γ2 2
m0 γ(~v ·~a) 1 + 2 v = ~F · ~v
c
m0 γ~v ·~a + m0
m0 γ3~v ·~a = ~F · ~v
essendo 1 +
γ2
c2
(5.32)
v2 = γ2 . Inserendo la (5.32) nella (5.31) otteniamo:
m0 γ~a + (~F · ~v)
1
m0~a =
γ
~v
= ~F
c2
!
~F · ~v
~F −
~v .
c2
(5.33)
Notiamo che se ~F, ~v,~a sono vettori paralleli, allora la (5.33) diventa
m0 γ3~a = ~F
(basta tener conto che in questo caso ~F −
~F ·~v
~v
c2
=
~F
).
γ2
79
relatività speciale
5.6
energia cinetica e momenti
Sia ~F la forza totale agente su una particella di massa a riposo m0 . Vogliamo ora
vedere come determinare l’energia cinetica della particella. L’idea è di partire, in
analogia a quanto avviene in meccanica newtoniana, dalla relazione dT = ~F · d~r,
cioé la variazione infinitesima di energia cinetica, dT, è supposta uguale al lavoro
elementare della forza totale. Teniamo presente che ~F · d~r = ~F · ~vdt = m0 γ3~v ·~adt
in base alla (5.32). Possiamo pertanto scrivere
dT = m0 γ3~v ·~adt = m0 γ3~v · d~v =
Poiché
1
2
R v2
0
1
m0 γ3 dv2 .
2
γ3 (v)dv2 = c2 γ − c2 , abbiamo
m0 c2
− m0 c2
T= q
v2
1 − c2
(5.34)
(notare che nel ricavare la precedente abbiamo supposto nulla la velocità iniziale).
Per vc 1, allora T = 21 m0 v2 + O(v4 ), cioè ritroviamo, al primo ordine, il valore
non relativistico dell’energia cinetica. Dalle (5.34) si deduce che l’energia non è
proporzionale a v2 (come nel caso non relativistico) ed inoltre che limv→c− T =
+∞. Si definisce energia totale della particella la quantità:
E = T + m0 c2 = m0 c2 γ.
Il termine m0 c2 è detto energia a riposo della particella (cioè, se v = 0, E = m0 c2 )
e rappresenta una novità sorprendente ed eccezionale rispetto al caso non relativistico. Esso, in qualche modo, stabilisce un’equivalenza tra massa ed energia
e asserisce che la massa può essere convertita in energia e viceversa l’energia in
massa. Questa equivalenza non ha riscontro alcuno nella fisica newtoniana. Osserviamo che in relatività non vale la conservazione della massa. In un processo
fisico, cui prendono parte diverse particelle, ciò che si conserva non è la massa
~ v. Poiché m0 c2 ha le
totale ma l’energia totale. Notiamo per inciso che dE
dt = F · ~
dimensioni di un’energia, la massa a riposo può essere misurata in eV
.
c2
Tra l’energia e il momento di una particella libera esiste una relazione particolare. Infatti
m20 c4 γ2
E2
2
−
p
=
− m20 v2 γ2 = m20 c2 .
c2
c2
Questa relazione può essere riscritta come
E2 = p2 c2 + m20 c4
(5.35)
(5.36)
da cui9
E=
q
p2 c2 + m20 c4 .
(5.37)
9 Nello scrivere la (5.37) abbiamo considerato solo la soluzione positiva e scartato quella negativa. Si
può far vedere nell’ambito della fisica classica che non vi sono motivi per ammettere stati di energia
negativi. Discorso diverso va fatto per la meccanica quantistica, dove non è possibile ignorare, a
priori, stati di energia negativa.
80
5.7 quadrimomento, tensore momento angolare
Osserviamo che la (5.37) prende il posto della relazione non relativistica E =
p2
2m0
(intendendo qui con E l’energia cinetica della particella libera). La (5.36) ha
enorme importanza in quanto, come vedremo fra poco, la quantità E2 − c2 p2 è
uno scalare di Lorentz. Dalla (5.35) si vede subito che il momento può essere
misurato in eV
c e suoi multipli.
Una particolarità notevole della relatività è la possibilità di considerare particelle con massa nulla. Infatti dalla (5.36) deduciamo che se m0 = 0
E = pc.
(5.38)
Ovviamente le espressioni di E e ~p in cui compare la massa perdono di significato per una particella di massa nulla. Se m0 = 0 l’energia rimane finita senza
annullarsi, in quanto v = c. Notiamo che bisogna fare il doppio limite m0 → 0+ e
v → c− : ciò rende finita e non nulla l’energia.
Stesso discorso vale per il momento. Sottolineiamo che, nel caso di particelle
con massa nulla, vale certamente la (5.38), che stabilisce un preciso legame tra
energia e momento. In natura esistono, effettivamente, particelle di massa nulla,
come per esempio i fotoni. In base alla relazione di Planck-Einstein, l’energia di
un fotone di frequenza ν è data da
E = hν
(5.39)
dove h è la costante di Planck ed ha le dimensioni di un’azione. Se indichiamo
con ω = 2πν la pulsazione della radiazione, la (5.39) può scriversi come E =
ω
h 2π
= }ω. Allora il momento di un fotone di frequenza ν è dato da
p=
E
ω
= } = }k
c
c
dove k è il numero d’onda.
5.7
quadrimomento, tensore momento angolare
La relazione (5.36) ci induce a pensare che energia e momento di una particella
possano essere componenti di uno stesso quadrivettore. Effettivamente è così;
infatti il quadrivettore (controvariante)
pµ = m0 cuµ
(5.40)
dove m0 è la massa a riposo della particella e uµ la sua quadrivelocità, ha come
componenti
p0 = m0 γc ≡
E
c
p1 = m0 γv x ≡ p x
p2 = m0 γvy ≡ py
p3 = m0 γvz ≡ pz
Il quadrivettore definito dalla (5.40) è, allora, detto quadrimomento. Si ha come
2
conseguenza che gµν pµ pν = Ec2 − p2 = m20 c2 è certamente un invariante relativistico, come avevamo annunciato. Inoltre passando dal sistema di riferimento
81
relatività speciale
inerziale S al sistema S0 le componenti del quadrimomento si trasformano nel
modo seguente:
 00
p


 01
p

p 02

 03
p
= γ( p0 − βp1 )
= γ( p1 − βp0 )
= p2
= p3
(5.41)
Le precedenti possono essere scritte in termini di E, p x , py , pz come:
 0
E

= γ( Ec − βp x )


 c0
p x = γ( p x − β Ec )

p0y = py


 p0 = p
z
z
(5.42)
Nel caso in cui m0 = 0 (particella di massa nulla) si ha gµν pµ pν = 0: il quadrimomento è ovviamente di tipo luce. Possiamo definire il tensore del momento
angolare (controvariante di rango 2 e antisimmetrico) come
Lµν = x µ pν − x ν pµ .
(5.43)
Notiamo che L0µν = x 0µ p0ν − x 0ν p0µ = Λα Λνβ ( x α p β − x β pα ) = Λα Λνβ Lαβ . Si verifica
facilmente che, detto ~L = ~r × ~p l’ordinario vettore momento angolare rispetto
µ
µ
all’origine degli assi cartesiani ortogonali, L12 = Lz , L31 = Ly , L23 = L x .
5.8
equazioni del moto
d~p
Nel caso di una particella libera di massa m0 sappiamo che dt = 0 e dE
dt = 0, dove
~p = m0 γ~v e E = m0 c2 γ. Poiché le componenti del quadrimomento sono date da
p = Ec , ~p è evidente che le precedenti equivalgono alla condizione
dp
= 0.
ds
(5.44)
La (5.44) costituisce, allora, l’equazione covariante del moto di una particella liµ
bera e può essere anche scritta, tenendo presente che pµ = m0 cuµ = m0 c dx
ds
come
d2 x µ
= 0.
ds2
Questa è la forma covariante dell’equazione di una particella libera e corrisponde
2
all’espressione non covariante ddt~2r = 0. Se la particella non è libera, ma soggetta
ad interazioni, la derivata rispetto ad s del quadrimomento è diversa da zero, in
generale. Possiamo definire come quadriforza il quadrivettore controvariante:
F=
82
dp
.
ds
(5.45)
5.9 meccanica analitica relativistica (cenni)
La (5.45) può essere scritta in modo equivalente:
m0 c
du
= m0 cw = F.
ds
Questa equazione, detta di Minkowski, rappresenta l’equazione del moto della
particella in forma covariante. Le componenti della quadriforza F sono
γ dE γ d~p
F=
,
.
c2 dt c dt
d~p
Dal momento che ~F = dt e
essere scritte anche come:
γ
γ F = 2 ~F · ~v, ~F .
c
c
dE
dt
= ~F · ~v, le componenti della quadriforza possono
Come conseguenza dell’ortogonalità tra quadrivelocità e quadriaccelerazione abbiamo che la quadrivelocità è ortogonale alla quadriforza, cioè F · u = 0. Possiamo
anche definire il momento relativistico della quadriforza come il tensore controvariante di rango 2 antisimmetrico N µν = x µ F ν − x ν F µ . Si verifica immediatamente
µν
che dLds = N µν .
5.9
meccanica analitica relativistica (cenni)
Si può enunciare anche in meccanica relativistica il principio variazionale di Hamilton, dal quale poi ricavare le equazioni del moto delle particelle materiali.
Consideriamo, prima, il caso di una particella materiale libera. Come possiamo
esprimere l’azione? Ovviamente dobbiamo richiedere che l’integrale, che esprime
l’azione, sia invariante per trasformazioni di Lorentz e, quindi, sia uno scalare di
Lorentz. Per una particella libera viene naturale pensare, come scalare di Lorentz,
all’intervallo infinitesimo ds o più in generale ad αds con α costante. L’idea, allora,
è di considerare l’azione data da:
S=α
Z b
a
ds
(5.46)
dove a e b rappresentano due punti eventi dello spazio di Minkowski. Come già
sappiamo, devono essere considerati tutti i moti ammissibili (linee d’universo) che
partono dall’evento a e giungono all’evento b. Il moto reale è ottenuto imponendo
δS = 0 fra tutte le linee d’universo ammissibili. Per determinare, poi, la costante
α dobbiamo richiedere che nell’approssimazione non relativistica la (5.46) diventi,
a meno di costanti additive, uguale all’azione di una particella non relativistica
libera di massa nota.
q
2
Se ora teniamo conto che per una particella materiale ds = c 1 − vc2 dt, la (5.46)
può essere scritta
Z br
v2
S[ x (t), y(t), z(t)] = αc
1 − 2 dt
(5.47)
c
a
83
relatività speciale
dove v2 (t) = ẋ2 (t) + ẏ2 (t) + ż2 (t). Dalla (5.47) si deduce che la lagrangiana è data
da:
r
v2
L = αc 1 − 2 .
(5.48)
c
Se procediamo esattamente come nel caso non relativistico, per il principio variazionale di Hamilton abbiamo:
d ∂L
=0
dt ∂~v
(5.49)
perché L non dipende esplicitamente da ~x. Dalle relazioni (5.48) e (5.49) si ottiene
facilmente ddt~v = 0 ⇔ ~v(t) = costante, cioè il moto della particella libera che rende
stazionaria l’azione è quello rettilineo uniforme.
Sia m0 la massa a riposo della particella. Se richiediamo che per vc 1 la
lagrangiana della (5.48) diventi:
L=
1
m0 v2 + costante
2
abbiamo α = −m0 c. In conclusione la lagrangiana della particella relativistica di
massa m0 è data da:
r
v2
2
L = − m0 c 1 − 2 .
c
Il momento della particella è definito come
~p =
∂L
m0~v
=q
2
∂~v
1 − vc2
(esattamente il valore che, come abbiamo detto, permette che la conservazione del
momento di sistemi isolati sia una legge della Fisica). Notiamo, solo per inciso,
d~p
che nel caso esaminato (particella libera) dt = 0. Possiamo chiamare energia la
quantità:
m0 c2
E = ~p · ~v − L = q
= m0 c2 γ
v2
1 − c2
(esattamente il valore ottenuto per altra via). Poiché L non dipende esplicitamente
dal tempo, l’energia è una costante del moto. Osserviamo che ~p = cE2 ~v e che
E2 − p2 c2 = m20 c4 . L’hamiltoniana è data da
q
H = c p2 + m20 c2 .
p2
Se vc 1, H ≈ m0 c2 + 21 m0 . Possiamo anche enunciare il principio variazionale
con il formalismo quadridimensionale
S = − m0 c
84
Z b
a
ds = −m0 c
Z bq
a
dx µ dxµ ;
5.9 meccanica analitica relativistica (cenni)
per una particella libera
δS = −m0 c
Z b
dx µ dδxµ
a
ds
= − m0 c
Z b
a
uµ dδxµ ,
dove abbiamo posto dx µ = uµ ds. Poiché uµ dδxµ = d(uµ δxµ ) − duµ δxµ e δxµ a =
δxµ b = 0, si ha:
δS = m0 c
Z b
a
duµ δxµ = m0 c
Z b
duµ
a
ds
dsδxµ .
µ
Da δS = 0 ⇒ du
ds = 0 (forma covariante del moto di una particella), cioè la
quadriaccelerazione è nulla.
5.9.1 Carica in moto in un campo elettromagnetico
Vogliamo ora scrivere, sempre con il formalismo quadridimensionale, l’azione di
una particella di massa m0 e carica q in un campo elettromagnetico. Abbiamo
visto a suo tempo che il potenziale generalizzato del campo elettromagnetico è
dato da
q~
V = qϕ − A
· ~v
c
~ Ora
noti il potenziale scalare ϕ e il potenziale vettore A.
Vdt =
q
q~
q
ϕ(cdt) − A
· d~r = Aµ dxµ
c
c
c
~ ) è ipotizzadove xµ è la coordinata covariante di un punto evento e A = ( ϕ, A
to essere un quadrivettore controvariante, il quadripotenziale. Assumiamo che la
carica sia uno scalare di Lorentz. Allora
S=−
Z b
a
δS = −
q
m0 cds + Aν dxν
c
Z b
a
(5.50)
q
q
m0 cuµ dδxµ + δAν dxν + Aα dδxα .
c
c
(5.51)
Poiché
1. δAν =
∂Aν
∂xµ δxµ ,
2. Aµ dδxµ = d( Aµ δxµ ) − dAµ δxµ = d( Aµ δxµ ) −
3. uµ dδxµ = d(uµ δxµ ) −
4. δxµ a = δxµ b = 0,
∂Aµ
∂xν dxν δxµ ,
duµ
ds dsδxµ ,
85
relatività speciale
la (5.51) diventa
Rb
µ
q ∂Aν
q ∂Aµ
ds
−
δS = a m0 c du
dx
+
dx
ν
ν =
ds
c ∂xνµ
c ∂xνi
Rbh
µ
µ
q ∂A
dxν
∂A
= a m0 c du
ds − c ∂xµ − ∂xν dsi dsδxµ =
h
Rb
µ
q ∂Aν
∂Aµ
= a m0 c du
ds − c
∂xµ − ∂xν uν dsδxµ
In definitiva abbiamo
q
duµ
=
δS = 0 ⇒ m0 c
ds
c
ν
∂Aν
∂Aµ
−
∂xµ
∂xν
uν =
q µν
F uν .
c
(5.52)
µ
∂A
dove F µν = ∂A
∂xµ − ∂xν , detto tensore elettromagnetico, è un quadritensore controvariante di rango 2 antisimmetrico.
La (5.52) rappresenta la forma controvariante della equazione del moto di una
particella di massa m0 e carica q in un campo elettromagnetico. Esplicitando si
vede che


0 − Ex − Ey − Ez
 Ex
0
− Bz − By 
.
F =
 Ey Bz
0
− Bx 
Ez
By
Bx
0
Si può dimostrare che E2 − B2 e ~E · ~B sono invarianti per trasformazioni di Lorentz.
Si può altresì far vedere che F è invariante per trasformazioni di gauge. La gauge
µ
di Lorentz è ∂A
∂x µ = 0. L’azione (5.50) può essere scritta nel formalismo ordinario:
!
r
Z b
q~
v2
2
S=
−m0 c 1 − 2 − qϕ + A · ~v dt.
(5.53)
c
c
a
La funzione sotto il segno di integrale è, naturalmente, la lagrangiana:
r
v2
q~
2
L = −m0 c 1 − 2 − qϕ + A
· ~v.
c
c
(5.54)
Il momento generalizzato ~
P è dato da
~ = ~p +
~P = ∂L = qm0~v + q A
∂~v
c
v2
1 − c2
q~
A
c
q~
da cui ~p = ~
P − c A.
Ora
H = ~v ·
2
∂L
m0 c2
(H − qϕ)2
2 2
~
~P − q A
−L= q
+ qϕ ⇒
=
m
c
+
0
2
∂~v
c2
c
1 − vc2
da cui
r
H=
q ~ 2
m20 c4 + c2 ~
P− A
+ qϕ
c
che è l’hamiltoniana di una particella con massa a riposo m0 e carica q in un
~
campo elettromagnetico con potenziale scalare ϕ e potenziale vettore A.
86
5.10 *l’interferometro di michelson e morley
5.10
*l’interferometro di michelson e morley
L’elettromagnetismo prerelativistico superava in modo piuttosto goffo la presenza della costante c nelle equazioni dei campi elettrico e magnetico ipotizzando
l’esistenza di un mezzo, l’etere, che permeasse l’intero universo e rispetto al quale
la luce si muoveva appunto con velocità c. L’etere era pensato come un mezzo del
tutto singolare, sottile e capace di permeare completamente il cosmo, dotato dell’unica proprietà di essere il mezzo attraverso il quale la radiazione si propagava.
Per avere una qualche stima della velocità della Terra rispetto a tale mezzo Albert
Abraham Michelson, singolarmente nel 1881 e poi assieme ad Edward Morley
nel 1887, mise a punto un esperimento in cui si intendeva rilevare il “vento d’etere” mediante tecniche interferometriche. Il dispositivo messo a punto dai due
sperimentatori è schematizzato in figura 9 ed era montato su una lastra di pietra
fatta galleggiare su mercurio liquido: questo permetteva di mantenere la lastra
orizzontale e di farla girare attorno ad un perno centrale.
Supponiamo ora che la Terra si muova rispetto all’etere con velocità v. Il fascio
luminoso che parte dalla sorgente S viene scomposto dallo specchio semiargentato in due raggi normali tra loro; il raggio 1 si propaga verso lo specchio R1 , viene
da questo riflesso, subisce una deviazione di π2 a causa dello specchio semiargentato e perviene al cannocchiale C; il raggio 2 invece si dirige verso lo specchio R2
e dopo la riflesione attraversa pressocché indisturbato lo specchietto semiargentato per poi giungere anch’esso nel cannocchiale. Ciò che si dovrebbe osservare
nel cannocchiale è una serie di frange di interferenza dovute al fatto che il tratto
AR1 dovrebbe essere percorso dalla luce in un arco di tempo diverso rispetto al
tratto AR2 , a causa della composizione delle velocità che consegue dalla presenza
del mezzo luminifero. La differenza di fase tra i due raggi nel momento in cui si
ricongiungono in A genera l’interferenza.
Il tempo impiegato dal raggio 1 per percorrere AR1 (andata e ritorno) è
T1 =
L1
L
2L
1
+ 1 = 1
.
c+v c−v
c 1 − v22
c
(5.55)
Per il raggio 2 bisognerà tener conto del fatto che, nel sistema dell’etere, la luce si
propaga sempre e comunque a velocità c. Dunque la velocità vy con cui viene per√
corsa la distanza deve soddisfare la relazione c2 = v2y + v2 , ovvero vy = c2 − v2 .
Di conseguenza
T2 = 2
L2
L2
1
=2 q
vy
c
1−
v2
c2
.
(5.56)
La differenza tra i tempi è dunque

∆T = T2 − T1 =
2  L2
q
c
1−

v2
c2
−
L1 
.
2
1 − vc2
(5.57)
87
relatività speciale
Se ora ruotiamo di
invertiti) è
π
2
l’intero apparato, la relazione che si trova (essendo i bracci

∆T 0 =

L
2  L2
−q 1
c 1 − v22
1−
c
v2
c2
.
(5.58)
Perciò

∆T 0 − ∆T = 2
L1 + L2 
1
q
c
1−
v2
c2
−
1
1−
v2
c2
.
(5.59)
v
c
e ignorando termini di ordine superiore al secondo,
L1 + L2
.
c3
(5.60)
Sviluppando in potenze di
otteniamo che
∆T 0 − ∆T ≈ v2

Dunque ruotando lo strumento dovrebbe osservarsi uno spostamento di ∆n =
v2 λc L1 c+3 L2 frange attraverso il centro del cannocchiale. Il dispositivo di Michelson
e Morley aveva L1 = L2 = 11 m, mentre la lunghezza d’onda della luce usata era
λ = 5.5 · 10−7 m. All’epoca dell’esperimento si riteneva che il Sole fosse essenzialmente solidale con il riferimento dell’etere, mentre la Terra orbitava con una
velocità di v = 30000 ms (che dunque era in modulo proprio la v dell’esperimento
esaminato). Si disponeva inoltre di varie stime della velocità della luce e tutte suggerivano che la luce avesse una velocità c ≈ 3 · 108 ms . Dunque si ricava vc ≈ 10−4 .
Da questi dati si ricava uno spostamento teorico di ∆n = 0.4 frange. Nel secondo
esperimento Michelson e Morley riuscirono a rendere lo strumento sensibile ad
uno spostamento di appena 0.01 frange. L’esperimento, nato per dare una stima
di v, fu un fallimento, in quanto non venne osservato alcuno spostamento dell’entità prevista e dunque il “vento d’etere” non fu rilevato. Ovviamente, alla luce dei
risultati di Einstein, questo risultato si spiega immediatamente, poiché la velocità
della luce è la medesima in tutte le direzioni in ogni sistema di riferimento. Lo
sfasamento, assunta vera questa ipotesi, non poteva che essere nullo.
L’esperimento ebbe, soprattutto negli anni seguenti, grande risonanza tra i fisici
in quanto fu una delle prove sperimentali più lucide dell’infondatezza della teoria
dell’etere, perlomeno come elaborata nel secolo XIX. Tuttavia occorre sottolineare
che l’esperimento non è di per sé una prova della teoria di Einstein; in effetti,
come poi si vide con esperimenti analoghi eseguiti con interferometri a bracci
disuguali, l’esperimento permetteva di concludere semplicemente che la velocità
della luce lungo percorsi diversi non dipende dalla velocita del sistema inerziale
in esame rispetto ad un qualsiasi altro sistema inerziale, e dunque non vi erano
sistemi di riferimento privilegiati. La costanza della velocità della luce di per sé
non è un risultato dell’esperimento in quanto non abbiamo informazioni sulla
differenza di velocità della radiazione tra andata e ritorno. Basti pensare che
si possono ricavare trasformazioni differenti da quelle di Lorentz che spieghino
88
5.10 *l’interferometro di michelson e morley
Figura 9.:
Schema dell’interferometro di Michelson e Morley.
correttamente l’esperimento10 . L’ipotesi che l’esperimento abbia spinto Einstein a
formulare i suoi postulati nella precisa forma in cui li conosciamo sembra dunque
infondata sia da un punto di vista logico che storico11 . Semmai essa manifestò in
modo quanto mai palese che occorreva necessariamente andare oltre il modello
dell’etere.
10 Si veda a proposito Vincenzo Barone, Relatività, Boringhieri, pagg.103-105.
11 Si ricordi il pensiero di Einstein a riguardo:
«L’esito dell’esperimento di Michelson non ebbe una grande influenza sull’evoluzione delle mie idee [...]. La spiegazione di ciò sta nel fatto che ero, per ragioni di carattere generale, fermamente convinto che non esista il moto assoluto, e
il mio unico problema era come ciò potesse conciliarsi con quello che sapevamo
dell’elettrodinamica.»
89
6
INTRODUZIONE ALLA MECCANICA QUANTISTICA
6.1
*il corpo nero
Un corpo nero è un oggetto che assorbe tutta la radiazione elettromagnetica incidente (e quindi non ne riflette). Se introduciamo il concetto di potere assorbente
come la frazione di energia raggiante incidente che viene assorbita dal corpo, si
conclude che un corpo nero è un oggetto che ha potere assorbente 1. Kirchhoff è
riuscito a dimostrare nel 1859 che il potere assorbente di un corpo dipende solo
dalla temperatura del corpo e non dalla sua natura. Kirchhoff stesso, ad esempio,
ha provato che un ottimo esempio di corpo nero è un contenitore a temperatura
costante sulle cui pareti è praticato un piccolissimo foro, di modo che la radiazione che entra attraverso di esso abbia probabilità praticamente nulla di uscirvi e
venga assorbita dal corpo in seguito alle numerose riflessioni interne.
Sia dunque u la densità di energia all’interno del contenitore e indichiamo con
uν dν la densità di energia delle componenti che cadono nell’intervallo (ν, ν + dν).
Il risultato di Kirchhoff cui si è accennato può esprimersi nel seguente modo:
fissata ν, uν = uν ( T ). Stefan aveva dimostrato che
U=
Z +∞
0
uν dν = σT 4
dove σ = 5, 67 · 10−8 Wm−2 K−4 è la costante di Stefan-Boltzmann. Ricordando
che la pressione esercitata sulle pareti del corpo è data da p = 31 u, consideriamo
una trasformazione termodinamica infinitesima:
δQ = TdS = dU + pdV =
1
4
= Vdu + udV + udV = Vdu + udV ⇔
3
3
4u
V du
dT +
dV.
dS =
T dT
3T
Ovvero
∂S
4u
=
∂V
3T
∂S
V du
=
.
∂T
T dT
(6.1)
(6.2)
Imponendo l’uguaglianza delle derivate miste si ottiene
du
dT
4 Tu .
4
3
1 du
T dT
−
u
T2
=
Integrando l’equazione differenziale si ottiene che u =
costante di integrazione, ovvero
U = σT 4 .
=
1 du
T dT
ςT 4 ,
⇔
con ς
(Legge di Stefan-Boltzmann)
91
introduzione alla meccanica quantistica
Nel 1893 Wien dimostrò che
ν
u ν = ν3 F
T
che contiene la legge di Stefan. Infatti
Z +∞
ν
dν = pongo
U=
ν3 F
T
0
=
Z +∞
0
= T4
(Legge dello spostamento)
α=
ν
T
T 3 α3 F (α) Tdα
Z +∞
0
α3 F (α)dα.
La relazione di Wien si può anche esprimere in funzione delle lunghezze d’onda λ;
infatti, indicata con uλ la densità di energia nell’intervallo di lunghezza d’onda,
|dν|
|
richiediamo che uν dν = uλ dλ. Da λν = c, differenziando si ha |dλ
λ = ν ⇔
|dν| = λν dλ. Perciò uλ dλ = uν dν = uν λν |dλ| da cui
uλ =
c4 c F
.
λ5
λT
Per trovare tali massimi come solito
c duλ
c 0 c + 5F
= 0.
=0⇔
F
dλ
λT
λT
λT
Poiché F è una funzione universale, detta λ̄ la soluzione, dalla forma dell’equazione abbiamo che λ̄T = costante = b. Pertanto λ̄ = Tb , ovvero all’aumentare
della temperatura, il massimo della funzione si sposta verso lunghezze d’onda
più piccole (legge dello spostamento di Wien)1 .
ν
Nel 1896 Wien stesso propone una forma possibile di F: Fν ( T ) = a1 e−a2 T .
Si mostra mediante analisi di Fourier che il campo elettromagnetico si comporta
come se fosse generato da molti oscillatori armonici indipendenti. Noto il numero
di oscillatori di una determinata frequenza si può ricavare uν ; si prova che
dN (ν)
8π
= 3 ν2 dν.
V
c
dN (ν)
Nota l’energia media dei detti oscillatori ū, allora uν dν = ū V .
Poiché vale il principio di equipartizione dell’energia e per ogni oscillatore,
avendo esso due modi possibili, ū = 2 12 k B T = k B T, ricorrendo alla distribuzione
di Boltzmann si ha:
e
P ( u ) = R +∞
0
− k uT
B
e
− k uT
B
.
du
Pertanto il valore medio può essere ottenuto da
R +∞ − u
Z +∞
ue k B T du
ū =
uP(u)du = R0 +∞ − u
= k B T.
kB T
0
e
du
0
1 La costante b = 2.8977685 · 10−3 mK prende il nome di costante dello spostamento di Wien.
92
6.2 l’effetto fotoelettrico
Perciò
uν ( T )dν = ū
8π
dN (ν)
= k B T 3 ν2 dν.
V
c
(Relazione di Rayleigh-Jeans)
Si vede subito che integrando tra 0 e +∞ l’integrale diverge (poiché tale fatto è
legato al contributo delle alte frequenze si parla di catastrofe ultravioletta o catastrofe
di Rayleigh-Jeans). La relazione è ottenuta ammettendo che gli scambi energetici
avvengano con continuità.
Nel 1901 Planck propose invece che l’energia potesse essere scambiata solo secondo quantità multiple di hν. In questo caso, detto un = nhν l’energia scambiata,
P(un ) =
e
− knhνT
∑i∞=0 e
hν
B
−n khνT
= (1 − e k B T )e
−n khνT
B
.
B
Dunque
∞
ū =
∑ un P(un ) = hν(1 − e
hν
kB T
n =0
∞
)
∑ ne
n =0
−n khνT
B
hν
=
e
hν
kB T
−1
ovvero
uν =
8π 3
h
ν
.
c3 e khν
BT − 1
(Legge della radiazione di Planck)
La legge di Planck è perfettamente in accordo con i dati sperimentali, elimina
il problema della “catastrofe ultravioletta” e restituisce la legge di Rayleigh-Jeans
come primo termine dello sviluppo in serie.
Figura 10.:
6.2
Curva di Planck a confronto con i risultati classici.
l’effetto fotoelettrico
L’esperienza mostra che, in certe condizioni, un metallo colpito da un fascio di
luce monocromatica emette elettroni. L’apparato sperimentale può essere, grosso
93
introduzione alla meccanica quantistica
modo, schematizzato come segue: all’interno di un involucro trasparente, in cui
è praticato il vuoto, è posto un catodo su cui è fatta incidere radiazione elettromagnetica monocromatica (nello spettro del visibile o superiore) ed un anodo che
raccoglie i fotoelettroni emessi dal catodo. L’anodo si trova, rispetto al catodo, ad
un potenziale inferiore, il cui valore può essere variato mediante un potenziometro (vedi figura 11). Gli aspetti rilevanti dell’effetto fotoelettrico possono essere
così riassunti:
Figura 11.:
Apparato per la rivelazione dell’effetto fotoelettrico.
1. esiste, in funzione del tipo di metallo di cui è costituito il catodo, una frequenza di soglia ν0 della radiazione incidente, al di sotto della quale non
si verifica nessuna emissione di fotoelettroni, qualunque sia l’intensità della
radiazione;
2. esiste un potenziale d’arresto V0 , indipendente dall’intensità della radiazione incidente, in corrispondenza del quale nessun elettrone raggiunge l’anodo; questa proprietà sta a significare che l’energia cinetica massima dei
fotoelettroni appena emessi dal catodo verifica l’equazione Tmax = eV0 dove
e è la carica dell’elettrone in modulo;
3. l’emissione dei fotoelettroni è istantanea qualunque sia l’intensità della radiazione, purché ν > ν0 ;
4. la corrente fotoelettrica i, ovvero il numero di elettroni emessi nell’unità di
tempo, dipende dall’intensità I della radiazione incidente.
La teoria classica della radiazione prevede
a) l’esistenza di una intensità di radiazione di soglia I0 al di sotto della quale
l’effetto non avviene, in contrasto col punto 1;
b) la dipendenza di Tmax , e quindi del potenziale d’arresto V0 , dall’intensità della
radiazione I in contrasto col punto 2;
c) che l’emissione debba avvenire dopo che un elettrone ha assorbito, a spese della radiazione incidente, abbastanza energia da superare il potenziale, detto
di estrazione, che, in condizioni normali impedisce all’elettrone di uscire dal
94
6.3 effetto compton
metallo: per tale ragione l’emissione può verificarsi solo dopo un certo intervallo di tempo dall’arrivo della radiazione incidente, intervallo ovviamente
tanto maggiore quanto più bassa è l’intensità I, in contrasto col punto 3;
d) che la corrente, dovuta ai fotoelettroni, debba aumentare al crescere di I, in
accordo col punto 4 (sempre che ν > ν0 ).
Allora, almeno tre delle caratteristiche principali dell’effetto fotoelettrico non sono
spiegabili mediante la teoria classica della radiazione. Nel 1905 Einstein propose una spiegazione dell’effetto assumendo che la radiazione fosse costituita da
pacchetti, o quanti di energia, detti fotoni: una radiazione elettromagnetica monocromatica di frequenza ν consiste di fotoni di energia hν, dove h = 6.6 · 10−34 J · s
è la costante di Planck. Abbiamo visto che, per spiegare l’emissione del corpo
nero, Planck aveva ipotizzato un simile comportamento per l’energia della radiazione elettromagnetica all’interno di una cavità. Vediamo ora come, con l’ipotesi
di Einstein, è possibile fornire una spiegazione esauriente dell’effetto.
Possiamo assumere, per semplicità, che l’elettrone sia a riposo all’interno del
metallo2 . Un elettrone, dopo aver assorbito un fotone di energia hν, è emesso
dal catodo con un’energia cinetica T = hν − W, dove W è il lavoro di estrazione
dal metallo. Se W0 è il lavoro minimo di estrazione caratteristico del metallo,
l’energia cinetica massima dell’elettrone (quando questo è emesso dal catodo) è
data da Tmax = hν − W0 . Esiste di conseguenza una frequenza di soglia ν0 = Wh0
tale che, se ν < ν0 , l’effetto non ha luogo. Vi è altresì un valore V0 del potenziale
in corrispondenza del quale anche gli elettroni più veloci non sono in grado di
raggiungere l’anodo. Abbiamo in particolare V0 = hν−e W0 . Dopo che un elettrone
ha acquistato, mediante assorbimento di un fotone, energia pari ad hν, la sua
emissione dal metallo, se ν > ν0 , è immediata (il ritardo è inferiore a 10−9 s) e
non dipende dall’intensità della radiazione. Se l’effetto ha luogo, all’aumentare
dell’intensità di radiazione cresce anche il numero di fotoelettroni e quindi la
corrente nel circuito.
In conclusione, possiamo dire che l’effetto fotoelettrico, al pari della radiazione
del corpo nero, fornisce una prova che la radiazione elettromagnetica di frequenza
ν è costituita da fotoni di frequenza hν.
Esercizio
Dimostrare che un elettrone libero non può assorbire un fotone di energia hν in
base alla conservazione del quadrimomento.
6.3
effetto compton
Se facciamo incidere un fascio di raggi X con λ0 = 0.7Å su una sostanza (come
per esempio il molibdeno) si osserva, sperimentalmente, che i raggi X diffusi ad
2 Osserviamo che l’energia termica è circa 10−2 eV mentre i fotoni, nel visibile e nell’ultravioletto,
hanno un’energia di circa 1 − 10 eV.
95
introduzione alla meccanica quantistica
Figura 12.:
Effetto Compton
un angolo θ rispetto alla direzione della radiazione incidente hanno lunghezza
d’onda lievemente maggiore di λ0 ; in particolare si trova
∆λ =
h
(1 − cos θ )
me c
dove m è la massa a riposo dell’elettrone3 . La grandezza mhe c ha (ovviamente) le
dimensioni di una lunghezza e vale 0.024Å: è detta lunghezza d’onda Compton
dell’elettrone. Questo effetto (di diffusione), detto Compton, può essere spiegato
come un urto tra un fotone di energia hν0 e momento hνc 0 ed un elettrone libero,
che possiamo considerare fermo (notiamo che l’energia di legame degli elettroni
periferici è di qualche eV, mentre l’energia dei fotoni è molto maggiore). Nell’urto
fotone-elettrone si conserva il quadrimomento. Chiamiamo ~p0 e ~p i momenti
fotonici prima e dopo l’urto e ~pe il momento dell’elettrone dopo l’urto; ricordiamo
che, prima dell’urto, l’elettrone è fermo. Dalla conservazione dell’energia:
2
me c + cp0 =
q
m2e c4 + c2 p2e + cp.
(6.3)
Dalla conservazione del momento:
~p0 = ~p + ~pe ⇔ ~pe = ~p0 − ~p ⇔ p2e = p20 + p2 − 2p0 p cos θ.
(6.4)
La (6.3) può anche scriversi come:
(me c2 + cp0 − cp)2 = m2e c4 + c2 p2e ⇔
4
4
m2e
c
+ c2 p20 + c2 p2 + 2me c3 ( p0 − p) − 2c2 pp0 = m2e
c
+ c2 p2e .
(6.5)
Sostituendo nella (6.5) la (6.4) otteniamo:
c2 p20 + c2 p2 + 2me c3 ( p0 − p) − 2c2 p0 p = c2 p20 + c2 p2 − 2c2 p0 p cos θ ⇒
me c( p0 − p) = p0 p(1 − cos θ ).
3 Ricordiamo che la massa a riposo di un elettrone è pari a me = 9.11 · 10−31 kg = 0.511 MeV
c2
96
(6.6)
6.4 onde di materia di de broglie
h
Ora, p0 = hνc 0 = λh0 , mentre p = hν
c = λ , perciò la precedente diventa
1
1
h2
(1 − cos θ ) ⇒
me ch
−
=
λ0
λ
λ0 λ
λ − λ0 =
h
(1 − cos θ ).
me c
(6.7)
In conclusione, nell’effetto Compton i fotoni si comportano proprio come dei
corpuscoli cui compete energia hν e momento hν
c . La diffusione Compton può
essere considerata come un assorbimento di radiazione elettromagnetica seguito
da emissione, mentre l’effetto fotoelettrico è un assorbimento puro e semplice.
6.4
onde di materia di de broglie
La radiazione elettromagnetica ha manifestazioni ondulatorie e presenta, nel contempo, comportamenti corpuscolari come nella radiazione del corpo nero, nell’effetto fotoelettrico e nell’effetto Compton. Il legame tra questi due aspetti è
rappresentato dalla costante di Planck h. Sappiamo infatti che, se ν è la frequenza di un’onda elettromagnetica monocromatica, questa può essere pensata
in certi contesti come formata da quanti, fotoni (particelle di massa nulla), ad
ognuno dei quali compete un’energia hν ed un momento hν
c . Poiché h interviene
anche nella condizione di quantizzazione di Bohr-Sommerfeld, Louis de Broglie
nel 1923 si chiese se non fosse possibile, per così dire, un percorso inverso, cioè
che oggetti (come gli elettroni) pensati sempre come particelle potessero presentare, in particolari situazioni, un comportamento ondulatorio. Consideriamo nel
modello atomico di Bohr un elettrone in orbita attorno al nucleo; la condizione di
quantizzazione è la seguente:
I
pdq = nh
n ∈ N.
Ora, se l è la lunghezza dell’orbita, la precedente relazione può anche essere
scritta:
l p = nh ⇔ l =
nh
.
p
Qui il termine hp ricorda la lunghezza d’onda λ di un fotone. Questa analogia ha
suggerito a de Broglie la seguente ipotesi: ad ogni particella, avente massa a riposo
non nulla, è associata un onda, la cui lunghezza d’onda, noto il momento p, è data da
λ = hp .
Alla luce di questa ipotesi, le orbite permesse nella teoria di Bohr sono quelle
che contengono un numero intero di lunghezze d’onda. Vediamo con quali lunghezze d’onda abbiamo a che fare nello schema di de Broglie. Prendiamo delle
particelle libere (non relativistiche):
λ=
h
h
.
=√
p
2mE
(6.8)
97
introduzione alla meccanica quantistica
Questa è la lunghezza d’onda di de Broglie di una particella di massa m avente
un’energia cinetica E.
Nel caso di un elettrone, se E = 100 eV, λ = 12.4Å (come nei raggi X), pari alle dimensioni atomiche. Per un oggetto di 1 kg ed energia di 1 J gli effetti
quantistici si avrebbero a distanze pari a 10−34 m, del tutto trascurabili rispetto alle oscillazioni termiche degli atomi. Notiamo che, mentre per i fotoni λ è
inversamente proporzionale
√ ad E, per le particelle (non relativistiche) λ è inversamente proporzionale a E. Inoltre maggiore è la massa, minore è, a parità
di energia, la lunghezza d’onda. Nel 1927 Davisson e Germer hanno provato
che gli elettroni presentano effettivamente un comportamento ondulatorio e sono
caratterizzati da una lunghezza d’onda data proprio dalla (6.8). Analoghi comportamenti ondulatori sono, poi, stati provati per protoni, neutroni, atomi di He,
ecc. Stabilito il carattere ondulatorio delle particelle materiali, bisogna vedere a
quale grandezza fisica si riferisce il fenomeno, cioè quale sia il significato fisico
della grandezza o delle grandezze oscillanti che chiamiamo funzioni d’onda e per
la quale ipotizziamo un’equazione lineare in analogia con le onde meccaniche e
quelle elettromagnetiche.
Normalmente quando si è in presenza di una propagazione ondulatoria, si
pone il problema di quale sia il mezzo che porta l’onda e quale la grandezza
che ne misuri l’ampiezza. Nel caso elettromagnetico alla prima domanda non
c’è risposta, o meglio è il vuoto, mentre le grandezze che misurano l’ampiezza
sono il campo elettrico e il campo magnetico. Ci chiediamo nel caso delle onde di
materia di de Broglie chi sostituisce questi campi (assodato che esse si propagano
nel vuoto). L’esperimento di Davisson e Germer fornisce una risposta a questo
quesito. Nell’esperimento, mediante rivelatori, viene testata la presenza o meno
di elettroni ad un particolare angolo. Alla fine, pensando di ripetere più volte
le misure, ogni volta con un solo elettrone nel fascio, viene di fatto misurata
la frequenza con cui l’elettrone è rivelato ai diversi angoli, cioè è misurata una
probabilità di presenza dell’elettrone.
Le idee di de Broglie sulle onde di materia avranno uno sviluppo fondamentale
con la Meccanica Ondulatoria di Schrödinger.
98
BIBLIOGRAFIA
[1] C. Kittel, W. D. Knight, M. A. Ruderman: La fisica di Berkeley, volume 1 Meccanica, Zanichelli.
[2] L.D. Landau, E. M. Lifsič: Teoria dei campi, Editori riuniti.
[3] V. Barone: Relatività, Bollati Boringhieri.
[4] H. W. Wichmann: La fisica di Berkeley, volume 4 - Fisica quantistica, Zanichelli.
[5] K. Krane: Modern Physics, John Wiley & Sons Inc .
[6] D. Halliday, R. Resnick, J. Walker: Fondamenti di fisica - Fisica moderna,
Edizioni CEA.
[7] L. Picasso: Lezioni di meccanica quantistica, Edizioni ETS.
[8] M. Born: Fisica atomica, Bollati Boringhieri.
99
A
L A T R A S F O R M ATA D I L E G E N D R E
a.1
definizione
Sia data una funzione y = f ( x ) convessa ( f 00 ( x ) > 0). La sua trasformata di
Legendre è una funzione g di una nuova
variabile p data da
g( p) = max{ px − f ( x )}.
x
y
(A.1)
g(p)
y = px
y = f(x)
Il significato geometrico della trasformata può essere inteso nel modo seguente. Consideriamo nel piano xy il
x(p)
x
grafico della funzione f ( x ) e sia data
la retta y = px passante per l’origine
con p inteso fissato. Allora è possibiTrasformata di Legendre.
le individuare un punto x̃ = x̃ ( p) tale
che px − f ( x ) = F ( p, x ) sia massima. La trasformata di Legendre è dunque
F ( p, x̃ ( p)) = g( p). Se esiste, il punto x̃ ( p) è univocamente determinato, essendo
individuato dalla condizione ∂∂xF = p − f 0 ( x̃ ) = 0 (grazie al teorema del Dini è
possibile esprimere x̃ in funzione
di p). Il punto stazionario così trovato è un
∂2 F ( x,p) massimo in quanto
= − f 00 ( x̃ ) < 0 per ipotesi.
2
∂x
x = x̃
La trasformata di Legendre gode di una proprietà molto importante: essa è involutiva, ovvero se g( p) è la trasformata di Legendre di f ( x ), allora la trasformata
di Legendre di g( p) è ancora f ( x ). Le due funzioni f e g si dicono dunque duali
secondo Young. Inoltre essendo per definizione px − f ( x ) ≤ g( p) allora vale la
cosiddetta disuguaglianza di Young:
px ≤ f ( x ) + g( p).
(A.2)
Le precedenti considerazioni si generalizzano facilmente
2 al caso di funzioni a
∂ f
più variabili (si richiede in questo caso che la matrice ∂xi ∂x j sia definita positiva).
Come abbiamo visto1 , la trasformazione di Legendre permette di passare dalla lagrangiana L(q, q̇, t) (intesa come funzione delle variabili q̇) all’hamiltoniana
H(q, p, t). La trasformazione di Legendre trova applicazione in svariati ambiti
della Fisica (ad esempio, in termodinamica la funzione entalpia è definita come
trasformata di Legendre della funzione energia rispetto al volume).
1 Si veda pagina 39. Nel caso dell’applicazione della trasformazione di Legendre alla fuzione L le
ipotesi di convessità sono in genere soddisfatte. La lagrangiana di un sistema
fisico ha infatti
solitamente la forma L =
positiva.
1
2
∑i mi q̇2i − V (q): evidentemente la matrice
∂2 L
∂q̇i ∂q̇ j
= mi δij è definita
101
la trasformata di legendre
La trasformazione di Legendre non è un semplice cambiamento di variabili:
essa consente di passare da funzioni definite su uno spazio lineare a funzioni
definite sul corrispondente spazio duale.
102
B
N O T E S U L L E U N I TÀ D I M I S U R A
Nel sistema internazionale (SI) l’unità di misura dell’energia è il joule (simbolo J):
1 J = 1 kg · m2 · s−2 .
Nel sistema di Gauss (SG o CGS) l’unità di misura è l’erg:
1 erg = 1 g · cm2 · s−2 .
Ovviamente 1 J = 107 erg.
Altra unità di misura, usata in chimica e in termodinamica, è la caloria (cal),
insieme al suo multiplo, la chilocaloria (kcal):
1 kcal = 4.184 · 103 J.
In diversi settori della Fisica l’unità di misura usata è l’elettronvolt (eV); ricordiamo che 1 eV è l’energia di un elettrone sottoposto ad una differenza di potenziale
di 1 V. Dunque, con riferimento alla tabella seguente:
1 eV = 1.6 · 10−19 J = 1.6 · 10−12 erg
e inversamente
1 J = 0.625 · 1019 eV.
Multipli dell’elettronvolt sono:
1 keV = 103 eV
1 MeV = 106 eV
1 GeV = 109 eV
1 TeV = 1012 eV
Poiché m0 c2 ha le dimensioni di un’energia, la massa a riposo può essere misurata
in eV
. In Fisica atomica si usa spesso come unità di massa l’unità di massa atomica
c2
(u.m.a.), definita come la dodicesima parte della massa del 12 C:
1 u.m.a. = 1.661 · 10−27 kg = 931.5
MeV
.
c2
103
C
C O S TA N T I F I S I C H E F O N D A M E N TA L I
Riportiamo di seguito alcune costanti fisiche fondamentali, alcune delle quali sono
di interesse per la trattazione corrente. Le grandezze sono riportate in unità SI.
Nome della costante
Velocità della luce (valore esatto)
Costante di Planck
Costante di Boltzmann
Simbolo
c
h
kB
2π 5 k4B
15h3 c2
Costante di Stefan-Boltzmann
Costante di gravitazione universale
Carica dell’elettrone
Massa a riposo dell’elettrone
Massa a riposo del protone
Massa a riposo del neutrone
Massa a riposo del muone
σ=
Raggio di Bohr
a0 =
Costante di Rydberg
R=
Permeabilità del vuoto
Permittività del vuoto
Magnetone di Bohr
Costante di struttura fine
Costante di Avagadro
Costante di Faraday
Costante molare dei gas
µ0
e0
e}
µ B = 2m
e
2
α = 4πee 0 }c
NA
F = eNA
R
G
−e
me
mp
mn
mµ
4πe0 h̄2
m e e2
m e e4
8e02 h3 c
Valore
299792458 ms
6.6260896 · 10−34 Js
1.3806505 · 10−23 JK−1
5.67040 · 10−8 W · m−2 · K−4
6.674 · 10−23 m3 kg−1 s−1
−1.602176487 · 10−19 C
9.11 · 10−31 kg = 0.511 MeV
c2
1.672 · 10−27 kg = 938.3 MeV
c2
MeV
−
27
1.675 · 10
kg = 939.6 c2
107 MeV
c2
5, 292 · 10−11 m
1.0974 · 107 m−1
1.25663706144 · 10−6 N · A−2
8.854187817 · 10−12 F · m−1
9.2740154 · 10−24 J · T−1
7.2973531 · 10−3
6.0221367 · 1023 mol−1
96485 C · mol−1
8.31451 J · K−1 · mol−1
105